

Google 作为全球最大的搜索引擎,他们的工程师每天都在改进思路,以便让搜索引擎更加符合用户预期,从而带来更好的体验。
十多年过去了,可以说 Google 的每一次算法更新都牵动着成千上万的站长以及网站的生死存亡。
每次变化的过程,其实就是一次用户与搜索引擎,搜索引擎与网页之间的对话与妥协,这中间对于SEO来说,有着非同寻常的意义。
同样一篇内容,每个人的解读都不一样,重要的是自己能理解并且总结这些更新深层次意义,才能得到其精华。
————————————————————————————
Google算法每年的改变都多达500-600次,只不过很多改动都很小,但是每隔几个月,Google都会做一次比较大的算法升级,这些升级都会直接影响到搜索的排名结果。作为一个搜索引擎营销人员,了解这些算法的改变有助于分析网站排名以及流量的变化状况,下面我们列出了几次影响比较大的算法升级,熟悉这些算法的变动将会有助于你的SEO工作。
2000年
2000年12月 – Google工具条
Google发布了其浏览器工具条,正是这个工具条上绿色小条(PR值),日后让无数的站长为之疯狂,甚至形成了买卖产业链。每三个月一次的”Google Dance”之后,站长们最关注的就是这个绿色的小条有没有变长。
2003年
2003年2月 – Boston
在当年Boston召开的搜索引擎战略大会(SES)上正式命名的一次算法升级,也是Google第一个有名字的算法升级。起初Google主要是按月进行升级,所以最开始的几次升级都是综合了一些算法改动以及收录刷新(Google Dance)。随着升级越来越频繁,月度升级计划很快消亡。
随着网络的迅速发展,万维网成为大量信息的载体,如何有效地提取并利用这些信息成为一个巨大的挑战。搜索引擎(Search Engine),例如传统的通用搜索引擎AltaVista,Yahoo!和Google等,作为一个辅助人们检索信息的工具成为用户访问万维网的入口和指南。但是,这些通用性搜索引擎也存在着一定的局限性,如:
(1) 不同领域、不同背景的用户往往具有不同的检索目的和需求,通用搜索引擎所返回的结果包含大量用户不关心的网页。
(2) 通用搜索引擎的目标是尽可能大的网络覆盖率,有限的搜索引擎服务器资源与无限的网络数据资源之间的矛盾将进一步加深。
...
100系列码
从100到199范围的HTTP状态码是信息报告码。基于各种原因考虑,大多数情况下我们是很少看见这些代码的。首先,如果一个浏览器尝试访问一个网站,而网站返回这些代码时,它们往往都不会显示在屏幕上。它们只是浏览器使引用的内部码。另外,这些代码不常见的另外一个原因是起初HTTP标准不允许使用这一范围的状态码。就其本身而言,它们也一直没有被广泛地使用。
200系列码
从200到299范围的状态码是操作成功代码。同样的,在正常的Web上网中,你也很可能不曾在屏幕上看到这些代码。相反的,这些代码是在浏览器内部使用的,用以确认操作成功确认和当前请求状态。虽然这些代码通常不显示,但是有一些故障排除工具能够读到它们,就像和其它大多数的HTTP状态码一样,它们在错误诊断过程中是非常有用的。
300系列码
转个帖子过来,作者收集了很多蜘蛛,这个有用的,弄个收藏。
5Ucms的蜘蛛代码函数。显示效果如下:
----------------代码开始----------------
' 蜘蛛机器人
function spiderbot()
dim agent: agent = lcase(request.servervariables("http_user_agent"))
dim Bot: Bot = ""
'百度
if instr(agent, "baiduspider") > 0 then Bot = "Baiduspider"
if instr(agent, "baiducustomer") > 0 then Bot = "BaiduCustomer"
if instr(agent, "baidu-thumbnail") > 0 then Bot = "Baidu-Thumbnail"
if instr(agent, "baiduspider-mobile-gate") > 0 then Bot = "Baiduspider-Mobile-Gate"
if instr(agent, "baidu-transcoder/1.0.6.0") > 0 then Bot = "Baidu-Transcoder/1.0.6.0"
'谷歌google
if instr(agent, "googlebot/2.1") > 0 then Bot = "Googlebot/2.1"
if instr(agent, "googlebot-image/1.0") > 0 then Bot = "Googlebot-Image/1.0"
if instr(agent, "feedfetcher-google") > 0 then Bot = "Feedfetcher-Google"
if instr(agent, "mediapartners-google") > 0 then Bot = "Google Adsense"
if instr(agent, "adsbot-google") > 0 then Bot = "Google AdWords"
if instr(agent, "googlebot-mobile/2.1") > 0 then Bot = "Googlebot-Mobile/2.1"
if instr(agent, "googlefriendconnect/1.0") > 0 then Bot = "GoogleFriendConnect/1.0"
这篇文章的确是值得全文转载的,不管是从UE方面还是从研究用户体验方面来说,包含很多东西,值得我们去了解。
大家可以看到,从2000年1月份,到2009年7月份,这个中文互联网用户大概增长了38倍。而这个数据是中国互联网过去十年的网站数量的增长情况,我们大家可以看到,这个数量大概是增长了20倍。那么这两个图的趋势是非常相似的,大家可以看一下。再看一下第三张图,这个图是SE做的统计,04年第四季度,到09年第一季度,中文网页搜索次数增长了一个需求。根据百度的统计,从04年到09年,中文网页搜索请求的次数增长了20倍,大家留意,是过去五年增长的20倍
上海点石大会又要来了,还记得08年的点石大会吗?
今年的大会时间多一天,有时间有兴趣的一起来参加了吧!
另外,在上海本地的点石论坛会员,想参加的可以报名志愿者,可以免费参加大会哦!
会议持续2天,时间暂定为2009年11月27,28号。
地址:浦东新区张江高科 蔡伦路333号
本次活动预期规模是500人,名额有限,报名从速!
如何报名参加点石大会?
目前仅接受电子邮件报名方式。请按照以下邮件格式给我们发送邮件: (接受报名邮件邮箱 robinliuchina@gmail.com)
邮件标题:某某报名参加2009年上海点石大会
邮件正文:必须包含以下信息
真实姓名:
公司名称: -便于我们了解参会公司情况
担任职务: -公司高管级别参会人员可能会受邀参加小范围聚会
手机号码: -用于紧急会务通知之用
附加留言: -你可以给我们提提建议,或者说说你希望的演讲内容等
问:.edu域名是否权重更大?
答:是的。但如果想通过edu网站作弊的话,别忘记Google里面工作的人可不是笨蛋。
问:如何对sliverslight进行SEO?
答:sliverlight SEO和flash一样,尽量使每一个内容都有对应一个URL。使用HTML,根据情况进行重定向,让搜索引擎看到HTML而用户看到富媒体内容。据可靠消息,微软已经着手优化sliverlight内容,使其更容易被搜索到。这里有一份sliverlight SEO参考文档。
问:针对最近nofollow变动,网站应该怎么做?
答:别反应过度,什么都不做就行了,等等看会有什么事情发生。nofollow作用的变化并不会使你的网站受到惩罚,你也没有必要仅仅因为nofollow算法的变动而去修改目前nofollow的页面。如果你一定要nofollow掉页面上的链接,将他们放在iframe里吧。博客评论其实也可以放在 iframe里面。
世界上第一个用于监测互联网发展规模的“机器人”程序是Matthew Gray开发的World wide Web Wanderer。刚开始它只用来统计互联网上的服务器数量,后来则发展为能够检索网站域名。
与Wanderer相对应,Martin Koster于1993年10月创建了ALIWEB,它是Archie的HTTP版本。ALIWEB不使用“机器人”程序,而是靠网站主动提交信息来建立自己的链接索引,类似于现在我们熟知的Yahoo。
随着互联网的迅速发展,使得检索所有新出现的网页变得越来越困难,因此,在Matthew Gray的Wanderer基础上,一些编程者将传统的“蜘蛛”程序工作原理作了些改进。其设想是,既然所有网页都可能有连向其他网站的链接,那么从跟踪一个网站的链接开始,就有可能检索整个互联网。到1993年底,一些基于此原理的搜索引擎开始纷纷涌现,其中以JumpStation、The World Wide Web Worm(Goto的前身,也就是今天Overture),和Repository-Based Software Engineering (RBSE) spider最负盛名。