<?xml version="1.0" standalone="yes"?>
<?xml-stylesheet type="text/xsl" href="css/rss.xslt"?>
<rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:trackback="http://madskills.com/public/xml/rss/module/trackback/" xmlns:wfw="http://wellformedweb.org/CommentAPI/" xmlns:slash="http://purl.org/rss/1.0/modules/slash/"><channel><title>杭州SEO策划博客-核桃SEO城堡 - 相关教程</title><link>http://www.abseo.cn/blog/</link><description>SEO策划 - </description><generator>RainbowSoft Studio Z-Blog 1.8 Walle Build 91204</generator><language>zh-CN</language><copyright>核桃-杭州SEO策划与网友交流SEO技巧,分享SEO教程,研究SEO方案    QQ：274949739    QQ群：46275434</copyright><pubDate>Sun, 05 Sep 2010 09:56:09 +0800</pubDate><item><title>核桃SEO：如何应对百度新站收录规则</title><author>a@b.com (核桃)</author><link>http://www.abseo.cn/blog/seo_teaching/115.html</link><pubDate>Wed, 05 Nov 2008 18:09:47 +0800</pubDate><guid>http://www.abseo.cn/blog/seo_teaching/115.html</guid><description><![CDATA[<p><strong>百度收录新站的状况：<br /></strong>无论如何，如果你想做一个新站，并且让百度正常收录的话，请做好15天的准备。<br />百度目前正常收录网站的周期在15天左右，当然，如果你的网站有较高权重的站点提供链接，也许你会比别人早点被放出百度的数据仓库。<br />点石论坛有会员在发表帖子时说有3天收录的案例，但绝大多数新站的收录周期都在15天左右。<br />在这15天里，你应该至少每三天更新一次内容几篇文章，或者至少每天增加一篇文章，让你的网站保持活力。<br />在网站被百度收录之前，你还必须要进行外链建设，在一个百度收录正常的网站上建立至少一条链接。接下来我介绍一些基本的链接建设方法。<br /><br /><strong>在自己的站上宣传：</strong><br />如果你有一个像<a target="_blank" href="http://www.abseo.cn/blog/"><a href="http://www.abseo.cn/" target="_blank">核桃</a>SEO<a href="http://www.abseo.cn/blog/" target="_blank">博客</a></a>这样的博客站点，你可以发一篇介绍新网站的文章，既可以增加自己博客的内容，也可以让你的新站URL容易被百度的蜘蛛碰到。<br />如果你觉得没有什么好写的，那么找一个与你新站有关的词进行创作或者进行内容的整理，然后发布到你的博客上，在文章中必要的关键词上面做一条链接到新网站。<br />当然，你也可以直接在网站的首页合适的位置放置你新网站的链接，都是可以的。<br /><a href="http://www.abseo.cn/" target="_blank">核桃</a>建议你在为新站宣传的时候用URL的文本链接形式<br />如：<a target="_blank" href="http://www.abseo.cn">www.abseo.cn</a><br />或者：<a target="_blank" href="http://www.abseo.cn">核桃SEO</a>（<a target="_blank" href="http://www.abseo.cn">www.abseo.cn</a>）<br />如果你的域名有这种直接的展示，将会极有可能在百度收录包含这个URL的网页时被认为传递一条链接给你的新网站，核桃将此看作是<strong>域名曝光度</strong>。通常用 <span style="color: #ff0000"><a target="_blank" href="http://www.baidu.com/s?word=domain:www%2Eabseo%2Ecn&amp;tn=baidu&amp;ie=gb2312&amp;ct=0">domain:www.abseo.cn</a></span> 这种形式在百度搜索时会表现出来。<br /><br /><strong>通过论坛签名或发帖进行宣传：</strong><br />如果你没有自己的站，那么核桃建议你可以在自己常去的论坛签名处或者可以供评论的网站里留下自己的的URL。<br />比如在论坛签名处加入自己的网站链接，然后找回帖量少的新帖进行回帖，以达到展示新站URL的目的，但是有一条要记住，如果你发布在需要登陆才能访问的版块，将不可能被搜索引擎的机器人找到你的帖子或者签名里的内容。所以一要记得在开放性的版块进行回帖或者发帖才有实际效果。<br /><br /><strong>通过博客或者网站评论进行宣传：</strong><br />如果你想进行网站或者博客评论，比如核桃的这个博客是可以输入URL评论的，在URL处填入你的新站地址然后发表你的评论，等到百度机器人访问或者更新你所评论的这个页面时，你的网址就会被机器人碰到，这时候就达到了让机器人找到你的目的。<br />当然，很多博客或者网站是不能留下链接的，有的博客的评论结果是JS代码调用的，那种评论里的链接是没有任何效果的，记得不要浪费自己的精力。<br />这里<a target="_blank" href="http://www.abseo.cn">核桃</a>还有个小提示，一般Z-BLOG评论都是可以填写自己的网址的，像核桃的这个博客的评论是直接以用户名为链接锚文字的，聪明的人应该知道这样的评论意味着可以使用关键词来做用户名称。<br />还有wordpress也就是大家简称为WP的博客，都是可以直接填写网址的，评论的链接形式跟核桃这个博客的形式完全一样，大家可以自己留意。<br />评论最好找最新发表的文章来评论，很老的文章也许要很久才会有一次搜索引擎更新周期，这样你会让自己的收录时间变长，因为机器人没有更新就无法找到你的网址。<br /><br /><strong>通过百度知道与百度帖吧宣传：<br /></strong>核桃觉得大家应该都知道这一点，核桃以前也写过诸如：<a target="_blank" href="http://www.abseo.cn/blog/hetao_seo/74.html"><strong>百度知道的注意事项</strong></a>&nbsp;的文章，但目前核桃不建议你进行这样的宣传，原因很简单，百度正在严格控制百度知道的链接流出量及回答问题的价值度，百度帖吧管理也越来越严格。<br />如果稍有失误，会造成自己的域名被百度加入黑名单，那么极有可能这个域名就无法再进入百度的收录列表，这是一个极大的风险。<br /><br /><strong>通过网摘或者DIGG进行宣传：<br /></strong>网摘大家都知道吧，DIGG应该也都知道，这两种形式的宣传还是比较好的，网摘核桃推荐<a target="_blank" href="http://cang.baidu.com/">百度收藏</a>、<a target="_blank" href="http://shuqian.qq.com/">QQ书签</a>、<a target="_blank" href="http://www.365key.com/">365KEY</a>等。DIGG只要找国内比较知名的DIGG站就行了，不过DIGG站要自己写文章，或者发表评论哦。<br /><br /><strong>向百度提交新网站的域名：<br /></strong>这是最后一条策略，但是核桃的建议是如果你的站内容不够丰富，并且做工粗糙，希望你打消这个念头，因为直接提交网址是会有人工审核的可能性存在的，虽然百度说是由机器人进行分析，但谁也不能打包票，毕竟我们不是百度管收录的员工，不会真正明白这些收录的规则。<br />如果你一定要提交，希望你最少有4-5个栏目，并且有20篇以上的可以供用户访问的页面，那么你可以制作一个htm文件形式的网站地图(不是XML地图)，然后将这个网站地图的URL提交给百度，不要直接提交域名地址。<br />百度提交的地址：<a target="_blank" href="http://www.baidu.com/search/url_submit.html">http://www.baidu.com/search/url_submit.html</a><br /><br /><strong>耐心地过15天再做其它打算：<br /></strong>是的，耐心！<br />这是很重要的，不要太浮躁，沉住气。只要你的站不是非法站点，请静下心来等待，在百度收录前一心一意地做好本文前面说的内容，不要每天一起床就去百度SITE，这样会让自己很累的，建议你建站一周以后再开始SITE。<br /><br /><strong>百度收录以后你应该做什么？<br /></strong><a target="_blank" href="http://www.abseo.cn">核桃</a>认为你在做网站之前应该要想清楚这些事情，否则你为什么要做这个站呢？<br />如果你真的没想过，现在开始想，想想你要为网民带来什么？或者你想为自己带来什么？<br />网站是为自己个人好玩还是想提供方便给网民，先看看你的潜在对手或者说你想模仿的人是怎么做的。</p>]]></description><category>相关教程</category><comments>http://www.abseo.cn/blog/seo_teaching/115.html#comment</comments><wfw:comment>http://www.abseo.cn/blog/</wfw:comment><wfw:commentRss>http://www.abseo.cn/blog/feed.asp?cmt=115</wfw:commentRss><trackback:ping>http://www.abseo.cn/blog/cmd.asp?act=tb&amp;id=115&amp;key=d81d9057</trackback:ping></item><item><title>SEO黑帽：群发的注意事项</title><author>a@b.com (核桃)</author><link>http://www.abseo.cn/blog/seo_teaching/73.html</link><pubDate>Tue, 11 Mar 2008 12:04:39 +0800</pubDate><guid>http://www.abseo.cn/blog/seo_teaching/73.html</guid><description><![CDATA[<p>这篇并不是要谈SEO黑帽手法，只是<a href="http://www.abseo.cn/" target="_blank">核桃</a>以前有一个列表要写一篇与此相关的文章罢了。<br />重点是一些<strong>注意事项</strong>，并不是操作黑帽。<br /><br /><a href="http://www.abseo.cn"><a href="http://www.abseo.cn/" target="_blank">核桃</a></a>对于黑帽手法所知并不多，在这里只谈下群发相关的事情。<br /><br /><strong>群发</strong>在目前来说还是有用的，对于GOOGLE来说群发的作用还是相当的大，但是群发相当于一颗地雷，哪天如果被搜索引擎发现你的网站有群发的迹象，那么会被毫不留情地降权，重者可能直接K站，让你这个网站永无出头之日！<br /><br />以前我有一个朋友，做过一个站，定位的关键词竞争相当大(百度前10页几乎都是域名级竞争)，当时他就采用了群发的手法。<br />他大约每天发200~400条垃圾评论或者是留言，通过书生以及其它一些群发软件进行。<br /><br />一个半月以后，<strong>群发</strong>的效果出现了，他的站在百度、谷歌的排名直线上升。最后在不到二个朋的时间里，他在百度排名第一，谷歌第二。当然，情况相当的不错！此时他的站PR从0已经到了2。雅虎外部链接达到1W5。</p><p>可是好景不长，百度在让他排名不到一个月的时间里，对他的首页进行了直接降权，K掉了首页！排名随之消失！<br />GOOGLE的惩罚比百度晚了将近半个月，最终还是降权了。<br /><br />我们并不能说这种降权是完全由<strong>群发</strong>引起的，但是可以确定群发绝对脱不了干系！<br /><br />过多的垃圾链接如果被发现，对自己的网站是没有任何好处的，<font color="#ff0000">况且如果是在操作竞争度很大的词，有可能是竞争对手直接投诉你，那样，群发的网站会死得更彻底！<br /></font><br /><font color="#ff0000">在群发的过程中，如果对<a href="http://www.abseo.cn/blog/" target="_blank">博客</a>垃圾<strong>群发</strong>太过头，可能会导致博客主的强烈反感，也有可能对你的网站进行投诉。<br /></font><br />当然，我就曾经遇到被人群发的情况，但是我没有投诉，而是把所有相关的评论全部删除了。<br /><br /><font color="#0000ff">回过头来想一下，如果百度刚好在删除前收录了这些页面，并且为群发的网站返回了权重，当百度再一次更新的时候，那些评论中的链接已经不见了，可想而知的是百度蜘蛛会很清楚地感到群发网站的链接资源正在大规模流失，它肯定会给一个很明显的降权观察时间，如果网站撑不过这个时间，没有采取措施，那么这个站可以就被永久性惩罚！<br /></font><br />所以，<strong>群发</strong>如果要进行，一定要慎之又慎，并且随时要检查自己的外部链接情况。当然，核桃的<a href="http://www.abseo.cn">SEO</a>建议是最好不要用群发！<br /><br /><strong>作者：核桃<br />首发：</strong><a href="http://www.abseo.cn"><strong>www.abseo.cn</strong></a><br /><strong>原文：</strong><a href="http://www.abseo.cn/blog/seo_teaching/73.html"><strong>http://www.abseo.cn/blog/seo_teaching/73.html</strong></a><br /><strong><a href="http://www.abseo.cn/blog/hetao_seo/95.html" target="_blank">原创</a>文章,转载请注明原文出处！</strong><br /></p>]]></description><category>相关教程</category><comments>http://www.abseo.cn/blog/seo_teaching/73.html#comment</comments><wfw:comment>http://www.abseo.cn/blog/</wfw:comment><wfw:commentRss>http://www.abseo.cn/blog/feed.asp?cmt=73</wfw:commentRss><trackback:ping>http://www.abseo.cn/blog/cmd.asp?act=tb&amp;id=73&amp;key=988f14d0</trackback:ping></item><item><title>SEOer发展指南(清晰版)</title><author>a@b.com (核桃)</author><link>http://www.abseo.cn/blog/seo_teaching/71.html</link><pubDate>Tue, 04 Mar 2008 18:15:02 +0800</pubDate><guid>http://www.abseo.cn/blog/seo_teaching/71.html</guid><description><![CDATA[<p>自认为是SEO高手？从SEO流程到SEO技术都了如指掌？手里有丰富的资源可以利用？好吧，可能你现在什么都不缺，但你绝对需要坐下来想想未来的发展。不要觉得这很简单，即使是SEO老手也是在一到两年以后才开始找准自己的位置。</p><p>SEOer应该从了解自己开始。每天都在做关键词分析、流量分析&hellip;可你分析过自己吗？你做的事、走的路是否适合自己？还在每天采集别人的内容骗流量变现？还在做着自己并无兴趣的业务？这样的生活有意义有意思吗？停下来吧，先把自己当作研究课题分析一下。下面有清晰的步骤帮助你。<br /><br /><img onload="ResizeImage(this,520)" src="http://www.abseo.cn/blog/upload/way-to-go-seo-1.gif" alt="" title=""/><strong></strong><strong><br />1.你对什么感兴趣<br /></strong>发现自己的兴趣并不难，除非你是一个非常无聊的人。<br />站起来看看自己的房间或者工作台，周围都放了些什么玩意，书柜里摆了什么书，桌上放着什么杂志，或是你有些什么收集？<br />如果你并没有多少书和杂志，也从没收集品，那就打开你的浏览器收藏夹和BLOG订阅软件，看看里面都有些什么网站和BLOG？无数的办法都能找到你的兴趣点。<br />拿我举例：我有不少书，可这些书并不集中在某一主题。游记、自传、小说、漫画&hellip;我很难从这些书的类别里找到我的兴趣。也许你遇到和我一样的情况，所以我们现在需要跳转到第二个&ldquo;点&rdquo;&hellip;&nbsp;&nbsp;</p><p>&nbsp;</p><p><strong>2.你擅长做什么</strong><br />有时你擅长一件自己并不喜欢的事，在这里我们排除他，只考虑你喜欢的、又擅长的事。<br />不要相信自己的错觉。也许你的专业是生物学，但科隆一只猪绝对不是你的特长。<br />找到特长的科学方法是注意一下&ldquo;身边的朋友和家人经常向自己咨询什么问题&rdquo;。如果你的妹妹经常打你电话问&ldquo;为什么我又上不了网了？&rdquo;，你就该想到这也许是你擅长的&mdash;&mdash;虽然作一名出色的网络修理工并不是你的梦想。如果你身边的同事有时会问你&ldquo;怎么连上公司的无线网络？&rdquo;，那你就更该加深印象，你也许真的是个网络修理工的好坯子。<br />好了，现在你就应该马上开始<a href="http://www.abseo.cn/blog/" target="_blank">策划</a>、和建设一个主题为&ldquo;电脑上网问题大全&rdquo;的网站或是Blog了。<br />不过请等一下，你一定不想白白付出自己的精力、甚至一些钱去买虚拟主机、域名什么的，所以我们应该再考虑一下&ldquo;做什么能赚钱&rdquo;。</p><p><strong>3.考虑做什么能赚钱</strong><br />做网站是一件绝对好玩的事，你可以照自己的想象去安排一切。<br />网上也有不少吹牛吹上天的赚钱方式。广告联盟、手机铃声、销售联盟、软件下载分成&hellip;你可以随意去做，但你不可能赚得比你上家多，因为更多的利润都上家拿走&mdash;&mdash;这是真实版的剥削故事。<br />也许你是个会做些手工艺品、又喜欢去做，那就自己销售它们吧；<br />或者你对<a href="http://www.abseo.cn/blog/" target="_blank">博客</a>营销很在行，那就向别人提供顾问服务好了；<br />如果你会开发软件，又懂SEO，那就做些软件去卖&mdash;&mdash;其他的SEOer想要一个有用的软件都想疯了。<br />这些例子我是随便举的，我想告诉你的事一定不要待在生物链的最底层。</p><p><strong>4.你该做什么？ <br /><br /></strong></p><p><img onload="ResizeImage(this,520)" src="http://www.abseo.cn/blog/upload/way-to-go-seo-2.gif" alt="" title=""/><br /><br />没有比这更简单的了，但你从没仔细想过对吗？<br /><a target="_blank" rel="nofollow" href="http://www.seoclass.biz/"><font color="#800080">SEO培训</font></a>中心祝每个SEOer都能有好发展。</p><strong><p>&nbsp;</p><p><strong>-版权声明-<br /></strong>本文：<a target="_blank" rel="nofollow" href="http://www.seoclass.biz/blog/archives/seoer%e5%8f%91%e5%b1%95%e6%8c%87%e5%8d%97%e6%b8%85%e6%99%b0%e7%89%88/"><font color="#800080">SEOer发展指南(清晰版)<br /></font></a>作者：<a target="_blank" rel="nofollow" href="http://www.seoclass.biz/"><font color="#005599">SEO培训中心</font></a></p></strong>]]></description><category>相关教程</category><comments>http://www.abseo.cn/blog/seo_teaching/71.html#comment</comments><wfw:comment>http://www.abseo.cn/blog/</wfw:comment><wfw:commentRss>http://www.abseo.cn/blog/feed.asp?cmt=71</wfw:commentRss><trackback:ping>http://www.abseo.cn/blog/cmd.asp?act=tb&amp;id=71&amp;key=2334f121</trackback:ping></item><item><title>SEO知识：中文分词 一篇关于中文分词算法的SEO必看文章</title><author>a@b.com (核桃)</author><link>http://www.abseo.cn/blog/seo_teaching/65.html</link><pubDate>Tue, 04 Dec 2007 17:34:10 +0800</pubDate><guid>http://www.abseo.cn/blog/seo_teaching/65.html</guid><description><![CDATA[<a href="http://www.abseo.cn/" target="_blank">核桃</a>今天把这篇文章转过来作为收藏了，SEO<a href="http://www.abseo.cn/blog/seo_teaching/baidu_fenci.html" target="_blank">分词</a>的研究相当相当重要，可以说如果不拼资源的话，就要看谁对分词了解透彻了，细节决定一切，中文分词显得尤其重要。这篇是学习SEO进入中、高级研究的必读文章。<br /><br />之前的一篇：<a target="_blank" href="http://www.abseo.cn/blog/seo_teaching/baidu_fenci.html">http://www.abseo.cn/blog/seo_teaching/baidu_fenci.html</a><br /><h3 align="center">SEO知识：中文分词</h3><p>搜索引擎技术的研究，国外比中国要早近十年，从最早的Archie，到后来的Excite，以及altvista、overture、google等搜索引擎面世，搜索引擎发展至今，已经有十几年的历史，而国内开始研究搜索引擎是在上世纪末本世纪初。在许多领域，都是国外的产品和技术一统天下，特别是当某种技术在国外研究多年而国内才开始的情况下。例如操作系统、字处理软件、浏览器等等，但搜索引擎却是个例外。虽然在国外搜索引擎技术早就开始研究，但在国内还是陆续涌现出优秀的搜索引擎，像百度（<a target="_blank" href="http://www.baidu.com/"><font color="#800080">http://www.baidu.com</font></a>）、中搜（<a target="_blank" href="http://www.zhongsou.com/"><font color="#800080">http://www.zhongsou.com</font></a>）等。目前在中文搜索引擎领域，国内的搜索引擎已经和国外的搜索引擎效果上相差不远。之所以能形成这样的局面，有一个重要的原因就在于中文和英文两种语言自身的书写方式不同，这其中对于计算机涉及的技术就是中文分词。</p><p><strong>什么是中文分词</strong></p><p>众所周知，英文是以词为单位的，词和词之间是靠空格隔开，而中文是以字为单位，句子中所有的字连起来才能描述一个意思。例如，英文句子I am a student，用中文则为：&ldquo;我是一个学生&rdquo;。计算机可以很简单通过空格知道student是一个单词，但是不能很容易明白&ldquo;学&rdquo;、&ldquo;生&rdquo;两个字合起来才表示一个词。把中文的汉字序列切分成有意义的词，就是中文分词，有些人也称为切词。我是一个学生，分词的结果是：我 是 一个 学生。</p><p>&nbsp;&nbsp;&nbsp; <strong>中文分词和搜索引擎</strong></p><p>&nbsp;&nbsp;&nbsp; 中文分词到底对搜索引擎有多大影响？对于搜索引擎来说，最重要的并不是找到所有结果，因为在上百亿的网页中找到所有结果没有太多的意义，没有人能看得完，最重要的是把最相关的结果排在最前面，这也称为相关度排序。中文分词的准确与否，常常直接影响到对搜索结果的相关度排序。笔者最近替朋友找一些关于日本和服的资料，在搜索引擎上输入&ldquo;和服&rdquo;，得到的结果就发现了很多问题。下面就以这个例子来说明分词对搜索结果的影响，在现有三个中文搜索引擎上做测试，测试方法是直接在Google（<a target="_top" href="http://www.google.com/"><font color="#800080">http://www.google.com</font></a>）、百度（<a target="_blank" href="http://www.baidu.com/"><font color="#800080">http://www.baidu.com</font></a>）、中搜（<a target="_blank" href="http://www.zhongsou.com/"><font color="#800080">http://www.zhongsou.com</font></a>）上以&ldquo;和服&rdquo;为关键词进行搜索：</p><p>&nbsp;&nbsp;&nbsp; <u>在Google上输入&ldquo;和服&rdquo;搜索所有中文简体网页，总共结果507,000条，前20条结果中有14条与和服一点关系都没有。在第一页就有以下错误：</u></p><div style="BORDER-RIGHT: #cccccc 1px solid; PADDING-RIGHT: 5px; BORDER-TOP: #cccccc 1px solid; PADDING-LEFT: 5px; BACKGROUND: #f3f3f3; PADDING-BOTTOM: 5px; MARGIN: 5px 20px; BORDER-LEFT: #cccccc 1px solid; PADDING-TOP: 5px; BORDER-BOTTOM: #cccccc 1px solid"><p>&nbsp;&nbsp;&nbsp; &ldquo;通信信息报：瑞星以技术和服务开拓网络安全市场&rdquo;</p><p>&nbsp;&nbsp;&nbsp; &ldquo;使用纯HTML的通用数据管理和服务- 开发者- ZDNet ...&rdquo;</p><p>&nbsp;&nbsp;&nbsp; &ldquo;陈慧琳《心口不一》化妆和服装自己包办&rdquo;</p><p>&nbsp;&nbsp;&nbsp; &ldquo;::外交部：中国境外领事保护和服务指南(2003年版) ...&rdquo;</p><p>&nbsp;&nbsp;&nbsp; &ldquo;产品和服务&rdquo;</p></div><p>&nbsp;&nbsp;&nbsp; 等等。第一页只有三篇是真正在讲&ldquo;和服&rdquo;的结果。</p><p>&nbsp;&nbsp;&nbsp; <u>在百度上输入&ldquo;和服&rdquo;搜索网页，总共结果为287,000条，前20条结果中有6条与和服一点关系都没有。在第一页有以下错误：</u></p><div style="BORDER-RIGHT: #cccccc 1px solid; PADDING-RIGHT: 5px; BORDER-TOP: #cccccc 1px solid; PADDING-LEFT: 5px; BACKGROUND: #f3f3f3; PADDING-BOTTOM: 5px; MARGIN: 5px 20px; BORDER-LEFT: #cccccc 1px solid; PADDING-TOP: 5px; BORDER-BOTTOM: #cccccc 1px solid"><p>&nbsp;&nbsp;&nbsp; &ldquo;福建省晋江市恒和服装有限公司系独资企业&rdquo;</p><p>&nbsp;&nbsp;&nbsp; &ldquo;关于商品和服务实行明码标价的规定&rdquo;</p><p>&nbsp;&nbsp;&nbsp; &ldquo;青岛东和服装设备&rdquo;</p></div><p>&nbsp;&nbsp;&nbsp; <u>在中搜上输入&ldquo;和服&rdquo;搜索网页，总共结果为26,917条，前20条结果都是与和服相关的网页。</u></p><p>&nbsp;&nbsp;&nbsp; 这次搜索引擎结果中的错误，就是由于分词的不准确所造成的。通过笔者的了解，Google的中文分词技术采用的是美国一家名叫Basis Technology（<a target="_blank" href="http://www.basistech.com/">http://www.basistech.com</a>）的公司提供的中文分词技术，百度使用的是自己公司开发的分词技术，中搜使用的是国内海量科技（<a target="_blank" href="http://www.hylanda.com/">http://www.hylanda.com</a>）提供的分词技术。由此可见，中文分词的准确度，对搜索引擎结果相关性和准确性有相当大的关系。</p><p>&nbsp;&nbsp;&nbsp; <strong>中文分词技术</strong></p><p>&nbsp;&nbsp;&nbsp; 中文分词技术属于自然语言处理技术范畴，对于一句话，人可以通过自己的知识来明白哪些是词，哪些不是词，但如何让计算机也能理解？其处理过程就是分词算法。</p><p>&nbsp;&nbsp;&nbsp; 现有的分词算法可分为三大类：基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。</p><p>&nbsp;&nbsp;&nbsp; <u>1、基于字符串匹配的分词方法</u></p><p>&nbsp;&nbsp;&nbsp; 这种方法又叫做机械分词方法，它是按照一定的策略将待分析的汉字串与一个&ldquo;充分大的&rdquo;机器词典中的词条进行配，若在词典中找到某个字符串，则匹配成功（识别出一个词）。按照扫描方向的不同，串匹配分词方法可以分为正向匹配和逆向匹配；按照不同长度优先匹配的情况，可以分为最大（最长）匹配和最小（最短）匹配；按照是否与词性标注过程相结合，又可以分为单纯分词方法和分词与标注相结合的一体化方法。常用的几种机械分词方法如下：</p><p>&nbsp;&nbsp;&nbsp; 1）正向最大匹配法（由左到右的方向）；</p><p>&nbsp;&nbsp;&nbsp; 2）逆向最大匹配法（由右到左的方向）；</p><p>&nbsp;&nbsp;&nbsp; 3）最少切分（使每一句中切出的词数最小）。</p><p>&nbsp;&nbsp;&nbsp; 还可以将上述各种方法相互组合，例如，可以将正向最大匹配方法和逆向最大匹配方法结合起来构成双向匹配法。由于汉语单字成词的特点，正向最小匹配和逆向最小匹配一般很少使用。一般说来，逆向匹配的切分精度略高于正向匹配，遇到的歧义现象也较少。统计结果表明，单纯使用正向最大匹配的错误率为1/169，单纯使用逆向最大匹配的错误率为1/245。但这种精度还远远不能满足实际的需要。实际使用的分词系统，都是把机械分词作为一种初分手段，还需通过利用各种其它的语言信息来进一步提高切分的准确率。</p><p>&nbsp;&nbsp;&nbsp; 一种方法是改进扫描方式，称为特征扫描或标志切分，优先在待分析字符串中识别和切分出一些带有明显特征的词，以这些词作为断点，可将原字符串分为较小的串再来进机械分词，从而减少匹配的错误率。另一种方法是将分词和词类标注结合起来，利用丰富的词类信息对分词决策提供帮助，并且在标注过程中又反过来对分词结果进行检验、调整，从而极大地提高切分的准确率。</p><p>&nbsp;&nbsp;&nbsp; 对于机械分词方法，可以建立一个一般的模型，在这方面有专业的学术论文，这里不做详细论述。</p><p>&nbsp;&nbsp;&nbsp; <u>2、基于理解的分词方法</u></p><p>&nbsp;&nbsp;&nbsp; 这种分词方法是通过让计算机模拟人对句子的理解，达到识别词的效果。其基本思想就是在分词的同时进行句法、语义分析，利用句法信息和语义信息来处理歧义现象。它通常包括三个部分：分词子系统、句法语义子系统、总控部分。在总控部分的协调下，分词子系统可以获得有关词、句子等的句法和语义信息来对分词歧义进行判断，即它模拟了人对句子的理解过程。这种分词方法需要使用大量的语言知识和信息。由于汉语语言知识的笼统、复杂性，难以将各种语言信息组织成机器可直接读取的形式，因此目前基于理解的分词系统还处在试验阶段。</p><p>&nbsp;&nbsp;&nbsp; <u>3、基于统计的分词方法</u></p><p>&nbsp;&nbsp;&nbsp; 从形式上看，词是稳定的字的组合，因此在上下文中，相邻的字同时出现的次数越多，就越有可能构成一个词。因此字与字相邻共现的频率或概率能够较好的反映成词的可信度。可以对语料中相邻共现的各个字的组合的频度进行统计，计算它们的互现信息。定义两个字的互现信息，计算两个汉字X、Y的相邻共现概率。互现信息体现了汉字之间结合关系的紧密程度。当紧密程度高于某一个阈值时，便可认为此字组可能构成了一个词。这种方法只需对语料中的字组频度进行统计，不需要切分词典，因而又叫做无词典分词法或统计取词方法。但这种方法也有一定的局限性，会经常抽出一些共现频度高、但并不是词的常用字组，例如&ldquo;这一&rdquo;、&ldquo;之一&rdquo;、&ldquo;有的&rdquo;、&ldquo;我的&rdquo;、&ldquo;许多的&rdquo;等，并且对常用词的识别精度差，时空开销大。实际应用的统计分词系统都要使用一部基本的分词词典（常用词词典）进行串匹配分词，同时使用统计方法识别一些新的词，即将串频统计和串匹配结合起来，既发挥匹配分词切分速度快、效率高的特点，又利用了无词典分词结合上下文识别生词、自动消除歧义的优点。</p><p>&nbsp;&nbsp;&nbsp; 到底哪种分词算法的准确度更高，目前并无定论。对于任何一个成熟的分词系统来说，不可能单独依靠某一种算法来实现，都需要综合不同的算法。笔者了解，海量科技的分词算法就采用&ldquo;复方分词法&rdquo;，所谓复方，相当于用中药中的复方概念，即用不同的药才综合起来去医治疾病，同样，对于中文词的识别，需要多种算法来处理不同的问题。</p><p>&nbsp;&nbsp;&nbsp; <strong>分词中的难题</strong></p><p>&nbsp;&nbsp;&nbsp; 有了成熟的分词算法，是否就能容易的解决中文分词的问题呢？事实远非如此。中文是一种十分复杂的语言，让计算机理解中文语言更是困难。在中文分词过程中，有两大难题一直没有完全突破。</p><p>&nbsp;&nbsp;&nbsp; <u>1、歧义识别</u></p><p>&nbsp;&nbsp;&nbsp; 歧义是指同样的一句话，可能有两种或者更多的切分方法。例如：表面的，因为&ldquo;表面&rdquo;和&ldquo;面的&rdquo;都是词，那么这个短语就可以分成&ldquo;表面 的&rdquo;和&ldquo;表 面的&rdquo;。这种称为交叉歧义。像这种交叉歧义十分常见，前面举的&ldquo;和服&rdquo;的例子，其实就是因为交叉歧义引起的错误。&ldquo;化妆和服装&rdquo;可以分成&ldquo;化妆 和 服装&rdquo;或者&ldquo;化妆 和服 装&rdquo;。由于没有人的知识去理解，计算机很难知道到底哪个方案正确。</p><p>&nbsp;&nbsp;&nbsp; 交叉歧义相对组合歧义来说是还算比较容易处理，组合歧义就必需根据整个句子来判断了。例如，在句子&ldquo;这个门把手坏了&rdquo;中，&ldquo;把手&rdquo;是个词，但在句子&ldquo;请把手拿开&rdquo;中，&ldquo;把手&rdquo;就不是一个词；在句子&ldquo;将军任命了一名中将&rdquo;中，&ldquo;中将&rdquo;是个词，但在句子&ldquo;产量三年中将增长两倍&rdquo;中，&ldquo;中将&rdquo;就不再是词。这些词计算机又如何去识别?</p><p>&nbsp;&nbsp;&nbsp; 如果交叉歧义和组合歧义计算机都能解决的话，在歧义中还有一个难题，是真歧义。真歧义意思是给出一句话，由人去判断也不知道哪个应该是词，哪个应该不是词。例如：&ldquo;乒乓球拍卖完了&rdquo;，可以切分成&ldquo;乒乓 球拍 卖 完 了&rdquo;、也可切分成&ldquo;乒乓球 拍卖 完 了&rdquo;，如果没有上下文其他的句子，恐怕谁也不知道&ldquo;拍卖&rdquo;在这里算不算一个词。</p><p>&nbsp;&nbsp;&nbsp; <u>2、新词识别</u></p><p>&nbsp;&nbsp;&nbsp; 新词，专业术语称为未登录词。也就是那些在字典中都没有收录过，但又确实能称为词的那些词。最典型的是人名，人可以很容易理解句子&ldquo;王军虎去广州了&rdquo;中，&ldquo;王军虎&rdquo;是个词，因为是一个人的名字，但要是让计算机去识别就困难了。如果把&ldquo;王军虎&rdquo;做为一个词收录到字典中去，全世界有那么多名字，而且每时每刻都有新增的人名，收录这些人名本身就是一项巨大的工程。即使这项工作可以完成，还是会存在问题，例如：在句子&ldquo;王军虎头虎脑的&rdquo;中，&ldquo;王军虎&rdquo;还能不能算词？</p><p>&nbsp;&nbsp;&nbsp; 新词中除了人名以外，还有机构名、地名、产品名、商标名、简称、省略语等都是很难处理的问题，而且这些又正好是人们经常使用的词，因此对于搜索引擎来说，分词系统中的新词识别十分重要。目前新词识别准确率已经成为评价一个分词系统好坏的重要标志之一。</p><p>&nbsp;&nbsp;&nbsp; <strong>中文分词的应用</strong></p><p>&nbsp;&nbsp;&nbsp; 目前在自然语言处理技术中，中文处理技术比西文处理技术要落后很大一段距离，许多西文的处理方法中文不能直接采用，就是因为中文必需有分词这道工序。中文分词是其他中文信息处理的基础，搜索引擎只是中文分词的一个应用。其他的比如机器翻译（MT）、语音合成、自动分类、自动摘要、自动校对等等，都需要用到分词。因为中文需要分词，可能会影响一些研究，但同时也为一些企业带来机会，因为国外的计算机处理技术要想进入中国市场，首先也是要解决中文分词问题。在中文研究方面，相比外国人来说，中国人有十分明显的优势。</p><p>&nbsp;&nbsp;&nbsp; 分词准确性对搜索引擎来说十分重要，但如果分词速度太慢，即使准确性再高，对于搜索引擎来说也是不可用的，因为搜索引擎需要处理数以亿计的网页，如果分词耗用的时间过长，会严重影响搜索引擎内容更新的速度。因此对于搜索引擎来说，分词的准确性和速度，二者都需要达到很高的要求。目前研究中文分词的大多是科研院校，清华、北大、中科院、北京语言学院、东北大学、IBM研究院、微软中国研究院等都有自己的研究队伍，而真正专业研究中文分词的商业公司除了海量科技以外，几乎没有了。科研院校研究的技术，大部分不能很快产品化，而一个专业公司的力量毕竟有限，看来中文分词技术要想更好的服务于更多的产品，还有很长一段路。<br /><br />本文来自<a target="_blank" href="http://blog.csdn.net/tember/archive/2006/02/19/602622.aspx">http://blog.csdn.net/tember/archive/2006/02/19/602622.aspx</a><br /></p>]]></description><category>相关教程</category><comments>http://www.abseo.cn/blog/seo_teaching/65.html#comment</comments><wfw:comment>http://www.abseo.cn/blog/</wfw:comment><wfw:commentRss>http://www.abseo.cn/blog/feed.asp?cmt=65</wfw:commentRss><trackback:ping>http://www.abseo.cn/blog/cmd.asp?act=tb&amp;id=65&amp;key=e58ed184</trackback:ping></item><item><title>SEO要读懂网站日志中的搜索引擎蜘蛛返回HTTP状态代码</title><author>a@b.com (核桃)</author><link>http://www.abseo.cn/blog/seo_teaching/http-code-seo.html</link><pubDate>Thu, 08 Nov 2007 08:13:40 +0800</pubDate><guid>http://www.abseo.cn/blog/seo_teaching/http-code-seo.html</guid><description><![CDATA[SEO一定要学会读懂网站日志中的搜索引擎蜘蛛返回HTTP状态代码。今天<a href="http://www.abseo.cn/"><a href="http://www.abseo.cn/" target="_blank">核桃</a></a>把这篇：《网站日志返回HTTP状态代码及其定义分析大全》转载过来让大家看看，了解下<a href="http://www.abseo.cn/">SEO</a>最基础的日志分析要掌握的内容。很重要的啊，学会看这些HTTP返回代码，能够明确搜索引擎的蜘蛛到底对这个页面如何进行的分析以及你应该如何应对，对于做好SEO来说有相当大的帮助！<br /><br /><p>网站日志返回HTTP状态代码及其定义<br />比如说：<br />2004-12-03 07:33:25 61.135.145.208 - *.*.*.* 80 GET /index/119.htm - 304 Baiduspider+(+<a title="http://www.baidu.com/search/spider.htm" href="http://www.baidu.com/search/spider.htm" target="_blank">http://www.baidu.com/search/spider.htm</a>)<br />这就意味着百度蜘蛛在2004-12-03 07:33:25爬过/index/119.htm这一页，它发现这页是没有更新过的。<br /><br />再比如说：2004-12-03 07:33:25 61.135.145.208 - *.*.*.* 80 GET /index/120.htm - Googlebot/2.1<br />(<a title="http://www.google.com/bot.html" href="http://www.google.com/bot.html" target="_blank">http://www.google.com/bot.html</a>)<br />这就意味着Google蜘蛛在2004-12-03 07:33:25爬过/index/119.htm这一页，它发现这页是新的，并全部爬完<br /><br />所有HTTP状态代码及其定义-看不懂IIS日志的进来<br /><br />代码 指示<br />2xx 成功<br />200 正常；请求已完成。<br />201 正常；紧接 POST 命令。<br />202 正常；已接受用于处理，但处理尚未完成。<br />203 正常；部分信息 &mdash; 返回的信息只是一部分。<br />204 正常；无响应 &mdash; 已接收请求，但不存在要回送的信息。<br />3xx 重定向<br />301 已移动 &mdash; 请求的数据具有新的位置且更改是永久的。<br />302 已找到 &mdash; 请求的数据临时具有不同 URI。<br />303 请参阅其它 &mdash; 可在另一 URI 下找到对请求的响应，且应使用 GET 方法检索此响应。<br />304 未修改 &mdash; 未按预期修改文档。<br />305 使用代理 &mdash; 必须通过位置字段中提供的代理来访问请求的资源。<br />306 未使用 &mdash; 不再使用；保留此代码以便将来使用。<br />4xx 客户机中出现的错误<br />400 错误请求 &mdash; 请求中有语法问题，或不能满足请求。<br />401 未授权 &mdash; 未授权客户机访问数据。<br />402 需要付款 &mdash; 表示计费系统已有效。<br />403 禁止 &mdash; 即使有授权也不需要访问。<br />404 找不到 &mdash; 服务器找不到给定的资源；文档不存在。<br />407 代理认证请求 &mdash; 客户机首先必须使用代理认证自身。<br />410 请求的网页不存在(永久)；<br />415 介质类型不受支持 &mdash; 服务器拒绝服务请求，因为不支持请求实体的格式。<br />5xx 服务器中出现的错误<br />500 内部错误 &mdash; 因为意外情况，服务器不能完成请求。<br />501 未执行 &mdash; 服务器不支持请求的工具。<br />502 错误网关 &mdash; 服务器接收到来自上游服务器的无效响应。<br />503 无法获得服务 &mdash; 由于临时过载或维护，服务器无法处理请求。<br /><br /><strong>网站日志返回HTTP状态代码及其定义分析大全</strong><br /><br />原文：<a title="http://www.dunsh.org/forums/thread-13016-1-1.html" href="http://www.dunsh.org/forums/thread-13016-1-1.html" target="_blank">http://www.dunsh.org/forums/thread-13016-1-1.html</a> </p>]]></description><category>相关教程</category><comments>http://www.abseo.cn/blog/seo_teaching/http-code-seo.html#comment</comments><wfw:comment>http://www.abseo.cn/blog/</wfw:comment><wfw:commentRss>http://www.abseo.cn/blog/feed.asp?cmt=50</wfw:commentRss><trackback:ping>http://www.abseo.cn/blog/cmd.asp?act=tb&amp;id=50&amp;key=fb32e07c</trackback:ping></item><item><title>SEO必读知识:沙盒,炸弹,幽灵,金三角,连坐等现象</title><author>a@b.com (核桃)</author><link>http://www.abseo.cn/blog/seo_teaching/51.html</link><pubDate>Wed, 07 Nov 2007 00:27:41 +0800</pubDate><guid>http://www.abseo.cn/blog/seo_teaching/51.html</guid><description><![CDATA[这篇文章是蜘蛛写的，很具有代表性，这些现象直接影响着SEO的效果。推荐大家学习下！<br /><br /><strong>SEO培训:沙盒炸弹来自幽灵的金三角连坐区域</strong><br /><br />先说一些题外话.<a href="http://www.abseo.cn/">seo</a>=<a href="http://www.abseo.cn/blog/seo_teaching/shen_me_shi_seo.html" target="_blank">搜索引擎优化</a>.那么&quot;seo优化&quot;是什么意思?为什么还有那么多人把&quot;seo优化&quot;当作自己网站和<a href="http://www.abseo.cn/blog/" target="_blank">博客</a>的标题?如果纯粹是为了seo而这样做,似乎不值的.建议大家搜索一下&quot;seo优化&quot;,如果哪个站点用这个词组做标题,那么里面的文章可以暂时忽略了,节省一下时间.<br /><br />本文是让大家对一些常见的搜索引擎现象做一个了解.&quot;炸弹来自幽灵的金三角连坐沙盒区域&quot;无实际意义,仅为连贯,方便阅读.句子包含了&quot;炸弹&quot;,&quot;幽灵&quot;,&quot;金三角&quot;,&quot;连坐&quot;,&quot;沙盒&quot;等几个常见搜索引擎现象.seo培训博客整理出来,供大家参考.以下内容使用词语特指引擎含义.<br /><br /><strong>一: 沙盒<br /></strong><br />什么是沙盒? 沙盒的意思是通常指新网站在前期很难在google有好的排名.一般时间限制在6个月左右.<br /><br />为什么进入沙盒? 一般进入沙盒的原因是网站突然增加了大量的外部连接.尤其是垃圾连接.这样的话更严重.<br /><br />如果走出沙盒? 至今除了等待没有好的办法.传说中给不同页面增加外部连接会减少沙盒时间.<br /><br />沙盒概论:至于沙盒,大家应该都有所耳闻.很多朋友虽然不了解seo,但是也对这个词语熟悉.沙盒现象虽然没有被各个搜索引擎官方承认,但是已经深入人心.大部分<a href="http://www.abseo.cn/">seo</a>er都遇到过这个现象.一般大家提到沙盒指的是google沙盒.但是在雅虎,这个现象也是应该存在的.seo培训博客(开站两周)现在应该也在yahoo沙盒中.在百度这个现象最近一段时间也有蔓延的趋势,很多新站,百度会刻意压制,不过所幸的是时间比较短,一般在25天左右.<br /><br /><strong>二: 炸弹</strong><br /><br />什么是炸弹? 炸弹的意思是通过建立大量的外部连接,锚文本(连接文字)全部为关键字.致使网站强行上升排名.<br /><br />为什么会存在炸弹? 因为现在搜索引擎算法问题,大量的锚文本让引擎误认为某个网站是最符合搜索请求的页面.<br /><br />如何使用炸弹? 给大家两个建议.如果有钱,就买高质量的友情连接.否则就自己去制造连接.重点在于连接数量和锚文本.<br /><br />炸弹概论:炸弹的最高境界就是可以让一个与关键字毫无关系,甚至不出现关键字的网站排名第一.炸弹现象几乎在所有的引擎里都有效,是黑帽seo的重要手法之一,因为炸弹现象起效快.但如果没有其他方法做辅助,排名下降也快.虽然google反作弊小组声明已经解决了google炸弹问题,但似乎改进的效果不太好.单独最近一周,我就发现了两个站点使用google炸弹获取了排名.现在在yahoo里,炸弹现象比较严重.至于百度,也存在炸弹现象.不过百度人工干预厉害,稍微好点.<br /><br /><strong>三: 幽灵</strong><br /><br />什么是幽灵? 幽灵指的是新站排名不稳定,忽高忽低的现象.<br /><br />为什么会出现幽灵? 这个主要是因为搜索引擎防止作弊造成的.还一个因素就是网站的权重问题.<br /><br />如何避免幽灵现象? 没有好的办法,网站年龄给限制着.不过大家可以争取做高质量的连接巩固排名.<br /><br />幽灵概论:一般大家提到幽灵都是指的在google里的现象.不过,幽灵现象在百度比较严重.很多网站某一段时间关键字排名很好,可突然下降,甚至无影无踪.雅虎一般不会出现太强的幽灵现象,至少做yahoo的时候几乎没有遇到过. QQ上每天都会被会员问很多次,我比较懒,以后不再对这样的问题做回答了. 解决幽灵现象最佳的也可以说唯一的方法,那就是加强外部连接建设.尤其是应该多做同类站点的连接.<br /><br /><strong>四: 连坐</strong><br /><br />什么是连坐? 连坐是古代一种刑法,在这里指的是被其他网站牵连.<br /><br />为什么会出现连坐现象? 同样是搜索引擎防止作弊,为了避免连接工厂的泛滥.<br /><br />如何避免连坐现象? 如果是因为你和一些网站交换友情连接造成的,那么取消就可以了.如果是群发造成的,那么你自己想办法吧!<br /><br />连坐概论:连坐效应在百度最严重.google是比较宽宏大量的,google反作弊小组对这种行为的回答很模糊,但是至少可以确定的是不会刻意乱杀无辜.建议大家不要过多使用黑帽seo手段.如果群发<br /><br />垃圾连接,造成连坐现象那么几乎是无法补救的.很多网站莫名其妙的被降权,也都是因为连坐的原因,不过很多人都忽略了这个原因. 我从来没有使用过群发工具.(当然,其中一个原因是一直没有找到好用的工具.) ^_^ <br /><br /><br /><strong>五: 金三角<br /></strong><br />什么是金三角? 金三角指的是google抓取关键字重点位置一般分布在页面左上,呈三角形.<br /><br />为什么会出现金三角? 我感觉这个现象没有太大研究价值,只不过大部分网站制作格局造成的.<br /><br />如何使用金三角现象? 不用刻意追求.金三角只是一个大家猜测的现象.而且统计数据并不严密.<br /><br />金三角概论: 曾经不少专业seoer去探索过这个问题.但是都没有得到太完善的结论,就算整理出一些分析报告,也没有被大家公认.金三角现象主要是从一些英文站统计的数据. 我观察过很多中文站点,除了在雅虎里能有一些规律,在百度和google并没有太明显的不同. 但是大家还是应该多注意导航文字的重要性.另外,关键字合理布局方式以后我会抽时间给大家讲解. <br /><br />罗嗦半天,看完了的朋友,应该能对一些搜索引擎常见现象都有了了解.以上只是我个人观点,如果有非议,请跟帖讨论.<br /><br />作者: 蜘蛛 <br />首发: SEO培训 <br />原文: <a title="http://spiderseo.com.cn/blog/seo/5se.html" target="_blank" href="http://spiderseo.com.cn/blog/seo/5se.html">http://spiderseo.com.cn/blog/seo/5se.html</a>]]></description><category>相关教程</category><comments>http://www.abseo.cn/blog/seo_teaching/51.html#comment</comments><wfw:comment>http://www.abseo.cn/blog/</wfw:comment><wfw:commentRss>http://www.abseo.cn/blog/feed.asp?cmt=51</wfw:commentRss><trackback:ping>http://www.abseo.cn/blog/cmd.asp?act=tb&amp;id=51&amp;key=5c20aaf8</trackback:ping></item><item><title>什么是SEM|搜索引擎营销</title><author>a@b.com (核桃)</author><link>http://www.abseo.cn/blog/seo_teaching/SEM_9733.html</link><pubDate>Fri, 14 Sep 2007 22:56:29 +0800</pubDate><guid>http://www.abseo.cn/blog/seo_teaching/SEM_9733.html</guid><description><![CDATA[<strong>什么是SEM?什么是搜索引擎营销?</strong><br /><br />SEM是搜索引擎营销的英文简称。<br /><br /><strong>搜索引擎营销</strong>英文为<strong>Search&nbsp;Engine&nbsp;Marketing</strong>，缩写为<strong>SEM</strong>，其中文的意思就是搜索引擎营销。&nbsp;SEM是网络营销的一种新形式，SEM就是企业有效地利用搜索引擎来进行网络营销和推广。<a href="http://www.abseo.cn/blog/seo_teaching/shen_me_shi_seo.html" target="_blank">搜索引擎优化</a>（<a href="http://www.abseo.cn/">SEO</a>）就是网络营销非常有效的一种手段。&nbsp;<br /><br /><strong>搜索引擎营销</strong>（Search Engine Marketing），简称<strong>SEM</strong>，是网络营销的一种。简单来讲就是根据用户使用搜索引擎的方式，利用用户检索信息的机会通过搜索引擎返回的结果，尽可能将营销信息传递给目标用户，以此来获得更好的销售或者推广效果。<br /><br /><strong>搜索引擎营销（SEM）有哪些好处</strong>？<br /><br />&nbsp;&nbsp;&nbsp;&nbsp;SEM营销是网络营销的主要手段，对于网站推广、网络品牌、产品推广、在线销售等具有明显的效果。它通过较高的搜索引擎排名来增加您的网站的点击率，即浏览量，从而获得产品或&nbsp;服务销售额的飙升。根据我们的网络调研数据，排名前10名的网站占据了72%的点击率，排名第&nbsp;10-20之间的网站拥有17.9%，而排名20以后的所有网站只有10%的点击率。<br /><br /><strong>SEM搜索引擎营销方法内容包括</strong>：搜索引擎优化（<a href="http://www.abseo.cn/">SEO</a>）、分类目录登录、搜索引擎登录、付费搜索引擎广告、&nbsp;关键词广告、竞价排名、地址栏搜索、网站链接策略等。]]></description><category>相关教程</category><comments>http://www.abseo.cn/blog/seo_teaching/SEM_9733.html#comment</comments><wfw:comment>http://www.abseo.cn/blog/</wfw:comment><wfw:commentRss>http://www.abseo.cn/blog/feed.asp?cmt=37</wfw:commentRss><trackback:ping>http://www.abseo.cn/blog/cmd.asp?act=tb&amp;id=37&amp;key=36872b11</trackback:ping></item><item><title>什么是SEM?什么是搜索引擎营销?</title><author>a@b.com (核桃)</author><link>http://www.abseo.cn/blog/seo_teaching/sem.html</link><pubDate>Mon, 03 Sep 2007 12:05:54 +0800</pubDate><guid>http://www.abseo.cn/blog/seo_teaching/sem.html</guid><description><![CDATA[<p>前面<a href="http://www.abseo.cn/" target="_blank">核桃</a>已经整理过一篇文章:<a href="http://www.abseo.cn/blog/seo_teaching/shen_me_shi_seo.html">什么是SEO</a>？今天给大家转载一些关于<strong>搜索引擎营销</strong>的知识，<strong>搜索引擎营销</strong>就是<strong>SEM</strong>的中文名称。<br /><br /><strong>什么是SEM?什么是搜索引擎营销?</strong><br /><br />SEM是Search Engine Marketing的英文缩写，其中文意思就是搜索引擎营销。SEM是网络营销的一种新形式，SEM就是企业有效地利用搜索引擎来进行网络营销和推广。搜索引擎排名营销是一个非常管用的网络营销途径。就拿 Google 来说，每天在其引擎的搜索达2亿人次。如果你的网站能在搜索结果中排名第一页或第一名的话，想想那将给你带来多少的订单！SEM搜索引擎营销可分为两种： <br /><br /><strong>一、 免费SEM搜索引擎营销</strong> <br /><br />1.<a href="http://www.abseo.cn"><strong>SEO</strong></a><a href="http://www.abseo.cn/blog/seo_teaching/shen_me_shi_seo.html" target="_blank">搜索引擎优化</a>设计 <br /><br />SEO搜索引擎优化是免费SEM搜索引擎营销的一种营销手段。影响网站在搜索引擎排名的因素很多，可以分为内部因素和外部因素。内部因素指的是网站本身，即网页中的HTML Meta 标记(Meta Tags)。这些标记出现在你网页 HTML 编码的 HEAD 与 HEAD 之间，搜索引擎可以看得到，浏览者却看不到。这些标记包括 TITLE , KEYWORDS 和 DEsc riptION 。 <br /><br />TITLE 标记位于HTML网页的HEAD部分。当冲浪者浏览一个网页的时候，它的内容会出现在浏览器最顶端。如果有人将你的网站保存到&ldquo;书签&rdquo;(Netscape)或&ldquo;收藏夹&rdquo;(IE)，TITLE将作为&ldquo;书签&rdquo;名或&ldquo;收藏&rdquo;名。TITLE 标记应该以你网站的正式名称开头，并包括网站简要描述。不要将关键字列表放在 TITLE 中，这样做弊大于利。也不要在那里放冗长无用的内容。 <br /><br />META KEYWORDS 和META DEsc riptION标记是 HEAD 部分两个对网站宣传很重要的标记。某些搜索引擎，使用这些标记的内容来决定你网站的排列位次。用于 META DEsc riptION 标记的规则与 TITLE 的基本上一样。而 META KEYWORDS 标记，就是一个关键字列表，注意，在这里放入太多单词，并没有什么益处。因此，挑选出人们真正会用的关键字，才是有价值的。多数人认为，这些关键字应该小写，并且用逗号或空格分开。 <br /><br />好的HTML标记可以大幅度地提高你的网站推广效果。如何编写HTML呢？主要的标准是你网站内容与常用搜索词的匹配性。如果你网站的关键词在各大搜索引擎被搜索的次数阅读，那么你的网络浏览者就越多。 <br /><br />以上是搜索引擎优化中的&ldquo;站内优化&rdquo;。另一影响网站排名的因素是外部因素，即关联性链接。链接到你网站的网站越多，你的网站排名越高。这也就是许多网站都有&ldquo;友情链接&ldquo;栏目的原因之一。征求友情链接是相互的，对各自网站都有好处，是免费的。但所花的时间较多，你需要一个一个地征求友情链接。最后需要说明的是，对方网站的排名越高，对提高你网站排名的效果越好。也就是说，如果对方是一个非常有名的网站，那么与它友情链接胜过于与其他几个甚至几十个不知名网站的链接。 <br /><br />2.搜索引擎登录 <br /><br />搜索引擎登录是免费SEM搜索引擎营销的另一种营销手段。搜索引擎登录是网站推广中非常重要的一个环节，指的是让网站被搜索引擎收录，网民可以在那里找到你的网站。网页的<a href="http://www.abseo.cn/">SEO搜索引擎优化</a>只是&ldquo;万里长征&rdquo;走完了第一步，接下来的工作是将优化好的网页提交到搜索引擎，这也是网站注册中非常重要的一环。登录搜索引擎并不是简单地把你的网址提交给它就万事大吉了，其中有许多值得我们注意的地方。在此需强调的是Google、Baidu这两家搜索引擎登录的是网站的URL，而世界上第2位的搜索引擎Overture可以登录网页的URL，根据不同情况，也可能需要付费。 <br /><br />2.1 提交网页 <br /><br />提交你网页的URL，而不是网站的URL。但对一些大型网站来说，这一原则就不一定适用了。 <br /><br />2.2 提交网页的数量 <br /><br />注意提交单个的网页，并不意味着你可以把几百个页面全塞给同一家搜索引擎。比如有的引擎规定来自同一URL的网页总数不能超过30个，而且在一天中，向单个搜索引擎提交的网页数量最好也不要超过5个。所以有些时候你要学会取舍，尽量让最重要的网页先得到露脸的机会。目录索引一般只允许你提交1个网页。 <br /><br />2.3 重复提交网页 <br /><br />由于每天都有大量新的网页加入竞争，你的领先地位很容易被后来者所取代。况且搜索引擎的排名规则经常改变，今天你可以排名第一，难保明天就不会落到100名之后。所以要及时查看排名，当排名不理想时，向搜索引擎重复提交网页是很有必要的。 <br /><br /><strong>什么是SEM?什么是搜索引擎营销?</strong><br /><br /><strong>二、付费SEM搜索引擎营销</strong> <br /><br />1.PPC广告 <br /><br />PPC是英文Pay Per Click的缩写形式，其中文意思就是点击付费广告。点击付费广告是大公司最常用的网络广告形式。这种方法费用很高，但效果也很好。比如搜狐和新浪首页上的banner广告。这种形式的广告是这样收费的：起价+点击数x每次点击的价格。越是著名的搜索引擎，起价越高，最高可达数万甚至数十万。而每次点击的价格在0.30元左右。提供点击付费的网站非常多，主要有各大门户网站(如搜狐、新浪)搜索引擎(Google和百度)，以及其他浏览量较大的网站，比如提供软件下载的华军等等。 <br /><br />2.竞价排名 <br /><br />竞价排名服务，是由客户为自己的网页购买关键字排名，按点击计费的一种服务。客户可以通过调整每次点击付费价格，控制自己在特定关键字搜索结果中的排名；并可以通过设定不同的关键词捕捉到不同类型的的目标访问者。 <br /><br />而在国内最流行的点击付费搜索引擎有百度，雅虎和Google。值得一提的是即使是做了PPC付费广告和竞价排名，最好也应该对网站进行搜索引擎优化设计，并将网站登录到各大免费的搜索引擎中。 <br /><br />&nbsp;</p>]]></description><category>相关教程</category><comments>http://www.abseo.cn/blog/seo_teaching/sem.html#comment</comments><wfw:comment>http://www.abseo.cn/blog/</wfw:comment><wfw:commentRss>http://www.abseo.cn/blog/feed.asp?cmt=30</wfw:commentRss><trackback:ping>http://www.abseo.cn/blog/cmd.asp?act=tb&amp;id=30&amp;key=2d1de67a</trackback:ping></item><item><title>关于百度分词技术的一篇研究性文章</title><author>a@b.com (核桃)</author><link>http://www.abseo.cn/blog/seo_teaching/baidu_fenci.html</link><pubDate>Tue, 21 Aug 2007 22:40:45 +0800</pubDate><guid>http://www.abseo.cn/blog/seo_teaching/baidu_fenci.html</guid><description><![CDATA[<a href="http://www.abseo.cn/blog/seo_teaching/baidu_fenci.html" target="_blank">分词</a>是做SEO最核心的部分了，SEO学习者对于分词一定要有所了解，对于组织好关键词以及页面布局来说可以达到最佳组合，同时，分词技术的研究对于不同搜索引擎排名算法的了解是最核心的部分，所以这篇文章我转过来让大家看看！希望对大家有帮助。<br /><br />主要介绍<a href="http://www.abseo.cn/blog/seo_teaching/baidu_fenci.html ">百度分词</a>技术！<br />-----------------------------------<br /><br /><span class="bold">百度(baidu)分词算法分析</span><br /><br /><div class="t_msgfont" id="message80552">之前在广州点石茶话会上也有重点讨论过百度分词算法，那时很多SEOer都认为百度在测试分词技术中，有些关键词带公司字眼的关键词，在搜索结果内容时基本上跟关键词不乎核。下面是中科院软件所<font color="#ff0000">张俊林</font>一篇百度分词算法的三步曲，希望能帮SEOer解答一些关于百算分词算法的问题，内容可能长点，各位慢慢消化！ <br /><br /><strong>查询处理以及分词技术 </strong><br /><br />随着搜索经济的崛起，人们开始越加关注全球各大搜索引擎的性能、技术和日流量。作为企业，会根据搜索引擎的知名度以及日流量来选择是否要投放广告等；<br />作为 普通网民，会根据搜索引擎的性能和技术来选择自己喜欢的引擎查找资料；作为技术人员，会把有代表性的搜索引擎作为研究对象。搜索引擎经济的崛起，又一次向人们证明了网络所蕴藏的巨大商机。网络离开了搜索将只剩下空洞杂乱的数据，以及大量等待去费力挖掘的金矿。 <br /><br />但是，如何设计一个高效的搜索引擎？我们可以以百度所采取的技术手段来探讨如何设计一个实用的搜索引擎。搜索引擎涉及到许多技术点，比如查询处理，排序算法，页面抓取算法，CACHE机制，ANTI-SPAM等等。这些技术细节，作为商业公司的搜索引擎服务提供商比如百度，GOOGLE等是不会公之于众的。我们可以将现有的搜索引擎看作一个黑盒，通过向黑盒提交输入，判断黑盒返回的输出大致判断黑盒里面不为人知的技术细节。 <br /><br />查询处理与分词是一个中文搜索引擎必不可少的工作，而百度作为一个典型的中文搜索引擎一直强调其&ldquo;中文处理&rdquo;方面具有其它搜索引擎所不具有的关键技术和优势。那么我们就来看看百度到底采用了哪些所谓的核心技术。 <br /><br /><strong>我们分两个部分来讲述：查询处理/中文分词。</strong> <br /><br /><strong>一、查询处理 </strong><br /><br />用户向搜索引擎提交查询，搜索引擎一般在接受到用户查询后要做一些处理，然后在索引数据库里面提取相关的信息。那么百度在接受到用户查询后做了些什么工作呢？ <br /><br />1、假设用户提交了不只一个查询串，比如&ldquo;信息检索 理论 工具&rdquo;。<br />那么搜索引擎首先做的是根据分隔符比如空格，标点符号，将查询串分割成若干子查询串，比如上面的查询就会被解析为：&lt;信息检索，理论，工具&gt;三个子字符串；这个道理简单，我们接着往下看。 <br /><br />2、假设提交的查询有重复的内容，搜索引擎怎么处理呢？比如查询&ldquo;理论 工具理论&rdquo;，百度是将重复的字符串当作只出现过一次，也就是处理成等价的&ldquo;理论工具&rdquo;，而GOOGLE显然是没有进行归并，而是将重复查询子串的权重增大进行处理。那么是如何得出这个结论的呢？我们可以将&ldquo;理论工具&rdquo;提交给百度，返回341,000篇文档，大致看看第一页的返回内容。<br /><br />OK。继续，我们提交查询&ldquo;理论 工具理论&rdquo;，在看看返回结果，仍然是那么多返回文档，当然这个不能说明太多问题，那看看第一页返回结果的排序，看出来了吗？顺序完全没有变化，而GOOGLE 则排序有些变动，这说明百度是将重复的查询归并成一个处理的，而且字符串之间的先后出现顺序基本不予考虑（GOOGLE是考虑了这个顺序关系的）。 <br /><br />3、假设提交的中文查询包含英文单词，搜索引擎是怎么处理的？比如查询&rdquo;电影BT下载&rdquo;，百度的方法是将中文字符串中的英文当作一个整体保留，并以此为断点将中文切分开，这样上述的查询就切为&lt;电影，BT，下载&gt;，不论中间的英文是否一个字典里能查到的单词也好，还是随机的字符也好，都会当作一个整体来对待。至于为什么，你用查询&ldquo;电影dfdfdf下载&rdquo;看看结果就知道了。当然如果查询中包含数字，也是如此办理。 <br /><br />到目前为止，一切很简单，也很清楚，百度怎么处理用户查询的呢？归纳如下：首先根据分割符号将查询分开，然后看看是否有重复的字符串，如果有，就抛弃多余的，只保留一个，接着判断是否有英文或者数字，如果有的话，把英文或者数字当作一个整体保留并把前后的中文切开。 <br /><br />接着该干什么呢？该考虑分词的问题了。 <br /><br /><strong>二、中文分词 </strong><br /><br />首先，讲讲百度的分词时机或者条件问题，是否是个中文字符串百度就拿来切一下呢？非也，要想被百度的分词程序荣幸的切割一下也是要讲条件的，哪能是个字符串就切割啊？你当百度是卖锯条的么？ <br /><br />那么什么样的字符串才满足被切割的条件呢？简单说来，如果字符串只包含小于等于3个中文字符的话，那就保留不动，当字符串长度大于4个中文字符的时候，百度的分词程序才出马大干快上，把这个字符串肢解掉。 <br /><br />怎么证明呢？我们向百度提交&ldquo;电影下载&rdquo;，看看返回结果中标为红字的地方，不难看出来，查询已经被切割成&lt;电影，下载&gt;两个单词了，说明分词程序已经开工了，如果是比4个中文字符更长的字符串，那分词程序就更不客气了，一定大卸八块而后快。我们来看看三个字符的情况，提交查询&ldquo;当然择&rdquo;，看起来这个查询不伦不类，那是因为我希望看到这个字符串被切分为&lt;当然，择&gt;，返回结果365篇相关页面，翻到最后一页，发现标红的关键字都是&rdquo; 当然择&rdquo;连续出现的情况，好像没有切分，但是还不确定，那么再提交人工分好的查询&ldquo;当然择&rdquo;看看，返回结果1，090，000篇，基本上可以确定没有进行分词了，当然另外一种解释是：对于三个字符先切分，然后将切分后的结果当作一个短语查询，这样看到的效果和没有切分是相似的。<br /><br />但是我倾向于判断百度对于少于3个字符的串没有切分，奥卡姆不是说了么&ldquo;如无必要，勿增实体&rdquo;，干吗做无用功呢。那么如果没有切分，会有一个随之而来的问题，怎么从索引库里面提取未切分的字符串呢？这牵扯到索引的问题，我觉得百度应该采取了两套索引机制，一种是按照单词索引，一种是按照N-GRAM索引，至于索引的具体问题，以后在详细论述。 <br /><br />下面我们看看百度是采取的何种分词算法，现在分词算法已经算是比较成熟了，有简单的有复杂的，比如正向最大匹配，反向最大匹配，双向最大匹配，语言模型方法，最短路径算法等等，有兴趣的可以用GOOGLE去搜索一下以增加理解。这里就不展开说了。但是要记住一点的是：判断一个分词系统好不好，关键看两点，一个是消除歧义能力；一个是词典未登录词的识别比如人名，地名，机构名等。 <br /><br />那么百度用的是什么方法？我的判断是用双向最大匹配算法。至于怎么推理得出的，让我们一步步来看。当然，这里首先有个假设，百度不会采取比较复杂的算法，因为考虑到速度问题。 <br /><br />我们提交一个查询&ldquo;毛泽东北京华烟云&rdquo;，又一个不知所云的查询，尽管不知所云但是自有它的道理，我想看看百度的分词是如何消歧以及是否有词典未登录词的识别的功能，如果是正向最大匹配算法的话，<br />那么输出应该是：&rdquo;毛泽东/北京/华/烟云&rdquo;，<br />如果是反向最大匹配算法的话，那么输出应该是：&rdquo;毛/泽/东北/京华烟云&rdquo;，<br />我们看看百度的分词结果：&rdquo;毛泽东/北/京华烟云&rdquo;，一个很奇怪的输出，跟我们的期望相差较多，<br />但是从中我们可以获得如下信息：百度分词可以识别人名，也可以识别&rdquo;京华烟云&rdquo;，这说明有词典未登录词的识别的功能，我们可以假设分词过程分为两个阶段：第一阶段，先查找一个特殊词典，这个词典包含一些人名，部分地名以及一些普通词典没有的新词，这样首先将&rdquo;毛泽东&rdquo;解析出来，剩下了字符串&rdquo;北京华烟云&rdquo;，而&rdquo;北/京华烟云&rdquo;，可以看作是反向最大匹配的分词结果。这样基本说得通。为了证明这一点，我们提交查询&rdquo;发毛泽东北&rdquo;，我们期望两种分词结果，一个是正向最大匹配&lt;发毛，泽，东北&gt;，一个是上述假设的结果&lt;发，毛泽东，北&gt;，事实上百度输出是第二种情况，这样基本能确定百度分词采取了至少两个词典，一个是普通词典，一个是专用词典（人名等）。而且是专用词典先切分，然后将剩余的片断交由普通词典来切分。 <br /><br />继续测验，提交查询&ldquo;古巴比伦理&rdquo;，如果是正向最大匹配，那么结果应该是&lt;古巴比伦，理&gt;，如果是反向最大匹配，那么结果应该是 &lt;古巴，比，伦理&gt;，事实上百度的分词结果是&lt;古巴比伦，理&gt;，从这个例子看，好像用了正向最大匹配算法；<br />此外还有一些例子表明好像是使用正向最大匹配的；但是且慢，我们看这个查询&ldquo;北京华烟云&rdquo;，正向最大匹配期望的结果是&lt;北京，华，烟云&gt;，而反向最大匹配期望的结果是 &lt;北，京华烟云&gt;，事实上百度输出的是后者，这说明可能采用的反向最大匹配；<br />从这点我们可以猜测百度采用的是双向最大匹配分词算法，如果正向和反向匹配分词结果一致当然好办，直接输出即可；但是如果两者不一致，正向匹配一种结果，反向匹配一种结果，此时该如何是好呢？<br />从上面两个例子看，在这种情况下，百度采取最短路径方法，也就是切分的片断越少越好，比如&lt;古巴，比，伦理&gt;和&lt;古巴比伦，理&gt;相比选择后者，&lt;北京，华，烟云&gt;和&lt;北，京华烟云&gt;相比选择后者。还有类似的一些例子，这样基本可以解释这些输出结果。 <br /><br />但是仍然遗留的问题是：如果正向反向分词不一致，而且最短路径也相同，那怎么办？输出正向的还是反向的结果？<br />我们再来看一个例子。提交查询&ldquo;遥远古古巴比伦&rdquo;，这个查询被百度切分为&lt;遥远，古古，巴比伦&gt;，说明词典里面有&rdquo;巴比伦&rdquo;，但是是否有&rdquo;古巴比伦&rdquo;这个词汇不确定，此时看不出是正向切分还是反向切分得出的结果，换查询为&ldquo;遥远古巴比伦&rdquo;，此时被切分为&ldquo;遥远/古巴比伦&rdquo;，这说明词典里面有&rdquo;古巴比伦&rdquo;这个词汇，这说明了&ldquo;遥远古古巴比伦&rdquo;是正向最大匹配的结果。那为什么&ldquo;遥远古古巴比伦&rdquo;不会被反向切分为&rdquo;遥/远古/古巴比伦&rdquo;呢，百度的可能选择是这种情况下选择单字少的那组切分结果。 <br /><br />当然还可以继续追问：如果切分后单字也一样多，那怎么办？最后看一个例子，查询&ldquo;王强大小：&rdquo;，百度将其切分为&ldquo;王/强大/小&rdquo;，是正向切分的结果，如果是反向的会被切分为&ldquo;王/强/大小&rdquo;，这说明有歧义而且单字也相同则选择正向切分结果。 <br /><br />OK，看到这里可能头已经有些晕了，最后总结一下百度的分词算法，当然里面还是有猜测的成分，算法如下： <br /><br />首先查询专用词典（人名，部分地名等），将专有名称切出，剩下的部分采取双向分词策略，如果两者切分结果相同，说明没有歧义，直接输出分词结果。如果不一 致，则输出最短路径的那个结果，如果长度相同，则选择单字词少的那一组切分结果。如果单字也相同，则选择正向分词结果。 <br /><br />百度一直宣传自己在中文处理方面的优势，从上面看，分词算法并无特殊之处，消歧效果并不理想，即使百度采取比上述分词算法复杂些的算法也难以说成是优势，如果说百度有优势的话，唯一的优势就是那个很大的专用词典，这个专用词典登录了人名（比如大长今），称谓（比如老太太），部分地名（比如阿联酋等），估计百度采用学术界公布的比较新的命名实体识别算法从语料库里面不断识别出词典未登录词，逐渐扩充这个专门词典。如果这就是优势的话，那么这个优势能够保持多久就是个很明显的问题。 <br /><br />Spelling Checker拼写检查错误提示(以及拼音提示功能) <br />　　 <br />拼写检查错误提示是搜索引擎都具备的一个功能,也就是说用户提交查询 给搜索引擎,搜索引擎检查看是否用户输入的拼写有错误,对于中文用户来说一般造成的错误是输入法造成的错误.那么我们就来分析看看百度是 怎么实现这一功能的. <br /><br />　　<strong>我们分析拼写检查系统关注以下几个问题: </strong><br /><br />　　(1)系统如何判断用户的输入是有可能发生错误的查询呢? <br />　　(2)如果判断是可能错误的查询输入,如何提示正确的词汇呢? <br />　　 <br />　　那么百度是如何做的呢?百度判断用户输入是否错误的标准,我觉得应该是查字典,如果发现字典里面不包含这个词汇,那么很有可能是个错误的输入,此时启动错误提示功能,这个很好判断,因为如果是一个正常词汇的话,百度一般不会有错误提示,而你故意输入一个词典不可能包含的所谓词汇,此时百度一般会提示你正确的检索词汇. <br /><br />　 　那么百度是怎么提示正确词汇的呢?很明显是通过拼音的方式,比如我输入查询&quot; 制才&quot;,百度提供的提示词汇为: &ldquo;:制裁 质材纸材&quot;,都是同 音字.所以百度必然维持着一个同音词词典,里面保留着同音词信息,比如可能包含着下面这条词条: &ldquo; zhi cai &agrave;制裁,质材,纸材&quot;,另外还有一 个标注拼音程序,现在能够看到的基本流程是: 用户输入&quot; 制才&quot;,查词典,发现没有这个词汇,OK,启动标注拼音程序,将&quot; 制才&quot;标注为拼音&quot;zhi cai&quot;,然后查找同音词词典,发现同音词&quot; 制裁,质材,纸材&quot;,那么提示用户可能的正确拼写. <br /><br />　　整体流程看起来很简单,但是还有一些遗留的小问题,比如是否将词表里面所有同音词都作为用户的提示信息呢?比如某个拼音有10个同音词,是否都输出呢?百度并没有将所有同音词都输出而是选择一定筛选标准,<br />选择其中几个输出.怎么证明这一点?我们看看拼音&quot;liu li&quot;的同音词,紫光输入法提示同音词汇有&quot; 流丽 流离 琉璃流利&quot;4个,我们看看百度返回几个,输入&quot;流厉&quot;作为查询,这里是故意输入一个词典不包含的词汇,这样百度的拼写检查才开始工作,<br />百度提示: &quot; 琉璃刘丽 刘莉 &quot;,这说明什么?说明不是所有同音词都输出,而是选择输出,那么选择的标准是什么?<br />我能够猜测到的方法是对于用户查询LOG进行统计,提取用户查询次数多的那些同音词输出,如果是这样的话,上面的例子说明用户搜索&quot;琉璃&quot;次数比其它的都要高些,次之是&quot; 刘丽&quot;,再次是&quot; 刘莉&quot;,看来大家都喜欢查询自己或者认识的人的名字. <br /><br />　　另外一个小问题:同音词词典包含2字词,3字词,那么是否包含4字词以及更长的词条?是否包含一字词? 这里一字词好回答,不用测试也能知道肯定不包含,因为你输入一个字,谁知道是否是错误的呢?<br />反正只要是汉字就能在词表里面找到,所以没有判断依据.二字词是包含的,上面有例子,三字词也包含,比如查询 &quot;中城药&quot;百度错误提示:&quot;中成药&quot;,修改查询为&quot;重城药&quot;,还是提示&quot;中成药&quot; ,再次修改查询 &quot;重城要&quot;,百度依然提示&quot;中成药&quot;. 那么4字词汇呢? <br /><br />　　<strong>百度还是会给你提示的,下面是个例子: </strong><br />　　输入:静华烟云 提示 京华烟云 <br />　　输入:静话烟云 提示 京华烟云 <br />　　输入:静话阎晕 提示 京华烟云 <br /><br />　　那么更长的词汇是否提 示呢?也提示,比如我输入: &quot;落花世界有风军&quot;,这个查询是什么意思,估计读过古诗的都知道,看看百度的提示&quot;落花时节又逢君&quot;,这说明什么?说明同音词词典包含不同长度的同音词信息,另外也说明了百度的核心中文处理技术,也就是那个词典,还真挺大的. <br /><br />　　但是,如果用户输入的 查询由两个或者两个以上子字符串构成,那么百度的错误提示功能就罢工了,比如输入查询&quot;哀体&quot;,百度提示&quot;艾提 挨踢&quot;,但是.输入为 &quot;我 哀体 &quot;,则没有任何错误提示. <br /><br />　　还有一个比较重要的问题:如果汉字是多音字那么怎么处理?百度呢比较偷懒,它根本就没有对多音字做处理.我们来看看百度的一个标注拼音的错误,在看这个错误前先看看对于多音字百度是怎么提示错误的,我们输入查询&quot;俱长&quot;,百度提示&quot;剧场 局长&quot;, &ldquo;俱长&quot;的拼音有两个:&quot;ju zhang /ju chang&quot; ,可见如果是多音字则几种情况都提示..现在我们来看看错误的情况, 我们输入查询&quot;剧常&quot;,百度 提示&quot;:剧场局长&quot;,提示为&quot;剧场&quot;当然好解释,因为是同音字,但是为什么 &quot;局长&quot;也会被提示呢?这说明百度的同音字词典有错误,说明在&quot;ju chang&quot;这个词条里面包含&quot;局长&quot;这个错误的同音词.让我们顺藤摸瓜,这个错误又说明什么问题呢?<br /><br />说明百度的同音词典是自动生成的,而且没有人工校对.还说明在自动生成同音词典的过程中,百度不是根据对一篇文章标注拼音然后在抽取词汇和对应的拼音信息获得的,而是完全按照某个词典的词条来标注音节的,<br />所以对于多音字造成的错误无法识别出来,如果是对篇章进行拼音标注,可能就不会出现这种很容易发现的错误标注. 当然还有另外一种解释,就是&quot;局长&quot;是故意被百度提示出来可能的正确提示词汇,因为考虑到南方人&quot;zh&quot;和 &quot;ch&quot;等前后鼻音分不清么,那么是这样的么?我们继续测试到底是何种情况.是百度有错误还是这是百度的先进的算法? <br /><br />　　我们考虑词汇&quot;长大 &quot;,故意错误输入为&quot;赃大&quot;,如果百度考虑到了前后鼻音的问题,那么应该会提示&quot;长大&quot;,但是百度提示是&quot;藏大&quot;.这说明什么?说明百度并没有考虑前后鼻音问题,根本就是系统错 误. 我们输入查询&quot;悬赏&quot;,故意将之错误输入为&quot;悬桑&quot;,没有错误提示,说明确实没有考虑这种情况.前鼻音没有考虑,那么后鼻音考虑了么,我们输入&quot;:经常&quot;,故意改为后鼻音 &quot;经缠&quot;,百度提示为&quot;经产 经忏&quot;,还是没有考虑后鼻音.这基本可以确定是百度系统的错误导致. <br /><br />　　根据以 上推导, 我们可以得出如下结论:百度是将分词词典里面每个词条利用拼音标注程序标注成拼音,然后形成同音词词典,所以两个词典是同样大的 ,而且这个词典也随着分词词典的增长而在不断增长. 至于标注过程中多音字百度没有考虑,如果是多音字就标注成多个发音组合,通过这种方式形成同音词词典.这样的同音词词典显然包含着很多错误. <br /><br />　最后一个问题:百度对于英文进行拼写检查么?让我们试试看,输入查询&quot;china&quot;,不错,搜到不少结果,专注中文搜索的百度还能搜索到英文,真是意外的惊喜.变换一下查询&quot;chine&quot;,会更加意外惊喜的给我们提示&quot;china&quot;吗?<br />百度提示的是: 吃呢持呢,原来是不小心触发了百度的拼音搜索功能了.那么拼音搜索和中文检查错误是否采用同一套同音词词典呢,让我们来实验一下,搜索&quot;rongji&quot;,<br />百度提示&quot; 榕基 溶剂 容积&quot;,OK,换个中文查询&quot;容机&quot;,<br />百度提示&quot; 榕基溶剂容积&quot;,看来使用的是同一套同音词词典.也就是说百度的中文纠错和拼音检索使用的机制相同,中文纠错多了一道拼音注音的过程而已.难道这就是传说中那个百度的&quot;事实上是一个无比强大的拼音输入法&quot;的拼音提示功能么? <br />　　最后让我们总结归纳一下百度的拼写检查系统: <br />　　后台作业: (1)前面的文章我们说过,百度分词使用的词典至少包含两个词典一个是普通词典,另外一个是专用词典(专名等),百度利用拼音标注程序依次扫描所有词典中的每个词条,然后标注拼音,如果是多音字则把多个音都标上,比如&quot;长大&quot;,会被标注为&quot;zhang da/chang da&quot;两个词条. <br />　　(2)通过标注完的 词条,建立同音词词典,比如上面的&quot;长大&quot;,会有两个词条: zhang da&agrave;长大&quot; , chang da&agrave;长大. <br />　　(3)利用用户查询LOG频率信息给予每个 中文词条一个权重; <br />　　(4)OK,同音词词典建立完成了,当然随着分词词典的逐步扩大,同音词词典也跟着同步扩大; <br />　　 <br />　　拼写 检查: <br />　　(1)用户输入查询,如果是多个子字符串,不作拼写检查; <br />　　(2)对于用户查询,先查分词词典,如果发现有这个单词词条,OK, 不作拼写检查; <br />　　(3)如果发现词典里面不包含用户查询,启动拼写检查系统;首先利用拼音标注程序对用户输入进行拼音标注; <br />　　 (4)对于标注好的拼音在同音词词典里面扫描,如果没有发现则不作任何提示; <br />　　(5)如果发现有词条,则按照顺序输出权重比较大的几个提 示结果; <br />　　 <br />　　拼音提示: <br />　　(1)对于用户输入的拼音在同音词词典里面扫描,如果没有发现则不作任何提示; <br />　　(2)如果 发现有词条,则按照顺序输出权重比较大的几个提示结果; <br /><br />上面说过,经过分析得出百度的分词系统采用双向最大匹配分词,但是后来发现推理过程中存在一个漏洞,而且推导出来的百度分词算法步骤还是过于繁琐,所以进一步进行分析,看看是否前面的推导有错误. <br /><br /><strong>那么以前的分析有什么漏洞呢?</strong><br />我们推导百度分词有反向最大匹配的依据是百度将&quot;北京华烟云&quot;分词为&lt;北,京华烟云&gt;,从这里看好像采用了反向最大匹配,因为正向最大匹配的结果应该是&lt;北京,华,烟云&gt;,但是由此就推论说百度采用了双向最大匹配还是太仓促了,前面文章我们也讲过,百度有两个词典,一个普通词典,一个专有词典,而且是专有词典的词汇先切分,然后将剩余片断交给普通词典去切分.所以上面的&quot;北京华烟云&quot;之所以被切分成&lt;北,京华烟云&gt;,另外一个可能是:京华烟云这个词汇是在专有词典里面存储的,所以先分析,这样得出&quot;京华烟云&quot;,剩下&quot;北&quot;,没什么好切分的,所以输出&lt;北,京华烟云&gt;. <br /><br />这里只是假设,那么是否确实&quot;京华烟云&quot;在专有词典呢?我们再看一个例子&quot;山东北京华烟云&quot;,百度切分的结果是&lt;山东,北,京华烟云 &gt;,如果&quot;京华烟云&quot;在普通词典,如果是反向切分,那么结果应该是&lt;山,东北,京华烟云&gt;,如果是正向切分应该是&lt;山东,北京, 华,烟云&gt;,无论如何都分不出&lt;山东,北,京华烟云&gt;.这说明什么?<br />说明&quot;京华烟云&quot;是在那个专有词典,所以先切分出&quot;京华烟云&quot;,然后剩下的&quot;山东北&quot;交由普通词典切分,明显是正向最大匹配的结果输出&lt;山东,北&gt;.当然按照我们在第一篇文章的算法推导&quot;山东北&quot;的切分也会得出&lt;山东,北&gt;的结论,但是明显比正向最大匹配多几个判断步骤,既然效果一样,另外一个更加简洁的方法也能说得通,那当然选择简便的方法了.所以初步判断百度采取的是正向最大匹配. <br /><br />我们继续测试采用何种分词算法,为了减少专有词典首先分词造成的影响,那么查询里面不能出现相对特殊的词汇,构筑查询&quot;天才能量级&quot;,这里应该没有专有词典出现过的词汇,百度切分为&lt;天才,能量,级&gt;,看来是正向最大匹配的结果.另外,如果所有查询词汇都出现在专有词典,那么采取的是何种方法?这样首先就得保证词汇都出现在专有词典,这么保证这一点呢?<br /><br />我们构造查询&quot;铺陈晓东方&quot;,百度切分为&lt;铺,陈晓东,方&gt;,可以看出 &quot;陈晓东&quot;是在专有词典的所以先切分出来.另外一个例子 &quot;山东京城&quot;,百度切分为&lt;山东,京城&gt;,说明&quot;东京&quot;是在普通词典的.OK,构造查询&quot;陈晓东京华烟云&quot;,通过前面分析可以看出两个词汇都在专有词典里面,百度切分为&lt;陈晓东,京华烟云&gt;,说明对于专有词典词汇也是采取正向最大匹配或者双向最大匹配.那么使用反向最大匹配了吗? 构造查询例子&quot;陈晓东方不败&quot;,首先我们肯定&quot;陈晓东&quot;和&quot;东方不败&quot;都是在专有词典出现的,如果是正向切分,那么应该是&lt;陈晓东,方,不败 &gt;或者&lt;陈晓东,方,不,败&gt;如果是反向切分则是&lt;陈,晓,东方不败&gt;,可以看出百度的切分是&lt;陈晓东,方,不败 &gt;或者&lt;陈晓东,方,不,败&gt;,说明采用的是正向最大匹配.通过分析,百度的词典不包含&quot;不败&quot;这个单词,所以实际上百度的切分结果是 &lt;陈晓东,方,不,败&gt;,很明显这和我们以前推导的算法是有矛盾的,所以以前的分析算法确实有问题,所以结论是百度采取的是正向最大匹配算法. <br /><br />重新归纳一下<a href="http://www.abseo.cn/blog/seo_teaching/baidu_fenci.html ">百度的分词算法</a>系统:首先用专有词典采用最大正向匹配分词,切分出部分结果,剩余没有切分交给普通词典,同样采取正向最大匹配分词,最后输出结果. <br /><br />另外,GOOGLE也是采用正向最大匹配分词算法,不过好像没有那个专用词典,所以很多专名都被切碎了. <br /><br />从这点讲,GOOGLE在中文词典构建上比百度差些,还需要加把子力气才行,不过这也不是什么多难的事.<br /><br />原文：<a href="http://www.dunsh.org/forums/thread-10553-1-2.html">http://www.dunsh.org/forums/thread-10553-1-2.html</a><br /></div>]]></description><category>相关教程</category><comments>http://www.abseo.cn/blog/seo_teaching/baidu_fenci.html#comment</comments><wfw:comment>http://www.abseo.cn/blog/</wfw:comment><wfw:commentRss>http://www.abseo.cn/blog/feed.asp?cmt=16</wfw:commentRss><trackback:ping>http://www.abseo.cn/blog/cmd.asp?act=tb&amp;id=16&amp;key=a43a0bd1</trackback:ping></item><item><title>SEO技巧:如何在15分钟学会SEO的核心技巧</title><author>a@b.com (核桃)</author><link>http://www.abseo.cn/blog/seo_teaching/15_minute_seo.html</link><pubDate>Sat, 18 Aug 2007 01:48:12 +0800</pubDate><guid>http://www.abseo.cn/blog/seo_teaching/15_minute_seo.html</guid><description><![CDATA[很多时候我们都在问<strong>SEO技巧</strong>是什么？如何快速学习SEO？SEO技巧其实就那么几项，重点是看谁坚持在做，谁的细节做得好，有一本书叫做《细节决定成败》，很值得一看。有的时候相同的人在用相同的SEO技巧，但是却没有得到相同的排名位置，这里的原因很多很多，几乎都是细节的体现。今天的SEO文章，是一篇讲SEO技巧的文章，教你如何在15分钟里掌握最核心的技巧，踏入SEO之门。当然，这是一篇转载的文章，原作者是外国人，然后别人翻译，然后<strong><a href="http://www.abseo.cn/" target="_blank">核桃</a>SEO</strong>加注的版本，桃桃希望自己的加注没有影响到你的阅读。<br /><br /><font size="4">SEO快速入门&mdash;让你15分钟学会SEO</font>（<a href="http://www.abseo.cn/" target="_blank">核桃</a>加强版）<br /><br />红字部分为<strong>核桃</strong>标注（格式<span style="COLOR: red">[核桃：XXX]</span> ）<br /><br />****************************************<br /><br />快速SEO入门&mdash;&mdash;15分钟让你学会SEO<br /><br />　　作为一个网站<a href="http://www.abseo.cn/blog/" target="_blank">策划</a>，学习一点SEO知识可以让你在策划网站乃至到网站推广的时候又有的放矢。无论如何，笔者认为不能到了推广的时候才关注SEO知识，有些知识在网站策划的时候就应该考虑到的，那么网站策划就应该把相关的优化建议作为网站开发规范文档的一部分交由程序和设计执行，所以，我们应该对SEO知识有个初步的了解，一下内容有笔者翻译自外国网站，我打算分几部分发出来，毕竟我们IT人的闲暇时间太少了，我会尽快把所有的都发出来的。<br /><span style="COLOR: red">[核桃：这里说一个前提，国外大部分研究基于google,yahoo,ask三大搜索引擎，每一个搜索引擎的算法都有差别，当然它们也有很大一部分是共通的，所以对于国内的百度来说也是很有用的。]</span><br />　　关键词部分<br /><br />　　<strong>1. 标题&lt;title&gt;中的关键字</strong><br /><br />这个是放置关键词最重要的地方。Title内的单词数一定要简短，最多6-7个单词（中文的话，大家斟酌，也就是10多个汉字），关键词一定要靠前<br /><br />　　权重: +3<br /><br /><span style="COLOR: red">[核桃：如果针对百度，TITLE的排名权重至少在+8以上，且TITLE可以显示30个汉字的长度，所以大家如果针对百度做TITLE优化，可以适当的把TITLE写在30字以内，同时对核心关键字做一定的重复组合形成一句话的TITLE，纯粹的堆砌关键词是任何搜索引擎都不会喜欢的形式。越重要的关键词放在越前面，现在是不用讨论的]</span><br /><br />　　<strong>2. URL中的关键词</strong><br /><br />URL中的关键词也有很大的帮助。例如：<a title="http://domainname.com/seo-services.html" target="_blank" href="http://domainname.com/seo-services.html"><font color="#800080">http://domainname.com/seo-services.html</font></a>，如果你没有在页面的其他地方放置关键词，不妨把他们放到URL中（这一点中文网页不太合适，因为我们中文网站的URL中一般是不包含中文关键词的，我指的是针对中文关键词的优化）<br /><br />权重: +3<br /><br /><span style="COLOR: red">[核桃：其实现在百度跟GG都能很好的分析出汉字形式的URL，百度空间就是一个很好的例子，所以基本上如果是汉字URL还是有一定权重影响的，但是目前不提倡，因为这样会导致很多不必要的麻烦。可以尝试拼音的URL，但是拼音URL的可变性也很大，中文太过博大精深，呵呵。现在来说，我个人还是比较看好拼音URL的]</span><br /><br />　　<strong>3.整个页面文档的关键词</strong><br /><br />　　这是另一个很重要的需要你检测的因子。一般来讲3-7%是最好的，1-2%就太少了。如果超过10%就有点危险了，可能被搜索引擎认为是在作弊，所以一定要小心。<br /><br />　　权重: +3<br /><br /><span style="COLOR: red">[核桃：这一项基本上现在都认同，7%在国外被认为是神奇的关键词密度值，而百度好像并不是很在意这些，但是不要超过15%是应该的，否则排名不会太好]</span><br /><br />　　<strong>4.锚点中的关键词</strong><br /><br />　　锚点同样页很重要，尤其是InBoundLinks（链入链接&mdash;&mdash;从其他网站过来的）的锚点文字。如果从其他网站过来的链接的锚点中含有你的关键词，相当于这个网站投了你一票。<br /><br />　　权重: +3<br /><br /><span style="COLOR: red">[核桃：这里有一点要注意，就是自己如果做内页关键字的锚文本链接，就要直接链向内页，而不应该是首页]</span><br /><br />　　<strong>5.页面顶部的关键词 （可以用H1,H2加粗）</strong><br /><br />　　这个位置也非常重要，但是要确定你的网站的文字中确实有关于该关键词的东西，不然会被认为是在作弊。<br /><br />　　权重: +3<br /><br /><span style="COLOR: red">[核桃：H1目前在内容区是权重是最高的，整个页面除了TITLE以外就数它了，H1一个页面最好只出现一次，超过两次就很有危险被认为作弊。除了H系列的以外，strog也是一个不错的标签]</span><br /><br />　　<strong>6.整个页面主要文字内容的开头的关键词</strong><br /><br />　　这个尽管没有锚点文字，title,顶部文字那么重要，但是你也应该他考虑在内。另外还要注意的是&ldquo;页面的开端&rdquo;并不意味这文章的第一段，因为如果你是用表格的话，主要段落的文字可能在表格的第二部分。<br /><br />　　权重: +2<br /><br /><span style="COLOR: red">[核桃：就是页面关键字出现在文章开头部分，这是对于搜索引擎表明这个词的重要性，同时说明这个页面与此相关，因为你在TITLE与KEYWORDS中也出现过]</span><br /><br />　　<strong>7.&lt;alt&gt;中的关键词</strong><br /><br />　　搜索蜘蛛不会读取图片的内容，但是会读取图片的文字描述：&lt;alt&gt;。如果你页面中又图片的话，应该用&lt;alt&gt;标记为图片添加合适的关键词。<br /><br />　　权重: +2<br /><br /><span style="COLOR: red">[核桃：ALT不要直接做主关键词，做相关的就行了。还有有一点，就是图片的文件名，跟前面提到的URL一个道理，可以做成汉字，拼音文件名，对于搜索引擎判断这张图是与什么相关联的也有影响]</span><br /><br />　　<strong>8.Meta 中的关键词</strong><br /><br />　　Meta关键词的重要性变得越来越低了，尤其是在google中。 但是Yahoo和MSN依然把它们作为参考。所以如果你在优化的时候想考虑Yahoo,MSN的话，把这个部分的东西填上！ 不管怎么样，加上这些标签是没有什么坏处的，前提是你不要乱加。<br /><br />　　权重: +1<br /><span style="COLOR: red">[核桃：在GG中网站的描述依然是收录页面时摘要的部分， 如果你希望GG显示你想要的信息，可以在描述里写，但是百度现在不会买你的帐，它会直接读页面的内容]</span><br /><br />　　<strong>9. 关键词亲近度</strong><br /><br />　　关键词亲近度用来衡量整个页面关键词的关联成都。比如你想优化&rdquo;dog food&rdquo;,那么 &ldquo;dog&rdquo;和&ldquo;food&rdquo;之间直接用空格相连是最好的，中间不要再插其他的文字。那么&ldquo;dog food&rdquo;就是最好的，如果你把&ldquo;dog&ldquo;放在第一段，把&rdquo;food&ldquo;放到第三段的话，搜索蜘蛛仍然会把他们计算在内，但是没有上面第一种的效果好。关键词亲近度主要用于由2个多个关键词组成的关键词<br /><br />　　权重: +1<br /><br /><span style="COLOR: red">[核桃：跟长尾关键词类似的结论，百度对组合的判断首先判断TITLE完整配对，然后不分位置组合]</span><br /><br />　　<strong>10. 关键字 词组</strong><br /><br />　　你可以用由多个单词组成的关键词词组，如&ldquo;SEO services&ldquo;.当你优化的关键词是非常热门（指的是好多人都在优化这个）的时候，这种方法是最好的。你可以找一些接近的相关的关键词，然后把它们组合，就可能会得到比较新的关键词词组，拿它作为优化的关键词可能效果会更好。<br /><br />　　权重: +1<br /><br />　　<strong>11. 第二关键词</strong><br /><br />　　第二关键词<br /><br />　　为第二关键词做优化是一个再好不过的主意了，因为大家都在优化最流行的关键词，那么为页面设置较为生疏的关键词就降低了竞争的成本。<br /><br />　　权重: +1<br /><br /><span style="COLOR: red">[核桃：蓝海策略与长尾理论其实是一样的，做相关关键词，积小流成大河]</span><br /><br />　　<strong>12.关键词分支</strong><br /><br />　　关键词分支<br /><br />　　这个对英文来说不算一个因子，因为英语一个单词的子形态和原态是差不多的。比如你的页面上又dog这个关键词，那么dog,dogs,doggy.会被认为是相关联的。但是对于其他语言关键词的子形态可能和原态相差很远，比如汉语，&ldquo;音乐，摇滚页&rdquo;可能作为音乐网站都是很重要的关键词，但是完全是不一样的。那么你就需要考虑吧相关的关键词都尽心优化。（举的例子可能不恰当，大家知道什么意思就可以咯）<br /><br />　　权重: +1<br /><br /><span style="COLOR: red">[核桃：依然是长尾，还有一些附加关键词，比如：&ldquo;马云&rdquo;与&ldquo;阿里巴巴&rdquo;是相关的，问题是搜索引擎能不能很好的判断出来]</span><br /><br />　　<strong>13. 同义字</strong><br /><br />　　优化关键词的同时，最好能将该关键词的同义字一起进行优化<br /><br />　　权重: +1<br /><br /><br />　　<strong>14.错误关键词</strong><br /><br />　　拼写错误是经常发生的事情，如果你意识到这点，你可能会为热门关键词可能拼错的词作为自己的关键词。例如，(i.e. Christmas and Xmas),你可以尝试为这些做优化，是的，这样确实可能给你带来一些流量，但是可能给别人很糟的印象，所以你最好不要这样干。<br /><br />　　权重: +0<br /><br />　　<strong>15. 关键词弱化</strong><br /><br />　　当你优化大量关键词的时候（尤其是不相关的），会印象整体关键词的质量，这样可能导致主关键词的作用被弱化。<br /><br />　　权重: -2<br /><br /><span style="COLOR: red">[核桃：一个页面最好定在三个关键词以内，太多的话会相互影响的，只做一个当然最好]</span><br /><br />　　<strong>16.垃圾关键词</strong><br /><br />　　如果你的关键词密度大于10%，会被认为是垃圾关键词，这样将可能导致被搜索引擎惩罚。<br /><br />　　权重: -3<br /><br /><span style="COLOR: red">[核桃：如果出现得很符合常理，被K的可能性很小，但是我们做SEO最重要的是要对搜索引擎友好，基于这上面的SEO才是有意义的]</span><br /><br />　　该文章主要是针对英文网站的SEO,但是这些原则我觉得用在任何搜索引擎都有帮助的，用到baidu也是可以的。因为这些原则都是很基础的原则，具体的请大家自行斟酌。<br /><br />　　翻译自：<a title="http://www.webconfs.com/15-minute-seo.php" target="_blank" href="http://www.webconfs.com/15-minute-seo.php">http://www.webconfs.com/15-minute-seo.php</a> 译者：魏天星【原网站保留该文章所有权利】<br /><br />****************************************<br />核桃只是根据自己近期所学到的一些SEO知识对此文进行读书笔记一样的标注，希望能给大家一点帮助，同时SEO最重要的是实际操作经验，如果只是看理论，你根本不了解别人为什么会得出这样的结论来，就是同一个网站让两个SEO者去分析，都会有很大的差别，所以，学习SEO更重要的是要去实践，然后结合理论进行归纳，形成自己的看法，再进行实践论证，再进行整理，这样的一个过程，将是学习SEO最有价值的过程。<br /><br />网络上的文章转载次数太多，就会变得乱七八糟，当然其中的各种原因相信大家都知道，其实这更像电视节目《快乐大本营》刚开始时的&ldquo;快乐传真&rdquo;一样，到最后变得太多。<br />文章转载太多就会不知道出处，这篇文章核桃找了很久的出处，跟我所想是一样，真的是国外人写的（原文地址：自：<a title="http://www.webconfs.com/15-minute-seo.php" target="_blank" href="http://www.webconfs.com/15-minute-seo.php">http://www.webconfs.com/15-minute-seo.php</a>），翻译是：<a title="http://blog.sina.com.cn/u/1241758252" target="_blank" href="http://blog.sina.com.cn/u/1241758252">雪海飘香</a> <br />同时找他到在<a title="http://home.donews.com/donews/article/1/112615.html" target="_blank" href="http://home.donews.com/donews/article/1/112615.html">donews</a>的这篇文章，应该算是首发地址：<a title="http://home.donews.com/donews/article/1/112615.html" target="_blank" href="http://home.donews.com/donews/article/1/112615.html">http://home.donews.com/donews/article/1/112615.html</a><br /><br />---------------------------------------------------------<br /><strong>作者</strong>：核桃<br /><strong>首发</strong>：seo策划(<a href="http://www.abseo.cn">http://www.abseo.cn</a>)<a title="http://www.todocn.com/blog/" target="_blank" href="http://www.todocn.com/blog/"><font color="#800080"></font></a><br /><strong>原文</strong>：<a href="http://www.abseo.cn/blog/seo_teaching/15_minute_seo.html">http://www.abseo.cn/blog/seo_teaching/15_minute_seo.html<br /></a>转载请保留以上的信息。]]></description><category>相关教程</category><comments>http://www.abseo.cn/blog/seo_teaching/15_minute_seo.html#comment</comments><wfw:comment>http://www.abseo.cn/blog/</wfw:comment><wfw:commentRss>http://www.abseo.cn/blog/feed.asp?cmt=12</wfw:commentRss><trackback:ping>http://www.abseo.cn/blog/cmd.asp?act=tb&amp;id=12&amp;key=00a3264c</trackback:ping></item><item><title>不用做SEO成功建站的最佳10 个步骤</title><author>a@b.com (核桃)</author><link>http://www.abseo.cn/blog/seo_teaching/no-seo.html</link><pubDate>Thu, 16 Aug 2007 07:02:29 +0800</pubDate><guid>http://www.abseo.cn/blog/seo_teaching/no-seo.html</guid><description><![CDATA[<p>随着搜索引擎在互联网中地位的提高，SEO（<a href="http://www.abseo.cn/blog/seo_teaching/shen_me_shi_seo.html" target="_blank">搜索引擎优化</a>）已经成为建立一个网站必须的一部分。但 SEO 专家 Tadeusz Szewczyk 在 Google Blogosoped 上却写下了一篇 <a target="_blank" href="http://blogoscoped.com/archive/2007-07-31-n90.html"><font style="BACKGROUND-COLOR: #eaffcc" color="#336633">10 Steps to Success on the &rsquo;Net Without SEO</font></a>，传授我们无需 SEO 成功建站的方法。尤其对于我们这些并不是很需要高流量高 PV 的<a href="http://www.abseo.cn/blog/" target="_blank">博客</a>来说，是一份不错的参考资料，下面简要翻译一下：</p><ol>    <li><strong>选好你的位置</strong><br />    要与众不同，选择一个并不是广泛讨论或熟知的话题和产品。所谓的选取话题，并不是让你像 SEO 中那样在搜索引擎中去选取优化关键字，你应该努力去介绍你自己的话题，而不是去迎合 Google 用户的需求。选取一个新颖的角度，即使像 <a href="http://www.abseo.cn"><font color="#000000"><em>SEO</em></font></a> 这样非常热门的话题中，仍然可以出现一些标新立异的东西。 </li>    <li><strong>使用 WordPress<br />    </strong>WordPress 本身提供了良好的搜索引擎优化，你可以用它来替代&ldquo;逐页面优化&rdquo;。WordPress 不仅仅是一个 Blog 平台，它甚至可以被用作一个小型 CMS，基本能够满足大多数网站的要求。此外，搜索引擎提交例如 XML 站点地图在 WordPress 中几乎是不需要的，因为它会自动 Ping Google Blogsearch，而你的新文章会在几个小时内出现在 Google 搜索引擎中。 </li>    <li><strong>设计一个漂亮的 CSS 外观并将网站提交到 CSS 画廊中<br />    </strong>传统的 SEO 主要是建立链接和得到链接。进行 SEO 的网站通常看起来都非常糟糕。近年来，人们经常会链接设计精良的网站。和前几年不同的是，如今 CSS&nbsp;和 Web 标准是设计一个网站最佳的方案。如今，建立一个设计精良的网站并不是什么难题，特别是在 WordPress 中。一个漂亮的设计，可能会让你的网站被很多人链接。看看<a target="_blank" href="http://cssjuice.com/30-weblogs-with-grid-based-design/"><font style="BACKGROUND-COLOR: #eaffcc" color="#89c189">这个</font></a>你就能理解其中的原因了。 </li>    <li><strong>允许引用通告，使用 dofollow<br />    </strong>相互交流才能使 Blog 繁荣。将 Blog 们联系在一起的最佳方案就是引用通告了。安装 <a target="_blank" href="http://seo2.0.onreact.com/dofollow-spread-link-love"><font style="BACKGROUND-COLOR: #eaffcc" color="#336633">dofollow 插件</font></a>，以便防止将其它 Blogger 当作 spammer 来对待。 </li>    <li><strong>社会化，发表评论，链接他人<br />    </strong>在你的文章中链接或提及其它 Blogger。此外，对别人的文章发表评论，因为 Blog 并不是自言自语。 </li>    <li><strong>在你的站点中包含网摘，你自己也要使用网摘</strong><br />    在你的 Blog 中应该包含流行网摘网站的收藏按钮。但要小心像 Digg 和 Reddit 这样的网站，他们有可能会摧毁你的服务器，或者由于大量的流量给你造成不少的费用。 </li>    <li><strong><a href="http://www.abseo.cn/blog/hetao_seo/95.html" target="_blank">原创</a>文章，写一些新颖的东西</strong><br />    写一些你自己的东西，不要只是链接到别人的站点上。写一些别人没有讨论过的东西。 </li>    <li><strong>汇整你所知道的或其他人说过的东西，并将他们发布出来</strong><br />    如果所有方面都被其他人讨论过了，那么你就汇整他们并做一个列表。有些列表，例如 200 个 Wordpress 插件，感觉有点太多了，&ldquo;10 个不可或缺的 WordPress 插件&rdquo;显然更好一些。 </li>    <li><strong>向你喜欢的站点投稿<br />    </strong>不要仅仅发布在你自己的 Blog 上，提交到其它的公共站点上。大多数编辑都会加上你的链接的。 </li>    <li><strong>至少每两天就要有一篇新文章<br />    </strong>稳定的更新频率可以保证稳定的读者群。如果人们只是每个月看一次你的 Blog，他们很可能没有任何印象。当然，每天更新也不是必须的，但如果你写一个 Blog 的话，至少保证一周要更新三次。 <br />    </li></ol>来自：<a href="http://blog.istef.info/2007/08/02/10-steps-to-success-without-seo/">http://blog.istef.info/2007/08/02/10-steps-to-success-without-seo/</a><br />]]></description><category>相关教程</category><comments>http://www.abseo.cn/blog/seo_teaching/no-seo.html#comment</comments><wfw:comment>http://www.abseo.cn/blog/</wfw:comment><wfw:commentRss>http://www.abseo.cn/blog/feed.asp?cmt=10</wfw:commentRss><trackback:ping>http://www.abseo.cn/blog/cmd.asp?act=tb&amp;id=10&amp;key=ea63314d</trackback:ping></item><item><title>Flash站的SEO优化整理（四）</title><author>a@b.com (核桃)</author><link>http://www.abseo.cn/blog/seo_teaching/flash_seo_4.html</link><pubDate>Wed, 15 Aug 2007 10:36:41 +0800</pubDate><guid>http://www.abseo.cn/blog/seo_teaching/flash_seo_4.html</guid><description><![CDATA[<p>关于这个<strong>全FLASH站的SEO</strong>专题，这篇文章应该是最后的一篇了，总共只有四篇文章发布，但是真正的SEO对于FLASH来说，还是具有相当的难度过，最重要的是搜索引擎对于FLASH文件读取的困难，导致这种虽然很炫的WEB文件却不能很好地运用起来。<br />这一篇是来自于<strong>蓝色理想</strong>的SEO教程。<br /><br />前言：<br /><br /><strong><a href="http://www.abseo.cn/" target="_blank">核桃</a></strong>决定要在<a href="http://www.abseo.cn/"><font color="#800080">SEO<a href="http://www.abseo.cn/blog/" target="_blank">策划</a></font></a>里整理一篇关于FALSH站如何优化的文章，所以一直在收集与此相关的资料，现在看起来资料相当的少，其实FLASH站与视频站的优化几乎差不多，者属于文字比较少而且不好做SEO的类型。<br /><br /></p><h1>Flash 网站的 SEO </h1><p>作者：HBrO</p><p>目前，全FLASH站里头的文字很难给一般的搜索引擎捕捉到（可能以后GOOGLE会有改善吧），因为搜索引擎只分析HTML页面里头的文字（动态页面如ASP，PHP那些也行，不过优先级会比较低），所以，FLASH在这方面是很吃亏的。之前也有人在这里发过关于FLASH的SEO问题，是通过XHTML实现的，今天我要给大家介绍的是另一种方法：通过网页重定向以及我上一篇教程的FLASH站定位技术。</p><p><strong>PS</strong>：这两种方法在搜索引擎眼里，都是作弊的行为。一个不小心，服务器给封了也不知道。所以建议大家如果真要用这些办法时得小心。我现在用的服务器不是自己的，所以我比较谨慎，在把页面提交给百度之前，我先联系了百度站长，直到他回复我才敢开始行动。<br /><strong>定位技术</strong>：<a target="_blank" href="http://www.blueidea.com/tech/multimedia/2006/3948.asp"><font color="#800080">http://www.blueidea.com/tech/multimedia/2006/3948.asp</font></a></p><p>还算成功的效果演示：<br /><a target="_blank" href="http://www.baidu.com/s?wd=site%3Ahbro.cincn.com&amp;cl=3">http://www.baidu.com/s?wd=site%3Ahbro.cincn.com&amp;cl=3</a><br />此为百度收录我网站里头的页面，点里头的任一链接（最好选择发布时间比较晚的那些），你会看到一整版比较单调的文字，在1~2秒（时间由网速决定）后，就重定向至我的FLASH页面，但是大家可以注意到，文字最后是显示在SWF里头。<br />本来是可以用META或者JS直接重定向就免掉那个延迟的，但是我还是比较小心，利用搜索引擎对FLASH支持性的缺陷，把重定向代码写在了一个FLASH控件里，因此，就有个加载FLASH的延迟。所以，我只能说还算成功。<br />重定向以后，其实都是定向于同一地址，因为整个站属于单一HTML页面的FLASH网站。因此，需要用到我的上一篇文章所介绍的定位技术让搜索结果的文字在SWF里得到正确的显示，否则，就是欺骗了用户，我也不需要在这里介绍我的做法，因为只要拼命造假就可以了。 </p><p><strong>下面介绍做这个SEO的步骤</strong>：</p><p>1、首先大家要认识到，搜索引擎捕捉不了FLASH里的文字，因此，FLASH里的文本需要在外部读取。这里，每一则新闻做成一个HTML文件，既让FLASH可以读取，也让搜索引擎可以抓到。如page1.html，page2.html，page3.html</p><p>2、在给搜索引擎提交页面的时候，一般都只提交首页，然后根据首页的链接等去捕捉其它页面。如果提交的是一个纯FLASH页面，所有链接，外部读取的文件都通过AS实现的话，搜索引擎将无法获取其它分页的地址。因此，我们需要制作一个HTML文件，放置相关的链接，如果希望用户一开始看到的是FLASH页面，就用一次重定向代码，到FLASH页去，并且不带参数。所以把FLASH首页文件命名为index_flash.htm，HTML版的页面命名为index.html，接着，在index.html里加入重定向代码。建议不要用META，很容易给搜索引擎枪毙。这里，可以采用JS：</p><p><span class="code"><font color="#000000">&lt;script language=&quot;javascript&quot;&gt;<br />location.href=&quot;index_flash.html&quot;<br />&lt;/script&gt;</font></span></p><p>最保险的还是放在FLASH里，用getURL来重定向，但这会造成延迟，影响用户体验。</p><p>3、捕捉到的分页也需要重定向至FLASH页面，此时需要把参数传到FLASH中，因此重定向的地址必须是一个带参数的，并且能区分不同页面，最好的参数就莫过于当前HTML页面的地址了。比如说在page1.html里加上：</p><p><span class="code"><font color="#000000">&lt;script language=&quot;javascript&quot;&gt;<br />location.href=&quot;index_flash.html#page1.html<br />&lt;/script&gt;</font></span></p><p>4、让JS把location.hash值传给Flash，让Flash读回page1.html里的内容。在JS里用setVariable来设置：index_flash.setVariable(&quot;link&quot;,document.location.hash.slice(1))<br />在Flash获取到link值以后，用LoadVars读出来：</p><p><span class="code"><font color="#000000">var lv=new LoadVars()<br />lv.load(link)<br />lv.onData=function(src){<br />&nbsp; textBox.text=src<br />}</font></span></p><p>关于第3、4点的一些细节，在我的第一篇文章里有提及：<br /><a target="_blank" href="http://www.blueidea.com/tech/multimedia/2006/3948.asp"><font color="#800080">http://www.blueidea.com/tech/multimedia/2006/3948.asp</font></a></p><p>接下来，我会做一个简单的演示文档，结合实例把上面的步骤具体化。<br /><br /></p><p>演示文档完成了，但是由于涉及的文件比较多，直接给大家测试不方便，所以，先把整个制作过程跟大家描述下：</p><p>1、 在你的站点放入几个HTML文件，page1.html，page2.html，page3.html，请注意，为了处理的方便，格式不要太复杂。最好使用如下格式：</p><p><span class="code"><font color="#000000">&lt;title&gt;新闻标题&lt;/title&gt;&lt;script language=&quot;javascript&quot; src=&quot;toNews.js&quot;&gt;&lt;/script&gt;&lt;body&gt;正文内容&lt;/body&gt;</font></span></p><p>toNews.js是每个分页都重用的重定向代码，故独立出来一个文件<br />location.href=&quot;index_flash.html#&quot;+document.location//把地址作为参数传到 _fcksavedurl=&quot;&quot;index_flash.html#&quot;+document.location//把地址作为参数传到&quot; Flash页面中识别。</p><p>2 、制作向搜索引擎提交的首页index.html，该页不能是FLASH版的，必须包含page1.html，page2.html，page3.html这些链接，或者通过层数不多的HTML分析，可以获取这些地址。<br />index.html范例：<br />然后index.html里再加上代码：</p><p><span class="code"><font color="#000000">&lt;script language=&quot;javascript&quot;&gt;<br />location.href=&quot;index_flash.html&quot;<br />&lt;/script&gt;</font></span></p><p>以让你的HTML版网页重定向至FLASH版网页。<br />附：index.html范例：</p><p><span class="code"><font color="#000000">&lt;a href=&quot;page1.html&quot;&gt;news1&lt;/a&gt;&lt;br&gt;<br />&lt;a href=&quot;page2.html&quot;&gt;news2&lt;/a&gt;&lt;br&gt;<br />&lt;a href=&quot;page3.html&quot;&gt;news3&lt;/a&gt;&lt;br&gt;<br />&lt;script language=&quot;javascript&quot;&gt;<br />location.href=&quot;index_flash.html&quot;<br />&lt;/script&gt;</font></span></p><p>做到这一步，只要向百度提交index.html并被收录，百度就会把page1.html，page2.html，page3.html列入索引中。</p><p>下面实现的就是如何通过重定向把内容显示在FLASH中。<br /><br /></p><p>3、 新建一个FLASH文档，在舞台放置两个多行动态文本框，实例名分别为titles和contents，分别放新闻标题及内容。<br />本来，笔者打算直接把index.html直接读进titles文本框里，可惜链接放进去就会跳转页面，如果要避免的话，必须通过字符串分析把链接改成asfunction协议，此法麻烦，而且容易受内容影响而出错。所以，还是再建一个XML文档提供给FLASH去读取好了。<br />在index.html所在目录下，建一XML文件news.xml</p><p><span class="code"><font color="#000000">&lt;?xml version=&quot;1.0&quot; encoding=&quot;GB2312&quot;?&gt;<br />&nbsp; &lt;news&gt;<br />&nbsp;&nbsp;&nbsp; &lt;a href=&quot;page1.html&quot; title=&quot;news1&quot;/&gt;<br />&nbsp;&nbsp;&nbsp; &lt;a href=&quot;page2.html&quot; title=&quot;news2&quot;/&gt;<br />&nbsp;&nbsp;&nbsp; &lt;a href=&quot;page3.html&quot; title=&quot;news3&quot;/&gt;<br />&nbsp; &lt;/news&gt;<br />在Flash里新建一图层，添加帧代码：<br />System.useCodepage = true;<br />titles.html = true;<br />var titlesLv = new XML();<br />titlesLv.load(&quot;news.xml&quot;);<br />titlesLv.onLoad = function(success) {<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; if (success) {<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; var titles_arr = new Array();<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; var hrefs_arr = new Array();<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; titles.htmlText = &quot;&quot;;<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; for (var i in titlesLv.childNodes[0].childNodes) {<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; titles_arr[i] = titlesLv.childNodes[0].childNodes[i].attributes.title;<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; hrefs_arr[i] = titlesLv.childNodes[0].childNodes[i].attributes.href;<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; }<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; for (var i in titles_arr) {<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; titles.htmlText += &quot;&lt;br&gt;&lt;a href=\&quot;asfunction:loadNews,&quot;+hrefs_arr[i]+&quot;\&quot;&gt;&quot;+titles_arr[i]+&quot;&lt;/a&gt;&quot;;<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; }<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; }<br />};</font></span></p><p>此段代码是把解析XML文件的，不属本教程的重点，故不再赘述。<br />这其中的loadNews函数是调用新闻的，在下面添加：</p><p><span class="code"><font color="#000000">var contentsLv = new LoadVars();<br />function loadNews(href) {<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; contentsLv.load(href);<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; fscommand(&quot;setAddress&quot;,href)//让新闻加载的时候，修改地址栏#后的内容。这将在JS里定义。<br />}<br />contents.html = true;<br />contentsLv.onData = function(src) {<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; fscommand(&quot;setTitle&quot;,getTitle(src))//setTitle修改页面的标题，也在JS里定义。getTitle从html字符串里获得标题。该函数在AS里定义<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; contents.htmlText = getContents(src);//getContents从html字符串里获取正文内容，将在AS里定义。</font></span></p><p>下面定义这两个字符串分析函数：<br />分页html的格式：</p><p><span class="code"></span></p><p>保存FLA文件到index.html所在目录，文件名为index_flash.fla。然后点&ldquo;文件&rdquo;-&ldquo;发布设置&rdquo;，在HTML选项卡里，模板下拉选择&ldquo;带FSCOMMAND跟踪的FLASH&rdquo;，然后点&ldquo;发布&rdquo;按钮。接着在&ldquo;格式&rdquo;选项卡里把HTML勾去掉。 <br /><br /></p><p>4、 此时用记事本打开生成的index_flash.html，找到//代码放在此处（Place your code here）这句，在index_flash_DoFSCommand函数里写：</p><p><span class="code"><font color="#000000">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; if(command==&quot;setTitle&quot;){<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; theTitle=args<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; }<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; if(command==&quot;setAddress&quot;){<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; document.location.hash=args<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; }</font></span></p><p>然后，在该函数外定义一个设置标题的函数：</p><p><span class="code"><font color="#000000">function setTitle(){<br />&nbsp; document.title=theTitle<br />&nbsp; id=setTimeout(setTitle,1000)<br />}</font></span></p><p>之所以使用周期回调，不知道是不是BUG的缘故，经常改完标题后，都会自动改回来，或者多个#号什么的。<br />现在，还需要在加载后通过JS调用Flash的loadNews函数。在Flash 8控件里头，可以通过CallFunction轻松调用函数，AS3甚至通过ExternalInterface可以直接在JS里写AS函数，但是目前还有少数用户的PLAYER处在7的阶段，所以就先介绍老方法：setVariable。<br />该方法可以设FLASH控件的变量值，但是如何通过改变量触发Flash的loadNews函数呢？这里介绍AS里头的addProperty方法。<br />Object.addProperty(proname:String,getter:Function,setter:Function)<br />proname，属性名称。<br />getter，当读取变量时调用的函数。<br />setter，当设置变量时调用的函数。<br />我们通过添加一个这样的属性，让JS的setVariable执行的时候，调用该函数。<br />AS里追加：</p><p><span class="code"><font color="#000000">this.addProperty(&quot;link&quot;,getLink,setLink)<br />function getLink(){<br />}<br />function setLink(link){<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; loadNews(link)<br />}</font></span></p><p>不知道为什么，如果不定义getLink，这个setLink也不可用，所以只好把这形式弄上去。</p><p>所以，此时可以在JS里添加这么个函数：</p><p><span class="code"><font color="#000000">function JS_loadNews(){<br />&nbsp; if(document.location.hash.slice(1)!=&quot;&quot;){//假如#号后面不带参数<br />&nbsp;&nbsp;&nbsp; index_flash.setVariable(&quot;link&quot;,document.location.hash.slice(1))//就设定FLASH里的link值，从而调用里头的loadNews函数。<br />&nbsp; }<br />}</font></span></p><p>然后在body标签里加onload=JS_loadNews()<br />此时，重定向到FLASH页面，并且真实反映相关内容的过程已经完成。虽然本质是一种作弊行为，但是已经没有欺骗用户了。</p><p>最后，往百度提交index.html，就可以给百度收到4个页面了。当然，内容要合法，否则也会给拒绝收录。<br />至于如何提高排名，那是内容的问题了，不是技术层面的东西，就不在这讨论了。一般来说，META的关键字标签的合理使用，会对提高排名有一定的作用。</p><p>附：测试地址<br /><a target="_blank" href="http://hbro.cincn.com/hbro/course/FlashWebSEO/index.html">http://hbro.cincn.com/hbro/course/FlashWebSEO/index.html</a><br /><a target="_blank" href="http://hbro.cincn.com/hbro/course/FlashWebSEO/page1.html">http://hbro.cincn.com/hbro/course/FlashWebSEO/page1.html</a> </p><p><strong>经典论坛讨论</strong>：<br /><a href="http://bbs.blueidea.com/viewthread.php?tid=2668685">http://bbs.blueidea.com/viewthread.php?tid=2668685</a></p><p><strong>Flash全站的技术应用系列</strong>：<br />（一）<a target="_blank" href="http://www.blueidea.com/tech/multimedia/2006/3948.asp"><font color="#800080">AS+JS的Flash网站无刷新定位技术&nbsp; <br /></font></a>（二）<strong>Flash网站的SEO</strong> (<strong>本文</strong>)<br />（三）<a target="_blank" href="http://www.blueidea.com/tech/multimedia/2006/3986.asp"><font color="#800080">Flash网站的流量统计</font></a><br />（四）<a target="_blank" href="http://www.blueidea.com/tech/multimedia/2006/3987.asp"><font color="#800080">让Flash网站具有IE前进后退的功能</font></a><br />（五）<a target="_blank" href="http://www.blueidea.com/tech/multimedia/2006/4031.asp"><font color="#800080">图片轮换效果</font></a><br /><br />来自：<a href="http://www.blueidea.com/tech/multimedia/2006/3967.asp">蓝色理想</a></p><p>&nbsp;</p><p>&lt;title&gt;新闻标题&lt;/title&gt;&lt;script language=&quot;javascript&quot; src=&quot;toNews.js&quot;&gt;&lt;/script&gt;&lt;body&gt;正文内容&lt;/body&gt;</p><p>function getTitle(str){<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; var beginIndex=str.indexOf(&quot;&lt;title&gt;&quot;)+7//标题符从&lt;title&gt;标签开始<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; var endIndex=str.indexOf(&quot;&lt;/title&gt;&quot;)//结束于&lt;/title&gt;标签<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; return str.slice(beginIndex,endIndex)//标记后用slice函数截得<br />}<br />function getContents(str){<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; var beginIndex=str.indexOf(&quot;&lt;/title&gt;&quot;)+8//正文可以从&lt;/title&gt;开始，也可以选择&lt;body&gt;标签<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; return str.slice(beginIndex)//标记后用slice截取。<br />}<br />};</p>]]></description><category>相关教程</category><comments>http://www.abseo.cn/blog/seo_teaching/flash_seo_4.html#comment</comments><wfw:comment>http://www.abseo.cn/blog/</wfw:comment><wfw:commentRss>http://www.abseo.cn/blog/feed.asp?cmt=9</wfw:commentRss><trackback:ping>http://www.abseo.cn/blog/cmd.asp?act=tb&amp;id=9&amp;key=4bd659c0</trackback:ping></item><item><title>Flash站的SEO优化整理（三）</title><author>a@b.com (核桃)</author><link>http://www.abseo.cn/blog/seo_teaching/flash_seo_3.html</link><pubDate>Wed, 15 Aug 2007 08:24:24 +0800</pubDate><guid>http://www.abseo.cn/blog/seo_teaching/flash_seo_3.html</guid><description><![CDATA[<p>上一篇关于FLASH站做SEO的<strong>海马科技</strong>文章讲的技术大家看完没有？如果有试验结果的话要记得分享了，不要学会了东西自己放在肚子里，这样别人也不会跟你交流的哈哈~！<br /><br />前言：<br /><br /><strong><a href="http://www.abseo.cn/" target="_blank">核桃</a></strong>决定要在<a href="http://www.abseo.cn">SEO<a href="http://www.abseo.cn/blog/" target="_blank">策划</a></a>里整理一篇关于FALSH站如何优化的文章，所以一直在收集与此相关的资料，现在看起来资料相当的少，其实FLASH站与视频站的优化几乎差不多，都属于文字比较少而且不好做SEO的类型。<br /><br />今天的文章来自己于一位属于点石互动的成员，也是一位SEO高手的<a href="http://www.abseo.cn/blog/" target="_blank">博客</a>：田锋林的博客。大家看看他真正的全flash站做SEO的终极研究成果。<br /><br /></p><h1>田锋林：搜索引擎对Flash视频的抓取及其SEO策略</h1><div class="post-body"><p><a href="http://blog.5ixb.com/"><font color="#000000">SEO博客</font></a>很早前做了这个&ldquo;Flash的搜索引擎抓取实验&rdquo;，现将实验成果拿来以作分享：</p><p>一般由于搜索引擎对于Flash页面的抓取效果不是很好，部分搜索引擎甚至无法抓取Flash程序，所以SEO们在进行站点优化的时候都会写上这条&ldquo;减少Flash在网页中的使用&rdquo;，今天我们来做这样一个实验：</p><p><strong>实验准备：</strong><a href="http://blog.5ixb.com/flash/chart.swf"><font color="#000000">http://blog.5ixb.com/flash/chart.swf</font></a>(搜索引擎关系图)</p><p><strong>实验目的：</strong>验证Google，yahoo等对Flash的抓取效果以便更好的指导Flash的<a href="http://blog.5ixb.com/"><font color="#000000"><a href="http://www.abseo.cn/blog/seo_teaching/shen_me_shi_seo.html" target="_blank">搜索引擎优化</a></font></a>工作的进行。</p><p><strong>实验步骤：</strong></p><p>1、flash页面的制作，本次实验不是将Flash镶嵌至网页当中，直接采用Flash地址：<a href="http://blog.5ixb.com/flash/chart.swf"><font color="#000000">http://blog.5ixb.com/flash/chart.swf</font></a></p><p>2、页面提交，分别向<a href="http://www.google.cn/"><font color="#000000">谷歌</font></a>和<a href="http://www.yahoo.cn/"><font color="#000000">雅虎</font></a>进行提交。<a href="http://www.google.cn/intl/zh-CN/add_url.html"><font color="#000000">谷歌页面登录入口</font></a>，<a href="http://search.help.cn.yahoo.com/h4_4.html"><font color="#000000">雅虎页面登录入口</font></a>。</p><p>3、适当的做好外部链接工作（在<a href="http://blog.5ixb.com/"><font color="#000000">SEO博客</font></a>的一篇文章&ldquo;<a href="http://blog.5ixb.com/seo/seo-tools.html"><font color="#000000">SEO工具集合</font></a>&rdquo;中加入此链接，使用这类文章的链接诱饵效果比较好），以便加快收录。</p><p>4、观察收录效果，分析SERP页面Flash相关信息抓取的构成要素。</p><p>5、根据步骤4的观察制定Flash的<a href="http://blog.5ixb.com/"><font color="#000000">搜索引擎优化</font></a>方案。</p><p><strong>实验效果观察：</strong></p><p><strong>Google对Flash抓取的SERP：</strong></p><p>&nbsp;<img alt="Google对Flash的抓取效果" src="http://blog.5ixb.com/upload/google-flash.jpg" /></p><p><strong>yahoo对Flash抓取的SERP：</strong></p><p><img alt="Yahoo对Flash的抓取效果" src="http://blog.5ixb.com/upload/yahoo-flash.jpg" /></p><p><strong>实验数据分析：</strong></p><p><table style="WIDTH: 608px; HEIGHT: 126px" cellspacing="1" cellpadding="1" width="608" align="left" summary="" border="1">    <caption><font size="2">Google、Yahoo对Flash文件抓取的SERP分析表</font></caption>    <tbody>        <tr>            <td>&nbsp;</td>            <td><strong>Google</strong></td>            <td><strong>Yahoo</strong></td>        </tr>        <tr>            <td><strong>标题</strong></td>            <td>含有HTML标签的Flash文字的Initial Text属性,Text String属性</td>            <td>Flash文字的Initial Text属性</td>        </tr>        <tr>            <td><strong>描述</strong></td>            <td>含HTML标签和属性的text1，text2，text3...的组合</td>            <td>text1，text2，text3...的简单的叠加组合</td>        </tr>        <tr>            <td><strong>快照</strong></td>            <td>无</td>            <td>有 （<a href="http://202.43.217.123/search/cache.html?ei=UTF-8&amp;icp=1&amp;u=blog.5ixb.com/flash/chart.swf&amp;w=&amp;d=B0kiUernO4Hs&amp;s=&amp;i=1"><font color="#000000">查看Yahoo快照</font></a>）</td>        </tr>    </tbody></table></p><p>&nbsp;</p><a href="http://blog.5ixb.com/upload/yahoo-flash.jpg"></a><p>&nbsp;</p><p>&nbsp;</p><p>&nbsp;</p><p>&nbsp;</p><p>&nbsp;由于图片中的观察结果，我们有必要查看Flash文件的元件中的文字部分，详细了解搜索引擎对Flash文字元件的抓取。</p><p>下图为经过&ldquo;闪客精灵&rdquo;查看到的Flash视频的各个元素组成：</p><p><img alt="标题" src="http://blog.5ixb.com/upload/snap1.jpg" /></p><p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 图1</p><p><img alt="标题" src="http://blog.5ixb.com/upload/snap1.jpg" /></p><p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 图2</p><p>由图一可以看出，google对Flash视频的抓取的SERP标题展示的时候直接罗列文字中的Initial Text属性的值。描述部分使用text前面几项的简单组合，不会过滤HTML标签，所以展示页面显示的比较混乱。</p><p>yahoo的抓取直接过滤掉HTML标签和属性，SERP对标题和描述的组成与Google雷同，比较直观，我们可以通过快照观察到这些文字。</p><p><strong>FLSH的SEO策略制定：</strong></p><p>根据Google和Yahoo Spider对Flash视频的抓取情况，再结合Jonathan Hochman的一篇文章（<a title="How To SEO Flash" href="http://www.jehochman.com/articles/seo-friendly-flash.shtml"><font style="BACKGROUND-COLOR: #ffffff" color="#0000ff">How To SEO Flash</font></a> ）我们制定以下Flash<a href="http://blog.5ixb.com/"><font color="#000000">搜索引擎优化</font></a>规则：</p><p>1、Flash制作的时候注重text1，text2，text3...前面的几个text中的Initial Text属性的书写。</p><p>这些属性支持HTML语言，根据需要适当的把握，针对Google优化的时候可以少用点HTML标签，以便SERP页面看上去很整齐，针对Yahoo优化的时候可以使用HTML进行相关文字的格式的约束。</p><p>2、关键字的布设，Initial Text属性和Text String属性中的关键字也就是展示在标题中的关键字了，权重和重要性不言而喻。</p><p>3、推荐Flash的搜索引擎优化使用了搜索引擎兼容的DIV标签、原始内容和叫做<a href="http://blog.deconcept.com/swfobject/"><font color="#0063dc">SWFObject()</font></a>的JS函数&mdash;它能够检测什么时候浏览器可以识别Flash。</p><p>4、外部链接策略，外部链接不仅可以提高该Flash的关注程度，而且可以加快Flash的收录。</p><p>以上几点是本次实验后，关于FLSH视频的SEO优化的总结，不足之处在所难免，欢迎与<a href="http://blog.5ixb.com/"><font color="#000000">枫林</font></a>交流，批评指正，谢谢！</p></div><p><br /></p><div class="post-body">作者: <a href="http://www.yanerquan.com/jianli"><font color="#000000">枫林</font></a><br />原载: <em><a title="搜索引擎优化" href="http://blog.5ixb.com/"><font color="#000000">搜索引擎优化</font></a><a title="SEO" href="http://blog.5ixb.com/"><font color="#000000">SEO</font></a></em>博客<br />版权所有。转载时必须以链接形式注明作者和原始出处及本声明。<br />本文链接地址: <a href="http://blog.5ixb.com/seo/flash-seo-in-google.html"><font color="#000000">http://blog.5ixb.com/seo/flash-seo-in-google.html</font></a> </div>]]></description><category>相关教程</category><comments>http://www.abseo.cn/blog/seo_teaching/flash_seo_3.html#comment</comments><wfw:comment>http://www.abseo.cn/blog/</wfw:comment><wfw:commentRss>http://www.abseo.cn/blog/feed.asp?cmt=8</wfw:commentRss><trackback:ping>http://www.abseo.cn/blog/cmd.asp?act=tb&amp;id=8&amp;key=26f1be9c</trackback:ping></item><item><title>Flash站的SEO优化整理（二）</title><author>a@b.com (核桃)</author><link>http://www.abseo.cn/blog/seo_teaching/flash_seo_2.html</link><pubDate>Wed, 15 Aug 2007 06:12:46 +0800</pubDate><guid>http://www.abseo.cn/blog/seo_teaching/flash_seo_2.html</guid><description><![CDATA[<p>上一篇关于FLASH站做SEO的文章不知道大家看得怎么样，可以说写得很有深度，接下来的文章是来自<strong>海马科技</strong>的,这篇文章着重介绍了纯FLAHS站做SEO的要点，当然，是不是很实用还要大家去验证。</p><p>前言：<br /><br /><strong><a href="http://www.abseo.cn/" target="_blank">核桃</a></strong>决定要在<a href="http://www.abseo.cn">SEO<a href="http://www.abseo.cn/blog/" target="_blank">策划</a></a>里整理一篇关于FALSH站如何优化的文章，所以一直在收集与此相关的资料，现在看起来资料相当的少，其实FLASH站与视频站的优化几乎差不多，都属于文字比较少而且不好做SEO的类型。<br /><br /></p><h2>为什么说首页全屏Flash难于优化</h2><p>　　对于搜索引擎来说，Flash是毫无意义的元素，搜索引擎无法抓取其中所有的内容和链接，也就是说，如果Flash中包含了到其他页面的链接的话，那么搜索引擎将无法索引 其他页面。<br />　　这也正说明了为什么首页是全屏Flash的网站，在搜索引擎上只有网页标签，其他的什么也没有的原因。<br />　　那么，有没有什么办法既不改变首页漂亮的Flash，又可以使搜索引擎索引到其他页面呢？答案是肯定的，可分为内部优化和外部索引，下面分别讲解。 </p><h3>外部索引</h3><p>　　通过外部导入链接索引各页面。如交换友情链接是避开首页，多与其他页面做交换链 接；在Blog上留言，或申请免费空间，做网站的外部索引页面，使搜索引擎可以快速全 面的索引整个网站。<br />　　但交换链接必定有限；在Blog上留言很可能被认为是垃圾留言；免费空间有不定期 的广告，而且有时还无法访问。外部索引虽然是一种方法，但毕竟有其局限性，归根结底 搜索引擎还是要从首页索引其他各页面的，所以我们建议还是做好站内优化。 </p><h3>内部优化</h3><p><strong>1、优化网页Title标签和Meta标签</strong><br />　　针对确定的关键词对Title、Description等标签进行优化。<br /><strong>2、为网站添加文字导航</strong><br />　　可以做一个基于Flash之上的层，在此层中添加文字链接替代Flash导航栏，使搜索 引擎可以很方便的索引所有网页。<br /><strong>3、制作导航页面</strong><br />　　制作导航页面（网站地图）可以让搜索引擎快速准确地索引整个网站的信息页面。导 航页面的制作要准确、简洁，链接最好不要超过100个，因为Google省略100个以后的链 接，如果超过100个连接最好再另做一页。<br /><strong>4、制作并提交Google Sitemap（Google地图）</strong><br />　　提交Google地图可以使Google很方便的索引你的网站，并且通过Google地图你还 可以主动通知Google哪些页面已经改动，网页的重要程度、刷新频率等的信息。同时， 还可以看到Googlebot是如何抓取你的网站的，以及特定关键词的排名信息，网页索引 信息等。<br /><strong>5、为首页添加内容</strong><br />　　由于首页是全屏Flash，搜索引擎看成只有一个元素，页面比较简洁，如果做好标题 和Meta的优化工作，再配以合理的内容，这样的页面是很有优势的。<br />　　方法类似添加文字导航，但要显示在Flash页面上，如影响美观请参阅方法6。<br /><strong>6、另类方法</strong><br />　　新建一个层，将这个层放在Body开始处（即网页内容开始处的最顶端），里面添加 与关键词相关的内容，最好是将关键词加链接，然后在CSS中将这个层定义为隐藏，这种 方法很有效，大概两个多星期左右，特定关键词排名就可以达到首页，但这属于作弊，还请慎用。 </p><h3>声明</h3><p>　　以上第6种方法只做介绍，仅供参考，由此引起的一切后果本站概不负责。<br />　　毕竟网站排名不是最终目的，最终目的是为您带来更多的目标用户。制作好网站的内 容，使用户有一个好的浏览体验才是留住用户的最佳方式。 </p><p>&nbsp;来源：<a href="http://www.hmseo.org/source/source_article_004.htm">海马科技</a></p>]]></description><category>相关教程</category><comments>http://www.abseo.cn/blog/seo_teaching/flash_seo_2.html#comment</comments><wfw:comment>http://www.abseo.cn/blog/</wfw:comment><wfw:commentRss>http://www.abseo.cn/blog/feed.asp?cmt=7</wfw:commentRss><trackback:ping>http://www.abseo.cn/blog/cmd.asp?act=tb&amp;id=7&amp;key=2cfffea8</trackback:ping></item><item><title>Flash站的SEO优化整理（一）</title><author>a@b.com (核桃)</author><link>http://www.abseo.cn/blog/seo_teaching/flash_seo_1.html</link><pubDate>Wed, 15 Aug 2007 04:02:33 +0800</pubDate><guid>http://www.abseo.cn/blog/seo_teaching/flash_seo_1.html</guid><description><![CDATA[<p><strong><a href="http://www.abseo.cn/" target="_blank">核桃</a></strong>决定要在<a href="http://www.abseo.cn">SEO<a href="http://www.abseo.cn/blog/" target="_blank">策划</a></a>里整理一篇关于FALSH站如何优化的文章，所以一直在收集与此相关的资料，现在看起来资料相当的少，其实FLASH站与视频站的优化几乎差不多，者属于文字比较少而且不好做SEO的类型。</p><p>现在是第一篇，来自己<strong>点石互动</strong>的。<br /><br /></p><h2>Flash视频的SEO优化 </h2><br />依我看来，Flash总是备受斥责、不受欢迎而且对于搜索引擎的可视性有害的。什么是搜索引擎从业者关注Flash的原因？如何优化Flash内容呢？对于Flash来讲，搜索引擎无法读取是最关键的问题，而且近期也不会改善。 Flash具有逻辑性、虽然用户可视，但搜索引擎天生就被设计为读取静态内容的工具；另外，确切说Flash是一个动态的程序，所以对于静态的HTML编码来说它太难分析了。<p><a id="more-402"></a></p><p>网络工具的龙头，Adobe Dreamweaver，在网页中嵌入了Flash代码，但没有提供用户或者搜索引擎处理Flash的快捷通道。除了使用缺省的代码，我更推荐使用基本的 HTML组件来手动处理Flash网页、采用在导入电影控件前自动监测其是否支持Flash的方法。当Flash内容不能在进而优化基本的HTML代码，虽然Flash对于具有播放器的用户来说带来了更强的用户体验。</p><p>2006年4月11日，微软宣布了带有&rdquo;Eolas&rdquo;更新包的IE浏览器，试图阻止ActiveX控件的正常工作。当用户与Flash动画进行互动行为的时候，提示条就出现了，&rdquo;点击激活该控件&rdquo;。这种多余的点击真实让人讨厌，幸运的是，一些编程的技巧可以解决这个问题。</p><p><strong>成功使用Flash的条件</strong></p><p>flash动画是介绍复杂内容的好方式，因为它允许设计师在既定空间内放入大量的内容、而不是使用页面跳转来设计。对于技术类的站点，制作幻灯片或者小动画能够帮助我们描述复杂的产品；对于另一种频率型动画来说，艺术和娱乐类的网站是真正需要多媒体的，而Flash是最完美的解决方案。</p><p>当使用Flash的时候，客观上我们要满足以下需求：</p><ul>    <li>干净的设计 </li>    <li><a href="http://www.abseo.cn/blog/seo_teaching/shen_me_shi_seo.html" target="_blank">搜索引擎优化</a> </li>    <li>不同浏览器的兼容，甚至包括电子屏幕和手机 </li>    <li>代码有效且标准统一 </li>    <li>具有正确的功能 </li></ul><p><strong>Flash编程的搜索引擎优化</strong></p><p>我推荐的Flash的搜索引擎优化使用了搜索引擎兼容的DIV标签、原始内容和叫做<a href="http://blog.deconcept.com/swfobject/"><font color="#0063dc">SWFObject()</font></a>的JS函数&mdash;它能够检测什么时候浏览器可以识别Flash。如果当前的播放器可用，那么Javascript就会将网页DOM模型中的原始内容替换为 Flash视频。大部分搜索引擎的蜘蛛不能处理Flash，所以它们会选择浏览原始内容。原始内容可能包含了链接、标题、样式表、图片&mdash;任何我们能加初始的HTML页面中的元素。通过原始内容的编辑和编辑技巧，Flash视频的使用不再是个问题。</p><p>Flash可访问编程并不是作弊，只要原始内容和视频保持一致。W3C的WAI标准特别指出多媒体内容是可以拥有替代内容的权利的。可访问编程即能够解决虚拟信息传播的用户流失问题、也能够让搜索引擎依靠上下文进行检索。</p><p><strong>SWFObject和UFO</strong></p><p>可以去Geoff Sterns的<a href="http://www.abseo.cn/blog/" target="_blank">博客</a>，<a href="http://blog.deconcept.com/swfobject/"><font color="#0063dc">deconcept</font></a>，去阅读关于SWFObject()的知识和下载相应的JS文件。另一个开源的解决方案，是UFO，可以去<a href="http://www.bobbyvandersluis.com/ufo/"><font color="#0063dc">Bobby van der Sluis</font></a>去找。两个在概念上是一致的。</p><p class="bodySmBold">作者：<strong>Jonathan Hochman<br /><span style="FONT-WEIGHT: normal">文章：</span></strong><a title="How To SEO Flash" href="http://www.jehochman.com/articles/seo-friendly-flash.shtml"><font color="#0063dc">How To SEO Flash</font></a> <strong><span style="FONT-WEIGHT: normal"><span style="FONT-WEIGHT: bold"><br />翻译：</span></span></strong><font color="#0063dc" size="2"><a title="wkcow" href="http://hi.baidu.com/wkcow">wkcow</a><br /></font>来自：<a href="http://www.dunsh.org/2007/01/17/how-to-seo-flash/">点石博客</a></p>]]></description><category>相关教程</category><comments>http://www.abseo.cn/blog/seo_teaching/flash_seo_1.html#comment</comments><wfw:comment>http://www.abseo.cn/blog/</wfw:comment><wfw:commentRss>http://www.abseo.cn/blog/feed.asp?cmt=6</wfw:commentRss><trackback:ping>http://www.abseo.cn/blog/cmd.asp?act=tb&amp;id=6&amp;key=debcf8ed</trackback:ping></item><item><title>什么是SEO</title><author>a@b.com (核桃)</author><link>http://www.abseo.cn/blog/seo_teaching/shen_me_shi_seo.html</link><pubDate>Wed, 15 Aug 2007 00:31:27 +0800</pubDate><guid>http://www.abseo.cn/blog/seo_teaching/shen_me_shi_seo.html</guid><description><![CDATA[<br /><h1><a href="http://www.abseo.cn/blog/seo_teaching/shen_me_shi_seo.html">什么是SEO</a></h1><p><br />这个问题相信所有是SEOer的都曾经问过,<a href="http://www.abseo.cn/" target="_blank">核桃</a>在学习SEO的过程中也一直在试图从另一种语议上对SEO的含义进行重新认识，而仅仅只是在一个<a href="http://www.abseo.cn/"><strong>SEO</strong></a>是一个英语词组的缩写而已。所以, 此文属于刚进入SEO学习阶段的同学,SEO高手们可以略过了。<br /><br />百度词典中SEO是这样的：</p><div class="ptitle">SEO</div><div class="pcixin">abbr.</div><div class="pexplain">1. = Search Engine Optimization【电脑】搜索引擎最佳化</div><div class="pexplain">2. = Senior Executive Officer 高级行政长官</div><div class="pexplain">3. = Systems Evaluation Office 系统评估办公室<br /><br /><strong>seo是什么</strong>?seo是<a href="http://www.abseo.cn/blog/seo_teaching/shen_me_shi_seo.html" target="_blank">搜索引擎优化</a>的英文缩写,它的英文全称是:<font color="#ff0000" size="3">search engine optimization </font>。<br /><br />接下来,<a href="http://www.abseo.cn/" target="_blank">核桃</a>带大家来了解&ldquo;<strong><a href="http://www.abseo.cn/blog/seo_teaching/shen_me_shi_seo.html">什么是SEO</a></strong>&rdquo;比较流行的定义:&nbsp;<br /><br />第一种定义：<br /><br /><strong>SEO是Search Engine Optimization的缩写，用英文描述是to use some technics to make your website in the top places in Search Engine when somebody is using Search Engine to find something，翻译成中文就是&ldquo;搜索引擎优化&rdquo;，一般可简称为搜索优化。与之相关的搜索知识还有Search Engine Positioning（搜索引擎定位）、Search Engine Ranking（搜索引擎排名）。</strong><br /><br /><em>SEO是做什么的</em>？<br /><br />SEO的主要工作是通过了解各类搜索引擎如何抓取互联网页面、如何进行索引以及如何确定其对某一特定关键词的搜索结果排名等技术，来对网页进行相关的优化，使其提高搜索引擎排名，从而提高网站访问量，最终提升网站的销售能力或宣传能力的技术。<br /><br />由于Google是目前世界最大搜索引擎提供商，所以Google也成为了全世界SEOs的主要研究对像，为此Google官司方网站专门有一页介绍SEO，并表明<a target="_blank" href="http://www.google.com/webmasters/seo.html">Google对SEO的态度</a>。<br /><br />在国外，SEO开展较早，那些专门从事SEO的技术人员被Google称之为&ldquo;Search Engine Optimizers&rdquo;，简称SEOs。<br /><br /><strong><a href="http://www.abseo.cn/blog/seo_teaching/shen_me_shi_seo.html">什么是SEO</a></strong>&nbsp; 第二种定义：<br /><br /><a href="http://www.abseo.cn/">SEO</a> 是英文search engine optimization的缩写，其中文意思是搜索引擎优化。而从事这方面工作的就是search engine optimizer，搜索引擎优化师。他们利用工具或者其他的各种手法使自己的合搜索引擎的搜索规则从而获得较好的排名（也就是常说的网站优化）。<u>无止境地追求较前排名是SEO们一世的目标</u>。 <br /><br />在网络营销中，搜索引擎优化排名是一种非常重要的手段，SEO主要就是通过对网站的结构，标签，排版等各方面的优化，使Google等搜索引擎更容易搜索网站的内容，并且让网站的各个网页在GOOGLE等搜索引擎中获得较高的评分，从而获得较好的排名。 <br /><br />当然还有&quot;<strong><a href="http://www.abseo.cn/blog/seo_teaching/shen_me_shi_seo.html">什么是SEO</a></strong>&quot;的第三种定义,这个定义同时被称为最具权威性的SEO定义</div><p>什么是搜索引擎优化（search engine optimization,简称seo）：指遵循搜索引擎的搜索原理，对网站结构、网页文字语言和站点间互动外交略等进行合理规划部署，以改善网站在搜索引擎的搜索表现，进而增加客户发现并访问网站的可能性的这样一个过程. 搜索引擎优化也是一种科学的发展观和方法论，它随着搜索引擎的发展而发展, 同时也促进了搜索引擎的发展。<br /><br />关于<strong><a href="http://www.abseo.cn/blog/seo_teaching/shen_me_shi_seo.html">什么是SEO</a></strong>，应该有一点点了解了吧。其实真正的SEO要在学习中去感受。<br /><br />核桃认为：<font color="#ff0000">SEO的核心是让搜索引擎更清楚地知道一个页面是在说明什么,其它的定义,都是这个核心的注解。<br /></font>因为当一个SEOer将自已的页面展示在搜索引擎面前的，他如果懂得如何向引擎表明自己，那么肯定会排名靠前的，这是不用讨论的。关键在于，每一个SEOer对于这个定义的理解以及其对<font color="#0000ff">SEO是一种心态</font>的认知度都不相同，所以才会出现各种不同的SEO技术手段。当然不同的理解，也让中国现在的SEO行业没有一个真正的属于指导性思想的，类似于SEO准则的东西出现，大家都在摸索中前进。<br /><br />本文参考文章：<br /><a href="http://bk.baidu.com/view/1047.htm"><font color="#800080">http://bk.baidu.com/view/1047.htm</font></a><br /><a href="http://bk.baidu.com/view/7147.html">http://bk.baidu.com/view/7147.html</a><br /><a href="http://www.dunsh.org/2006/07/24/seo-definition/">http://www.dunsh.org/2006/07/24/seo-definition/</a><br /><a href="http://www.shineblog.com/user4/greenskys/archives/2006/677155.shtml">http://www.shineblog.com/user4/greenskys/archives/2006/677155.shtml</a><br /><br /><strong>作者</strong>：<a href="http://www.abseo.cn">核桃</a><br /><strong>首发</strong>：<a href="http://www.abseo.cn/">http://www.abseo.cn/</a><br /><strong>原文</strong>：<a href="http://www.abseo.cn/blog/seo_teaching/shen_me_shi_seo.html">http://www.abseo.cn/blog/seo_teaching/shen_me_shi_seo.html<br /></a>本文属于核桃整理，并在<a href="http://www.abseo.cn">seo<a href="http://www.abseo.cn/blog/" target="_blank">策划</a></a>发布。<br />转载请保留以上信息。<br /></p>]]></description><category>相关教程</category><comments>http://www.abseo.cn/blog/seo_teaching/shen_me_shi_seo.html#comment</comments><wfw:comment>http://www.abseo.cn/blog/</wfw:comment><wfw:commentRss>http://www.abseo.cn/blog/feed.asp?cmt=5</wfw:commentRss><trackback:ping>http://www.abseo.cn/blog/cmd.asp?act=tb&amp;id=5&amp;key=efc0aaa4</trackback:ping></item></channel></rss>
