跟着2006年Web2.0技巧的成长,搜刮引擎也在赓续地调剂本身的
网站抓取策略和网站排名算法,下面就大年夜这两方面谈一下Web2.0技巧对搜刮引擎优化(Search Engine Optimization,搜刮引擎优化)的影响。
搜刮引擎针对RSS的改进
搜刮引擎优化技巧一向都专注更有质量的原创内容、更有针对性的文┞仿标题和更吸惹人的文┞仿摘要上。自负年夜2006年Blog鼓起后,RSS订阅也同时开端风行起来,这在很大年夜程度上也改变了很多人的统??读方法,而搜刮引擎老是跟随用户的存眷而赓续地改进本身的排名算法,所认为你的网站内容体系供给一个RSS订阅功能会是一个异常重要的方面,并且你会发明效不雅异常好。
当然某些网站不欲望部分RSS被搜刮引擎索引,RSS2.0已经可认为RSS Flogs添加标示,类似noindex, follow,搜刮引擎将不再索引你的RSS。
弥补材料问题
Google的弥补材料问题是本年比较受存眷的搜刮引擎优化问题。
弥补材料(Supplemental Result), 是Google帮助索引的一部分。对帮助索引进行抓取的限制少于重要索引。例如,一个网址的参量可能使该网站无法被抓取到重要索引中,但仍可能被抓取到Google的弥补索引里。
根据Google的说法,作为弥补材料的网页,只是一种帮助、弥补的索引,并不作为重要索引。也就是说,这些网页并非在Google的主数据库中,而是在帮助数据库中。一般情况下,当我们在Google长进行搜刮时,它展示给我们的结不雅是主数据库中的网页,并非帮助数据库中的网页。由此可以得出结论,作为弥补材料的网页,在Google的表示会异常差。
如不雅网页被Google列为弥补材料,这对于网站来说是一件不幸的工作。被列为弥补材料的网页,在搜刮结不雅中的排名,都邑表示异常差。如不雅网站本身的PR值较高,情况会稍好一些。
是什么原因造成了网页被Google认为弥补材料呢?大年夜Google本身供给的信息中,我们看不到任何有价值的材料。重要原因可能是网页的Head部分的Description书写不规范造成的和网页内容是复制的。
某位搜刮引擎存眷者曾经有6个雷同主题的网站,这些网站都是用同一个数据库生成的,个中有100多个网页的内容几乎完全一样,并且都是用XHTML+CSS技巧制造。在这些网站中,只有一个网站的所有网页不是弥补材料,其他的网站的页面,除了首页之外全部都是弥补材料。是以困惑弥补材料是因为复制网页造成的。
在复制网页的情况下,弥补材料是某一个特定的URL,而不是一个网页或者一个文件。比如说xxx.com和www.xxx.com,一般来说是同一个文件,然则是两个不合的URL。这两个URL有可能个一一个是正常网页,别的一个倒是弥补材料。
弥补材料是针对特定的日期所抓取的网页快照,也就是说即使是雷同的URL,在Google数据库中也可能存在多个版本,个一一个版本是日期A所抓取的新的内容,这个URL+这个特定的日期和网页快照,可能是在正常的数据库中。而别的一个日期B所抓取的内容(同一个URL,比较老的内容),却可能是在弥补材料数据库中。
在分析了不是弥补材料的网站的网页后,还发明只有这个网站的Description书写规范,Description内容由成段的句子构成,与网页的内容吻合; 而被作为弥补材料的网页,Description内容书写得都很不规范,都是将关键词堆砌几遍。发明这个问题后,搜刮引擎存眷者将个中某些网站网页的Description修改为规范的写法,以期不雅察。然则因为Google几个月都不更新这些页面,无法不雅察到结不雅。于是,搜刮引擎存眷者又用同样的数据库,做了两个网站,这两个网站的内容与以前的网站几乎完全雷同,然则Description采取规范的写法。这两个网站被Google收录后,所有网页都不是弥补材料。
由此,得出结论,Google弥补材料形成的原因是: 网页的Description写法不规范。
弥补材料对排名的影响
如何避免出现弥补材料?
这个问题就比较复杂,要具体情况具体分析。
像前面讲的,同一个URL可能涌如今不合的数据库中,新版本的URL可能会涌如今正常的重要关键词典搜刮中。然则在其他关键词搜刮中,它也可能涌如今弥补资估中。
如不雅你的网站有很多弥补材料,有可能影响排名。然则如不雅这些弥补材料都有一个响应的新的URL+日期+网页快照版本,对排名的影响就不大年夜。如不雅这些弥补资僚绫腔有新的版本,影响就比较大年夜。
1. 网页的Description写法不规范
解决网页被Google列为弥补材料的重要办法,就是规范书写Description。不要在Description里堆砌关键词,Description的内容要与页面的内容吻合; 保持合理的网站构造,确保每个页面都有连接指向,并且连接不被埋藏得很深。
2. 有网址规范化问题。也就是带有www和没有www的两个网址版本都在数据库中,个一一个就有可能被标为弥补材料。
今朝可以经由过程Google供给的治理员对象来同一www和无www域名的网站。
3. 有时刻已经被删除的网页,也就是实际上应当返回404缺点的URL,会被列为弥补材料; 或者域名已经由时了,也有时会被标成弥补材料。
4. 有时刻站长在修改网页之后,新旧内容的两个版本的网页都邑涌如今Google索引中; 糟糕的是,个一一个会被标为弥补材料。
根据一些搜刮引擎存眷者的不雅察,作为弥补材料的网页,被Google爬虫爬行的距离时光异常长,很多时刻几个月、甚至半年都不会被Google爬虫访问,严重影响网页在Google数据库中的更新。同时,这些网页的排名异常差,只有在搜刮结不雅很少的时刻,才会被Google列出来。一般情况下,根本无法在搜刮结不雅里看见这些网页。
5. 复制内容网页。很多转载或抄袭的内容会被标为弥补材料。因为Google也没办法断定哪一个是原创的,所以有时刻原创者也会遭殃。
6. 网页上雷同或类似的内容太多。比如导航体系占网页内容比例比较大年夜,而正文部分比较小。(作者系搜刮引擎优化专家)
如今无论是经由过程Google、MSN, 照样Yahoo进行搜刮,RSS都邑涌如今搜刮结不雅中,例如,当你用Google搜刮一个异常风行的Blog——boing boing,你会发明排名第三的就是FeedBurner记录该Blog的Flog,实际上我们会发明Google确切给拥有Flog的网站额外的PR值。 |