比来,引擎计谋会议在严寒的芝加哥举办。很多谷歌参加者老是被问及关于反复内容的问题。对于这个话题,我们发明有很多破裂的并且有些纷乱的懂得。我们想在此予以澄清。
比来,引擎计谋会议在严寒的芝加哥举办。很多谷歌参加者老是被问及关于反复内容的问题。对于这个话题,我们发明有很多破裂的并且有些纷乱的懂得。我们想在此予以澄清。
什么是内容反复?
反复的内容一般是指在不合域名存放在大年夜量的雷同或类似的内容。很多时刻,它并非有意或至少本无恶意。譬如说,有些论坛会生成一些专为手机屏幕的页面;市廛物品被显示在(有时甚至是链接到)多种不合的URL上,等等。但有些时刻,一些网站为了把持引擎排名,获得更多风行或长尾萌芽的拜访量,大年夜量地大年夜其他网站复制内容。
什么不是反复内容?
什么谷歌关怀反复内容?
链接要一致:尽力使你的内部链接保持一致; 不要既有/page/,又有/page和/page/index.htm 的内部链接
固然谷歌网站有便利易用的翻译功能,我们的算法不会把有着雷同内容的英文版和西班牙文版看作内容复制。同样,你不消担心我们把你文┞仿中对其他文┞仿小片段的引用认定为反复内容。
谷歌用户应用Google时平日欲望看到多样化的原创内容。如不雅他们找到的都是内容雷同的一堆结不雅,可以想见那是多么常人。别的,网站治理员不肯意看到Google给出象example.com/contentredir?value=http://www.chinaz.com/web/2008/0122/shorty-george?=en一样复杂的URL。他们往往更爱好类似example.com/en/shorty-george.htm的URL。
谷歌做了些什么?
Google在抓取网页和获得结不雅时,老是力争索引并显示内容不合的页面。这种过滤意味着,譬如说,如不雅你的网站有文┞仿的┞俘常版和打印版,并且你没有在robots.txt里设定noindex标记,谷歌就只会选择一个版本显示给谷歌用户。对于妄图应用复制内容来操控排名,欺骗谷歌用户的少数情况,我们会在对相干页面的索引和排名作出恰当调剂。当然,我们更愿意把重点放在过滤而不是排名调剂上… 是以,在绝大年夜多半情况下,最坏的结不雅就是原创者看到了不肯看到的版本涌如今我们的索引里。
网站治理员若何主动处理内容复制问题?
恰当阻拦引擎拜访:与其让我们的算法来肯定一个文件的"最佳"版本,你也许欲望指引谷歌拔取你的首选版本。譬如说,如不雅你不想我们索引你网站文┞仿的打印版,你可以在你的robots.txt文件中写上目次名或正则表达式来禁止谷歌对那些打印版的抓取。
应用301重定向:如不雅你已经重构你的网站,请在你的原网站的.htaccess中应用301重定向(永远性重定向)来重定向你的用户、Google爬虫、以及其他引擎蜘蛛等。
应用顶级域名:为了让我们老是应用最合适的文件版本, 请尽可能应用国度特定的顶级域名。与诸如example.com/de或de.example.com的URL比拟,谷歌肯定更清跋扈地知道example.de是以德文为核心的内容。
当心辛迪加式的结合供文:如不雅你为其他网站上也供给你的内容,请在每一个其他网站的文┞仿中包含连回原文┞仿的链接。留意:即使是如许,对一个萌芽,谷歌老是显示我们认为是最合适的(没被网站禁止的)版本, 它可能是,也有可能不是你所想要的版本。
应用谷歌网站治理员对象的首选域功能: 如不雅其他网站链接你的URL时既应用www版本又应用无www的版本,你可以用谷歌网站治理员对象让我们知道你想要哪种索引方法。
削减模板网页上的反复内容:拿版权声明来说,你有两种选择,一种是在你的每一个页面底部都有一个冗长的版权声明。另一种是设立一个专门的版权具体声明页,然后在每页底部写一个异常简短的总结,并链接到版权声明页。
避免宣布无内容页:用户不爱好看到无实际内容的页面。要尽量避免空架页。以房地产网页为例,不要宣布(或至少要阻拦)没有点评的点评网页,或者没有房地产列表的房地产列举网站等。只有如许,网站用户(以及Google爬虫)才不会看到无穷多的写着"以下是在【某城签名】中弗成错掉的待租房列表…"但其实根本没有什么列表的网页。
懂得你的内容治理体系:确保你熟悉你的网站是如何显示内容的,尤其是当它包含了博客,论坛,或相干的体系。往往在这些体系中同一内容会以多种情势出现。
不要担心,保持快活:不要过分受(调用和转载)你内容站点的干扰。固然很末路人, 它们几乎弗成能对你在谷歌中的存在产生负面影响。如不雅你实袈溱忍无可忍, 迎接你提出千禧年著作权法案申请 来声明对你的内容的所有权。我们会处理那些恶棍网站。
总之, 如不雅你对内容复制问题有一个大年夜体的熟悉,又能花上几分钟有看法地预防性保护一下你的网站,这将既赞助你们,也赞助我们为用户供给独特而相干的内容。 |