自负年夜Google撤消弥补材料标记后,关于弥补材料的评论辩论沉积下来了。Google只是撤消了在结不雅中标注弥补材料,弥补材料以及弥补索引照样存在的,只不过我们不克不及直接看出来了。
在经由一段时光的思虑后,今晒台谈对弥补材料的更进一步熟悉。
挑出一部分权重高的网页进入主索引,把其他权重低的归入弥补索引,可以大年夜大年夜进步计算速度。有的时刻主索引中结不雅不足,才去弥补索引中寻找结不雅。至于在什么情况下才会触发去弥补索引中寻找网页不得而知。
以前我曾经认为弥补材料和弥补索引的惹人,很有可能是因为想节俭带宽。但Google比来注解,弥补索引中的网页抓取和更新频率加快,弥补索引中的网页涌如今结不雅中的机会也进步,解释不是为了节俭带宽。
HighDiy有一篇关于检查弥补索引替代办法的帖子,很周全深刻,但个一一句话生怕不太精确。他提到“Google给出网页进入弥补索引的原因包含网页“not fully indexed”,那么,反过来,如不雅发明某个网页的缓存并不完全,即不谅解网页的全部内容,那么,也根本上可以剖断该页位于弥补索引了。”我认为这里的not fully indexed指的不是缓存不包含全部网页内容(没见过如许的缓存),而是指网页固然被完全收录,但并不介入排名。
结合一些其他方面的不雅察,我如今认为弥补索引是为了进步速度。在某些关键词时,Google可能只主索引,忽视弥补索引里的结不雅,如许能大年夜大年夜进步速度。所有关键词都在抓取的所有页面索引中寻找结不雅的话,那计算量必定使返回结不雅的速度减慢。
以前弥补材料被存眷的时刻,就有同伙认为弥补材料并弗成怕,因为不少关键词结不雅中,列在前面的也包含很多弥补材料。我想这种不雅察是缺点的。
举一个例子。如今无法精确断定哪些页面是在弥补索引中,所以我拿以前谈弥补材料时一个帖子的抓图来看点石论坛的一个页面。
这个页面http://www.dunsh.org/forums/thread-6462-1-1.html,当时是在弥补索引中的,我断定如今也还在弥补索引中。起首这个网页肯定存在于Google的索引库中,我们可以大年夜Google快照中证拭魅这一点。
如不雅我们在点石域名内网页标题+发帖人史安牛的名字,可以发明Google返回结不雅中包含这个网页,排在第二位。然则如不雅我们帖子中的第一句话+史安牛,Google显示没有相匹配的文件。要留意,实际上在Google数据库中,确切存在相匹配的文件,大年夜膳绫擎的快照和中可以看出。
如不雅我们不限制在点石的网站内帖子的第一句话+史安牛,也可以看到这个页面不被返回。然则如不雅我们帖子中的第二段的一句话+史安牛,又会发明这个网页可以被返回。结论是Google确切有两个索引,主索引和弥补索引。在弥补索引中的网页有时刻在某些关键词下,根本不介入排名。就算已经被收录,网页中有这个关键词,并且没有其他匹配文件的时刻,这个网页因为是存在于弥补索引中,所以根本不会被返回。
所以大年夜量网页进入弥补索引,在很大年夜程度上说清楚明了网站的健康情况。弥补索引中的网页,能排到前面的几率照样大年夜大年夜降低。根据Google的说法,进入弥补索引最大年夜的原因是PR值过低。趁便做个实验,我这个帖子有链接到点石的那个网页,过一段时光看看是不是还在弥补索引中。按Google的说法,有了外部链接,应当大年夜弥补索引中出来。 |