Google通过提交表单抓取新页面
Google固然已经是抓取页面最多的引擎,但照样不知足,因为有很多网页和信息是很难被发明和抓取的。这也就是为什么做网站时必定要留意引擎友爱。如今Google开端供给提交表单(form)发明厥后的网页。本想写个具体解释,刚好看到幻灭已经写了,就直接引用重要内容如下。
Matt Cutts也写了个帖子举例解释这么做的好处。有很多网站首也执偾以表单方法列出公暗里属的各地区分站,没有以链接情势列出各分站。这种网站以前是不克不及被深度收录的,因为Google不提交表单,就发明不了隐蔽在表单后面的URL。
据Google所述,当前Googlebot正对一小部分高质量网站进行表格提交的实验。当Googlebot发明这些网站上有HTML表格时(即检测到时),它就会主动大年夜网站上选择一些词语输入表格的文本框里,然后再选择不合的按钮、勾选项及验证项,再提交表格。提交表格后一旦 Googlebot认为出现的新内容是合法并且是有趣及独特的,它就可能会把内容抓取进Google的结不雅索引数据库里。这意味着Googlebot 如今已司懂得经由过程提交蓖ㄐ砒获得新内容。
同时Google也强调,如不雅网站的robots.txt文件里禁止了对表格进行了隐蔽,不欲望表格提交后所产生的链接被抓取,那Googlebot 是不会抓取的。此外,当前Googlebot只提交GET类型的表格。比如当表格须要输入用户小我信息比如暗码、用户名、接洽人等,Googlebot是 会主动略过这些表格的。
这肿莨狁抓取当前只是一个小范围的实验,Google表示不会对网站造成影响。既不会对网站的PR值袈潇成影响,也不会对网站的┞俘常抓取、排名等造成影响。
之前我们已经知道Googlebot除了能抓取文本、视频、音频、Flash等类型的内容外,它还可以经由过程JS代码抓取链接。并且在将来,Googlebot还有望直接辨认图片及视频狼9依υ?字。为了进一步抓取互联网的内容,Google宣布Googlebot已可经由过程提交表格抓取更多内容。
这当然给一些网站的收录创造了机会,是否也会对某些公司网站带来必定的安然风险?网站某部分不想被收录的话,赶紧用robots.txt文件禁止吧。 SEO很难学,还得多多努力 好优化方案就是要顶 难得一见的好技术贴 很好哦,学到了不少SEO知识 现在找个会优化的真心难,还好找到了帝国网络 这篇网站优化技术文章真心赞 不错不错,看好帝国网络 LZ真是人才,教教我如何优化自己的网站 楼猪能帮我优化一下公司的网站吗?