黑帽联盟
标题:
搜狗蜘蛛抓取详解-官方标准
[打印本页]
作者:
yun
时间:
2016-11-15 08:35
标题:
搜狗蜘蛛抓取详解-官方标准
sogou spider User-Agent字段是什么?
Sogou web spider
Sogou inst spider
Sogou Spider
请注意,根据标准,ua区分大小写。
搜狗spider的抓取频次是怎样的?
sogou spider 对于同一个 IP 地址的服务器主机,只建立一个连接,抓取间隔速度控制在几秒一次。一个网页被收录后,最快也要过几天以后才会去更新。如果持续不断地抓取您的网站,请注意您的网站上的网页是否每次访问都产生新的链接。
如果您认为 sogou spider 对于您的网站抓取过快,请与我们联系,并最好能提供访问日志中sogou spider 访问的部分,而不要直接将搜狗spider的ua封禁。
sogou spider 如何反应我网站上页面的更新?
sogou spider 会根据网页的重要性和历史变化情况来动态调整更新时间,更新已经抓取过的页面。
sogou spider 喜欢收录什么样的页面
内容优良而独特的页面。如果您的页面内容和互联网上已存在的其他页面有高度的相似性,可能不会被 sogou spider 收录。
链接层次较浅的页面。过深的链接层次,尤其是动态网页的链接,会被丢弃而不收录。
如果是动态网页,请控制参数的数量和URL的长度。搜狗更偏好收录静态网页。重定向次数越多的页面,越有可能被 sogou spider 丢弃。
转载自搜狗站长
欢迎光临 黑帽联盟 (https://bbs.cnblackhat.com/)
Powered by Discuz! X2.5