來(lái)源:網絡推廣知識 - 遠(yuǎn)策科技 | 2021-11-05
百度搜索蜘蛛也(yě)有假的(de)?哪些蜘蛛是百度搜索的(de)?如何才能正确識别百度蜘蛛呢(ne)?今天遠(yuǎn)策科技簡單兩步,教你如何識别真假百度蜘蛛。
一、查看UA信息
如果UA信息不對(duì),可(kě)以直接判斷該蜘蛛爲非百度搜索的(de)蜘蛛。
目前UA分(fēn)爲移動、PC、和(hé)小程序三個(gè)應用(yòng)場(chǎng)景,分(fēn)别如下(xià):
【移動UA】
Mozilla/5.0(Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,like Gecko)Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)
Mozilla/5.0 (iPhone;CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko)Version/9.0 Mobile/13B143 Safari/601.1 (compatible; Baiduspider-render/2.0;+http://www.baidu.com/search/spider.html)
【PC UA】
Mozilla/5.0(compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)
Mozilla/5.0(compatible; Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)
【小程序UA】
Mozilla/5.0 (iPhone;CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko)Version/9.0 Mobile/13B143 Safari/601.1 (compatible; Baiduspider-render/2.0;Smartapp; +http://www.baidu.com/search/spider.html)
二、雙向DNS解析認證
第一步:DNS反查IP
開發者可(kě)以對(duì)日志中訪問服務器的(de)IP地址進行反向DNS查找,判斷某隻spider是否來(lái)自百度搜索引擎,Baiduspider的(de)hostname以*.baidu.com或*.baidu.jp 的(de)格式命名,非*.baidu.com或*.baidu.jp即爲冒充。
在Linux/Windows/OS三種平台下(xià),驗證方法分(fēn)别如下(xià):
1) 在Linux平台下(xià),可(kě)以使用(yòng)host IP命令反解IP來(lái)判斷該抓取是否來(lái)自Baiduspider。
2) 在Windows平台或者IBM OS/2平台下(xià),可(kě)以使用(yòng)nslookup IP命令反解IP:打開命令處理(lǐ)器,輸入nslookup xxx.xxx.xxx.xxx(IP地址)就能解析IP,判斷該抓取是否來(lái)自Baiduspider。
3) 在macOS平台下(xià),可(kě)以使用(yòng)dig命令反解IP:打開命令處理(lǐ)器輸入dig -x xxx.xxx.xxx.xxx(IP地址)就能解析IP,判斷該抓取是否來(lái)自Baiduspider。
第二步:對(duì)域名運行正向DNS查找
對(duì)第一步中通(tōng)過命令檢索到的(de)域名運行正向DNS查找,驗證該域名與日志中訪問服務器的(de)原始IP地址是否一緻,IP地址一緻可(kě)确認spider來(lái)自百度搜索引擎,IP地址不一緻即爲冒充。
【示例】
> host 111.206.198.69
69.198.206.111. in-addr.arpa domain name pointer baiduspider-111-206-198-69.crawl.baidu.com.
>hostbaiduspider-111-206-198-69.crawl.baidu.com
baiduspider-111-206-198-69.crawl.baidu.com has address 111.206.198.69