通过IP反查(nslookup)判断百度蜘蛛IP真假

张俊SEM seo优化119字数 1329阅读4分25秒阅读模式

我们经常会碰到黑客利用伪装蜘蛛扫描网站,今天我们介绍下如何利用IP反查方法,判断蜘蛛是否为百度搜索引擎蜘蛛。

以百度为例,通常我们判断是否是百度蜘蛛抓取看用户代理字符串也就是User-Agent,但是User-Agent是可以模拟的,所以很多时候也会有虚假的模拟伪装成百度蜘蛛来抓取,这时候我们就需要学会分辨真伪。文章源自张俊SEM-https://www.zhangjunsem.com/27317.html

文章源自张俊SEM-https://www.zhangjunsem.com/27317.html

首先是百度User-Agent代理字符串,百度官方公布的有如下User-Agent:

移动UA:Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,likeGecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)文章源自张俊SEM-https://www.zhangjunsem.com/27317.html

PC UA:Mozilla/5.0 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)文章源自张俊SEM-https://www.zhangjunsem.com/27317.html

新增渲染UA:文章源自张俊SEM-https://www.zhangjunsem.com/27317.html

移动UA:Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 likeMac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Version/9.0 Mobile/13B143Safari/601.1 (compatible; Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)文章源自张俊SEM-https://www.zhangjunsem.com/27317.html

PC UA:Mozilla/5.0 (compatible;Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)文章源自张俊SEM-https://www.zhangjunsem.com/27317.html

需要注意的是百度新增了一个移动的User-Agent,和一个PC的User-Agent。我们知道了百度蜘蛛的User-Agent,如何正确识别和判断某条抓取是否是真实的百度蜘蛛。文章源自张俊SEM-https://www.zhangjunsem.com/27317.html

如何识别百度蜘蛛

1、首选我们需要通过关键词找User-Agent中是否包含Baiduspider;文章源自张俊SEM-https://www.zhangjunsem.com/27317.html

2、如果想区分移动和PC的蜘蛛的话,我们还需要在结果中再进行关键词过滤,移动端的User-Agent包含:Android 、iPhone、Mobile等三个中至少一个。文章源自张俊SEM-https://www.zhangjunsem.com/27317.html

3、通过上述操作我们可以分辨出哪些抓取是百度蜘蛛抓取,但并不能分辨真伪。

判断百度蜘蛛真伪

1、验证百度蜘蛛真伪我们一般使用的是DNS反查IP的方式来进行判断,首选我们需要找到上述抓取记录中蜘蛛的IP。

2、以windows操作系统为例,开始运行中输入cmd 弹出窗口中输入 nslookup (上述IP地址),判断百度蜘蛛的真伪,真是百度蜘蛛结果中会返回以*.baidu.com 或*.baidu.jp 的格式命名hostname,如不包含则为假百度蜘蛛。

常见HTTP状态码解读:

1、200代码,表示蜘蛛爬取正常

2、404代码,访问的这个链接是错误链接

3、301代码,永久重定向

4、302代码,表示临时重定向

5、304代码,客户端已经执行了GET,但文件未变化。

6、500代码,表示网站内部程序或服务器有错

声明:转载此文是出于传递更多学习交流目的。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢。本站部分图文来源于网络,仅供学习交流,发表作品观点仅代表作者本人,本站仅提供信息存储空间服务,不承担连带责任。如有侵权,请及时联系管理员删除。

weinxin
ynxtwl
加个微信
交个朋友
张俊SEM
  • 本文由 张俊SEM 发表于 2024年12月11日11:41:10
  • 转载请务必保留本文链接:https://www.zhangjunsem.com/27317.html
淘宝描述不符三倍赔偿怎么申请?有哪些要求?
淘宝描述不符三倍赔偿怎么申请?有哪些要求? seo优化

淘宝描述不符三倍赔偿怎么申请?有哪些要求?

  在淘宝这个平台,如果买家在购物的过程中,可以提出相关的证据,代表商家售卖的商品是假货的,那么所购买的商品,是可以去平台上申请三倍赔偿,然而有很多的买家都不清楚,那不符三倍赔偿怎么申请?有哪些要求?...
淘宝企业过户需要多长时间?相关规则是什么?
淘宝企业过户需要多长时间?相关规则是什么? seo优化

淘宝企业过户需要多长时间?相关规则是什么?

  各位淘宝商家们,如果觉得自己无法再继续开淘宝店了,是可以将自己的淘宝店铺过户给别人的,一般来说需要多长的时间呢?相信很多的淘宝商家都存在这方面的业务,这里汉聪电商就带大家一起来了解一下!   需要...
淘宝推广会有返点吗?淘宝推广返利如何设置?
淘宝推广会有返点吗?淘宝推广返利如何设置? seo优化

淘宝推广会有返点吗?淘宝推广返利如何设置?

  互联网的快速增长得益于互联网无可替代的优势,它为全球的消费者构建了一个交易平台,可以跨越交易双方的空间距离,因此催生了新的商业模式——电子商务。现在我国电商经济发展是有目共睹的,也吸引了不少人选择...
淘宝网超时说明规则变更公式通知是什么意思?
淘宝网超时说明规则变更公式通知是什么意思? seo优化

淘宝网超时说明规则变更公式通知是什么意思?

  电子商务的发展已然成为事实,计算机网络信息的发展为电子商务的发展提供强有力的条件,并已成为当下的经济热点和发展趋势。而电商经济的快速发展也让不少人看到了机遇,纷纷选择网店创业,但网店开设容易,网店...