分析日志真假百度(谷歌)蜘蛛如何识别,假蜘蛛的危害有哪些?

大标 2022年9月7日07:06:17网络推广评论0阅读模式

如何通过分析日志的真实性来识别百度(Google)蜘蛛?假蜘蛛的危害是什么?我们的SEO优化人员在分析网站日志时一定遇到过这种情况。该网站似乎有很多来自百度蜘蛛的IP访问,但事实上,其中一些是虚假和无效的搜索引擎蜘蛛的IP。这些假蜘蛛不友好,可能会影响网站,在分析抓取蜘蛛的情况时,更可能迷惑观众并误导你。因此,我们应该能够通过分析日志正确识别百度(Google)的真实和虚假蜘蛛。

两种方法可以轻松识别百度的真蜘蛛和假蜘蛛

首先,看看人脸识别

当我们看得越多,体验得越多,我们一眼就能看到哪个百度蜘蛛IP是真实的。

百度官方真假蜘蛛文件记录了这一点:

新的移动UA:

Mozilla/5.0(Linux;u;Android 4.2.2;zh CN;)Applewebkit/534.46(KHTML,像gecko一样)版本/5.1移动Safari/10600.6.3(与百度Piper/2.0+兼容)http://www.Baidu.com/search/spider.html)

PC ua:

Mozilla/5.0(与百度Piper/2.0+兼容)http://www.Baidu.com/search/spider.html)

因此,根据百度的说法,任何不这样的东西都是假的,而且都会被删除。例如,有一个假的百度蜘蛛。

假蜘蛛:

baiduspider++http://www.Baidu.com/search/spider.htm)

2、 DOS命令查询

我们通过DOS命令进行检查。我们正在寻找两个IP段,220.181.108.140和117.28.255.37。

启动-运行-输入CMD并使用命令NSLOOKUP+IP查看屏幕截图:

如果是真实IP段:

百度蜘蛛

如何区分百度搜索引擎蜘蛛IP的真伪

错误:

百度优化

如何区分百度搜索引擎蜘蛛IP的真伪

注意:只要是百度的IP段,代码中就会有一个名称:百度蜘蛛。如果没有出现,就不是真正的百度IP。

PS:谷歌也是如此:将会有谷歌机器人等等。

百度(Google)假蜘蛛的危害是什么?

1.占用网站带宽,导致网站流量增加和额外支出;

2.在带宽有限的前提下,阻碍了正常蜘蛛的捕获,误导了我们对网站SEO的思考;

3.一些伪装成假蜘蛛的收集工具复制了我们的作品;

4.假蜘蛛无法捕获内容,也无法形成包含的数据库,因此影响不大。

PS:假蜘蛛有一些危险,一般都在可控范围内,所以一旦发现假蜘蛛爬行,可以临时屏蔽。你可以先观察百度站长的网站爬行是否正常,然后看看具体的危害,比如这个假蜘蛛是否已经出现了很长时间。经过一段时间的观察,如果没有问题,不要去注意它。如果有影响,请使用机器人协议屏蔽该IP段中的假蜘蛛。但是,应注意,屏蔽时,不要屏蔽错误。

以上是林云如何与大家分享如何识别百度和谷歌的真假蜘蛛,以及假蜘蛛的危害。记住,假蜘蛛的存在并不一定会影响网站。更重要的是,你应该知道哪些是假蜘蛛,不要被误导。除了上述两种识别方法外,百度在线还可以检查蜘蛛真实性查询工具(输入要查询的IP),以了解是否是真正的百度蜘蛛。

weinxin
我的微信
微信扫一扫
大标
  • 本文由 发表于 2022年9月7日07:06:17
  • 转载请务必保留本文链接:https://www.tanhuibiao.com/3177.html
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: