130-2688-3305

服务咨询热线(微信同号)

百度搜索引擎蜘蛛spider介绍和方法

百度搜索引擎蜘蛛名字为Baiduspider,是百度搜索引擎的一个自动程序,它的作用是访问互联网上的网页,建立索引数据库,使用户能在百度搜索引擎中搜索到您网站上的网页。

百度旗下有网页搜索、无线搜索、图片搜索、视频搜索、新闻搜索、百度搜藏、百度联盟、商务搜索等8个搜索产品,不同的搜索产品使用的user-agent(用户代理,简称UA)各不相同,下表是百度各搜索产品的UA:

百度各个产品使用不同的user-agent:

产品名称

对应user-agent

网页搜索

Baiduspider

无线搜索

Baiduspider

图片搜索

Baiduspider-image

视频搜索

Baiduspider-video

新闻搜索

Baiduspider-news

百度搜藏

Baiduspider-favo

百度联盟

Baiduspider-cpro

商务搜索

Baiduspider-ads

百度搜索的Baiduspider工作原理是像普通上网用户一样去访问互联网上出现的网页,为了达到对目标资源较好的检索效果,Baiduspider需要对您的网站保持一定量的抓取。所有的有访问行为必定会占用一定的网络资源,Baiduspider会根据服务器承 受能力,网站质量,网站更新等综合因素来进行调整。如果您觉得baiduspider的访问行为有任何不合理的情况,可以反馈至百度搜索官方的反馈中心:https://ziyuan.baidu.com/feedback

对于您网站上新产生的或者持续更新的页面,Baiduspider会持续抓取,但Baiduspider的正常抓取并不会造成您网站的带宽堵塞,造成此现象可能是由于有人冒充Baiduspider恶意抓取。如果您发现Baiduspider非正常抓取您的网站,请通过反馈中心反馈给我们,并请尽量给出Baiduspider对贵站的访问日志,以便于我们跟踪处理。

如果您不想您的网站被Baiduspider访问,应该怎么做呢?

这时候您可以利用robots.txt文件完全禁止Baiduspider访问您的网站,或者禁止 Baiduspider访问您网站上的部分文件。Baiduspider遵守互联网robots协议对目标网页进行访问和抓取,当您禁止Baiduspider访问您的网站,将使您的网站上的网页,在百度搜索引擎以及所有百度提供搜索引擎服务的搜索引擎中无法被搜索到。

关于robots.txt文件的书写格式,请参照这里:

如果您希望的网站内容被百度索引但不被保存快照,可以使用meta robots协议。Baiduspider遵守互联网meta robots协议。您可以利用网页meta的设置,使百度显示只对该网页建索引,但并不在搜索结果中显示该网页的快照。和robots的更新一样,因为搜索引擎索引数据库的更新需要时间,所以虽然您已经在网页中通过meta禁止了百度在搜索结果中显示该网页的快照,但百度搜索引擎数据库中如果已经建立了网页索引信息,可能需要二至四周才会在线上生效。

如果大家对百度spider还有别的疑问,大家可以到百度搜索官方论坛讨论区:http://bbs.zhanzhang.baidu.com/thread-21429-1-1.html发表自己的看法,会有官方工作人员处理。

以上是金科网络为您整理的关于百度蜘蛛的介绍和相关用法,希望对有网站优化需求的您带来帮助,如果您需要更专业的网站排名优化服务,可直接与我们联系,我们的优化技术团队一定会让您满意。

不管您需要网站建设、小程序还是APP开发,我们将会为您做得更好!