行业资讯

首页 > 新闻资讯 > 行业资讯 > 网站如何屏蔽拦截蜘蛛抓取

网站如何屏蔽拦截蜘蛛抓取

2024-10-17 22:51:03   来源:   阅读:
网站完成后就正式上线了,在网站运营过程中,如果你用的是虚拟主机,可能遇到过网站流量超标的情况,我们通过网站流量监控发现,绝大部分的流量消耗都是蜘蛛抓取造成的,那么我们如何屏蔽拦截蜘蛛抓取我们的网站呢?如果是正常的搜索引擎蜘蛛访问,不建议对蜘蛛进行禁止,否则网站在百度等搜索引擎中的收录和排名将会丢失,造成客户流失等损失。

可以优先考虑将网站改版为静态页面的,静态文件都是有缓存的。如果不想在网站方面作出改动,可以使用空间的伪静态规则来进行拦截:

Linux下规则文件.htaccess(手工创建.htaccess文件到站点根目录)

Linux下规则文件屏蔽蜘蛛抓取

Windows2008、2012或更高系统下规则文件web.config (手工创建web.config文件到站点根目录)

Windows规则文件屏蔽蜘蛛抓取

注:“{HTTP_USER_AGENT}”所在行中是不明蜘蛛名称,根据需要添加以"|"为分割。

  规则中默认屏蔽部分不明蜘蛛,要屏蔽其他蜘蛛按规则添加即可,附各大蜘蛛名字:

  google蜘蛛:googlebot

  百度蜘蛛:baiduspider

  百度手机蜘蛛:baiduboxapp

  yahoo蜘蛛:slurp

  alexa蜘蛛:ia_archiver

  msn蜘蛛:msnbot

  bing蜘蛛:bingbot

  altavista蜘蛛:scooter

  lycos蜘蛛:lycos_spider_(t-rex)

  alltheweb蜘蛛:fast-webcrawler

  inktomi蜘蛛:slurp

  有道蜘蛛:YodaoBot和OutfoxBot

  热土蜘蛛:Adminrtspider

  搜狗蜘蛛:sogou spider

  SOSO蜘蛛:sosospider

  360搜蜘蛛:360spider 

以上蜘蛛的名称可以参考,如果你的网站有其它蜘蛛也可以增加上去。
本文《网站如何屏蔽拦截蜘蛛抓取》发布于君君营销文章,作者:admin,如若转载,请注明出处:/news/hyzx/2.html,否则禁止转载,谢谢配合!

联系我们

18221295083
上海市浦东新区航头镇沪南公路4583号
上海市青浦区蟠龙路899号
18221295083
zhanglongfu@ijunjun.com
  • 联系我们
  • 关于我们
  • 二维码


    官方微信

    小程序
    返回
    顶部
    咨询

    扫描微信二维码,添加好友

    电话

    24小时电话:

    18221295083
    微信

    官方微信

    在线客服系统