站长之家 - 中国草根站长新闻、建站经验、素材资源交流平台!
分类导航

站长新闻|网站运营|建站经验|网站优化|站长资源|站长源码|

服务器之家 - 站长之家 - 建站经验 - 恶意蜘蛛列表以及屏蔽的方法

恶意蜘蛛列表以及屏蔽的方法

2022-11-12 16:35忆天网络 建站经验

恶意蜘蛛带来最直观的影响就是网站没几人访问,服务器变得很卡,恶意蜘蛛消耗服务器内存和占用带宽,所以我们做优化之前一定要禁止。我把恶意蜘蛛定义为对网站的品牌和流量没有任何实质性的帮助,并且给网站性能带来一

恶意蜘蛛定义

恶意蜘蛛带来最直观的影响就是网站没几人访问,服务器变得很卡,恶意蜘蛛消耗服务器内存和占用带宽,所以我们做优化之前一定要禁止。

我把恶意蜘蛛定义为对网站的品牌和流量没有任何实质性的帮助,并且给网站性能带来一定损耗的蜘蛛。这种蜘蛛会频繁抓取网站内容,并且利用内容做一些数据分析来达到他们的商业目的。

恶意蜘蛛列表以及屏蔽的方法

通过分析网站日志,搜集资料,我得出了下面的一些恶意蜘蛛。下面给出列表并说明这些蜘蛛的用途。

恶意蜘蛛列表

  1. SemrushBot,这是semrush下面的一个蜘蛛,是一家做搜索引擎优化的公司,因此它抓取网页的目的就很明显了。这种蜘蛛对网站没有任何用处,好在它还遵循robots协议,因此可以直接在robots屏蔽
  2. DotBot, 这是moz旗下的,作用是提供seo服务的蜘蛛,但是对我们并没有什么用处。好在遵循robots协议,可以使用robots屏蔽
  3. AhrefsBot, 这是ahrefs旗下的蜘蛛,作用是提供seo服务,对我们没有任何用处,遵循robots协议。
  4. MJ12bot,这是英国的一个搜索引擎蜘蛛,但是对中文站站点就没有用处了,遵循robots协议。
  5. MauiBot,这个不太清楚是什么,但是有时候很疯狂,好在遵循robots协议。
  6. MegaIndex.ru,这是一个提供反向链接查询的网站的蜘蛛,因此它爬网站主要是分析链接,并没有什么作用。遵循robots协议。
  7. BLEXBot, 这个是webmeup下面的蜘蛛,作用是收集网站上面的链接,对我们来说并没有用处。遵循robots协议
  8. 等待增加

屏蔽方法

对于遵循robots协议的蜘蛛,可以直接在robots禁止。上面常见的无用蜘蛛禁止方法如下,将下面的内容加入到网站根目录下面的robots.txt就可以了


  1. User-agent: SemrushBot
  2. Disallow: /
  3. User-agent: DotBot
  4. Disallow: /
  5. User-agent: MegaIndex.ru
  6. Disallow: /
  7. User-agent: MauiBot
  8. Disallow: /
  9. User-agent: AhrefsBot
  10. Disallow: /
  11. User-agent: MJ12bot
  12. Disallow: /
  13. User-agent: BLEXBot
  14. Disallow: /

对于不尊许robots规则的蜘蛛,目前能够屏蔽的方法就是根据useragent或者ip来禁止了。

原文地址:http://www.fjd100.com/?p=2203

延伸 · 阅读

精彩推荐