BLEXBot BLEXBot

蜘蛛/爬虫名称
BLEXBot
开发商
WebMeUp
官网
webmeup.com
当前状态
活动
  • BLEXBot/1.0
  • BLEXBotTest/1.0
  • BLEXBot/1.0
  • BLEXBot/1.0
  • BLEXBot
用户代理字符串
Mozilla/5.0 (compatible; BLEXBot/1.0; +http://webmeup-crawler.com/
类型
营销
首次出现
2018-07-21 23:52:58
最后出现
2019-02-13 18:10:58
遵循robots.txt
IP地址
1
来源
IP地址 服务器名称 所属国家
136.243.170.146 static.146.170.243.136.clients.your-server.de DE
用户代理字符串
Mozilla/5.0 (compatible; BLEXBotTest/1.0; +http://webmeup.com/crawler.html)
类型
营销
首次出现
2014-04-11 13:30:00
最后出现
2017-01-18 00:22:56
遵循robots.txt
IP地址
1
来源
IP地址 服务器名称 所属国家
136.243.170.146 ? DE
用户代理字符串
Mozilla/5.0 (compatible; BLEXBot/1.0; +http://webmeup.com/crawler.html)
类型
营销
首次出现
2013-06-28 08:05:00
最后出现
2013-08-03 10:13:38
遵循robots.txt
IP地址
4
来源
IP地址 服务器名称 所属国家
144.76.226.104 ninja-crawler53.webmeup.com ?
168.119.4.44 ninja-crawler42.webmeup.com US
157.90.91.229 ninja-crawler78.webmeup.com DE
162.55.85.224 ninja-crawler102.webmeup.com US
157.90.181.150 ninja-crawler67.webmeup.com US
157.90.181.207 ninja-crawler85.webmeup.com US
157.90.181.221 ninja-crawler74.webmeup.com US
162.55.85.222 ninja-crawler103.webmeup.com US
157.90.182.27 ninja-crawler90.webmeup.com US
157.90.182.25 ninja-crawler92.webmeup.com US
157.90.182.28 ninja-crawler89.webmeup.com DE
157.90.209.79 ninja-crawler81.webmeup.com US
176.9.25.75 pot25.webmeup.com DE
94.130.237.97 pot53.webmeup.com DE
162.55.85.223 ninja-crawler100.webmeup.com DE
162.55.86.62 ninja-crawler110.webmeup.com DE
136.243.170.146 static.146.170.243.136.clients.your-server.de DE
198.20.66.122 blexn14.webmeup.com US
108.178.60.2 blexn16.webmeup.com US
198.143.129.170 blexn13.webmeup.com US
198.143.133.42 . US
157.90.181.220 ninja-crawler75.webmeup.com US
162.55.85.218 ninja-crawler105.webmeup.com DE
162.55.85.228 ninja-crawler96.webmeup.com DE
162.55.85.219 ninja-crawler108.webmeup.com DE
157.90.181.222 ninja-crawler73.webmeup.com DE
157.90.209.83 ninja-crawler77.webmeup.com DE
157.90.182.24 ninja-crawler93.webmeup.com US
162.55.86.58 ninja-crawler113.webmeup.com US
157.90.181.151 ninja-crawler66.webmeup.com US
157.90.181.152 ninja-crawler65.webmeup.com DE
94.130.237.95 pot55.webmeup.com DE
157.90.181.219 ninja-crawler76.webmeup.com US
157.90.181.206 ninja-crawler86.webmeup.com DE
162.55.85.226 ninja-crawler98.webmeup.com DE
157.90.182.29 ninja-crawler88.webmeup.com DE
157.90.182.30 ninja-crawler87.webmeup.com DE
148.251.4.36 ninja-crawler80.webmeup.com DE
157.90.181.145 ninja-crawler72.webmeup.com DE
157.90.209.76 ninja-crawler84.webmeup.com DE
157.90.209.77 ninja-crawler83.webmeup.com DE
157.90.182.23 ninja-crawler94.webmeup.com DE
162.55.85.229 ninja-crawler95.webmeup.com DE
213.239.205.62 ninja-crawler86.webmeup.com DE
157.90.209.81 ninja-crawler79.webmeup.com DE
37.27.58.20 rondo-crawler14.blex.seopowersuite.com FI
65.109.159.118 rondo-crawler10.blex.seopowersuite.com DE
65.109.99.209 rondo-crawler9.blex.seopowersuite.com FI
95.217.114.173 rondo-crawler6.blex.seopowersuite.com FI
65.109.159.109 rondo-crawler12.blex.seopowersuite.com FI
65.109.100.155 rondo-crawler4.blex.seopowersuite.com FI
37.27.126.98 rondo-crawler17.blex.seopowersuite.com FI
135.181.166.58 rondo-crawler3.blex.seopowersuite.com FI
用户代理字符串
Mozilla/5.0 (compatible; BLEXBot/1.0; +http://webmeup.com/crawler.html)
类型
营销
首次出现
2013-06-28 08:05:00
最后出现
2013-08-03 10:13:38
遵循robots.txt
IP地址
4
来源
IP地址 服务器名称 所属国家
198.20.66.122 blexn14.webmeup.com US
108.178.60.2 blexn16.webmeup.com US
198.143.133.42 . US
198.143.129.170 blexn13.webmeup.com US
用户代理字符串
BLEXBot
类型
营销
首次出现
2013-06-21 15:00:31
最后出现
2013-06-24 12:50:13
遵循robots.txt
IP地址
3
来源
IP地址 服务器名称 所属国家
198.143.129.170 blexn13.webmeup.com US
198.143.187.114 blexn12.webmeup.com US
198.20.66.122 blexn14.webmeup.com US

BLEXBot是什么

BLEXBot爬虫是一个自动机器人,它访问网页以检查和分析内容,在这个意义上,它类似于主要搜索引擎公司使用的机器人。

BLEXBot爬虫的识别方法是具有以下形式的用户代理:

Mozilla/5.0 (compatible; BLEXBot/1.0; +http://webmeup-crawler.com/)

BLEXBot爬虫可以通过上述用户代理来识别。如果你怀疑请求被欺骗,你应该首先检查请求的IP地址,并通过适当的工具进行反向DNS查询,查看其域名–它应该指向*.webmeup.com的一个子域。

我们关心您的网站性能

BLEXbot是一个对网站非常友好的爬虫程序。我们让它在抓取网站时尽可能地 “温柔”:它每3秒只发出一次请求,如果在您的robots.txt文件中指定了另一个抓取延迟,则会更少。BLEXbot尊重您在robots.txt文件中指定的规则。

如果出现任何问题,可能是由于您的特定网站的特殊性,或者是链接到您的其他网站的错误。因此,我们想请您注意,如果您发现BLEXbot有任何问题,请报告给customercare@webmeup.com,我们会迅速为您的特定网站进行独特的设置,这样抓取就不会影响您网站的性能。

 

为什么它在抓取我的网站

BLEXBot协助网络营销人员获取网站的链接结构及其在网络上的相互链接信息,以避免任何技术和可能的法律问题,并改善整体在线体验。要做到这一点,就必须检查,或者说爬行,以收集和检查其内容中的所有链接。

如果BLEXBot爬虫访问了您的网站,这意味着该页面上的链接以前从未被收集和测试过,或需要被刷新。由于这个原因,您不会看到BLEXBot爬虫对同一页面的重复请求。

爬虫系统在设计上尽可能地友好,例如限制对任何特定网站的请求率(BLEXBot每3秒不超过一次点击),如果一个网站宕机或速度慢,则自动退避。

使用robots.txt进行拦截

首先注意,BLEXBot是:

  1. 只收集任何随机访问者都可以访问的公开信息。如果你认为爬虫收集了一些敏感信息,请将其从公开访问中删除。
  2. 不能使您的网站超载并对其造成任何伤害–BLEXBot的设计非常有礼貌,它每3秒最多只能进行一次点击。此外,您可以很容易地减缓BLEXBot(以及任何其他机器人/爬虫,它们从您网站上的robots.txt文件中获取指示)。
  3. 不读取、解析、收集或储存您网站上的任何信息,但从您的页面上的链接。这指的是你网页上的任何文本、图形或视频材料或任何其他东西。

 

通过robots.txt文件,您可以阻止BLEXBot爬虫进入您网站的部分或全部内容,或减缓其速度,如以下例子所示:

禁止抓取您网站的特定部分:

User-agent: BLEXBot

Disallow: /private/

Disallow: /messages/

整个网站禁止抓取:

User-agent: BLEXBot

Disallow: /

减缓爬虫的速度:

User-agent: BLEXBot

Crawl-delay: 10

注意:一旦您对robots.txt进行修改,请给爬虫最多10分钟的时间来完全停止对您网站的抓取。这是由于一些网页可能已经在处理队列中了,所以我们不能保证爬虫能够立即停止。但是,它最多应该在10分钟后完全停止爬行。

关于robots.txt协议的一般介绍,请参见http://www.robotstxt.org。有关 robots.txt 规则的更多细节和例子,也请参见我们此前发布的文章

联系

综上所述,webmeup.com/当然会认真对待任何关于停止抓取任何网站或部分网站的请求,或任何其他关于爬虫操作的反馈意见,并将以迅速和适当的方式采取行动。

如果您是这种情况,请毫不犹豫地与webmeup.com联系:customercare@webmeup.com。

常见问题

FAQs
查看更多 >