BUbiNG

BUbiNG蜘蛛/爬虫属于未分类类型,由Universita degli studi di Milano.开发运行。您可以继续阅读下方信息,以深入了解BUbiNG基本信息,用户代理和访问控制等。

基本信息

BUbiNG的基本信息如下表。但部分不是很规范的蜘蛛和爬虫,可能存在信息不明的情况。
蜘蛛/爬虫名称
BUbiNG
类型
其他
开发商
Universita degli studi di Milano.
当前状态
活动

用户代理

关于BUbiNG蜘蛛或者爬虫的用户代理字符串,IP地址和服务器,所在地等信息如下表格所示:
BUbiNG
用户代理字符串
BUbiNG (+http://law.di.unimi.it/BUbiNG.html)
首次出现
2013-10-04 13:20:30
最后出现
2019-11-22 21:51:48
遵循robots.txt
未知
来源
IP地址(570) 服务器名称 所属国家
52.87.252.80 ec2-52-87-252-80.compute-1.amazonaws.com US
93.103.137.65 93-103-137-65.dynamic.t-2.net SI
89.212.20.214 89-212-20-214.dynamic.t-2.net SI
93.103.154.48 93-103-154-48.dynamic.t-2.net SI
195.78.123.5 ip005-123.netbone.cz CZ
64.62.252.163 ? US
64.62.252.164 ? US
64.62.252.162 ? US
147.229.8.39 athena2.fit.vutbr.cz CZ
64.62.252.169 ? US
用户代理字符串
BUbiNG (+http://law.di.unimi.it/BUbiNG.html#dc)
首次出现
2018-03-03 03:13:56
最后出现
2018-03-25 22:51:46
遵循robots.txt
未知
来源
IP地址(8) 服务器名称 所属国家
52.201.172.119 ec2-52-201-172-119.compute-1.amazonaws.com US
34.202.159.35 ec2-34-202-159-35.compute-1.amazonaws.com US
52.23.213.46 ec2-52-23-213-46.compute-1.amazonaws.com US
54.174.39.248 ec2-54-174-39-248.compute-1.amazonaws.com US
35.153.193.122 ec2-35-153-193-122.compute-1.amazonaws.com US
54.208.249.249 ec2-54-208-249-249.compute-1.amazonaws.com US
34.207.57.181 ec2-34-207-57-181.compute-1.amazonaws.com US
34.232.76.186 ec2-34-232-76-186.compute-1.amazonaws.com US
用户代理字符串
BUbiNG (+http://law.di.unimi.it/BUbiNG.html#wc)
首次出现
2018-03-03 03:39:04
最后出现
2018-03-25 22:09:40
遵循robots.txt
未知
来源
IP地址(680) 服务器名称 所属国家
147.229.8.59 knot38.fit.vutbr.cz CZ
147.229.8.170 knot36.fit.vutbr.cz CZ
147.229.8.167 knot37.fit.vutbr.cz CZ
147.229.8.39 athena2.fit.vutbr.cz CZ
147.229.8.130 knot30.fit.vutbr.cz CZ
147.229.8.140 knot35.fit.vutbr.cz CZ
147.229.8.136 knot33.fit.vutbr.cz CZ
147.229.8.224 knot04.fit.vutbr.cz CZ
147.229.8.105 athena5.fit.vutbr.cz CZ
147.229.8.135 athena9.fit.vutbr.cz CZ
52.87.252.80 ec2-52-87-252-80.compute-1.amazonaws.com US
93.103.137.65 93-103-137-65.dynamic.t-2.net SI
89.212.20.214 89-212-20-214.dynamic.t-2.net SI
93.103.154.48 93-103-154-48.dynamic.t-2.net SI
195.78.123.5 ip005-123.netbone.cz CZ
64.62.252.163 ? US
64.62.252.164 ? US
64.62.252.162 ? US
64.62.252.169 ? US
52.201.172.119 ec2-52-201-172-119.compute-1.amazonaws.com US
34.202.159.35 ec2-34-202-159-35.compute-1.amazonaws.com US
52.23.213.46 ec2-52-23-213-46.compute-1.amazonaws.com US
54.174.39.248 ec2-54-174-39-248.compute-1.amazonaws.com US
35.153.193.122 ec2-35-153-193-122.compute-1.amazonaws.com US
54.208.249.249 ec2-54-208-249-249.compute-1.amazonaws.com US
34.207.57.181 ec2-34-207-57-181.compute-1.amazonaws.com US
34.232.76.186 ec2-34-232-76-186.compute-1.amazonaws.com US
34.201.161.68 ec2-34-201-161-68.compute-1.amazonaws.com US
174.129.54.205 ec2-174-129-54-205.compute-1.amazonaws.com US
35.168.8.213 ec2-35-168-8-213.compute-1.amazonaws.com US
52.91.148.207 ec2-52-91-148-207.compute-1.amazonaws.com US
107.20.26.147 ec2-107-20-26-147.compute-1.amazonaws.com US
52.91.154.143 ec2-52-91-154-143.compute-1.amazonaws.com US
52.72.12.225 ec2-52-72-12-225.compute-1.amazonaws.com US
54.86.94.45 ec2-54-86-94-45.compute-1.amazonaws.com US
54.166.133.220 ec2-54-166-133-220.compute-1.amazonaws.com US
54.208.43.88 ec2-54-208-43-88.compute-1.amazonaws.com US
用户代理字符串
BUbiNG (+http://law.di.unimi.it/BUbiNG.html#wc)
首次出现
2018-03-03 03:39:04
最后出现
2018-03-25 22:09:40
遵循robots.txt
未知
来源
IP地址(680) 服务器名称 所属国家
34.201.161.68 ec2-34-201-161-68.compute-1.amazonaws.com US
174.129.54.205 ec2-174-129-54-205.compute-1.amazonaws.com US
35.168.8.213 ec2-35-168-8-213.compute-1.amazonaws.com US
52.91.148.207 ec2-52-91-148-207.compute-1.amazonaws.com US
107.20.26.147 ec2-107-20-26-147.compute-1.amazonaws.com US
52.91.154.143 ec2-52-91-154-143.compute-1.amazonaws.com US
52.72.12.225 ec2-52-72-12-225.compute-1.amazonaws.com US
54.86.94.45 ec2-54-86-94-45.compute-1.amazonaws.com US
54.166.133.220 ec2-54-166-133-220.compute-1.amazonaws.com US
54.208.43.88 ec2-54-208-43-88.compute-1.amazonaws.com US

访问控制

了解如何控制BUbiNG访问权限,避免BUbiNG抓取行为不当。

是否拦截BUbiNG?

对于未知蜘蛛或者爬虫。它的用途对网站来说可能是好的,也可能是坏的,这取决于它是什么。所以说,这需要站长进一步分析判断这些尚不明确的爬虫行为,再作最终决定。 但,根据以往的经验,未声明行为目的及未命名的蜘蛛爬虫,通常都有不可告人的秘密,我们理应对其行为进行控制,比如拦截。

通过Robots.txt拦截

您可以通过在网站的 robots.txt 中设置用户代理访问规则来屏蔽 BUbiNG 或限制其访问权限。我们建议安装 Spider Analyser 插件,以检查它是否真正遵循这些规则。

	# robots.txt
	# 下列代码一般情况可以拦截该代理
	
	User-agent: BUbiNG
	Disallow: /

您无需手动执行此操作,可通过我们的 Wordpress 插件 Spider Analyser 来拦截不必要的蜘蛛或者爬虫。

更多信息

BUbiNG是一个可扩展的、完全分布式的爬虫,目前正在开发中,它取代了UbiCrawler

BUbiNG支持机器人排除标准。如果你想排除你的网站被BUbiNG抓取,请参阅《网络机器人页面》。

简而言之,你可以在你想排除抓取的网络服务器根目录的robots.txt文件中放入以下内容。

User-agent: BUbiNG
Disallow: /

目前,BUbiNG尊重robots.txt文件的变化(通常每小时一次),但不支持META标签的机器人排除。

如需任何信息,请随时发送电子邮件至 law@di.unimi.it。

常见蜘蛛/爬虫

Common Spiders
DataForSeo bot
DataForSeo bot蜘蛛/爬虫属于类型,由DataForSEO OU开发运行。您可以继续阅读下方信息,以深入了解DataForSeo bot基本信息,用户代理和访问控制等。
CloudFlare crawler
CloudFlare crawler蜘蛛/爬虫属于类型,由CloudFlare, Inc.开发运行。您可以继续阅读下方信息,以深入了解CloudFlare crawler基本信息,用户代理和访问控制等。
Odin
Odin蜘蛛/爬虫属于类型,由Cyble, Inc.开发运行。您可以继续阅读下方信息,以深入了解Odin基本信息,用户代理和访问控制等。
Chrome Privacy Preserving Prefetch Proxy
Chrome Privacy Preserving Prefetch Proxy蜘蛛/爬虫属于类型,由Google Inc.开发运行。您可以继续阅读下方信息,以深入了解Chrome Privacy Preserving Prefetch Proxy基本信息,用户代理和访问控制等。
EFF crawler
EFF crawler蜘蛛/爬虫属于类型,由Electronic Frontier Foundation开发运行。您可以继续阅读下方信息,以深入了解EFF crawler基本信息,用户代理和访问控制等。
Modat crawler
Modat crawler蜘蛛/爬虫属于类型,由Modat B.V.开发运行。您可以继续阅读下方信息,以深入了解Modat crawler基本信息,用户代理和访问控制等。
FirmoGraph
FirmoGraph蜘蛛/爬虫属于类型,由firmograph.io开发运行。您可以继续阅读下方信息,以深入了解FirmoGraph基本信息,用户代理和访问控制等。
fluid
fluid蜘蛛/爬虫属于类型,由leak.info开发运行。您可以继续阅读下方信息,以深入了解fluid基本信息,用户代理和访问控制等。

相关文章

Related Articles