BublupBot

BublupBot蜘蛛/爬虫属于获取器类型,由Bublup Inc.开发运行。您可以继续阅读下方信息,以深入了解BublupBot基本信息,用户代理和访问控制等。

基本信息

BublupBot的基本信息如下表。但部分不是很规范的蜘蛛和爬虫,可能存在信息不明的情况。
蜘蛛/爬虫名称
BublupBot
类型
信息流
开发商
Bublup Inc.
当前状态
活动

用户代理

关于BublupBot蜘蛛或者爬虫的用户代理字符串,IP地址和服务器,所在地等信息如下表格所示:
Bublup
用户代理字符串
Bublup (+https://www.bublup.com/bublup.html)
首次出现
2019-03-23 17:06:01
最后出现
2019-12-09 20:17:04
遵循robots.txt
未知
来源
IP地址(4) 服务器名称 所属国家
3.232.122.21 bublup-bot-002.bublup.com US
3.216.162.237 ec2-3-216-162-237.compute-1.amazonaws.com US
54.162.31.246 ec2-54-162-31-246.compute-1.amazonaws.com US
54.234.124.126 ec2-54-234-124-126.compute-1.amazonaws.com US
用户代理字符串
BublupBot (+http://www.bublup.com)
首次出现
2018-10-02 08:32:22
最后出现
2018-11-28 09:40:46
遵循robots.txt
未知
来源
IP地址(5) 服务器名称 所属国家
18.235.167.68 bublup-bot-003.bublup.com US
3.216.162.237 bublup-bot-001.bublup.com US
3.232.122.21 bublup-bot-002.bublup.com US
34.238.237.228 bublup-bot-201.bublup.com US
3.233.49.229 ec2-3-233-49-229.compute-1.amazonaws.com US
34.233.197.230 bublup-bot-301.bublup.com US
100.25.120.113 bublup-bot-202.bublup.com US
34.237.153.71 bublup-bot-001.bublup.com US
54.234.124.126 ec2-54-234-124-126.compute-1.amazonaws.com US
34.196.83.141 bublup-bot-002.bublup.com US
34.232.181.100 bublup-bot-003.bublup.com US
35.172.229.86 ec2-35-172-229-86.compute-1.amazonaws.com US
54.165.114.202 ec2-54-165-114-202.compute-1.amazonaws.com US
用户代理字符串
BublupBot (+http://www.bublup.com)
首次出现
2018-10-02 08:32:22
最后出现
2018-11-28 09:40:46
遵循robots.txt
未知
来源
IP地址(5) 服务器名称 所属国家
34.196.83.141 bublup-bot-002.bublup.com US
34.232.181.100 bublup-bot-003.bublup.com US
34.238.237.228 bublup-bot-201.bublup.com US
35.172.229.86 ec2-35-172-229-86.compute-1.amazonaws.com US
54.165.114.202 ec2-54-165-114-202.compute-1.amazonaws.com US

访问控制

了解如何控制BublupBot访问权限,避免BublupBot抓取行为不当。

是否拦截BublupBot?

通常不需要。除非您不希望信息流网站或者APP对您的网站内容进行抓取,网站也不提供Feed订阅服务,则可以考虑拦截此类型爬虫。

通过Robots.txt拦截

您可以通过在网站的 robots.txt 中设置用户代理访问规则来屏蔽 BublupBot 或限制其访问权限。我们建议安装 Spider Analyser 插件,以检查它是否真正遵循这些规则。

	# robots.txt
	# 下列代码一般情况可以拦截该代理
	
	User-agent: BublupBot
	Disallow: /

您无需手动执行此操作,可通过我们的 Wordpress 插件 Spider Analyser 来拦截不必要的蜘蛛或者爬虫。

更多信息

什么是Bublup Bot?

Bublup Bot是一个由Bublup创建的互联网机器人,系统地浏览互联网上的有趣内容,并为Bublup用户创建一个包含数百万条内容的数据库。Bublup复杂的建议引擎在幕后工作,为其用户带来基于关键词和众包的建议,这些建议与他们在用户账户中保存的内容以及他们喜欢看的趋势性话题有关。

Bublup创建了视觉上吸引人的内容供用户审查。机器人帮助Bublup识别网页上的数据,包括页面标题、描述和相关图片。网页包含的信息使Bublup能够提供建议,过滤垃圾邮件,并显示与该网页相关的有用信息。Bublup Bot定期获取网页及其内容,并使Bublup能够处理和存储或刷新页面内容。

Bublup如何访问你的网站?

当一个真正的Bublup Bot访问你的网站,它将发送一个有效的Bublup用户代理,并从Bublup管理的网络连接。Bublup Bot也被配置为自动限制对你的网站的并发请求的速度。

Bublup使用动态扩展的实例来处理用户负载,因此,其服务器击中网站的IP地址是不固定的。我们建议网站管理员避免在他们的网站配置中硬编码IP地址,因为Bublup Bot使用的地址可能会改变而不通知。

Bublup用户代理的签名是什么?

BublupBot (+https://www.bublup.com/bublup-bot.html)Mozilla/5.0 (compatible; BublupBot; https://www.bublup.com/bublup-bot.html)

你如何验证一个真正的Bublup Bot?

  1. 对你的访问日志中的IP地址进行反向DNS查询。
  2. 验证响应中的域名是否以bublup.com结尾。
  3. 对从步骤1检索到的响应进行DNS正向查询。
  4. 确认它与步骤1中的IP地址相同。

如果你收到一个客户端发送的有效Bublup用户代理的一致流量,但它没有通过上述DNS测试,请联系我们:info@bublup.com。

你如何限制Bublup访问你的网站?

如果你不希望Bublup Bot访问你的网站,你可以联系我们,我们会把你列入 “禁止访问 “名单。

我如何联系Bublup以获得更多信息?

你可以联系Bublup,info@bublup.com。

常见蜘蛛/爬虫

Common Spiders
Twitterbot
Twitterbot蜘蛛/爬虫属于获取器类型,由X Corp.开发运行。您可以继续阅读下方信息,以深入了解Twitterbot基本信息,用户代理和访问控制等。
SeznamBot
SeznamBot蜘蛛/爬虫属于搜索引擎类型,由Seznam.cz, a.s.开发运行。您可以继续阅读下方信息,以深入了解SeznamBot基本信息,用户代理和访问控制等。
Blogtrottr
Blogtrottr蜘蛛/爬虫属于信息流类型,由Blogtrottr Ltd.开发运行。您可以继续阅读下方信息,以深入了解Blogtrottr基本信息,用户代理和访问控制等。
RSSingBot
RSSingBot蜘蛛/爬虫属于信息流类型,由RSSING.COM开发运行。您可以继续阅读下方信息,以深入了解RSSingBot基本信息,用户代理和访问控制等。
WordPress.com bots
WordPress.com bots蜘蛛/爬虫属于信息流类型,由Automattic Inc.开发运行。您可以继续阅读下方信息,以深入了解WordPress.com bots基本信息,用户代理和访问控制等。
Feedspotbot
Feedspotbot蜘蛛/爬虫属于信息流类型,由Feedspot开发运行。您可以继续阅读下方信息,以深入了解Feedspotbot基本信息,用户代理和访问控制等。
Discordbot
Discordbot蜘蛛/爬虫属于获取器类型,由Discord Inc.开发运行。您可以继续阅读下方信息,以深入了解Discordbot基本信息,用户代理和访问控制等。
Awario crawler
Awario crawler蜘蛛/爬虫属于营销类型,由Link-Assistant.Com开发运行。您可以继续阅读下方信息,以深入了解Awario crawler基本信息,用户代理和访问控制等。

相关文章

Related Articles