Protopage

Protopage蜘蛛/爬虫属于工具类型,由Protopage Ltd.开发运行。您可以继续阅读下方信息,以深入了解Protopage基本信息,用户代理和访问控制等。

基本信息

Protopage的基本信息如下表。但部分不是很规范的蜘蛛和爬虫,可能存在信息不明的情况。
蜘蛛/爬虫名称
Protopage
类型
工具
开发商
Protopage Ltd.
当前状态
活动

用户代理

关于Protopage蜘蛛或者爬虫的用户代理字符串,IP地址和服务器,所在地等信息如下表格所示:
Protopage/3.0
用户代理字符串
Protopage/3.0 (http://www.protopage.com)
首次出现
2015-12-21 10:50:00
最后出现
2025-01-09 06:11:59
遵循robots.txt
来源
IP地址(8) 服务器名称 所属国家
142.4.217.113 virt9.protopage.com CA
149.56.241.77 virt10.protopage.com CA
192.99.147.100 virt7.protopage.com CA
144.217.77.150 virt8.protopage.com CA
142.4.217.162 virt6.protopage.com CA
167.114.186.163 167.114.186.163 CA
15.235.11.129 virt13.protopage.com CA
148.113.159.50 virt12.protopage.com CA

访问控制

了解如何控制Protopage访问权限,避免Protopage抓取行为不当。

是否拦截Protopage?

可能不需要。工具类型爬虫通常为网站所有者使用此类工具对网站进行相关服务请求才会出现。当然,实际情况需站长判断后再作决定。

通过Robots.txt拦截

您可以通过在网站的 robots.txt 中设置用户代理访问规则来屏蔽 Protopage 或限制其访问权限。我们建议安装 Spider Analyser 插件,以检查它是否真正遵循这些规则。

	# robots.txt
	# 下列代码一般情况可以拦截该代理
	
	User-agent: Protopage
	Disallow: /

您无需手动执行此操作,可通过我们的 Wordpress 插件 Spider Analyser 来拦截不必要的蜘蛛或者爬虫。

常见蜘蛛/爬虫

Common Spiders
Googlebot
GoogleBot蜘蛛/爬虫属于搜索引擎类型,由Google Inc.开发运行。您可以继续阅读下方信息,以深入了解GoogleBot基本信息,用户代理和访问控制等。
Online Domain Tools
Online Domain Tools蜘蛛/爬虫属于监控类型,由AITIS s.r.o.开发运行。您可以继续阅读下方信息,以深入了解Online Domain Tools基本信息,用户代理和访问控制等。
cron-job.org
cron-job.org蜘蛛/爬虫属于工具类型,由B1G Software开发运行。您可以继续阅读下方信息,以深入了解cron-job.org基本信息,用户代理和访问控制等。
WGETbot
WGETbot蜘蛛/爬虫属于工具类型,由Alan Reed开发运行。您可以继续阅读下方信息,以深入了解WGETbot基本信息,用户代理和访问控制等。
MxToolbox bot
MxToolbox bot蜘蛛/爬虫属于工具类型,由MXToolBox, Inc开发运行。您可以继续阅读下方信息,以深入了解MxToolbox bot基本信息,用户代理和访问控制等。
updown.io bot
updown.io bot蜘蛛/爬虫属于监控类型,由Adrien Jarthon开发运行。您可以继续阅读下方信息,以深入了解updown.io bot基本信息,用户代理和访问控制等。
WordPress.com bots
WordPress.com bots蜘蛛/爬虫属于信息流类型,由Automattic Inc.开发运行。您可以继续阅读下方信息,以深入了解WordPress.com bots基本信息,用户代理和访问控制等。
s4a
s4a蜘蛛/爬虫属于工具类型,由Capsule Code SAS开发运行。您可以继续阅读下方信息,以深入了解s4a基本信息,用户代理和访问控制等。

相关文章

Related Articles