CloudFlare crawler

CloudFlare crawler,由CloudFlare, Inc.开发的类型蜘蛛/爬虫,当前为活动状态。

基本信息

CloudFlare crawler的基本信息如下表。但部分不是很规范的蜘蛛和爬虫,可能存在信息不明的情况。
蜘蛛/爬虫名称
CloudFlare crawler
开发商
CloudFlare, Inc.
官网
www.cloudflare.com
当前状态
活动

用户代理

关于CloudFlare crawler蜘蛛或者爬虫的用户代理字符串,IP地址和服务器,所在地等信息如下表格所示:
请选择代理
Cloudflare-Validator/1.0
用户代理字符串
Cloudflare-Validator/1.0
首次出现
2024-04-30 04:55:36
最后出现
2025-01-02 08:05:42
遵循robots.txt
IP地址
1
来源
IP地址 服务器名称 所属国家
198.41.144.243 198.41.144.243 US
用户代理字符串
Cloudflare-SSLDetector
首次出现
2021-01-30 16:52:31
最后出现
2021-02-14 18:42:56
遵循robots.txt
IP地址
3
用户代理字符串
Cloudflare Diagnostics
首次出现
2019-11-02 01:03:08
最后出现
2019-11-02 01:03:11
遵循robots.txt
IP地址
3
来源
IP地址 服务器名称 所属国家
162.158.155.91 162.158.155.91 GB
162.158.158.140 162.158.158.140 GB
141.101.107.107 141.101.107.107 GB
用户代理字符串
Cloudflare-Diagnostics
首次出现
2019-05-14 05:22:46
最后出现
2019-05-16 04:21:22
遵循robots.txt
IP地址
2
来源
IP地址 服务器名称 所属国家
172.68.142.58 172.68.142.58 US
162.158.107.42 162.158.107.42 US

访问控制

了解如何控制CloudFlare crawler访问权限,避免CloudFlare crawler抓取行为不当。

通过Robots.txt拦截

您可以通过在网站的 robots.txt 中设置用户代理访问规则来屏蔽 CloudFlare crawler 或限制其访问权限。我们建议安装 Spider Analyser 插件,以检查它是否真正遵循这些规则。

	# robots.txt
	# 下列代码一般情况可以拦截该代理
	
	User-agent: CloudFlare crawler
	Disallow: /

您无需手动执行此操作,可通过我们的 Wordpress 插件 Spider Analyser 来拦截不必要的蜘蛛或者爬虫。