FAST-WebCrawler

基本信息

FAST-WebCrawler的基本信息如下表。但部分不是很规范的蜘蛛和爬虫，可能存在信息不明的情况。

用户代理

关于FAST-WebCrawler蜘蛛或者爬虫的用户代理字符串，IP地址和服务器，所在地等信息如下表格所示：

用户代理字符串: FAST-WebCrawler/3.8 (crawler at trd dot overture dot com; http://www.alltheweb.com/help/webmaster/crawler)

来源

IP地址(9)	服务器名称	所属国家
3.128.172.1	ec2-3-128-172-1.us-east-2.compute.amazonaws.com	US
51.68.139.151	vps-34b45890.vps.ovh.net	PL
3.19.58.18	ec2-3-19-58-18.us-east-2.compute.amazonaws.com	US
50.18.1.166	ec2-50-18-1-166.us-west-1.compute.amazonaws.com	US
3.76.249.59	ec2-3-76-249-59.eu-central-1.compute.amazonaws.com	DE
51.20.96.65	ec2-51-20-96-65.eu-north-1.compute.amazonaws.com	SE
83.147.52.42	83.147.52.42	US
179.43.168.130	hostedby.privatelayer.com	CH
3.237.4.118	ec2-3-237-4-118.compute-1.amazonaws.com	US
94.156.68.162	94.156.68.162	NL
3.139.101.130	ec2-3-139-101-130.us-east-2.compute.amazonaws.com	US
195.178.110.57	195.178.110.57	US

访问控制

了解如何控制FAST-WebCrawler访问权限，避免FAST-WebCrawler抓取行为不当。

可以考虑拦截。。爬虫通常会下载公开的互联网内容，这些内容默认情况下可以免费访问。不过，如果你不希望你的内容被用于未经授权的目的，你应该拦截它们。

您可以通过在网站的 robots.txt 中设置用户代理访问规则来屏蔽 FAST-WebCrawler 或限制其访问权限。我们建议安装 Spider Analyser 插件，以检查它是否真正遵循这些规则。

# robots.txt

# 下列代码一般情况可以拦截该代理

User-agent: FAST-WebCrawler

Disallow: /

# robots.txt # 下列代码一般情况可以拦截该代理 User-agent: FAST-WebCrawler Disallow: /

# robots.txt
# 下列代码一般情况可以拦截该代理
User-agent: FAST-WebCrawler
Disallow: /

您无需手动执行此操作，可通过我们的 Wordpress 插件 Spider Analyser 来拦截不必要的蜘蛛或者爬虫。

基本信息