ArchiveTeam crawler

ArchiveTeam crawler蜘蛛/爬虫属于类型,由Archive Team开发运行。您可以继续阅读下方信息,以深入了解ArchiveTeam crawler基本信息,用户代理和访问控制等。

基本信息

ArchiveTeam crawler的基本信息如下表。但部分不是很规范的蜘蛛和爬虫,可能存在信息不明的情况。
蜘蛛/爬虫名称
ArchiveTeam crawler
类型
其他
开发商
Archive Team
当前状态
活动

用户代理

关于ArchiveTeam crawler蜘蛛或者爬虫的用户代理字符串,IP地址和服务器,所在地等信息如下表格所示:
ArchiveTeam ArchiveBot/20240923.203d40a
用户代理字符串
ArchiveTeam ArchiveBot/20240923.203d40a (wpull 2.0.3) and not Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.36
首次出现
2024-10-12 06:36:33
最后出现
2025-01-04 09:07:00
遵循robots.txt
未知
来源
IP地址(7) 服务器名称 所属国家
5.135.140.155 ns345142.ip-5-135-140.eu FR
202.61.239.70 v2202409235438287392.supersrv.de DE
2a03:4000:5c:152:: 2a03:4000:5c:152:: DE
152.53.107.23 ams1.aktheknight.co.uk AT
2a01:4f9:3051:1095::2 2a01:4f9:3051:1095::2 DE
用户代理字符串
ArchiveTeam ArchiveBot/20230129.7ad0d38 (wpull 2.0.3) and not Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.36
首次出现
2023-07-03 05:24:12
最后出现
2024-09-15 04:41:53
遵循robots.txt
未知
来源
IP地址(2) 服务器名称 所属国家
2a01:4f9:2b:12e6::2 2a01:4f9:2b:12e6::2 DE
95.216.99.153 hel3.aktheknight.co.uk FI
用户代理字符串
ArchiveTeam ArchiveBot/20231201.ad9703c (wpull 2.0.3) and not Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.36
首次出现
2024-05-08 05:04:33
最后出现
2024-06-02 05:03:14
遵循robots.txt
未知
来源
IP地址(2) 服务器名称 所属国家
94.16.106.112 v2202404220987263241.goodsrv.de AT
用户代理字符串
ArchiveTeam ArchiveBot/20231130.dd5ce62 (wpull 2.0.3) and not Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.36
首次出现
2023-12-29 21:32:08
最后出现
2023-12-29 21:32:08
遵循robots.txt
未知
来源
IP地址(1) 服务器名称 所属国家
5.135.140.155 ns345142.ip-5-135-140.eu FR
用户代理字符串
ArchiveTeam ArchiveBot/20220523.4a672db (wpull 2.0.3) and not Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.36
首次出现
2022-11-13 22:36:36
最后出现
2023-08-29 10:37:22
遵循robots.txt
未知
来源
IP地址(2) 服务器名称 所属国家
65.108.231.39 hel4.aktheknight.co.uk FI
2a01:4f9:1a:ab1b::2 2a01:4f9:1a:ab1b::2 DE
用户代理字符串
ArchiveTeam ArchiveBot/20210807.16be765 (wpull 2.0.3) and not Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.36
首次出现
2022-02-10 16:21:41
最后出现
2022-11-18 23:27:13
遵循robots.txt
未知
来源
IP地址(1) 服务器名称 所属国家
198.27.81.59 ns509217.ip-198-27-81.net CA
用户代理字符串
ArchiveTeam ArchiveBot/20220224.1cab846 (wpull 2.0.3) and not Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.36
首次出现
2022-05-24 03:45:11
最后出现
2022-05-25 19:03:07
遵循robots.txt
未知
来源
IP地址(4) 服务器名称 所属国家
185.186.10.94 185.186.10.94 GB
185.186.10.93 185.186.10.93 GB
185.186.10.87 185.186.10.87 GB
用户代理字符串
ArchiveTeam ArchiveBot/20210517.c1020e5 (wpull 2.0.3) and not Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.36
首次出现
2021-07-01 02:41:25
最后出现
2022-03-15 04:33:52
遵循robots.txt
未知
来源
IP地址(2) 服务器名称 所属国家
95.216.99.153 hel3.aktheknight.co.uk FI
23.168.145.20 ananiel-th.falconk.rocks US
用户代理字符串
ArchiveTeam ArchiveBot/20210302.d21680e (wpull 2.0.3) and not Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.36
首次出现
2021-05-26 00:27:30
最后出现
2021-05-26 00:27:30
遵循robots.txt
未知
来源
IP地址(1) 服务器名称 所属国家
23.168.144.20 ananiel-th.falconk.rocks US
用户代理字符串
ArchiveTeam ArchiveBot/20190825.7691ba8 (wpull 2.0.3) and not Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.36
首次出现
2019-11-25 13:48:17
最后出现
2021-05-18 04:54:34
遵循robots.txt
未知
来源
IP地址(2) 服务器名称 所属国家
103.230.141.99 103.230.141.99 BZ
203.86.193.213 203-86-193-213-unused.tasman.net NZ
用户代理字符串
ArchiveTeam ArchiveBot/20200413.2e71c9a (wpull 2.0.3) and not Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.36
首次出现
2020-07-22 05:26:58
最后出现
2021-05-12 18:46:40
遵循robots.txt
未知
来源
IP地址(1) 服务器名称 所属国家
192.99.9.75 192.99.9.75 CA
用户代理字符串
ArchiveTeam ArchiveBot/20210323.877335e (wpull 2.0.3) and not Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.36
首次出现
2021-05-08 04:38:33
最后出现
2021-05-10 16:00:07
遵循robots.txt
未知
来源
IP地址(1) 服务器名称 所属国家
101.100.146.155 101-100-146-155.myrepublic.co.nz NZ
用户代理字符串
ArchiveTeam ArchiveBot/20210105.3af42e7 (wpull 2.0.3) and not Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.36
首次出现
2021-02-14 04:48:04
最后出现
2021-02-14 04:48:04
遵循robots.txt
未知
来源
IP地址(1) 服务器名称 所属国家
69.197.128.218 shriekwild.com US
用户代理字符串
ArchiveTeam ArchiveBot/20191207.38f77ff (wpull 2.0.3) and not Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.36
首次出现
2020-02-06 17:28:47
最后出现
2021-01-30 14:31:26
遵循robots.txt
未知
来源
IP地址(3) 服务器名称 所属国家
198.27.81.59 ns509217.ip-198-27-81.net CA
104.192.169.246 104.192.169.246 US
185.194.143.29 host.invalid DE
用户代理字符串
ArchiveTeam ArchiveBot/20190617.01 (wpull 2.0.3) and not Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.36
首次出现
2019-07-19 13:30:24
最后出现
2021-01-30 06:23:47
遵循robots.txt
未知
来源
IP地址(3) 服务器名称 所属国家
46.105.98.229 ns382244.ip-46-105-98.eu FR
95.217.35.29 ? FI
136.243.33.150 static.150.33.243.136.clients.your-server.de DE
用户代理字符串
ArchiveTeam ArchiveBot/20201201.72d2d09 (wpull 2.0.3) and not Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.36
首次出现
2020-12-15 06:43:33
最后出现
2020-12-15 06:43:33
遵循robots.txt
未知
来源
IP地址(2) 服务器名称 所属国家
23.168.144.20 ananiel-th.falconk.rocks US
2602:808:4000:1::b37a ananiel-th.falconk.rocks US
用户代理字符串
ArchiveTeam ArchiveBot/20190823.9d2521e (wpull 2.0.3) and not Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.36
首次出现
2019-09-26 08:20:21
最后出现
2020-03-13 13:15:36
遵循robots.txt
未知
来源
IP地址(1) 服务器名称 所属国家
192.99.9.75 ns531958.ip-192-99-9.net CA
用户代理字符串
ArchiveTeam ArchiveBot/20171212.01 (wpull 2.0.3) and not Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.36
首次出现
2018-05-21 07:48:39
最后出现
2019-08-04 13:34:15
遵循robots.txt
未知
来源
IP地址(5) 服务器名称 所属国家
172.93.102.2 hosted-by.reliablesite.net US
88.202.128.193 mail.sdmjc.net GB
185.194.143.29 host.invalid DE
159.203.99.11 ? US
23.92.211.59 archivebot.tyzoid.com US
用户代理字符串
ArchiveTeam ArchiveBot/20180922.01 (wpull 2.0.3) and not Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.36
首次出现
2019-05-04 07:03:55
最后出现
2019-05-04 07:03:55
遵循robots.txt
未知
来源
IP地址(1) 服务器名称 所属国家
203.86.193.213 203-86-193-213-unused.tasman.net NZ
用户代理字符串
ArchiveTeam ArchiveBot/20170106.02 (wpull 2.0.2) and not Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.36
首次出现
2018-02-01 05:46:38
最后出现
2018-02-01 05:46:38
遵循robots.txt
未知
来源
IP地址(1) 服务器名称 所属国家
88.202.128.193 mail.sdmjc.net GB
用户代理字符串
ArchiveTeam ArchiveBot/20170811.01 (wpull 2.0.3) and not Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.36
首次出现
2017-09-01 06:31:53
最后出现
2017-09-01 06:31:53
遵循robots.txt
未知
来源
IP地址(1) 服务器名称 所属国家
51.15.133.71 71-133-15-51.rev.cloud.scaleway.com FR
用户代理字符串
curl/7.37.1 (not really) URLTeam TerrorOfTinyTown/45 (ArchiveTeam; +http://archiveteam.org/index.php?title=URLTeam/Appeal)
首次出现
2016-06-13 02:08:45
最后出现
2016-06-13 02:08:45
遵循robots.txt
未知
来源
IP地址(1) 服务器名称 所属国家
64.62.243.83 ? US

访问控制

了解如何控制ArchiveTeam crawler访问权限,避免ArchiveTeam crawler抓取行为不当。

是否拦截ArchiveTeam crawler?

对于未知蜘蛛或者爬虫。它的用途对网站来说可能是好的,也可能是坏的,这取决于它是什么。所以说,这需要站长进一步分析判断这些尚不明确的爬虫行为,再作最终决定。 但,根据以往的经验,未声明行为目的及未命名的蜘蛛爬虫,通常都有不可告人的秘密,我们理应对其行为进行控制,比如拦截。

通过Robots.txt拦截

您可以通过在网站的 robots.txt 中设置用户代理访问规则来屏蔽 ArchiveTeam crawler 或限制其访问权限。我们建议安装 Spider Analyser 插件,以检查它是否真正遵循这些规则。

	# robots.txt
	# 下列代码一般情况可以拦截该代理
	
	User-agent: ArchiveTeam crawler
	Disallow: /

您无需手动执行此操作,可通过我们的 Wordpress 插件 Spider Analyser 来拦截不必要的蜘蛛或者爬虫。

常见蜘蛛/爬虫

Common Spiders
DataForSeo bot
DataForSeo bot蜘蛛/爬虫属于类型,由DataForSEO OU开发运行。您可以继续阅读下方信息,以深入了解DataForSeo bot基本信息,用户代理和访问控制等。
CloudFlare crawler
CloudFlare crawler蜘蛛/爬虫属于类型,由CloudFlare, Inc.开发运行。您可以继续阅读下方信息,以深入了解CloudFlare crawler基本信息,用户代理和访问控制等。
Odin
Odin蜘蛛/爬虫属于类型,由Cyble, Inc.开发运行。您可以继续阅读下方信息,以深入了解Odin基本信息,用户代理和访问控制等。
Chrome Privacy Preserving Prefetch Proxy
Chrome Privacy Preserving Prefetch Proxy蜘蛛/爬虫属于类型,由Google Inc.开发运行。您可以继续阅读下方信息,以深入了解Chrome Privacy Preserving Prefetch Proxy基本信息,用户代理和访问控制等。
EFF crawler
EFF crawler蜘蛛/爬虫属于类型,由Electronic Frontier Foundation开发运行。您可以继续阅读下方信息,以深入了解EFF crawler基本信息,用户代理和访问控制等。
Modat crawler
Modat crawler蜘蛛/爬虫属于类型,由Modat B.V.开发运行。您可以继续阅读下方信息,以深入了解Modat crawler基本信息,用户代理和访问控制等。
FirmoGraph
FirmoGraph蜘蛛/爬虫属于类型,由firmograph.io开发运行。您可以继续阅读下方信息,以深入了解FirmoGraph基本信息,用户代理和访问控制等。
fluid
fluid蜘蛛/爬虫属于类型,由leak.info开发运行。您可以继续阅读下方信息,以深入了解fluid基本信息,用户代理和访问控制等。

相关文章

Related Articles