COMSYS crawler
COMSYS crawler蜘蛛/爬虫属于类型,由COMSYS at RWTH Aachen University开发运行。您可以继续阅读下方信息,以深入了解COMSYS crawler基本信息,用户代理和访问控制等。
基本信息
COMSYS crawler的基本信息如下表。但部分不是很规范的蜘蛛和爬虫,可能存在信息不明的情况。
- 蜘蛛/爬虫名称
- COMSYS crawler
- 类型
- 其他
- 开发商
-
COMSYS at RWTH Aachen University
- 当前状态
-
活动
用户代理
关于COMSYS crawler蜘蛛或者爬虫的用户代理字符串,IP地址和服务器,所在地等信息如下表格所示:
researchscan.comsys
-
researchscan.comsys
-
Researchscan/http
-
Researchscan/t13l
-
Researchscan/t13rl
-
Researchscan/t12sns
-
Researchscan/t12ca
-
Researchscan/t13-0rtt
- 用户代理字符串
- Mozilla/5.0 researchscan.comsys.rwth-aachen.de
- 首次出现
- 2023-03-17 03:14:32
- 最后出现
- 2025-01-09 05:47:55
- 遵循robots.txt
- 未知
- 来源
-
IP地址(18) |
服务器名称 |
所属国家 |
137.226.113.9 |
researchscan2.comsys.rwth-aachen.de |
? |
137.226.113.44 |
researchscan36.comsys.rwth-aachen.de |
DE |
13.245.17.221 |
ec2-13-245-17-221.af-south-1.compute.amazonaws.com |
ZA |
54.176.177.7 |
ec2-54-176-177-7.us-west-1.compute.amazonaws.com |
US |
18.183.43.173 |
ec2-18-183-43-173.ap-northeast-1.compute.amazonaws.com |
JP |
3.106.135.198 |
ec2-3-106-135-198.ap-southeast-2.compute.amazonaws.com |
AU |
3.75.242.177 |
ec2-3-75-242-177.eu-central-1.compute.amazonaws.com |
DE |
177.71.160.191 |
ec2-177-71-160-191.sa-east-1.compute.amazonaws.com |
BR |
207.148.119.21 |
researchscan-external1.comsys.rwth-aachen.de |
SG |
149.28.118.137 |
researchscan-external9.comsys.rwth-aachen.de |
US |
95.179.241.62 |
researchscan-external3.comsys.rwth-aachen.de |
DE |
2a00:8a60:1014:88::9 |
researchscan2.comsys.rwth-aachen.de |
DE |
202.182.111.56 |
researchscan-external6.comsys.rwth-aachen.de |
JP |
139.180.170.247 |
researchscan-external7.comsys.rwth-aachen.de |
AU |
139.84.232.165 |
researchscan-external4.comsys.rwth-aachen.de |
US |
64.176.7.63 |
researchscan-external5.comsys.rwth-aachen.de |
US |
137.226.113.15 |
researchscan8.comsys.rwth-aachen.de |
DE |
2a00:8a60:1014:88::15 |
researchscan8.comsys.rwth-aachen.de |
DE |
- 用户代理字符串
- Mozilla/5.0 zgrab/0.x (compatible; Researchscan/http; +http://researchscan.comsys.rwth-aachen.de)
- 首次出现
- 2022-08-11 22:45:59
- 最后出现
- 2023-03-09 05:17:59
- 遵循robots.txt
- 未知
- 来源
-
IP地址(2) |
服务器名称 |
所属国家 |
137.226.113.44 |
researchscan36.comsys.rwth-aachen.de |
DE |
137.226.113.9 |
researchscan2.comsys.rwth-aachen.de |
DE |
- 用户代理字符串
- Mozilla/5.0 zgrab/0.x (compatible; Researchscan/t13l; +http://researchscan.comsys.rwth-aachen.de)
- 首次出现
- 2020-08-10 09:14:23
- 最后出现
- 2020-08-10 09:14:23
- 遵循robots.txt
- 未知
- 来源
-
IP地址(1) |
服务器名称 |
所属国家 |
183.134.108.22 |
183.134.108.22 |
CN |
- 用户代理字符串
- Mozilla/5.0 zgrab/0.x (compatible; Researchscan/t13rl; +http://researchscan.comsys.rwth-aachen.de)
- 首次出现
- 2018-10-23 00:26:04
- 最后出现
- 2020-06-24 11:51:29
- 遵循robots.txt
- 未知
- 来源
-
IP地址(11) |
服务器名称 |
所属国家 |
137.226.113.28 |
researchscan21.comsys.rwth-aachen.de |
DE |
137.226.113.27 |
researchscan20.comsys.rwth-aachen.de |
DE |
137.226.113.26 |
researchscan19.comsys.rwth-aachen.de |
DE |
162.158.202.87 |
? |
DE |
162.158.90.65 |
? |
DE |
162.158.90.11 |
? |
DE |
162.158.93.62 |
? |
DE |
162.158.89.90 |
? |
DE |
162.158.88.49 |
? |
DE |
162.158.88.169 |
? |
DE |
- 用户代理字符串
- Mozilla/5.0 zgrab/0.x (compatible; Researchscan/t12sns; +http://researchscan.comsys.rwth-aachen.de)
- 首次出现
- 2018-04-14 10:26:07
- 最后出现
- 2020-06-09 03:01:41
- 遵循robots.txt
- 未知
- 来源
-
IP地址(37) |
服务器名称 |
所属国家 |
137.226.113.26 |
researchscan19.comsys.rwth-aachen.de |
DE |
137.226.113.28 |
researchscan21.comsys.rwth-aachen.de |
DE |
137.226.113.27 |
researchscan20.comsys.rwth-aachen.de |
DE |
162.158.202.63 |
? |
DE |
162.158.234.141 |
? |
BE |
162.158.114.99 |
? |
DE |
162.158.202.153 |
? |
DE |
162.158.114.45 |
? |
DE |
162.158.114.57 |
? |
DE |
162.158.114.125 |
? |
DE |
- 用户代理字符串
- Mozilla/5.0 zgrab/0.x (compatible; Researchscan/t12ca; +http://researchscan.comsys.rwth-aachen.de)
- 首次出现
- 2018-10-24 09:20:18
- 最后出现
- 2020-03-26 07:45:41
- 遵循robots.txt
- 未知
- 来源
-
IP地址(36) |
服务器名称 |
所属国家 |
137.226.113.26 |
researchscan19.comsys.rwth-aachen.de |
DE |
137.226.113.27 |
researchscan20.comsys.rwth-aachen.de |
DE |
137.226.113.28 |
researchscan21.comsys.rwth-aachen.de |
DE |
162.158.202.153 |
? |
DE |
162.158.202.171 |
? |
DE |
162.158.114.57 |
? |
DE |
162.158.202.63 |
? |
DE |
162.158.114.45 |
? |
DE |
162.158.114.125 |
? |
DE |
162.158.114.99 |
? |
DE |
- 用户代理字符串
- Mozilla/5.0 zgrab/0.x (compatible; Researchscan/t13-0rtt; +http://researchscan.comsys.rwth-aachen.de)
- 首次出现
- 2019-07-12 02:57:18
- 最后出现
- 2019-07-12 02:57:18
- 遵循robots.txt
- 未知
- 来源
-
IP地址(2) |
服务器名称 |
所属国家 |
162.158.90.71 |
162.158.90.71 |
DE |
162.158.94.73 |
162.158.94.73 |
DE |
访问控制
了解如何控制COMSYS crawler访问权限,避免COMSYS crawler抓取行为不当。
是否拦截COMSYS crawler?
对于未知蜘蛛或者爬虫。它的用途对网站来说可能是好的,也可能是坏的,这取决于它是什么。所以说,这需要站长进一步分析判断这些尚不明确的爬虫行为,再作最终决定。
但,根据以往的经验,未声明行为目的及未命名的蜘蛛爬虫,通常都有不可告人的秘密,我们理应对其行为进行控制,比如拦截。
通过Robots.txt拦截
您可以通过在网站的 robots.txt 中设置用户代理访问规则来屏蔽 COMSYS crawler 或限制其访问权限。我们建议安装 Spider Analyser
插件,以检查它是否真正遵循这些规则。
# robots.txt
# 下列代码一般情况可以拦截该代理
User-agent: COMSYS crawler
Disallow: /
您无需手动执行此操作,可通过我们的 Wordpress 插件 Spider Analyser 来拦截不必要的蜘蛛或者爬虫。