My Nutch Spider
My Nutch Spider蜘蛛/爬虫属于爬虫类型,由Unknown Author开发运行。您可以继续阅读下方信息,以深入了解My Nutch Spider基本信息,用户代理和访问控制等。
基本信息
My Nutch Spider的基本信息如下表。但部分不是很规范的蜘蛛和爬虫,可能存在信息不明的情况。
- 蜘蛛/爬虫名称
- My Nutch Spider
- 类型
- 爬虫
- 开发商
-
Unknown Author
- 当前状态
-
活动
用户代理
关于My Nutch Spider蜘蛛或者爬虫的用户代理字符串,IP地址和服务器,所在地等信息如下表格所示:
My Nutch Spider/Nutch-1.18
-
My Nutch Spider/Nutch-1.18
-
My Nutch Spider
-
My Nutch Spider/Nutch-1.14
-
My Nutch Spider/Nutch-1.12
-
My Nutch Spider/Nutch-1.9
-
My Nutch Spider/Nutch-1.11
-
My Nutch Spider/Nutch-1.10
-
My Nutch Spider/Nutch-1.6
-
My Nutch Spider/Nutch-1.5-SNAPSHOT
-
My Nutch Spider/Nutch-1.5
-
My Nutch Spider/Nutch-1.5.1
-
My Nutch Spider/Nutch-1.4
-
My Nutch Spider/Nutch-1.3
- 用户代理字符串
- My Nutch Spider/Nutch-1.18
- 首次出现
- 2022-07-08 10:19:30
- 最后出现
- 2022-07-28 19:11:23
- 遵循robots.txt
- 未知
- 来源
-
IP地址(3) |
服务器名称 |
所属国家 |
35.187.118.3 |
? |
BE |
158.174.80.2 |
h-158-174-80-2.a357.priv.bahnhof.se |
SE |
3.84.214.146 |
ec2-3-84-214-146.compute-1.amazonaws.com |
US |
- 用户代理字符串
- My Nutch Spider/Nutch-1.16
- 首次出现
- 2020-03-29 18:08:43
- 最后出现
- 2020-03-29 18:08:43
- 遵循robots.txt
- 未知
- 来源
-
IP地址(1) |
服务器名称 |
所属国家 |
35.187.118.3 |
? |
BE |
158.174.80.2 |
h-158-174-80-2.a357.priv.bahnhof.se |
SE |
3.84.214.146 |
ec2-3-84-214-146.compute-1.amazonaws.com |
US |
93.217.136.233 |
p5dd988e9.dip0.t-ipconnect.de |
DE |
- 用户代理字符串
- My Nutch Spider/Nutch-1.14
- 首次出现
- 2018-05-08 02:09:25
- 最后出现
- 2018-06-20 21:28:49
- 遵循robots.txt
- 未知
- 来源
-
IP地址(2) |
服务器名称 |
所属国家 |
141.41.35.82 |
? |
DE |
193.136.212.194 |
gtdei-nat-cisuc.dei.uc.pt |
PT |
- 用户代理字符串
- My Nutch Spider/Nutch-1.12
- 首次出现
- 2017-03-14 06:24:26
- 最后出现
- 2017-04-04 03:37:21
- 遵循robots.txt
- 未知
- 来源
-
IP地址(2) |
服务器名称 |
所属国家 |
193.136.212.204 |
gtdei-nat-servidores-alunos.dei.uc.pt |
PT |
147.47.120.248 |
scalgateway.snu.ac.kr |
KR |
- 用户代理字符串
- My Nutch Spider/Nutch-1.9
- 首次出现
- 2015-01-25 08:49:33
- 最后出现
- 2016-09-07 14:14:16
- 遵循robots.txt
- 未知
- 来源
-
IP地址(6) |
服务器名称 |
所属国家 |
198.211.112.147 |
search.serend.io |
US |
104.236.210.7 |
search.serend.io |
US |
144.76.217.197 |
? |
DE |
104.236.223.91 |
search.serend.io |
US |
195.113.209.154 |
doom14.metacentrum.cz |
CZ |
69.203.107.29 |
cpe-69-203-107-29.nyc.res.rr.com |
US |
- 用户代理字符串
- My Nutch Spider/Nutch-1.11
- 首次出现
- 2016-01-28 20:52:36
- 最后出现
- 2016-07-13 06:43:43
- 遵循robots.txt
- 未知
- 来源
-
IP地址(13) |
服务器名称 |
所属国家 |
172.99.69.88 |
? |
US |
162.242.255.52 |
? |
US |
52.6.251.74 |
ec2-52-6-251-74.compute-1.amazonaws.com |
US |
52.21.174.235 |
ec2-52-21-174-235.compute-1.amazonaws.com |
US |
52.71.49.253 |
ec2-52-71-49-253.compute-1.amazonaws.com |
US |
92.186.121.46 |
46.pool92-186-121.dynamic.orange.es |
ES |
52.2.208.248 |
ec2-52-2-208-248.compute-1.amazonaws.com |
US |
52.71.53.178 |
ec2-52-71-53-178.compute-1.amazonaws.com |
US |
52.3.129.222 |
ec2-52-3-129-222.compute-1.amazonaws.com |
US |
52.70.130.19 |
ec2-52-70-130-19.compute-1.amazonaws.com |
US |
- 用户代理字符串
- My Nutch Spider/Nutch-1.10
- 首次出现
- 2016-02-25 18:28:45
- 最后出现
- 2016-02-25 18:28:45
- 遵循robots.txt
- 未知
- 来源
-
IP地址(1) |
服务器名称 |
所属国家 |
144.76.217.197 |
? |
DE |
- 用户代理字符串
- My Nutch Spider/Nutch-1.6
- 首次出现
- 2014-02-23 06:21:57
- 最后出现
- 2015-06-12 19:46:17
- 遵循robots.txt
- 未知
- 来源
-
IP地址(1) |
服务器名称 |
所属国家 |
46.17.203.253 |
f2.skbkontur.ru |
RU |
- 用户代理字符串
- My Nutch Spider/Nutch-1.5-SNAPSHOT
- 首次出现
- 2012-02-04 13:50:00
- 最后出现
- 2014-05-02 11:01:17
- 遵循robots.txt
- 未知
- 来源
-
IP地址(2) |
服务器名称 |
所属国家 |
118.250.163.108 |
? |
CN |
129.100.16.86 |
lab400-dk.kdd.csd.uwo.ca |
CA |
- 用户代理字符串
- My Nutch Spider/Nutch-1.5
- 首次出现
- 2012-06-14 09:15:34
- 最后出现
- 2012-10-20 00:20:03
- 遵循robots.txt
- 未知
- 来源
-
IP地址(4) |
服务器名称 |
所属国家 |
184.73.9.68 |
ec2-184-73-9-68.compute-1.amazonaws.com |
US |
204.236.227.151 |
ec2-204-236-227-151.compute-1.amazonaws.com |
US |
205.168.84.133 |
? |
US |
69.165.131.132 |
69-165-131-132.dsl.teksavvy.com |
CA |
- 用户代理字符串
- My Nutch Spider/Nutch-1.5.1
- 首次出现
- 2012-08-04 16:23:42
- 最后出现
- 2012-09-07 12:47:53
- 遵循robots.txt
- 未知
- 来源
-
IP地址(1) |
服务器名称 |
所属国家 |
72.9.5.148 |
d-72-9-5-148.cpe.metrocast.net |
US |
- 用户代理字符串
- My Nutch Spider/Nutch-1.4
- 首次出现
- 2012-04-23 10:15:35
- 最后出现
- 2012-04-23 10:15:35
- 遵循robots.txt
- 未知
- 来源
-
IP地址(1) |
服务器名称 |
所属国家 |
50.57.109.72 |
50-57-109-72.static.cloud-ips.com |
US |
- 用户代理字符串
- My Nutch Spider/Nutch-1.3
- 首次出现
- 2011-10-14 12:56:27
- 最后出现
- 2011-10-22 20:27:01
- 遵循robots.txt
- 未知
- 来源
-
IP地址(1) |
服务器名称 |
所属国家 |
69.28.58.15 |
? |
US |
访问控制
了解如何控制My Nutch Spider访问权限,避免My Nutch Spider抓取行为不当。
是否拦截My Nutch Spider?
可以考虑拦截。。爬虫通常会下载公开的互联网内容,这些内容默认情况下可以免费访问。不过,如果你不希望你的内容被用于未经授权的目的,你应该拦截它们。
通过Robots.txt拦截
您可以通过在网站的 robots.txt 中设置用户代理访问规则来屏蔽 My Nutch Spider 或限制其访问权限。我们建议安装 Spider Analyser
插件,以检查它是否真正遵循这些规则。
# robots.txt
# 下列代码一般情况可以拦截该代理
User-agent: My Nutch Spider
Disallow: /
您无需手动执行此操作,可通过我们的 Wordpress 插件 Spider Analyser 来拦截不必要的蜘蛛或者爬虫。