findlinks
findlinks蜘蛛/爬虫属于类型,由Universität Leipzig开发运行。您可以继续阅读下方信息,以深入了解findlinks基本信息,用户代理和访问控制等。
基本信息
findlinks的基本信息如下表。但部分不是很规范的蜘蛛和爬虫,可能存在信息不明的情况。
- 蜘蛛/爬虫名称
- findlinks
- 类型
- 其他
- 开发商
-
Universität Leipzig
- 当前状态
-
无效
用户代理
关于findlinks蜘蛛或者爬虫的用户代理字符串,IP地址和服务器,所在地等信息如下表格所示:
findlinks/1.1.6-beta4
-
findlinks/1.1.6-beta4
-
findlinks/1.0
-
findlinks/2.1.3
-
findlinks/2.2
-
findlinks/1.1.3-beta8
-
findlinks/2.6
-
findlinks/1.1.6-beta1
-
findlinks/2.1.5
-
findlinks/2.0.2
-
findlinks/2.5
-
findlinks/2.0.5
-
findlinks/2.0.1
-
findlinks/2.0.4
-
findlinks/2.1
-
findlinks/2.0.9
-
findlinks/1.1.3-beta9
-
findlinks/1.1.6-beta6
-
findlinks/2.0
-
findlinks/1.1.6-beta5
-
findlinks/1.1.6-beta3
-
findlinks/1.1.6-beta1 Yacy
-
findlinks/1.1.6-beta2
-
findlinks/1.1.4-beta7
- 用户代理字符串
- findlinks/1.1.6-beta4 (+http://wortschatz.uni-leipzig.de/findlinks/)
- 首次出现
- 2010-09-23 15:18:00
- 最后出现
- 2023-12-09 10:42:09
- 遵循robots.txt
- 未知
- 来源
-
IP地址(2) |
服务器名称 |
所属国家 |
139.18.13.202 |
woclu2.informatik.uni-leipzig.de |
DE |
188.225.127.89 |
188.225.127.89 |
RU |
- 用户代理字符串
- findlinks/1.0 (+http://wortschatz.uni-leipzig.de/findlinks/)
- 首次出现
- 2015-01-24 19:34:44
- 最后出现
- 2023-04-09 16:38:14
- 遵循robots.txt
- 未知
- 来源
-
IP地址(1) |
服务器名称 |
所属国家 |
178.205.244.59 |
178.205.244.59 |
RU |
- 用户代理字符串
- findlinks/2.1.3 (+http://wortschatz.uni-leipzig.de/findlinks/)
- 首次出现
- 2011-07-30 02:59:18
- 最后出现
- 2022-01-29 01:13:29
- 遵循robots.txt
- 未知
- 来源
-
IP地址(3) |
服务器名称 |
所属国家 |
139.18.2.17 |
niederhausen.tm.informatik.uni-leipzig.de |
DE |
139.18.13.202 |
woclu2.informatik.uni-leipzig.de |
DE |
178.62.62.205 |
762547.cloudwaysapps.com |
GB |
- 用户代理字符串
- findlinks/2.2 (+http://wortschatz.uni-leipzig.de/findlinks/)
- 首次出现
- 2012-04-11 05:28:24
- 最后出现
- 2021-06-29 22:29:21
- 遵循robots.txt
- 未知
- 来源
-
IP地址(2) |
服务器名称 |
所属国家 |
138.68.180.0 |
138.68.180.0 |
GB |
139.18.2.209 |
gkpc9.informatik.uni-leipzig.de |
DE |
- 用户代理字符串
- findlinks/1.1.3-beta8 (+http://wortschatz.uni-leipzig.de/findlinks/)
- 首次出现
- 2016-02-23 09:52:20
- 最后出现
- 2016-02-23 09:52:20
- 遵循robots.txt
- 未知
- 来源
-
IP地址(1) |
服务器名称 |
所属国家 |
188.165.238.96 |
ns3280143.ip-188-165-238.eu |
FR |
- 用户代理字符串
- findlinks/2.6 (+http://wortschatz.uni-leipzig.de/findlinks/)
- 首次出现
- 2012-05-16 20:30:43
- 最后出现
- 2013-09-20 12:15:49
- 遵循robots.txt
- 未知
- 来源
-
IP地址(17) |
服务器名称 |
所属国家 |
139.18.2.209 |
gkpc9.informatik.uni-leipzig.de |
DE |
130.83.167.153 |
desktop-153.ukp.informatik.tu-darmstadt.de |
DE |
85.114.142.245 |
142245.vs.webtropia.com |
DE |
139.18.2.17 |
niederhausen.tm.informatik.uni-leipzig.de |
DE |
78.51.229.196 |
f051229196.adsl.alicedsl.de |
DE |
91.64.204.254 |
91-64-204-254-dynip.superkabel.de |
DE |
84.135.36.144 |
p54872490.dip0.t-ipconnect.de |
DE |
93.219.126.206 |
p5ddb7ece.dip.t-dialin.net |
DE |
89.186.132.37 |
89-186-132-37.dynamic.primacom.net |
DE |
91.64.204.36 |
91-64-204-36-dynip.superkabel.de |
DE |
84.135.46.219 |
p54872edb.dip0.t-ipconnect.de |
DE |
85.181.202.189 |
e181202189.adsl.alicedsl.de |
DE |
85.5.66.52 |
52-66.5-85.cust.bluewin.ch |
CH |
194.94.76.249 |
natwlan.fh-stralsund.de |
DE |
- 用户代理字符串
- findlinks/1.1.6-beta1 (+http://wortschatz.uni-leipzig.de/findlinks/)
- 首次出现
- 2010-05-09 20:35:27
- 最后出现
- 2013-09-19 18:15:03
- 遵循robots.txt
- 未知
- 来源
-
IP地址(10) |
服务器名称 |
所属国家 |
139.18.2.209 |
gkpc9.informatik.uni-leipzig.de |
DE |
178.24.40.13 |
178-24-40-13-dynip.superkabel.de |
DE |
88.72.13.235 |
dslb-088-072-013-235.pools.arcor-ip.net |
DE |
88.72.20.114 |
dslb-088-072-020-114.pools.arcor-ip.net |
DE |
88.72.29.25 |
dslb-088-072-029-025.pools.arcor-ip.net |
DE |
88.72.7.251 |
dslb-088-072-007-251.pools.arcor-ip.net |
DE |
88.75.71.152 |
dslb-088-075-071-152.pools.arcor-ip.net |
DE |
91.67.141.134 |
91-67-141-134-dynip.superkabel.de |
DE |
91.67.146.120 |
91-67-146-120-dynip.superkabel.de |
DE |
139.18.13.202 |
woclu2.informatik.uni-leipzig.de |
DE |
- 用户代理字符串
- findlinks/2.1.5 (+http://wortschatz.uni-leipzig.de/findlinks/)
- 首次出现
- 2011-11-07 19:10:52
- 最后出现
- 2013-03-23 17:28:03
- 遵循robots.txt
- 未知
- 来源
-
IP地址(7) |
服务器名称 |
所属国家 |
130.83.167.161 |
desktop-161.ukp.informatik.tu-darmstadt.de |
DE |
139.18.2.17 |
niederhausen.tm.informatik.uni-leipzig.de |
DE |
188.155.163.203 |
xdsl-188-155-163-203.adslplus.ch |
CH |
31.164.164.231 |
xdsl-31-164-164-231.adslplus.ch |
CH |
31.164.165.236 |
xdsl-31-164-165-236.adslplus.ch |
CH |
95.91.60.242 |
95-91-60-242-dynip.superkabel.de |
DE |
130.83.167.153 |
desktop-153.ukp.informatik.tu-darmstadt.de |
DE |
- 用户代理字符串
- findlinks/2.0.2 (+http://wortschatz.uni-leipzig.de/findlinks/)
- 首次出现
- 2011-03-04 21:46:00
- 最后出现
- 2013-03-13 00:16:30
- 遵循robots.txt
- 未知
- 来源
-
IP地址(80) |
服务器名称 |
所属国家 |
77.21.147.173 |
77-21-147-173-dynip.superkabel.de |
DE |
217.249.129.41 |
pd9f98129.dip0.t-ipconnect.de |
DE |
77.20.40.173 |
77-20-40-173-dynip.superkabel.de |
DE |
93.198.62.147 |
p5dc63e93.dip0.t-ipconnect.de |
DE |
93.198.59.183 |
p5dc63bb7.dip0.t-ipconnect.de |
DE |
77.20.40.89 |
77-20-40-89-dynip.superkabel.de |
DE |
89.182.72.199 |
a89-182-72-199.net-htp.de |
DE |
77.21.146.71 |
77-21-146-71-dynip.superkabel.de |
DE |
217.249.132.14 |
pd9f9840e.dip.t-dialin.net |
DE |
89.183.66.88 |
a89-183-66-88.net-htp.de |
DE |
89.182.17.197 |
a89-182-17-197.net-htp.de |
DE |
77.20.158.103 |
77-20-158-103-dynip.superkabel.de |
DE |
77.20.155.143 |
77-20-155-143-dynip.superkabel.de |
DE |
89.182.81.175 |
a89-182-81-175.net-htp.de |
DE |
77.21.146.155 |
77-21-146-155-dynip.superkabel.de |
DE |
139.18.13.202 |
woclu2.informatik.uni-leipzig.de |
DE |
77.20.40.20 |
77-20-40-20-dynip.superkabel.de |
DE |
89.182.22.240 |
a89-182-22-240.net-htp.de |
DE |
89.182.86.239 |
a89-182-86-239.net-htp.de |
DE |
- 用户代理字符串
- findlinks/2.5 (+http://wortschatz.uni-leipzig.de/findlinks/)
- 首次出现
- 2012-04-25 07:01:00
- 最后出现
- 2012-05-13 00:08:03
- 遵循robots.txt
- 未知
- 来源
-
IP地址(2) |
服务器名称 |
所属国家 |
139.18.2.209 |
gkpc9.informatik.uni-leipzig.de |
DE |
139.18.2.17 |
niederhausen.tm.informatik.uni-leipzig.de |
DE |
- 用户代理字符串
- findlinks/2.0.5 (+http://wortschatz.uni-leipzig.de/findlinks/)
- 首次出现
- 2012-04-22 02:01:54
- 最后出现
- 2012-04-22 07:26:19
- 遵循robots.txt
- 未知
- 来源
-
IP地址(2) |
服务器名称 |
所属国家 |
139.18.2.209 |
gkpc9.informatik.uni-leipzig.de |
DE |
139.18.2.17 |
niederhausen.tm.informatik.uni-leipzig.de |
DE |
- 用户代理字符串
- findlinks/2.0.1 (+http://wortschatz.uni-leipzig.de/findlinks/)
- 首次出现
- 2010-12-16 20:55:21
- 最后出现
- 2012-03-17 06:18:38
- 遵循robots.txt
- 未知
- 来源
-
IP地址(2) |
服务器名称 |
所属国家 |
139.18.2.209 |
gkpc9.informatik.uni-leipzig.de |
DE |
139.18.13.202 |
woclu2.informatik.uni-leipzig.de |
DE |
- 用户代理字符串
- findlinks/2.0.4 (+http://wortschatz.uni-leipzig.de/findlinks/)
- 首次出现
- 2011-03-30 19:30:56
- 最后出现
- 2012-03-03 04:25:47
- 遵循robots.txt
- 未知
- 来源
-
IP地址(9) |
服务器名称 |
所属国家 |
130.83.167.153 |
desktop-153.ukp.informatik.tu-darmstadt.de |
DE |
130.83.163.39 |
desktop-161.tk.informatik.tu-darmstadt.de |
DE |
139.18.13.202 |
woclu2.informatik.uni-leipzig.de |
DE |
188.138.90.169 |
zulu289.server4you.de |
DE |
85.114.141.58 |
s058.area91gs.de |
DE |
94.221.157.74 |
dslb-094-221-157-074.pools.arcor-ip.net |
DE |
94.221.158.70 |
dslb-094-221-158-070.pools.arcor-ip.net |
DE |
94.221.204.136 |
dslb-094-221-204-136.pools.arcor-ip.net |
DE |
130.83.163.231 |
desktop-153.tk.informatik.tu-darmstadt.de |
DE |
- 用户代理字符串
- findlinks/2.1 (+http://wortschatz.uni-leipzig.de/findlinks/)
- 首次出现
- 2011-07-26 00:07:11
- 最后出现
- 2011-07-26 00:07:11
- 遵循robots.txt
- 未知
- 来源
-
IP地址(1) |
服务器名称 |
所属国家 |
139.18.2.17 |
niederhausen.tm.informatik.uni-leipzig.de |
DE |
- 用户代理字符串
- findlinks/2.0.9 (+http://wortschatz.uni-leipzig.de/findlinks/)
- 首次出现
- 2011-07-20 06:58:00
- 最后出现
- 2011-07-21 04:35:12
- 遵循robots.txt
- 未知
- 来源
-
IP地址(2) |
服务器名称 |
所属国家 |
139.18.2.17 |
niederhausen.tm.informatik.uni-leipzig.de |
DE |
139.18.13.202 |
woclu2.informatik.uni-leipzig.de |
DE |
- 用户代理字符串
- findlinks/1.1.3-beta9 (+http://wortschatz.uni-leipzig.de/findlinks/)
- 首次出现
- 2011-03-15 16:29:44
- 最后出现
- 2011-05-15 16:29:44
- 遵循robots.txt
- 未知
- 来源
-
IP地址(1) |
服务器名称 |
所属国家 |
46.5.56.103 |
hsi-kbw-046-005-056-103.hsi8.kabel-badenwuerttemberg.de |
DE |
- 用户代理字符串
- findlinks/1.1.6-beta6 (+http://wortschatz.uni-leipzig.de/findlinks/)
- 首次出现
- 2010-10-02 13:52:29
- 最后出现
- 2010-11-29 16:02:59
- 遵循robots.txt
- 未知
- 来源
-
IP地址(1) |
服务器名称 |
所属国家 |
139.18.2.209 |
gkpc9.informatik.uni-leipzig.de |
DE |
- 用户代理字符串
- findlinks/2.0 (+http://wortschatz.uni-leipzig.de/findlinks/)
- 首次出现
- 2010-11-18 21:31:00
- 最后出现
- 2010-11-14 16:02:51
- 遵循robots.txt
- 未知
- 来源
-
IP地址(1) |
服务器名称 |
所属国家 |
139.18.13.202 |
woclu2.informatik.uni-leipzig.de |
DE |
- 用户代理字符串
- findlinks/1.1.6-beta5 (+http://wortschatz.uni-leipzig.de/findlinks/)
- 首次出现
- 2010-10-13 21:17:32
- 最后出现
- 2010-10-13 21:17:32
- 遵循robots.txt
- 未知
- 来源
-
IP地址(1) |
服务器名称 |
所属国家 |
139.18.2.209 |
gkpc9.informatik.uni-leipzig.de |
DE |
- 用户代理字符串
- findlinks/1.1.6-beta3 (+http://wortschatz.uni-leipzig.de/findlinks/)
- 首次出现
- 2010-09-19 08:14:50
- 最后出现
- 2010-09-19 08:14:50
- 遵循robots.txt
- 未知
- 来源
-
IP地址(1) |
服务器名称 |
所属国家 |
139.18.2.209 |
gkpc9.informatik.uni-leipzig.de |
DE |
- 用户代理字符串
- findlinks/1.1.6-beta1 (+http://wortschatz.uni-leipzig.de/findlinks/; YaCy 0.1; yacy.net)
- 首次出现
- 2010-09-06 03:27:18
- 最后出现
- 2010-09-06 03:27:18
- 遵循robots.txt
- 未知
- 来源
-
IP地址(1) |
服务器名称 |
所属国家 |
188.40.74.66 |
static.66.74.40.188.clients.your-server.de |
DE |
- 用户代理字符串
- findlinks/1.1.6-beta2 (+http://wortschatz.uni-leipzig.de/findlinks/)
- 首次出现
- 2010-07-08 23:52:33
- 最后出现
- 2010-07-08 23:52:33
- 遵循robots.txt
- 未知
- 来源
-
IP地址(1) |
服务器名称 |
所属国家 |
139.18.13.202 |
woclu2.informatik.uni-leipzig.de |
DE |
- 用户代理字符串
- findlinks/1.1.5-beta7 (+http://wortschatz.uni-leipzig.de/findlinks/)
- 首次出现
- 2009-08-08 17:03:14
- 最后出现
- 2009-08-08 17:03:16
- 遵循robots.txt
- 未知
- 来源
-
IP地址(1) |
服务器名称 |
所属国家 |
139.18.2.209 |
gkpc9.informatik.uni-leipzig.de |
DE |
访问控制
了解如何控制findlinks访问权限,避免findlinks抓取行为不当。
是否拦截findlinks?
对于未知蜘蛛或者爬虫。它的用途对网站来说可能是好的,也可能是坏的,这取决于它是什么。所以说,这需要站长进一步分析判断这些尚不明确的爬虫行为,再作最终决定。
但,根据以往的经验,未声明行为目的及未命名的蜘蛛爬虫,通常都有不可告人的秘密,我们理应对其行为进行控制,比如拦截。
通过Robots.txt拦截
您可以通过在网站的 robots.txt 中设置用户代理访问规则来屏蔽 findlinks 或限制其访问权限。我们建议安装 Spider Analyser
插件,以检查它是否真正遵循这些规则。
# robots.txt
# 下列代码一般情况可以拦截该代理
User-agent: findlinks
Disallow: /
您无需手动执行此操作,可通过我们的 Wordpress 插件 Spider Analyser 来拦截不必要的蜘蛛或者爬虫。