webarchiv.cz webarchiv.cz

蜘蛛/爬虫名称
webarchiv.cz
开发商
National Library of the Czech Republic
官网
www.nkp.cz
当前状态
活动
  • heritrix/3.4.0
  • heritrix/3.4.0
  • heritrix/3.4.0
  • heritrix/3.4.0
  • heritrix/3.2.0
  • heritrix/3.1.2
  • heritrix/1.14.3
  • heritrix/1.14.2
  • heritrix/1.12.1
用户代理字符串
Mozilla/5.0 (compatible; heritrix/3.4.0-20210923 +http://webarchiv.cz/kontakty/)
类型
首次出现
2021-12-29 12:06:48
最后出现
2022-01-01 17:19:03
遵循robots.txt
IP地址
5
来源
IP地址 服务器名称 所属国家
195.113.133.205 crawler05.webarchiv.cz CZ
195.113.133.213 crawler13.webarchiv.cz CZ
195.113.133.218 crawler18.webarchiv.cz CZ
195.113.133.216 crawler16.webarchiv.cz CZ
195.113.133.214 crawler14.webarchiv.cz CZ
用户代理字符串
Mozilla/5.0 (compatible; heritrix/3.4.0-SNAPSHOT-2019-04-18T15:23:13Z +http://webarchiv.cz/kontakty/)
类型
首次出现
2019-06-20 06:13:46
最后出现
2021-03-04 04:58:48
遵循robots.txt
IP地址
2
来源
IP地址 服务器名称 所属国家
195.113.133.200 crawler00.webarchiv.cz CZ
195.113.133.201 crawler01.webarchiv.cz CZ
用户代理字符串
Mozilla/5.0 (compatible; heritrix/3.4.0-SNAPSHOT-2019-05-22T20:43:22Z +http://webarchiv.cz/kontakty/)
类型
首次出现
2019-07-31 22:07:22
最后出现
2020-12-14 13:17:59
遵循robots.txt
IP地址
7
来源
IP地址 服务器名称 所属国家
195.113.133.200 crawler00.webarchiv.cz CZ
195.113.133.201 crawler01.webarchiv.cz CZ
195.113.133.205 crawler05.webarchiv.cz CZ
195.113.133.213 crawler13.webarchiv.cz CZ
195.113.133.218 crawler18.webarchiv.cz CZ
195.113.133.216 crawler16.webarchiv.cz CZ
195.113.133.214 crawler14.webarchiv.cz CZ
195.113.133.207 crawler07.webarchiv.cz CZ
195.113.133.217 crawler17.webarchiv.cz CZ
195.113.133.211 crawler11.webarchiv.cz CZ
195.113.133.195 ? CZ
195.113.133.220 ? CZ
195.113.133.197 ? CZ
195.113.133.198 195.113.133.198 CZ
195.113.133.194 ? CZ
用户代理字符串
Mozilla/5.0 (compatible; heritrix/3.4.0-SNAPSHOT-2019-05-22T20:43:22Z +http://webarchiv.cz/kontakty/)
类型
首次出现
2019-07-31 22:07:22
最后出现
2020-12-14 13:17:59
遵循robots.txt
IP地址
7
来源
IP地址 服务器名称 所属国家
195.113.133.216 crawler16.webarchiv.cz CZ
195.113.133.213 crawler13.webarchiv.cz CZ
195.113.133.218 crawler18.webarchiv.cz CZ
195.113.133.207 crawler07.webarchiv.cz CZ
195.113.133.214 crawler14.webarchiv.cz CZ
195.113.133.217 crawler17.webarchiv.cz CZ
195.113.133.211 crawler11.webarchiv.cz CZ
用户代理字符串
Mozilla/5.0 (compatible; heritrix/3.2.0 +http://webarchiv.cz/kontakty/)
类型
首次出现
2014-12-18 07:21:11
最后出现
2019-04-24 06:49:06
遵循robots.txt
IP地址
13
来源
IP地址 服务器名称 所属国家
195.113.133.200 crawler00.webarchiv.cz CZ
195.113.133.213 crawler13.webarchiv.cz CZ
195.113.133.214 crawler14.webarchiv.cz CZ
195.113.133.216 crawler16.webarchiv.cz CZ
195.113.133.207 crawler07.webarchiv.cz CZ
195.113.133.211 crawler11.webarchiv.cz CZ
195.113.133.201 crawler01.webarchiv.cz CZ
195.113.133.218 ? CZ
195.113.133.217 crawler17.webarchiv.cz CZ
195.113.133.205 crawler05.webarchiv.cz CZ
用户代理字符串
Mozilla/5.0 (compatible; heritrix/3.1.2-SNAPSHOT-20130207.001528 +http://webarchiv.cz/kontakty/)
类型
首次出现
2014-03-16 21:23:52
最后出现
2014-03-16 21:23:52
遵循robots.txt
IP地址
1
来源
IP地址 服务器名称 所属国家
195.113.134.1 cou.cdh.nkp.cz CZ
用户代理字符串
Mozilla/5.0 (compatible; heritrix/1.14.3 +http://www.webarchiv.cz)
类型
首次出现
2009-10-25 00:11:32
最后出现
2012-01-09 09:03:15
遵循robots.txt
IP地址
7
来源
IP地址 服务器名称 所属国家
195.113.134.47 crawler03.webarchiv.cz CZ
195.113.134.48 crawler04.webarchiv.cz CZ
195.113.192.151 har.webarchiv.cz CZ
195.113.192.152 raptor.webarchiv.cz CZ
195.113.134.30 195.113.134.30 CZ
195.113.134.44 crawler00.webarchiv.cz CZ
195.113.134.45 crawler01.webarchiv.cz CZ
用户代理字符串
Mozilla/5.0 (compatible; heritrix/1.14.2 +http://www.webarchiv.cz)
类型
首次出现
2010-01-12 09:58:22
最后出现
2010-01-12 09:58:22
遵循robots.txt
IP地址
1
来源
IP地址 服务器名称 所属国家
195.113.192.151 har.webarchiv.cz CZ
用户代理字符串
Mozilla/5.0 (compatible; heritrix/1.12.1 +http://www.webarchiv.cz)
类型
首次出现
2009-05-31 22:15:00
最后出现
2009-04-21 00:23:12
遵循robots.txt
IP地址
1
来源
IP地址 服务器名称 所属国家
195.113.192.151 har.webarchiv.cz CZ

常见问题

FAQs
查看更多 >