uni-passau bot uni-passau bot

蜘蛛/爬虫名称
uni-passau bot
开发商
Universität Passau
官网
www.uni-passau.de
当前状态
活动
  • hgfAlphaXCrawl/0.1
  • RobotsTxtFetcher/1.3
用户代理字符串
hgfAlphaXCrawl/0.1 (+https://www.fim.uni-passau.de/data-science/forschung/open-search)
类型
搜索引擎
首次出现
2022-07-31 17:54:33
最后出现
2022-08-02 06:50:03
遵循robots.txt
IP地址
1
来源
IP地址 服务器名称 所属国家
195.113.175.41 ? CZ
用户代理字符串
hgfAlphaXCrawl/0.1 (+https://www.fim.uni-passau.de/data-science/forschung/open-search) RobotsTxtFetcher/1.3
类型
首次出现
2022-07-31 09:33:24
最后出现
2022-08-02 06:50:03
遵循robots.txt
IP地址
1
来源
IP地址 服务器名称 所属国家
195.113.175.41 ? CZ

作为创建开放索引研究的一部分,Passau大学正在与外部合作伙伴进行爬行实验,以找到合适的爬虫。除了分析技术特征外,还将收集统计数据,例如网页的平均大小、网页净文本内容的大小和网页之间的连接结构(例如每页的出站链接数)。

常见问题

FAQs
查看更多 >