InfoTigerBot InfoTigerBot

蜘蛛/爬虫名称
InfoTigerBot
开发商
Infotiger UG
官网
infotiger.com
当前状态
活动
  • InfoTigerBot/1.9
用户代理字符串
Mozilla/5.0 (compatible; InfoTigerBot/1.9; +https://infotiger.com/bot)
类型
搜索引擎
首次出现
2021-06-11 12:03:57
最后出现
2023-02-26 06:24:47
遵循robots.txt
IP地址
4
来源
IP地址 服务器名称 所属国家
91.143.80.66 crawler-66-80-143-91.infotiger.com DE
91.143.88.40 crawler-40-88-143-91.infotiger.com DE
85.31.186.210 crawler-210-186-31-85.infotiger.com DE
91.143.93.12 crawler-12-93-143-91.infotiger.com DE

什么是InfoTigerBot?

InfoTigerBot是为infotiger搜索引擎的网络爬虫提供的网络机器人(bot)。基本上,InfoTigerBot正在浏览网页并检索网页,这些网页可能会被解析,并可能在以后被infotiger搜索引擎收录。

如何验证InfoTigerBot

InfoTigerBot通常由以下用户代理字符串来识别。

Mozilla/5.0 (compatible; InfoTigerBot/1.9; +https://infotiger.com/bot)

infotiger.com的爬虫的源IP地址确实解决了类似的问题。

crawler-40-88-143-91.infotiger.com

你可以通过比较反向DNS(ip->name)和正向DNS(name->ip)来验证真实性,它们应该与原始IP地址相匹配。

# nslookup 91.143.88.40
40.88.143.91.in-addr.arpa name = crawler-40-88-143-91.infotiger.com.

# nslookup crawler-40-88-143-91.infotiger.com
Name: crawler-40-88-143-91.infotiger.com
Address: 91.143.88.40

请注意,用户代理(User-Agent)字符串很容易被欺骗,所以并不是每个名字中带有InfoTigerBot的请求都可能来自infotiger.com的爬虫。

控制InfoTigerBot

InfoTigerBot总是(尽量)有礼貌的,并且将每分钟的请求数限制在一个主机上。

InfoTigerBot遵守robots.txt规则,该规则由robots排除标准定义。

此外,InfoTigerBot还尊重HTML头中的robots元标签,特别是 noindex 和 nofollow

如果你不希望你的网页被infotiger搜索引擎收录,你可以通过适当地编辑你的robots.txt或robots元标签来轻松排除InfoTigerBot。

 

如何将我的URL添加到infotiger的索引中?

您可以在infotiger.com的添加URL页面提交您的URL,以便被InfoTigerBot抓取。

报告问题

如果您有任何问题或想报告InfoTigerBot的问题,请给他们留言: contact (at) infotiger (point) com

常见问题

FAQs
查看更多 >