IP地址(1) | 服务器名称 | 所属国家 |
---|---|---|
161.97.144.155 | vmi487123.contaboserver.net | DE |
IP地址(2) | 服务器名称 | 所属国家 |
---|---|---|
161.97.144.155 | vmi487123.contaboserver.net | US |
104.238.159.242 | ? | DE |
对于未知蜘蛛或者爬虫。它的用途对网站来说可能是好的,也可能是坏的,这取决于它是什么。所以说,这需要站长进一步分析判断这些尚不明确的爬虫行为,再作最终决定。 但,根据以往的经验,未声明行为目的及未命名的蜘蛛爬虫,通常都有不可告人的秘密,我们理应对其行为进行控制,比如拦截。
您可以通过在网站的 robots.txt 中设置用户代理访问规则来屏蔽 Tomba Crawler 或限制其访问权限。我们建议安装 Spider Analyser 插件,以检查它是否真正遵循这些规则。
# robots.txt # 下列代码一般情况可以拦截该代理 User-agent: Tomba Crawler Disallow: /
您无需手动执行此操作,可通过我们的 Wordpress 插件 Spider Analyser 来拦截不必要的蜘蛛或者爬虫。
Tomba成立于2021年,其使命是为专业人士提供与重要人物建立新联系的力量。
TombaPublicWebCrawler是一个网络搜索引擎的索引机器人,类似于谷歌。由Tomba技术网络服务有限公司(Tomba.io)创建,TombaPublicWebCrawler的专利技术不断扫描数百万个公司网站、新闻稿、电子新闻服务、SEC文件和其他在线来源。利用先进的自然语言处理算法,Tomba创建了一个下一代搜索引擎,专注于寻找有企业和商业专业人士信息的网页。
Version: 3.0 Obeys Robots.txt: Yes User-Agent String: Mozilla/5.0 (compatible; TombaPublicWebCrawler/3.0; +https://tombascraper.com)
该机器人只分析公共网页。
是的。绝对的。我们严格遵循robots.txt,包括禁止和允许规则。
如上所述,TombaPublicWebCrawler严格遵守您网站上的robots.txt文件。因此,如果您需要,您可以完全控制您网站上的它。
要改变TombaPublicWebCrawler访问您网站的频率,您可以在Robots.txt文件中指定我们的机器人连续两次请求之间的最小可接受延迟。
User-agent: TombaPublicWebCrawler Crawl-Delay: [value]
其中Crawl-Delay值是以秒为单位的时间。如果由于某种原因,你想阻止TombaPublicWebCrawler访问你的网站,请在你的服务器上的robots.txt文件中放入以下两行。
User-agent: TombaPublicWebCrawler Disallow: /
请注意,TombaPublicWebCrawler可能需要一些时间来选择robots.txt文件中的变化。这将在每次预定抓取之前进行。
还请注意,如果您的robots.txt包含错误,TombaPublicWebCrawler将无法识别您的命令,它将继续按照以前的方式抓取您的网站。
阅读更多关于robots.txt的信息:https://support.google.com/webmasters/answer/6062608?hl=en
如果您认为TombaPublicWebCrawler在您的网站上有某种程度的不当行为,或者您对它有任何疑问,请毫不犹豫地联系tomba的支持团队:support@tomba.io。