GeedoBot

GeedoBot蜘蛛/爬虫属于搜索引擎类型,由Geedo.com开发运行。您可以继续阅读下方信息,以深入了解GeedoBot基本信息,用户代理和访问控制等。

基本信息

GeedoBot的基本信息如下表。但部分不是很规范的蜘蛛和爬虫,可能存在信息不明的情况。
蜘蛛/爬虫名称
GeedoBot
类型
其他
开发商
Geedo.com
当前状态
活动

用户代理

关于GeedoBot蜘蛛或者爬虫的用户代理字符串,IP地址和服务器,所在地等信息如下表格所示:
GeedoProductSearch
用户代理字符串
Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GeedoProductSearch; +http://www.geedo.com/product-search.html) Chrome/79.0.3945.88 Safari/537.36
首次出现
2024-02-27 23:30:19
最后出现
2025-01-01 05:18:42
遵循robots.txt
未知
来源
IP地址(8) 服务器名称 所属国家
83.99.151.64 product-search-83-99-151-64.geedo.com LV
83.99.151.69 product-search-83-99-151-69.geedo.com LV
83.99.151.71 product-search-83-99-151-71.geedo.com LV
83.99.151.70 product-search-83-99-151-70.geedo.com LV
83.99.151.65 product-search-83-99-151-65.geedo.com LV
83.99.151.68 product-search-83-99-151-68.geedo.com LV
83.99.151.67 product-search-83-99-151-67.geedo.com LV
83.99.151.66 product-search-83-99-151-66.geedo.com LV
用户代理字符串
Mozilla/5.0 (compatible; GeedoBot; +http://www.geedo.com/bot.html)
首次出现
2022-07-26 17:54:55
最后出现
2024-02-13 12:14:58
遵循robots.txt
未知
来源
IP地址(5) 服务器名称 所属国家
81.198.74.4 crawler-81-198-74-4.bot.geedo.com LV
109.229.213.23 host-109-229-213-23.icoms.lv LV
46.23.42.42 balticom-23-42-42.balticom.lv LV
212.142.103.56 balticom-142-103-56.balticom.lv LV
83.99.151.65 balticom-151-65.balticom.lv LV

访问控制

了解如何控制GeedoBot访问权限,避免GeedoBot抓取行为不当。

是否拦截GeedoBot?

对于未知蜘蛛或者爬虫。它的用途对网站来说可能是好的,也可能是坏的,这取决于它是什么。所以说,这需要站长进一步分析判断这些尚不明确的爬虫行为,再作最终决定。 但,根据以往的经验,未声明行为目的及未命名的蜘蛛爬虫,通常都有不可告人的秘密,我们理应对其行为进行控制,比如拦截。

通过Robots.txt拦截

您可以通过在网站的 robots.txt 中设置用户代理访问规则来屏蔽 GeedoBot 或限制其访问权限。我们建议安装 Spider Analyser 插件,以检查它是否真正遵循这些规则。

	# robots.txt
	# 下列代码一般情况可以拦截该代理
	
	User-agent: GeedoBot
	Disallow: /

您无需手动执行此操作,可通过我们的 Wordpress 插件 Spider Analyser 来拦截不必要的蜘蛛或者爬虫。

更多信息

GeedoBot是一个用于扫描网页的程序,特别是网上商店,以找到供全世界购买的产品。

GeedoBot用户代理字符串

Mozilla/5.0 (compatible; GeedoBot; +http://www.geedo.com/bot.html)

如何验证GeedoBot

使用反向DNS查询来检查GeedoBot的真实性:

1. 从你的日志中对访问的IP地址运行反向DNS查询。验证域名是否以bot.geedo.com结尾。

# host 81.198.74.4
4.74.198.81.in-addr.arpa domain name pointer crawler-81-198-74-4.bot.geedo.com.

2. 对检索到的域名进行DNS前向查询。验证它是否与原始访问的IP地址相匹配

# host crawler-81-198-74-4.bot.geedo.com
crawler-81-198-74-4.bot.geedo.com has address 81.198.74.4

不提供IP地址的公开列表,因为它们可能会改变。

GeedoBot爬取限制

为了限制GeedoBot,使用速率限制指令,设置请求之间的最小间隔时间(秒)。

User-agent: GeedoBot
Crawl-delay: 10

如何拦截GeedoBot

如果您想阻止GeedoBot访问您的某些内容,您可以通过指定GeedoBot为用户代理来实现这一目的:

User-agent: GeedoBot
Disallow: /forum

常见蜘蛛/爬虫

Common Spiders
DataForSeo bot
DataForSeo bot蜘蛛/爬虫属于类型,由DataForSEO OU开发运行。您可以继续阅读下方信息,以深入了解DataForSeo bot基本信息,用户代理和访问控制等。
CloudFlare crawler
CloudFlare crawler蜘蛛/爬虫属于类型,由CloudFlare, Inc.开发运行。您可以继续阅读下方信息,以深入了解CloudFlare crawler基本信息,用户代理和访问控制等。
Odin
Odin蜘蛛/爬虫属于类型,由Cyble, Inc.开发运行。您可以继续阅读下方信息,以深入了解Odin基本信息,用户代理和访问控制等。
Chrome Privacy Preserving Prefetch Proxy
Chrome Privacy Preserving Prefetch Proxy蜘蛛/爬虫属于类型,由Google Inc.开发运行。您可以继续阅读下方信息,以深入了解Chrome Privacy Preserving Prefetch Proxy基本信息,用户代理和访问控制等。
EFF crawler
EFF crawler蜘蛛/爬虫属于类型,由Electronic Frontier Foundation开发运行。您可以继续阅读下方信息,以深入了解EFF crawler基本信息,用户代理和访问控制等。
Modat crawler
Modat crawler蜘蛛/爬虫属于类型,由Modat B.V.开发运行。您可以继续阅读下方信息,以深入了解Modat crawler基本信息,用户代理和访问控制等。
FirmoGraph
FirmoGraph蜘蛛/爬虫属于类型,由firmograph.io开发运行。您可以继续阅读下方信息,以深入了解FirmoGraph基本信息,用户代理和访问控制等。
fluid
fluid蜘蛛/爬虫属于类型,由leak.info开发运行。您可以继续阅读下方信息,以深入了解fluid基本信息,用户代理和访问控制等。

相关文章

Related Articles