Timpibot

基本信息

Timpibot的基本信息如下表。但部分不是很规范的蜘蛛和爬虫，可能存在信息不明的情况。

蜘蛛/爬虫名称: Timpibot

类型: 搜索引擎

开发商: Timpi Inc.

当前状态: 活动

用户代理

关于Timpibot蜘蛛或者爬虫的用户代理字符串，IP地址和服务器，所在地等信息如下表格所示：

用户代理字符串: Mozilla/5.0 (compatible; Timpibot/0.9; +http://www.timpi.io)

首次出现: 2023-12-18 08:07:34

最后出现: 2024-11-16 13:11:10

遵循robots.txt: 否

来源

IP地址(4)	服务器名称	所属国家
62.171.181.196	vmi652047.contaboserver.net	DE
164.68.97.25	vmi984491.contaboserver.net	DE
149.5.106.23	?	GB
76.158.137.222	c-76-158-137-222.hsd1.ca.comcast.net	US
89.217.190.102	adsl-89-217-190-102.adslplus.ch	CH
84.247.191.147	vmi1624596.contaboserver.net	DE
66.94.114.182	vmi949791.contaboserver.net	US
47.72.227.218	47-72-227-218.dsl.dyn.ihug.co.nz	NZ
45.62.89.44	45.62.89.44	CA
84.247.151.35	vmi2150124.contaboserver.net	SG

用户代理字符串: Timpibot/0.8 (+http://www.timpi.io)

首次出现: 2022-07-14 08:36:12

最后出现: 2023-08-26 23:14:36

遵循robots.txt: 否

来源

IP地址(3)	服务器名称	所属国家
93.157.168.252	93-157-168-252.avk-wellcom.com	RU
78.82.187.174	c-aebb524e.012-211-6d6c6d5.cust.ownit.se	SE
62.228.69.24	62-69-24.netrun.cytanet.com.cy	CY
216.137.2.6	216.137.2.6	BS
72.73.66.122	72-73-66-122.ptldme.east.myfairpoint.net	US
131.147.164.85	fp8393a455.stma001.ap.nuro.jp	JP
176.158.41.14	static-176-158-41-14.ftth.abo.bbox.fr	FR
45.132.226.223	?	CH
186.10.191.125	z323.entelchile.net	CL
47.72.227.218	47-72-227-218.dsl.dyn.ihug.co.nz	NZ
108.181.55.89	unassigned.psychz.net	US
45.62.89.44	45.62.89.44	CA

用户代理字符串: Timpibot/0.8 (+http://www.timpi.io)

首次出现: 2022-07-14 08:36:12

最后出现: 2022-07-14 08:38:08

遵循robots.txt: 否

来源

IP地址(1)	服务器名称	所属国家
78.82.187.174	c-aebb524e.012-211-6d6c6d5.cust.ownit.se	SE

访问控制

了解如何控制Timpibot访问权限，避免Timpibot抓取行为不当。

是否拦截Timpibot？

一般不要拦截。搜索引擎爬虫为搜索引擎提供动力，是用户发现您网站的有效途径。事实上，拦截搜索引擎爬虫可能会严重减少网站的自然流量。

通过Robots.txt拦截

您可以通过在网站的 robots.txt 中设置用户代理访问规则来屏蔽 Timpibot 或限制其访问权限。我们建议安装 Spider Analyser 插件，以检查它是否真正遵循这些规则。

# robots.txt

# 下列代码一般情况可以拦截该代理

User-agent: Timpibot

Disallow: /

# robots.txt # 下列代码一般情况可以拦截该代理 User-agent: Timpibot Disallow: /

# robots.txt
# 下列代码一般情况可以拦截该代理
User-agent: Timpibot
Disallow: /

您无需手动执行此操作，可通过我们的 Wordpress 插件 Spider Analyser 来拦截不必要的蜘蛛或者爬虫。

更多信息

Timpi是世界上第一个完全去中心化的搜索引擎。我们的使命是提供自由和无偏见的信息访问。不仅可以自由保护您的数据和隐私，您还可以自由做出自己的选择，而不会被操纵。Timpi由您为您提供动力和管理。

至于关于Timpibot的介绍，貌似官方也没有很详细的信息，倒是有国外站长反馈：

Timpibot是另一个行为恶劣的爬虫

在过去的几天里，我注意到来自一个我以前没有见过的用户代理的积极的爬行。

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
Timpibot/0.8 (+http://www.timpi.io)
Timpibot/0.8 (+http://www.timpi.io)
Timpibot/0.8 (+http://www.timpi.io)
它下载但完全无视robots.txt指令，每秒发送几十个并行请求。这触发了我在我管理的基础设施上设置的某些保障措施。这种行为可以在一组不同的机器上反复观察。

该公司的网站对自由、隐私、”由你驱动 “等进行了惯常的崇高的营销宣称。当然，这一切都完全忽略了我的–非常感谢。

他们也没有提供电子邮件联系地址或爬虫信息页面，这是值得信赖的演员的惯例。相反，这里有关于融资回合的信息。那里有相当多的红旗。甚至他们所谓的 “白皮书 “也是一份轻于技术细节的营销文件。

因此，我已经在全球范围内阻止了该用户代理，并将对目前和未来遇到的所有IP进行防火墙。目前，活动似乎集中在三个地址上。

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
2.70.165.155 (2.70.165.155.mobile.tre.se)
89.217.182.135 (adsl-89-217-182-135.adslplus.ch)
186.83.236.48 (dynamic-ip-1868323648.cable.net.co)
2.70.165.155 (2.70.165.155.mobile.tre.se) 89.217.182.135 (adsl-89-217-182-135.adslplus.ch) 186.83.236.48 (dynamic-ip-1868323648.cable.net.co)
2.70.165.155 (2.70.165.155.mobile.tre.se)
89.217.182.135 (adsl-89-217-182-135.adslplus.ch)
186.83.236.48 (dynamic-ip-1868323648.cable.net.co)
我很不理解，一个搜索初创公司怎么能合理地认为，在抓取时忽视网站管理员的指令是可以接受的行为。这要么是一种故意的选择，要么是对其核心技术的根本无能。你自己判断哪种情况更合理。

最近，我确实遇到了一个不同但类似的案例，在询问了各自的爬虫后，他们大胆地表示robots.txt指令被遵循，并将允许Googlebot解释为允许其爬虫。他们的理由是：排除大多数爬虫，但允许Googlebot，这对网站管理员来说是一种错误的配置。哇。

我不知道Timpi的团队的态度是否同样狂妄，但我想应该是这样的。

–herrbischoff.com