Ai2Bot
Ai2Bot蜘蛛/爬虫属于AI数据采集类型,由Allen Institute for Artificial Intelligence开发运行。您可以继续阅读下方信息,以深入了解Ai2Bot基本信息,用户代理和访问控制等。
基本信息
Ai2Bot的基本信息如下表。但部分不是很规范的蜘蛛和爬虫,可能存在信息不明的情况。
- 蜘蛛/爬虫名称
- Ai2Bot
- 类型
- AI数据采集
- 开发商
-
Allen Institute for Artificial Intelligence
- 当前状态
-
活动
用户代理
关于Ai2Bot蜘蛛或者爬虫的用户代理字符串,IP地址和服务器,所在地等信息如下表格所示:
- 用户代理字符串
- Mozilla/5.0 (compatible) Ai2Bot-Dolma (+https://www.allenai.org/crawl)
- 首次出现
- 2025-03-09 07:13:33
- 最后出现
- 2025-03-10 17:29:13
- 遵循robots.txt
- 未知
- 来源
-
IP地址(10) |
服务器名称 |
所属国家 |
144.202.84.81 |
144.202.84.81.vultrusercontent.com |
US |
104.238.140.158 |
? |
US |
216.128.145.152 |
216.128.145.152.vultrusercontent.com |
US |
50.28.107.56 |
50.28.107.56 |
US |
50.28.40.163 |
50.28.40.163 |
US |
67.225.188.31 |
67.225.188.31 |
US |
72.52.132.18 |
72.52.132.18 |
US |
72.52.196.79 |
72.52.196.79 |
US |
50.28.107.59 |
50.28.107.59 |
US |
67.227.250.168 |
67.227.250.168 |
US |
访问控制
了解如何控制Ai2Bot访问权限,避免Ai2Bot抓取行为不当。
是否拦截Ai2Bot?
这取决于你。AI数据采集器器通常会下载公开可用的互联网内容,这些内容默认情况下可以免费访问。不过,如果你担心归属问题或你的创意作品如何被用于生成的人工智能模型中,你可以拦截它们。
通过Robots.txt拦截
您可以通过在网站的 robots.txt 中设置用户代理访问规则来屏蔽 Ai2Bot 或限制其访问权限。我们建议安装 Spider Analyser
插件,以检查它是否真正遵循这些规则。
# robots.txt
# 下列代码一般情况可以拦截该代理
User-agent: Ai2Bot
Disallow: /
# robots.txt
# 下列代码一般情况可以拦截该代理
User-agent: Ai2Bot
Disallow: /
您无需手动执行此操作,可通过我们的 Wordpress 插件 Spider Analyser 来拦截不必要的蜘蛛或者爬虫。