GoogleDocs

GoogleDocs蜘蛛/爬虫属于工具类型,由Google Inc.开发运行。您可以继续阅读下方信息,以深入了解GoogleDocs基本信息,用户代理和访问控制等。

基本信息

GoogleDocs的基本信息如下表。但部分不是很规范的蜘蛛和爬虫,可能存在信息不明的情况。
蜘蛛/爬虫名称
GoogleDocs
类型
工具
开发商
Google Inc.
当前状态
活动

用户代理

关于GoogleDocs蜘蛛或者爬虫的用户代理字符串,IP地址和服务器,所在地等信息如下表格所示:
GoogleDocs; drawings
用户代理字符串
Mozilla/5.0 (compatible; GoogleDocs; drawings; +http://docs.google.com)
首次出现
2016-03-12 11:45:21
最后出现
2024-11-01 18:54:29
遵循robots.txt
来源
IP地址(13) 服务器名称 所属国家
66.249.83.102 google-proxy-66-249-83-102.google.com US
66.249.88.218 google-proxy-66-249-88-218.google.com US
66.249.88.88 google-proxy-66-249-88-88.google.com US
66.249.88.152 google-proxy-66-249-88-152.google.com US
66.102.8.4 google-proxy-66-102-8-4.google.com US
66.249.83.202 google-proxy-66-249-83-202.google.com US
66.102.8.54 google-proxy-66-102-8-54.google.com US
66.249.88.11 google-proxy-66-249-88-11.google.com US
66.102.7.27 google-proxy-66-102-7-27.google.com US
66.249.83.194 google-proxy-66-249-83-194.google.com US
66.102.8.100 google-proxy-66-102-8-100.google.com US
66.249.83.35 google-proxy-66-249-83-35.google.com US
用户代理字符串
Mozilla/5.0 (compatible; GoogleDocs; apps-presentations; +http://docs.google.com)
首次出现
2016-11-07 15:46:10
最后出现
2024-11-01 18:52:45
遵循robots.txt
来源
IP地址(21) 服务器名称 所属国家
66.249.88.212 google-proxy-66-249-88-212.google.com US
66.249.88.218 google-proxy-66-249-88-218.google.com US
66.249.88.86 google-proxy-66-249-88-86.google.com US
66.102.7.150 google-proxy-66-102-7-150.google.com US
66.249.83.44 google-proxy-66-249-83-44.google.com US
74.125.210.25 google-proxy-74-125-210-25.google.com US
66.102.7.140 google-proxy-66-102-7-140.google.com US
66.249.83.40 google-proxy-66-249-83-40.google.com US
66.102.8.4 google-proxy-66-102-8-4.google.com US
66.102.8.20 google-proxy-66-102-8-20.google.com US
66.249.83.90 google-proxy-66-249-83-90.google.com US
66.102.7.234 google-proxy-66-102-7-234.google.com US
66.249.88.68 google-proxy-66-249-88-68.google.com US
用户代理字符串
Mozilla/5.0 (compatible; GoogleDocs; documents; +http://docs.google.com)
首次出现
2016-10-11 13:51:14
最后出现
2024-11-01 18:51:07
遵循robots.txt
来源
IP地址(36) 服务器名称 所属国家
74.125.210.40 google-proxy-74-125-210-40.google.com US
74.125.210.38 google-proxy-74-125-210-38.google.com US
66.249.88.216 google-proxy-66-249-88-216.google.com US
66.249.88.214 google-proxy-66-249-88-214.google.com US
66.102.6.166 google-proxy-66-102-6-166.google.com US
66.102.8.104 google-proxy-66-102-8-104.google.com US
74.125.212.245 google-proxy-74-125-212-245.google.com US
66.102.8.124 google-proxy-66-102-8-124.google.com US
66.102.8.126 google-proxy-66-102-8-126.google.com US
66.102.8.97 google-proxy-66-102-8-97.google.com US
66.102.7.182 google-proxy-66-102-7-182.google.com US
66.102.7.185 google-proxy-66-102-7-185.google.com US
66.102.7.188 google-proxy-66-102-7-188.google.com US
66.102.8.100 google-proxy-66-102-8-100.google.com US
66.102.8.102 google-proxy-66-102-8-102.google.com US
192.178.10.83 google-proxy-192-178-10-83.google.com US
66.102.8.108 google-proxy-66-102-8-108.google.com US
用户代理字符串
Mozilla/5.0 (compatible; GoogleDocs; apps-spreadsheets; +http://docs.google.com)
首次出现
2016-05-16 03:22:46
最后出现
2024-05-06 06:58:48
遵循robots.txt
来源
IP地址(90) 服务器名称 所属国家
66.249.92.131 rate-limited-proxy-66-249-92-131.google.com US
66.249.92.159 rate-limited-proxy-66-249-92-159.google.com US
66.249.92.39 rate-limited-proxy-66-249-92-39.google.com US
66.249.92.40 rate-limited-proxy-66-249-92-40.google.com US
66.249.92.73 rate-limited-proxy-66-249-92-73.google.com US
66.249.92.195 rate-limited-proxy-66-249-92-195.google.com ?
66.249.92.135 rate-limited-proxy-66-249-92-135.google.com US
66.249.92.89 rate-limited-proxy-66-249-92-89.google.com US
66.249.92.37 rate-limited-proxy-66-249-92-37.google.com US
66.249.92.133 rate-limited-proxy-66-249-92-133.google.com US
66.102.7.176 google-proxy-66-102-7-176.google.com US
66.249.92.35 rate-limited-proxy-66-249-92-35.google.com US
66.249.90.108 rate-limited-proxy-66-249-90-108.google.com US
66.249.92.200 rate-limited-proxy-66-249-92-200.google.com US
66.249.92.152 rate-limited-proxy-66-249-92-152.google.com US
66.249.92.72 rate-limited-proxy-66-249-92-72.google.com US
66.249.92.32 rate-limited-proxy-66-249-92-32.google.com US
74.125.151.203 rate-limited-proxy-74-125-151-203.google.com US
74.125.151.209 rate-limited-proxy-74-125-151-209.google.com US
74.125.151.206 rate-limited-proxy-74-125-151-206.google.com US
66.249.92.45 rate-limited-proxy-66-249-92-45.google.com US
66.249.92.151 rate-limited-proxy-66-249-92-151.google.com US
66.249.92.5 rate-limited-proxy-66-249-92-5.google.com US
66.249.92.33 rate-limited-proxy-66-249-92-33.google.com US
66.249.92.6 rate-limited-proxy-66-249-92-6.google.com ?
66.249.92.70 rate-limited-proxy-66-249-92-70.google.com US
66.249.92.43 rate-limited-proxy-66-249-92-43.google.com US
66.249.92.9 rate-limited-proxy-66-249-92-9.google.com US
66.249.92.10 rate-limited-proxy-66-249-92-10.google.com US
66.249.92.44 rate-limited-proxy-66-249-92-44.google.com US
66.249.92.8 rate-limited-proxy-66-249-92-8.google.com US
66.249.92.163 rate-limited-proxy-66-249-92-163.google.com US
66.249.89.168 rate-limited-proxy-66-249-89-168.google.com GB
74.125.217.103 rate-limited-proxy-74-125-217-103.google.com US
74.125.217.104 rate-limited-proxy-74-125-217-104.google.com US
66.249.92.81 rate-limited-proxy-66-249-92-81.google.com US
66.249.90.103 rate-limited-proxy-66-249-90-103.google.com US
66.249.90.105 rate-limited-proxy-66-249-90-105.google.com US
66.249.90.104 rate-limited-proxy-66-249-90-104.google.com US
66.249.92.80 rate-limited-proxy-66-249-92-80.google.com US
74.125.217.105 rate-limited-proxy-74-125-217-105.google.com US
44.193.159.76 ec2-44-193-159-76.compute-1.amazonaws.com US
用户代理字符串
Mozilla/5.0 (compatible; GoogleDocs; jam; +http://docs.google.com)
首次出现
2022-03-21 12:33:21
最后出现
2022-03-21 12:33:21
遵循robots.txt
未知
来源
IP地址(1) 服务器名称 所属国家
66.102.8.43 google-proxy-66-102-8-43.google.com US
用户代理字符串
Mozilla/5.0 (compatible; GoogleDocs; +http://docs.google.com; +Google-Document-Conversion)
首次出现
2015-12-21 11:03:01
最后出现
2021-09-19 05:22:41
遵循robots.txt
未知
来源
IP地址(19) 服务器名称 所属国家
66.249.83.100 google-proxy-66-249-83-100.google.com US
74.125.213.4 google-proxy-74-125-213-4.google.com US
64.233.172.63 google-proxy-64-233-172-63.google.com US
74.125.213.29 google-proxy-74-125-213-29.google.com US
74.125.213.1 google-proxy-74-125-213-1.google.com US
66.249.83.127 google-proxy-66-249-83-127.google.com US
66.102.8.51 google-proxy-66-102-8-51.google.com US
66.249.83.125 google-proxy-66-249-83-125.google.com US
74.125.213.31 google-proxy-74-125-213-31.google.com US
66.102.7.175 google-proxy-66-102-7-175.google.com US
用户代理字符串
Mozilla/5.0 (compatible; GoogleDocs; spreadsheet_forms; +http://docs.google.com)
首次出现
2016-03-12 01:45:23
最后出现
2019-08-21 10:50:03
遵循robots.txt
来源
IP地址(6) 服务器名称 所属国家
66.102.8.8 google-proxy-66-102-8-8.google.com US
66.102.8.4 google-proxy-66-102-8-4.google.com US
66.102.8.54 google-proxy-66-102-8-54.google.com US
64.233.172.148 google-proxy-64-233-172-148.google.com US
66.102.8.50 google-proxy-66-102-8-50.google.com US
66.102.8.52 google-proxy-66-102-8-52.google.com US

访问控制

了解如何控制GoogleDocs访问权限,避免GoogleDocs抓取行为不当。

是否拦截GoogleDocs?

可能不需要。工具类型爬虫通常为网站所有者使用此类工具对网站进行相关服务请求才会出现。当然,实际情况需站长判断后再作决定。

通过Robots.txt拦截

您可以通过在网站的 robots.txt 中设置用户代理访问规则来屏蔽 GoogleDocs 或限制其访问权限。我们建议安装 Spider Analyser 插件,以检查它是否真正遵循这些规则。

	# robots.txt
	# 下列代码一般情况可以拦截该代理
	
	User-agent: GoogleDocs
	Disallow: /

您无需手动执行此操作,可通过我们的 Wordpress 插件 Spider Analyser 来拦截不必要的蜘蛛或者爬虫。

常见蜘蛛/爬虫

Common Spiders
Googlebot
GoogleBot蜘蛛/爬虫属于搜索引擎类型,由Google Inc.开发运行。您可以继续阅读下方信息,以深入了解GoogleBot基本信息,用户代理和访问控制等。
Online Domain Tools
Online Domain Tools蜘蛛/爬虫属于监控类型,由AITIS s.r.o.开发运行。您可以继续阅读下方信息,以深入了解Online Domain Tools基本信息,用户代理和访问控制等。
cron-job.org
cron-job.org蜘蛛/爬虫属于工具类型,由B1G Software开发运行。您可以继续阅读下方信息,以深入了解cron-job.org基本信息,用户代理和访问控制等。
WGETbot
WGETbot蜘蛛/爬虫属于工具类型,由Alan Reed开发运行。您可以继续阅读下方信息,以深入了解WGETbot基本信息,用户代理和访问控制等。
MxToolbox bot
MxToolbox bot蜘蛛/爬虫属于工具类型,由MXToolBox, Inc开发运行。您可以继续阅读下方信息,以深入了解MxToolbox bot基本信息,用户代理和访问控制等。
updown.io bot
updown.io bot蜘蛛/爬虫属于监控类型,由Adrien Jarthon开发运行。您可以继续阅读下方信息,以深入了解updown.io bot基本信息,用户代理和访问控制等。
WordPress.com bots
WordPress.com bots蜘蛛/爬虫属于信息流类型,由Automattic Inc.开发运行。您可以继续阅读下方信息,以深入了解WordPress.com bots基本信息,用户代理和访问控制等。
s4a
s4a蜘蛛/爬虫属于工具类型,由Capsule Code SAS开发运行。您可以继续阅读下方信息,以深入了解s4a基本信息,用户代理和访问控制等。

相关文章

Related Articles