Hatena

Hatena蜘蛛/爬虫属于获取器类型,由Hatena Co., Ltd.开发运行。您可以继续阅读下方信息,以深入了解Hatena基本信息,用户代理和访问控制等。

基本信息

Hatena的基本信息如下表。但部分不是很规范的蜘蛛和爬虫,可能存在信息不明的情况。
蜘蛛/爬虫名称
Hatena
类型
快照
开发商
Hatena Co., Ltd.
当前状态
活动

用户代理

关于Hatena蜘蛛或者爬虫的用户代理字符串,IP地址和服务器,所在地等信息如下表格所示:
Hatena::Scissors/0.01
用户代理字符串
Hatena::Scissors/0.01
首次出现
2018-07-02 04:52:31
最后出现
2025-01-09 04:36:41
遵循robots.txt
未知
来源
IP地址(5) 服务器名称 所属国家
54.249.85.140 vpcgw02.hatena.ne.jp JP
52.68.0.227 ec2-52-68-0-227.ap-northeast-1.compute.amazonaws.com JP
54.92.97.59 ec2-54-92-97-59.ap-northeast-1.compute.amazonaws.com JP
54.250.227.185 ec2-54-250-227-185.ap-northeast-1.compute.amazonaws.com JP
59.106.108.116 gw08.hatena.ne.jp JP
用户代理字符串
HatenaBlog-bot/0.02 (+https://help.hatenablog.com/entry/about-hatenablogbot)
首次出现
2020-09-22 14:08:04
最后出现
2025-01-09 04:36:39
遵循robots.txt
未知
来源
IP地址(2) 服务器名称 所属国家
54.249.8.242 vpcgw03.hatena.ne.jp JP
54.249.44.51 vpcgw01.hatena.ne.jp JP
用户代理字符串
Hatena Star UserAgent/2
首次出现
2018-03-22 08:22:11
最后出现
2024-05-26 05:36:36
遵循robots.txt
来源
IP地址(2) 服务器名称 所属国家
59.106.108.116 gw08.hatena.ne.jp JP
54.249.44.51 vpcgw01.hatena.ne.jp JP
用户代理字符串
Hatena-Favicon/2 (http://www.hatena.ne.jp/faq/)
首次出现
2019-03-19 02:26:57
最后出现
2022-08-03 06:10:57
遵循robots.txt
来源
IP地址(66) 服务器名称 所属国家
107.178.234.80 80.234.178.107.gae.googleusercontent.com US
107.178.234.17 17.234.178.107.gae.googleusercontent.com US
107.178.234.90 90.234.178.107.gae.googleusercontent.com US
107.178.234.94 94.234.178.107.gae.googleusercontent.com US
107.178.234.27 27.234.178.107.gae.googleusercontent.com US
107.178.234.91 91.234.178.107.gae.googleusercontent.com US
107.178.234.87 87.234.178.107.gae.googleusercontent.com US
107.178.234.147 147.234.178.107.gae.googleusercontent.com US
107.178.234.144 144.234.178.107.gae.googleusercontent.com US
107.178.234.28 28.234.178.107.gae.googleusercontent.com US
107.178.234.150 150.234.178.107.gae.googleusercontent.com US
107.178.234.24 24.234.178.107.gae.googleusercontent.com US
107.178.234.155 155.234.178.107.gae.googleusercontent.com US
107.178.234.151 151.234.178.107.gae.googleusercontent.com US
107.178.234.152 152.234.178.107.gae.googleusercontent.com US
107.178.234.23 23.234.178.107.gae.googleusercontent.com US
107.178.234.89 89.234.178.107.gae.googleusercontent.com US
107.178.234.19 19.234.178.107.gae.googleusercontent.com US
107.178.234.86 86.234.178.107.gae.googleusercontent.com US
107.178.234.93 ? US
107.178.234.81 81.234.178.107.gae.googleusercontent.com US
107.178.234.21 21.234.178.107.gae.googleusercontent.com US
107.178.234.157 157.234.178.107.gae.googleusercontent.com US
107.178.234.30 30.234.178.107.gae.googleusercontent.com US
107.178.234.154 154.234.178.107.gae.googleusercontent.com US
107.178.234.29 29.234.178.107.gae.googleusercontent.com US
107.178.234.148 148.234.178.107.gae.googleusercontent.com US
107.178.234.146 146.234.178.107.gae.googleusercontent.com US
107.178.234.31 31.234.178.107.gae.googleusercontent.com US
107.178.234.26 26.234.178.107.gae.googleusercontent.com US
107.178.234.16 16.234.178.107.gae.googleusercontent.com US
107.178.234.95 95.234.178.107.gae.googleusercontent.com US
107.178.234.20 20.234.178.107.gae.googleusercontent.com US
107.178.234.22 22.234.178.107.gae.googleusercontent.com US
107.178.234.84 84.234.178.107.gae.googleusercontent.com US
107.178.234.156 156.234.178.107.gae.googleusercontent.com US
107.178.234.83 83.234.178.107.gae.googleusercontent.com US
107.178.234.153 153.234.178.107.gae.googleusercontent.com US
107.178.234.149 149.234.178.107.gae.googleusercontent.com US
107.178.234.25 25.234.178.107.gae.googleusercontent.com US
107.178.234.158 158.234.178.107.gae.googleusercontent.com US
107.178.234.88 88.234.178.107.gae.googleusercontent.com ?
107.178.234.82 82.234.178.107.gae.googleusercontent.com US
107.178.234.18 18.234.178.107.gae.googleusercontent.com US
34.34.226.60 34.34.226.60 US
34.34.226.106 34.34.226.106 US
34.34.226.95 34.34.226.95 US
34.34.226.56 34.34.226.56 US
34.34.226.36 34.34.226.36 US
34.34.226.51 34.34.226.51 US
34.34.226.97 34.34.226.97 US
34.34.226.109 34.34.226.109 US
34.34.226.61 34.34.226.61 US
34.34.226.63 34.34.226.63 US
34.34.226.100 34.34.226.100 US
34.34.226.96 34.34.226.96 US
34.34.226.48 34.34.226.48 US
34.34.226.103 34.34.226.103 US
34.34.226.102 34.34.226.102 US
34.34.226.58 34.34.226.58 US
34.34.226.104 34.34.226.104 US
用户代理字符串
Hatena-Favicon/2 (http://www.hatena.ne.jp/faq/)
首次出现
2019-03-19 02:26:57
最后出现
2022-08-03 06:10:57
遵循robots.txt
来源
IP地址(66) 服务器名称 所属国家
107.178.234.151 151.234.178.107.gae.googleusercontent.com US
107.178.234.152 152.234.178.107.gae.googleusercontent.com US
107.178.234.23 23.234.178.107.gae.googleusercontent.com US
107.178.234.80 80.234.178.107.gae.googleusercontent.com US
107.178.234.89 89.234.178.107.gae.googleusercontent.com US
107.178.234.19 19.234.178.107.gae.googleusercontent.com US
107.178.234.86 86.234.178.107.gae.googleusercontent.com US
107.178.234.93 ? US
107.178.234.155 155.234.178.107.gae.googleusercontent.com US
107.178.234.81 81.234.178.107.gae.googleusercontent.com US
用户代理字符串
Hatena::Analyzer/0.02 (master) Furl/3.13
首次出现
2021-02-23 15:26:54
最后出现
2021-03-17 21:10:25
遵循robots.txt
未知
来源
IP地址(1) 服务器名称 所属国家
153.120.13.138 ? JP
133.242.243.6 ? JP
用户代理字符串
Hatena::ContentScreener::ImageFetcher/1.0
首次出现
2020-03-17 10:31:32
最后出现
2020-03-17 10:31:32
遵循robots.txt
未知
来源
IP地址(1) 服务器名称 所属国家
107.178.234.18 18.234.178.107.gae.googleusercontent.com JP
用户代理字符串
HatenaBookmark/4.0 (Hatena::Bookmark; Scissors)
首次出现
2019-12-29 07:01:55
最后出现
2019-12-29 07:01:55
遵循robots.txt
来源
IP地址(1) 服务器名称 所属国家
153.120.13.138 ? JP
153.120.13.137 ? JP
54.92.97.59 ec2-54-92-97-59.ap-northeast-1.compute.amazonaws.com JP
54.249.85.140 vpcgw02.hatena.ne.jp JP
52.68.0.227 ec2-52-68-0-227.ap-northeast-1.compute.amazonaws.com JP
54.250.227.185 ec2-54-250-227-185.ap-northeast-1.compute.amazonaws.com JP
133.242.243.6 ? JP
用户代理字符串
HatenaBookmark/4.0 (Hatena::Bookmark; Scissors)
首次出现
2019-12-29 07:01:55
最后出现
2019-12-29 07:01:55
遵循robots.txt
未知
来源
IP地址(1) 服务器名称 所属国家
54.249.85.140 vpcgw02.hatena.ne.jp JP
用户代理字符串
WWW::LayeredExtractor::Handler::Feed/0.01
首次出现
2015-12-04 13:30:00
最后出现
2019-06-11 07:40:24
遵循robots.txt
未知
来源
IP地址(2) 服务器名称 所属国家
153.120.13.138 ? JP
59.106.108.116 gw08.hatena.ne.jp JP
用户代理字符串
Hatena-Favicon2 (http://www.hatena.ne.jp/faq/)
首次出现
2018-06-25 23:14:52
最后出现
2019-01-17 10:14:55
遵循robots.txt
未知
来源
IP地址(9) 服务器名称 所属国家
35.190.237.174 ? US
35.194.124.64 ? US
35.187.210.137 ? US
35.200.110.132 ? US
35.221.119.11 ? US
35.200.21.56 ? US
35.221.120.97 ? US
35.189.135.26 ? US
35.190.237.178 35.190.237.178 US
用户代理字符串
Hatena::Fetcher/0.01 (master) Furl/3.06
首次出现
2018-03-21 07:51:54
最后出现
2018-07-29 13:57:34
遵循robots.txt
未知
来源
IP地址(4) 服务器名称 所属国家
52.68.0.227 ec2-52-68-0-227.ap-northeast-1.compute.amazonaws.com JP
54.92.97.59 ec2-54-92-97-59.ap-northeast-1.compute.amazonaws.com JP
54.250.227.185 ec2-54-250-227-185.ap-northeast-1.compute.amazonaws.com JP
54.249.85.140 vpcgw02.hatena.ne.jp JP
用户代理字符串
Hatena::Fetcher/0.01 (master) Furl/3.06
首次出现
2018-03-21 07:51:54
最后出现
2018-07-29 13:57:34
遵循robots.txt
未知
来源
IP地址(4) 服务器名称 所属国家
52.68.0.227 ec2-52-68-0-227.ap-northeast-1.compute.amazonaws.com JP
54.250.227.185 ec2-54-250-227-185.ap-northeast-1.compute.amazonaws.com JP
54.249.85.140 vpcgw02.hatena.ne.jp JP
54.92.97.59 ec2-54-92-97-59.ap-northeast-1.compute.amazonaws.com JP
用户代理字符串
WWW::Document/0.02
首次出现
2017-01-11 04:15:23
最后出现
2018-03-26 10:30:15
遵循robots.txt
来源
IP地址(1) 服务器名称 所属国家
59.106.108.116 gw08.hatena.ne.jp JP
用户代理字符串
Hatena Star UserAgent
首次出现
2018-03-22 08:12:08
最后出现
2018-03-22 08:12:08
遵循robots.txt
来源
IP地址(1) 服务器名称 所属国家
59.106.108.116 gw08.hatena.ne.jp JP
用户代理字符串
Hatena::Bookmark/2.00 (Hatena::Bookmark; master;)
首次出现
2016-10-28 06:55:21
最后出现
2018-03-22 08:12:05
遵循robots.txt
来源
IP地址(1) 服务器名称 所属国家
59.106.108.116 gw08.hatena.ne.jp JP
用户代理字符串
DoCoMo/2.0 D903i(c100;TB;W28H20) (compatible; Hatena-Mobile-Gateway/1.2; +http://mgw.hatena.ne.jp/help)
首次出现
2013-05-02 14:40:58
最后出现
2017-04-04 11:44:20
遵循robots.txt
未知
来源
IP地址(2) 服务器名称 所属国家
59.106.108.116 gw08.hatena.ne.jp JP
59.106.108.114 gw07.hatena.ne.jp JP
用户代理字符串
HatenaScreenshot
首次出现
2009-05-11 05:50:00
最后出现
2016-10-28 09:17:04
遵循robots.txt
未知
来源
IP地址(1) 服务器名称 所属国家
59.106.108.116 gw08.hatena.ne.jp JP
用户代理字符串
Hatena Antenna/0.5 (http://a.hatena.ne.jp/help)
首次出现
2009-05-11 05:50:00
最后出现
2015-10-22 14:12:45
遵循robots.txt
未知
来源
IP地址(1) 服务器名称 所属国家
59.106.108.116 gw08.hatena.ne.jp JP
用户代理字符串
HatenaScreenshot/1.0 (checker)
首次出现
2009-05-11 05:50:00
最后出现
2010-02-15 06:27:38
遵循robots.txt
未知
来源
IP地址(1) 服务器名称 所属国家
59.106.108.66 gw.hatena.ne.jp JP

访问控制

了解如何控制Hatena访问权限,避免Hatena抓取行为不当。

是否拦截Hatena?

这取决于你。数字存档通常是为了保存历史记录。如果你出于某种原因不想成为历史记录的一部分,你可以拦截这类型的蜘蛛爬虫。

通过Robots.txt拦截

您可以通过在网站的 robots.txt 中设置用户代理访问规则来屏蔽 Hatena 或限制其访问权限。我们建议安装 Spider Analyser 插件,以检查它是否真正遵循这些规则。

	# robots.txt
	# 下列代码一般情况可以拦截该代理
	
	User-agent: Hatena
	Disallow: /

您无需手动执行此操作,可通过我们的 Wordpress 插件 Spider Analyser 来拦截不必要的蜘蛛或者爬虫。

更多信息

在Hatena中,您可以根据用户的指定自动访问其他页面并收集信息,以便在您的博客中提供各种功能。此时,请指定以下用户代理进行访问。

HatenaBlog-bot/0.02 (+https://help.hatenablog.com/entry/about-hatenablogbot)

用户代理可以在博客以外的系统上指定相同的值。请作为参考信息使用。

获取的信息的主要用途如下:

  • 用于标记URL的:title选项
  • 用于自动显示标题
  • 用于标记URL标记的:embed选项
  • 用于获取博客卡的信息(页面标题、概要、传真等)

常见蜘蛛/爬虫

Common Spiders
Googlebot
GoogleBot蜘蛛/爬虫属于搜索引擎类型,由Google Inc.开发运行。您可以继续阅读下方信息,以深入了解GoogleBot基本信息,用户代理和访问控制等。
SeznamBot
SeznamBot蜘蛛/爬虫属于搜索引擎类型,由Seznam.cz, a.s.开发运行。您可以继续阅读下方信息,以深入了解SeznamBot基本信息,用户代理和访问控制等。
WordPress.com bots
WordPress.com bots蜘蛛/爬虫属于信息流类型,由Automattic Inc.开发运行。您可以继续阅读下方信息,以深入了解WordPress.com bots基本信息,用户代理和访问控制等。
Hatena
Hatena蜘蛛/爬虫属于获取器类型,由Hatena Co., Ltd.开发运行。您可以继续阅读下方信息,以深入了解Hatena基本信息,用户代理和访问控制等。
hyperhost.ua crawler
hyperhost.ua crawler蜘蛛/爬虫属于快照类型,由HyperHost Ukraine开发运行。您可以继续阅读下方信息,以深入了解hyperhost.ua crawler基本信息,用户代理和访问控制等。
bingbot
Bingbot蜘蛛/爬虫属于搜索引擎类型,由Microsoft Corporation.开发运行。您可以继续阅读下方信息,以深入了解Bingbot基本信息,用户代理和访问控制等。
PhantomJsCloud.com
PhantomJsCloud.com蜘蛛/爬虫属于快照类型,由Novaleaf Software Co. Ltd.开发运行。您可以继续阅读下方信息,以深入了解PhantomJsCloud.com基本信息,用户代理和访问控制等。
Daumoa
Daumoa蜘蛛/爬虫属于搜索引擎类型,由Kakao Corp.开发运行。您可以继续阅读下方信息,以深入了解Daumoa基本信息,用户代理和访问控制等。

相关文章

Related Articles