Hatena

Hatena蜘蛛/爬蟲屬於快照型別,由Hatena Co., Ltd.開發執行。您可以繼續閱讀下方資訊,以深入瞭解Hatena基本資訊,使用者代理和訪問控制等。

基本資訊

Hatena的基本資訊如下表。但部分不是很規範的蜘蛛和爬蟲,可能存在資訊不明的情況。
蜘蛛/爬蟲名稱
Hatena
型別
快照
開發商
Hatena Co., Ltd.
當前狀態
活動

使用者代理

關於Hatena蜘蛛或者爬蟲的使用者代理字串,IP地址和伺服器,所在地等資訊如下表格所示:
Hatena::Scissors/0.01
使用者代理字串
Hatena::Scissors/0.01
首次出現
2018-07-02 04:52:31
最後出現
2025-01-09 04:36:41
遵循robots.txt
未知
來源
IP地址(5) 伺服器名稱 所屬國家
54.249.85.140 vpcgw02.hatena.ne.jp JP
52.68.0.227 ec2-52-68-0-227.ap-northeast-1.compute.amazonaws.com JP
54.92.97.59 ec2-54-92-97-59.ap-northeast-1.compute.amazonaws.com JP
54.250.227.185 ec2-54-250-227-185.ap-northeast-1.compute.amazonaws.com JP
59.106.108.116 gw08.hatena.ne.jp JP
使用者代理字串
HatenaBlog-bot/0.02 (+https://help.hatenablog.com/entry/about-hatenablogbot)
首次出現
2020-09-22 14:08:04
最後出現
2025-01-09 04:36:39
遵循robots.txt
未知
來源
IP地址(2) 伺服器名稱 所屬國家
54.249.8.242 vpcgw03.hatena.ne.jp JP
54.249.44.51 vpcgw01.hatena.ne.jp JP
使用者代理字串
Hatena Star UserAgent/2
首次出現
2018-03-22 08:22:11
最後出現
2024-05-26 05:36:36
遵循robots.txt
來源
IP地址(2) 伺服器名稱 所屬國家
59.106.108.116 gw08.hatena.ne.jp JP
54.249.44.51 vpcgw01.hatena.ne.jp JP
使用者代理字串
Hatena-Favicon/2 (http://www.hatena.ne.jp/faq/)
首次出現
2019-03-19 02:26:57
最後出現
2022-08-03 06:10:57
遵循robots.txt
來源
IP地址(66) 伺服器名稱 所屬國家
107.178.234.80 80.234.178.107.gae.googleusercontent.com US
107.178.234.17 17.234.178.107.gae.googleusercontent.com US
107.178.234.90 90.234.178.107.gae.googleusercontent.com US
107.178.234.94 94.234.178.107.gae.googleusercontent.com US
107.178.234.27 27.234.178.107.gae.googleusercontent.com US
107.178.234.91 91.234.178.107.gae.googleusercontent.com US
107.178.234.87 87.234.178.107.gae.googleusercontent.com US
107.178.234.147 147.234.178.107.gae.googleusercontent.com US
107.178.234.144 144.234.178.107.gae.googleusercontent.com US
107.178.234.28 28.234.178.107.gae.googleusercontent.com US
107.178.234.150 150.234.178.107.gae.googleusercontent.com US
107.178.234.24 24.234.178.107.gae.googleusercontent.com US
107.178.234.155 155.234.178.107.gae.googleusercontent.com US
107.178.234.151 151.234.178.107.gae.googleusercontent.com US
107.178.234.152 152.234.178.107.gae.googleusercontent.com US
107.178.234.23 23.234.178.107.gae.googleusercontent.com US
107.178.234.89 89.234.178.107.gae.googleusercontent.com US
107.178.234.19 19.234.178.107.gae.googleusercontent.com US
107.178.234.86 86.234.178.107.gae.googleusercontent.com US
107.178.234.93 ? US
107.178.234.81 81.234.178.107.gae.googleusercontent.com US
107.178.234.21 21.234.178.107.gae.googleusercontent.com US
107.178.234.157 157.234.178.107.gae.googleusercontent.com US
107.178.234.30 30.234.178.107.gae.googleusercontent.com US
107.178.234.154 154.234.178.107.gae.googleusercontent.com US
107.178.234.29 29.234.178.107.gae.googleusercontent.com US
107.178.234.148 148.234.178.107.gae.googleusercontent.com US
107.178.234.146 146.234.178.107.gae.googleusercontent.com US
107.178.234.31 31.234.178.107.gae.googleusercontent.com US
107.178.234.26 26.234.178.107.gae.googleusercontent.com US
107.178.234.16 16.234.178.107.gae.googleusercontent.com US
107.178.234.95 95.234.178.107.gae.googleusercontent.com US
107.178.234.20 20.234.178.107.gae.googleusercontent.com US
107.178.234.22 22.234.178.107.gae.googleusercontent.com US
107.178.234.84 84.234.178.107.gae.googleusercontent.com US
107.178.234.156 156.234.178.107.gae.googleusercontent.com US
107.178.234.83 83.234.178.107.gae.googleusercontent.com US
107.178.234.153 153.234.178.107.gae.googleusercontent.com US
107.178.234.149 149.234.178.107.gae.googleusercontent.com US
107.178.234.25 25.234.178.107.gae.googleusercontent.com US
107.178.234.158 158.234.178.107.gae.googleusercontent.com US
107.178.234.88 88.234.178.107.gae.googleusercontent.com ?
107.178.234.82 82.234.178.107.gae.googleusercontent.com US
107.178.234.18 18.234.178.107.gae.googleusercontent.com US
34.34.226.60 34.34.226.60 US
34.34.226.106 34.34.226.106 US
34.34.226.95 34.34.226.95 US
34.34.226.56 34.34.226.56 US
34.34.226.36 34.34.226.36 US
34.34.226.51 34.34.226.51 US
34.34.226.97 34.34.226.97 US
34.34.226.109 34.34.226.109 US
34.34.226.61 34.34.226.61 US
34.34.226.63 34.34.226.63 US
34.34.226.100 34.34.226.100 US
34.34.226.96 34.34.226.96 US
34.34.226.48 34.34.226.48 US
34.34.226.103 34.34.226.103 US
34.34.226.102 34.34.226.102 US
34.34.226.58 34.34.226.58 US
34.34.226.104 34.34.226.104 US
使用者代理字串
Hatena-Favicon/2 (http://www.hatena.ne.jp/faq/)
首次出現
2019-03-19 02:26:57
最後出現
2022-08-03 06:10:57
遵循robots.txt
來源
IP地址(66) 伺服器名稱 所屬國家
107.178.234.151 151.234.178.107.gae.googleusercontent.com US
107.178.234.152 152.234.178.107.gae.googleusercontent.com US
107.178.234.23 23.234.178.107.gae.googleusercontent.com US
107.178.234.80 80.234.178.107.gae.googleusercontent.com US
107.178.234.89 89.234.178.107.gae.googleusercontent.com US
107.178.234.19 19.234.178.107.gae.googleusercontent.com US
107.178.234.86 86.234.178.107.gae.googleusercontent.com US
107.178.234.93 ? US
107.178.234.155 155.234.178.107.gae.googleusercontent.com US
107.178.234.81 81.234.178.107.gae.googleusercontent.com US
使用者代理字串
Hatena::Analyzer/0.02 (master) Furl/3.13
首次出現
2021-02-23 15:26:54
最後出現
2021-03-17 21:10:25
遵循robots.txt
未知
來源
IP地址(1) 伺服器名稱 所屬國家
153.120.13.138 ? JP
133.242.243.6 ? JP
使用者代理字串
Hatena::ContentScreener::ImageFetcher/1.0
首次出現
2020-03-17 10:31:32
最後出現
2020-03-17 10:31:32
遵循robots.txt
未知
來源
IP地址(1) 伺服器名稱 所屬國家
107.178.234.18 18.234.178.107.gae.googleusercontent.com JP
使用者代理字串
HatenaBookmark/4.0 (Hatena::Bookmark; Scissors)
首次出現
2019-12-29 07:01:55
最後出現
2019-12-29 07:01:55
遵循robots.txt
來源
IP地址(1) 伺服器名稱 所屬國家
153.120.13.138 ? JP
153.120.13.137 ? JP
54.92.97.59 ec2-54-92-97-59.ap-northeast-1.compute.amazonaws.com JP
54.249.85.140 vpcgw02.hatena.ne.jp JP
52.68.0.227 ec2-52-68-0-227.ap-northeast-1.compute.amazonaws.com JP
54.250.227.185 ec2-54-250-227-185.ap-northeast-1.compute.amazonaws.com JP
133.242.243.6 ? JP
使用者代理字串
HatenaBookmark/4.0 (Hatena::Bookmark; Scissors)
首次出現
2019-12-29 07:01:55
最後出現
2019-12-29 07:01:55
遵循robots.txt
未知
來源
IP地址(1) 伺服器名稱 所屬國家
54.249.85.140 vpcgw02.hatena.ne.jp JP
使用者代理字串
WWW::LayeredExtractor::Handler::Feed/0.01
首次出現
2015-12-04 13:30:00
最後出現
2019-06-11 07:40:24
遵循robots.txt
未知
來源
IP地址(2) 伺服器名稱 所屬國家
153.120.13.138 ? JP
59.106.108.116 gw08.hatena.ne.jp JP
使用者代理字串
Hatena-Favicon2 (http://www.hatena.ne.jp/faq/)
首次出現
2018-06-25 23:14:52
最後出現
2019-01-17 10:14:55
遵循robots.txt
未知
來源
IP地址(9) 伺服器名稱 所屬國家
35.190.237.174 ? US
35.194.124.64 ? US
35.187.210.137 ? US
35.200.110.132 ? US
35.221.119.11 ? US
35.200.21.56 ? US
35.221.120.97 ? US
35.189.135.26 ? US
35.190.237.178 35.190.237.178 US
使用者代理字串
Hatena::Fetcher/0.01 (master) Furl/3.06
首次出現
2018-03-21 07:51:54
最後出現
2018-07-29 13:57:34
遵循robots.txt
未知
來源
IP地址(4) 伺服器名稱 所屬國家
52.68.0.227 ec2-52-68-0-227.ap-northeast-1.compute.amazonaws.com JP
54.92.97.59 ec2-54-92-97-59.ap-northeast-1.compute.amazonaws.com JP
54.250.227.185 ec2-54-250-227-185.ap-northeast-1.compute.amazonaws.com JP
54.249.85.140 vpcgw02.hatena.ne.jp JP
使用者代理字串
Hatena::Fetcher/0.01 (master) Furl/3.06
首次出現
2018-03-21 07:51:54
最後出現
2018-07-29 13:57:34
遵循robots.txt
未知
來源
IP地址(4) 伺服器名稱 所屬國家
52.68.0.227 ec2-52-68-0-227.ap-northeast-1.compute.amazonaws.com JP
54.250.227.185 ec2-54-250-227-185.ap-northeast-1.compute.amazonaws.com JP
54.249.85.140 vpcgw02.hatena.ne.jp JP
54.92.97.59 ec2-54-92-97-59.ap-northeast-1.compute.amazonaws.com JP
使用者代理字串
WWW::Document/0.02
首次出現
2017-01-11 04:15:23
最後出現
2018-03-26 10:30:15
遵循robots.txt
來源
IP地址(1) 伺服器名稱 所屬國家
59.106.108.116 gw08.hatena.ne.jp JP
使用者代理字串
Hatena Star UserAgent
首次出現
2018-03-22 08:12:08
最後出現
2018-03-22 08:12:08
遵循robots.txt
來源
IP地址(1) 伺服器名稱 所屬國家
59.106.108.116 gw08.hatena.ne.jp JP
使用者代理字串
Hatena::Bookmark/2.00 (Hatena::Bookmark; master;)
首次出現
2016-10-28 06:55:21
最後出現
2018-03-22 08:12:05
遵循robots.txt
來源
IP地址(1) 伺服器名稱 所屬國家
59.106.108.116 gw08.hatena.ne.jp JP
使用者代理字串
DoCoMo/2.0 D903i(c100;TB;W28H20) (compatible; Hatena-Mobile-Gateway/1.2; +http://mgw.hatena.ne.jp/help)
首次出現
2013-05-02 14:40:58
最後出現
2017-04-04 11:44:20
遵循robots.txt
未知
來源
IP地址(2) 伺服器名稱 所屬國家
59.106.108.116 gw08.hatena.ne.jp JP
59.106.108.114 gw07.hatena.ne.jp JP
使用者代理字串
HatenaScreenshot
首次出現
2009-05-11 05:50:00
最後出現
2016-10-28 09:17:04
遵循robots.txt
未知
來源
IP地址(1) 伺服器名稱 所屬國家
59.106.108.116 gw08.hatena.ne.jp JP
使用者代理字串
Hatena Antenna/0.5 (http://a.hatena.ne.jp/help)
首次出現
2009-05-11 05:50:00
最後出現
2015-10-22 14:12:45
遵循robots.txt
未知
來源
IP地址(1) 伺服器名稱 所屬國家
59.106.108.116 gw08.hatena.ne.jp JP
使用者代理字串
HatenaScreenshot/1.0 (checker)
首次出現
2009-05-11 05:50:00
最後出現
2010-02-15 06:27:38
遵循robots.txt
未知
來源
IP地址(1) 伺服器名稱 所屬國家
59.106.108.66 gw.hatena.ne.jp JP

訪問控制

瞭解如何控制Hatena訪問許可權,避免Hatena抓取行為不當。

是否攔截Hatena?

這取決於你。數字存檔通常是為了儲存歷史記錄。如果你出於某種原因不想成為歷史記錄的一部分,你可以攔截這型別的蜘蛛爬蟲。

通過Robots.txt攔截

您可以通過在網站的 robots.txt 中設定使用者代理訪問規則來遮蔽 Hatena 或限制其訪問許可權。我們建議安裝 Spider Analyser 外掛,以檢查它是否真正遵循這些規則。

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
# robots.txt
# 下列程式碼一般情況可以攔截該代理
User-agent: Hatena
Disallow: /
# robots.txt # 下列程式碼一般情況可以攔截該代理 User-agent: Hatena Disallow: /
	# robots.txt
	# 下列程式碼一般情況可以攔截該代理
	
	User-agent: Hatena
	Disallow: /

您無需手動執行此操作,可通過我們的 Wordpress 外掛 Spider Analyser 來攔截不必要的蜘蛛或者爬蟲。

更多資訊

在Hatena中,您可以根據使用者的指定自動訪問其他頁面並收集資訊,以便在您的部落格中提供各種功能。此時,請指定以下使用者代理進行訪問。

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
HatenaBlog-bot/0.02 (+https://help.hatenablog.com/entry/about-hatenablogbot)
HatenaBlog-bot/0.02 (+https://help.hatenablog.com/entry/about-hatenablogbot)
HatenaBlog-bot/0.02 (+https://help.hatenablog.com/entry/about-hatenablogbot)

使用者代理可以在部落格以外的系統上指定相同的值。請作為參考資訊使用。

獲取的資訊的主要用途如下:

  • 用於標記URL的:title選項
  • 用於自動顯示標題
  • 用於標記URL標記的:embed選項
  • 用於獲取部落格卡的資訊(頁面標題、概要、傳真等)

常見蜘蛛/爬蟲

Common Spiders
Googlebot
GoogleBot蜘蛛/爬蟲屬於搜尋引擎型別,由Google Inc.開發執行。您可以繼續閱讀下方資訊,以深入瞭解GoogleBot基本資訊,使用者代理和訪問控制等。
SeznamBot
SeznamBot蜘蛛/爬蟲屬於搜尋引擎型別,由Seznam.cz, a.s.開發執行。您可以繼續閱讀下方資訊,以深入瞭解SeznamBot基本資訊,使用者代理和訪問控制等。
WordPress.com bots
WordPress.com bots蜘蛛/爬蟲屬於資訊流型別,由Automattic Inc.開發執行。您可以繼續閱讀下方資訊,以深入瞭解WordPress.com bots基本資訊,使用者代理和訪問控制等。
Hatena
Hatena蜘蛛/爬蟲屬於快照型別,由Hatena Co., Ltd.開發執行。您可以繼續閱讀下方資訊,以深入瞭解Hatena基本資訊,使用者代理和訪問控制等。
hyperhost.ua crawler
hyperhost.ua crawler蜘蛛/爬蟲屬於快照型別,由HyperHost Ukraine開發執行。您可以繼續閱讀下方資訊,以深入瞭解hyperhost.ua crawler基本資訊,使用者代理和訪問控制等。
bingbot
Bingbot蜘蛛/爬蟲屬於搜尋引擎型別,由Microsoft Corporation.開發執行。您可以繼續閱讀下方資訊,以深入瞭解Bingbot基本資訊,使用者代理和訪問控制等。
PhantomJsCloud.com
PhantomJsCloud.com蜘蛛/爬蟲屬於快照型別,由Novaleaf Software Co. Ltd.開發執行。您可以繼續閱讀下方資訊,以深入瞭解PhantomJsCloud.com基本資訊,使用者代理和訪問控制等。
Daumoa
Daumoa蜘蛛/爬蟲屬於搜尋引擎型別,由Kakao Corp.開發執行。您可以繼續閱讀下方資訊,以深入瞭解Daumoa基本資訊,使用者代理和訪問控制等。

相關文章

Related Articles