Feedspotbot

Feedspotbot蜘蛛/爬蟲屬於資訊流型別,由Feedspot開發執行。您可以繼續閱讀下方資訊,以深入瞭解Feedspotbot基本資訊,使用者代理和訪問控制等。

基本資訊

Feedspotbot的基本資訊如下表。但部分不是很規範的蜘蛛和爬蟲,可能存在資訊不明的情況。
蜘蛛/爬蟲名稱
Feedspotbot
型別
資訊流
開發商
Feedspot
當前狀態
活動

使用者代理

關於Feedspotbot蜘蛛或者爬蟲的使用者代理字串,IP地址和伺服器,所在地等資訊如下表格所示:
Feedspot/1.0
使用者代理字串
Mozilla/5.0 (compatible; Feedspot/1.0 (+https://www.feedspot.com/fs/fetcher; like FeedFetcher-Google)
首次出現
2018-10-08 08:40:34
最後出現
2025-01-10 07:19:03
遵循robots.txt
來源
IP地址(19) 伺服器名稱 所屬國家
52.26.159.11 ec2-52-26-159-11.us-west-2.compute.amazonaws.com US
54.189.114.202 ec2-54-189-114-202.us-west-2.compute.amazonaws.com US
35.164.178.38 ec2-35-164-178-38.us-west-2.compute.amazonaws.com US
44.239.58.113 ec2-44-239-58-113.us-west-2.compute.amazonaws.com US
52.89.120.202 ec2-52-89-120-202.us-west-2.compute.amazonaws.com US
52.35.141.177 ec2-52-35-141-177.us-west-2.compute.amazonaws.com US
143.198.72.22 ? US
52.34.161.249 ec2-52-34-161-249.us-west-2.compute.amazonaws.com US
44.241.148.94 ec2-44-241-148-94.us-west-2.compute.amazonaws.com US
44.233.151.127 ec2-44-233-151-127.us-west-2.compute.amazonaws.com US
44.241.181.80 ec2-44-241-181-80.us-west-2.compute.amazonaws.com US
100.20.80.33 ec2-100-20-80-33.us-west-2.compute.amazonaws.com US
35.84.123.54 ec2-35-84-123-54.us-west-2.compute.amazonaws.com US
50.112.183.254 ec2-50-112-183-254.us-west-2.compute.amazonaws.com US
67.60.3.229 67-60-3-229.cpe.sparklight.net US
52.41.34.172 ec2-52-41-34-172.us-west-2.compute.amazonaws.com US
100.21.245.151 ec2-100-21-245-151.us-west-2.compute.amazonaws.com US
52.43.148.198 ec2-52-43-148-198.us-west-2.compute.amazonaws.com US
35.160.211.129 ec2-35-160-211-129.us-west-2.compute.amazonaws.com US
使用者代理字串
Mozilla/5.0 (compatible; Feedspot/1.0 (+https://www.feedspot.com/fs/fetcher; like FeedFetcher-Google)
首次出現
2018-10-08 08:40:34
最後出現
2022-09-03 15:43:09
遵循robots.txt
未知
來源
IP地址(11) 伺服器名稱 所屬國家
44.233.151.127 ec2-44-233-151-127.us-west-2.compute.amazonaws.com US
52.35.141.177 ec2-52-35-141-177.us-west-2.compute.amazonaws.com US
54.189.114.202 ec2-54-189-114-202.us-west-2.compute.amazonaws.com US
52.89.120.202 ec2-52-89-120-202.us-west-2.compute.amazonaws.com US
35.84.123.54 ec2-35-84-123-54.us-west-2.compute.amazonaws.com US
35.160.211.129 ec2-35-160-211-129.us-west-2.compute.amazonaws.com US
100.20.80.33 ec2-100-20-80-33.us-west-2.compute.amazonaws.com US
44.241.148.94 ec2-44-241-148-94.us-west-2.compute.amazonaws.com US
50.112.183.254 ec2-50-112-183-254.us-west-2.compute.amazonaws.com US
44.239.58.113 ec2-44-239-58-113.us-west-2.compute.amazonaws.com US
使用者代理字串
Feedspot http://www.feedspot.com
首次出現
2015-08-27 09:59:08
最後出現
2018-10-06 05:22:21
遵循robots.txt
未知
來源
IP地址(2) 伺服器名稱 所屬國家
54.186.248.49 ec2-54-186-248-49.us-west-2.compute.amazonaws.com US
54.245.252.119 ec2-54-245-252-119.us-west-2.compute.amazonaws.com US
使用者代理字串
Mozilla/5.0 (compatible; Feedspotbot/1.0; +http://www.feedspot.com/fs/bot)
首次出現
2015-09-14 07:45:00
最後出現
2018-10-05 11:14:45
遵循robots.txt
未知
來源
IP地址(1) 伺服器名稱 所屬國家
54.186.248.49 ec2-54-186-248-49.us-west-2.compute.amazonaws.com US

訪問控制

瞭解如何控制Feedspotbot訪問許可權,避免Feedspotbot抓取行為不當。

是否攔截Feedspotbot?

通常不需要。除非您不希望資訊流網站或者APP對您的網站內容進行抓取,網站也不提供Feed訂閱服務,則可以考慮攔截此型別爬蟲。

通過Robots.txt攔截

您可以通過在網站的 robots.txt 中設定使用者代理訪問規則來遮蔽 Feedspotbot 或限制其訪問許可權。我們建議安裝 Spider Analyser 外掛,以檢查它是否真正遵循這些規則。

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
# robots.txt
# 下列程式碼一般情況可以攔截該代理
User-agent: Feedspotbot
Disallow: /
# robots.txt # 下列程式碼一般情況可以攔截該代理 User-agent: Feedspotbot Disallow: /
# robots.txt
# 下列程式碼一般情況可以攔截該代理
User-agent: Feedspotbot
Disallow: /

您無需手動執行此操作,可通過我們的 Wordpress 外掛 Spider Analyser 來攔截不必要的蜘蛛或者爬蟲。

更多資訊

Feedspot Fetcher是Feedspot在使用者向其Feedspot帳戶新增Feed時獲取RSS/Atom Feed的方式。Fetcher根據feed的更新頻率,定期抓取feed。在大多數情況下,每小時最多抓取2次feed網址。以下是網站管理員最常問到的關於這個使用者控制的feed爬取器如何工作的一些問題。

常問問題

爬蟲多長時間取一次feed?

平均而言,爬蟲每小時抓取feed的次數不應超過一次。如果提要經常更新且被許多使用者關注,則每小時最多可抓取2次。在某些情況下,如果feed更新不那麼頻繁,它們會在3至6小時內被抓取一次。

為什麼Crawler不遵循robots.txt檔案?

Crawler只有在使用者明確將其新增到他們的Feedspot賬戶後才會檢索feeds。由於爬蟲的請求來自於將feed新增到Feedspot帳戶的人類使用者的明確行動,而不是來自自動爬蟲,因此爬蟲不遵循robots.txt準則。抓取器有助於減少您的頻寬消耗。例如,即使一個feed被幾個使用者關注,它也只被抓取一次,從而減少您伺服器上的負載。

我如何要求Feedspot不抓取我的所有Feeds或部分Feeds?

您可以通過您的官方郵箱將您的要求或問題發到 team@feedspot.com,標題為Feedspot Fetcher,Feedspot將嘗試在24-48小時內作出迴應。

為什麼Crawler從我們的 “私人 “網路伺服器下載資訊?

Crawler是應已將其新增到Feedspot賬戶的使用者的要求檢索資訊的。該請求有可能來自知道您的 “私人 “伺服器的使用者,或錯誤地輸入了該伺服器。

為什麼Crawler試圖從我的伺服器下載不正確的連結,或從一個不存在的伺服器下載?

Crawler是應已將其新增到Feedspot帳戶的使用者的要求而檢索提要的。有可能是使用者請求的Feed URL位置不存在,也可能是打字錯誤。

Feedspot是從單個IP還是從多個IP抓取的?

爬蟲是分散式系統,在多臺機器上執行。爬蟲可能使用幾個IP來抓取。識別它的最好方法是使用使用者代理字串:Feedspot/1.0。

你們支援Pubsub/push技術嗎?

是的。Feedspot 支援 Pubsub/push 中心。如果您的Feeds宣傳推送中心,Feedspot將訂閱更新並減少抓取Feed的次數。

如果上述常見問題未能解決您的問題,你可以把你的問題發到 team@feedspot.com,標題為 Feedspot Fetcher,Feedspot會盡量在 24-48 小時內答覆。

常見蜘蛛/爬蟲

Common Spiders
Twitterbot
Twitterbot蜘蛛/爬蟲屬於資訊流型別,由X Corp.開發執行。您可以繼續閱讀下方資訊,以深入瞭解Twitterbot基本資訊,使用者代理和訪問控制等。
SeznamBot
SeznamBot蜘蛛/爬蟲屬於搜尋引擎型別,由Seznam.cz, a.s.開發執行。您可以繼續閱讀下方資訊,以深入瞭解SeznamBot基本資訊,使用者代理和訪問控制等。
Blogtrottr
Blogtrottr蜘蛛/爬蟲屬於資訊流型別,由Blogtrottr Ltd.開發執行。您可以繼續閱讀下方資訊,以深入瞭解Blogtrottr基本資訊,使用者代理和訪問控制等。
RSSingBot
RSSingBot蜘蛛/爬蟲屬於資訊流型別,由RSSING.COM開發執行。您可以繼續閱讀下方資訊,以深入瞭解RSSingBot基本資訊,使用者代理和訪問控制等。
WordPress.com bots
WordPress.com bots蜘蛛/爬蟲屬於資訊流型別,由Automattic Inc.開發執行。您可以繼續閱讀下方資訊,以深入瞭解WordPress.com bots基本資訊,使用者代理和訪問控制等。
Feedspotbot
Feedspotbot蜘蛛/爬蟲屬於資訊流型別,由Feedspot開發執行。您可以繼續閱讀下方資訊,以深入瞭解Feedspotbot基本資訊,使用者代理和訪問控制等。
Discordbot
Discordbot蜘蛛/爬蟲屬於資訊流型別,由Discord Inc.開發執行。您可以繼續閱讀下方資訊,以深入瞭解Discordbot基本資訊,使用者代理和訪問控制等。
Awario crawler
Awario crawler蜘蛛/爬蟲屬於營銷型別,由Link-Assistant.Com開發執行。您可以繼續閱讀下方資訊,以深入瞭解Awario crawler基本資訊,使用者代理和訪問控制等。

相關文章

Related Articles