Awario crawler

Awario crawler蜘蛛/爬蟲屬於營銷型別,由Link-Assistant.Com開發執行。您可以繼續閱讀下方資訊,以深入瞭解Awario crawler基本資訊,使用者代理和訪問控制等。

基本資訊

Awario crawler的基本資訊如下表。但部分不是很規範的蜘蛛和爬蟲,可能存在資訊不明的情況。
蜘蛛/爬蟲名稱
Awario crawler
型別
營銷 , 資訊流
開發商
Link-Assistant.Com
當前狀態
活動

使用者代理

關於Awario crawler蜘蛛或者爬蟲的使用者代理字串,IP地址和伺服器,所在地等資訊如下表格所示:
AwarioBot/1.0
使用者代理字串
Mozilla/5.0 (compatible; AwarioBot/1.0; +https://awario.com/bots.html)
首次出現
2023-01-18 01:15:42
最後出現
2025-01-10 07:05:12
遵循robots.txt
未知
來源
IP地址(34) 伺服器名稱 所屬國家
94.130.216.182 pot17.webmeup.com DE
94.130.237.168 pot61.webmeup.com DE
94.130.237.99 pot51.webmeup.com DE
176.9.25.75 pot25.webmeup.com DE
176.9.10.174 pot12.webmeup.com DE
94.130.237.97 pot53.webmeup.com DE
46.4.105.24 pot45.webmeup.com DE
46.4.120.165 pot11.webmeup.com DE
94.130.219.230 pot9.webmeup.com DE
94.130.236.180 pot32.webmeup.com DE
94.130.237.95 pot55.webmeup.com DE
88.99.90.46 pot30.webmeup.com DE
88.99.251.222 pot21.webmeup.com DE
46.4.107.145 pot35.webmeup.com DE
46.4.104.16 pot44.webmeup.com DE
88.99.150.47 pot18.webmeup.com DE
88.99.250.16 pot27.webmeup.com DE
116.202.246.181 node01.belprime.net DE
65.21.113.251 pot30.webmeup.com FI
65.21.113.242 pot39.webmeup.com FI
37.27.129.137 pot11.webmeup.com FI
65.21.113.246 pot35.webmeup.com FI
65.21.113.243 pot38.webmeup.com FI
65.21.113.202 pot17.webmeup.com FI
65.21.113.200 pot19.webmeup.com FI
37.27.129.201 pot12.webmeup.com FI
65.21.113.194 pot25.webmeup.com FI
65.21.113.205 pot14.webmeup.com FI
65.21.46.73 pot9.webmeup.com FI
65.21.113.249 pot32.webmeup.com FI
65.109.35.209 pot1.webmeup.com FI
65.21.113.198 pot21.webmeup.com FI
65.21.44.205 pot8.webmeup.com FI
使用者代理字串
AwarioSmartBot/1.0 (+https://awario.com/bots.html; bots@awario.com)
首次出現
2017-05-26 10:53:46
最後出現
2024-11-04 13:53:03
遵循robots.txt
未知
來源
IP地址(6) 伺服器名稱 所屬國家
2a01:4f8:212:246a::2 2a01:4f8:212:246a::2 DE
116.202.246.181 node01.belprime.net DE
136.243.70.68 rtc-fetcher1.awar.io DE
138.201.252.169 datanode9.webmeup.com DE
2a01:4f8:171:2a14::2 2a01:4f8:171:2a14::2 DE
2a01:4f8:222:c9c::2 2a01:4f8:222:c9c::2 DE
使用者代理字串
AwarioRssBot/1.0 (+https://awario.com/bots.html; bots@awario.com)
首次出現
2018-01-21 00:11:55
最後出現
2019-08-21 13:47:43
遵循robots.txt
未知
來源
IP地址(3) 伺服器名稱 所屬國家
88.99.2.203 rss-crawler3.awar.io DE
88.99.136.237 rss-crawler2.awar.io DE
88.99.62.159 rss-crawler1.awar.io DE

訪問控制

瞭解如何控制Awario crawler訪問許可權,避免Awario crawler抓取行為不當。

是否攔截Awario crawler?

一般不需要攔截,尤其是如果你自己也受益於搜尋引擎優化服務。不過,如果你擔心伺服器資源佔用等問題,且您都不使用這些工具,當然也可以選擇攔截它們。

通過Robots.txt攔截

您可以通過在網站的 robots.txt 中設定使用者代理訪問規則來遮蔽 Awario crawler 或限制其訪問許可權。我們建議安裝 Spider Analyser 外掛,以檢查它是否真正遵循這些規則。

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
# robots.txt
# 下列程式碼一般情況可以攔截該代理
User-agent: Awario crawler
Disallow: /
# robots.txt # 下列程式碼一般情況可以攔截該代理 User-agent: Awario crawler Disallow: /
# robots.txt
# 下列程式碼一般情況可以攔截該代理
User-agent: Awario crawler
Disallow: /

您無需手動執行此操作,可通過我們的 Wordpress 外掛 Spider Analyser 來攔截不必要的蜘蛛或者爬蟲。

更多資訊

機器人,也被稱為網路機器人、網路蜘蛛或網路爬蟲,是一種軟體應用程式,旨在以比人類更有效、更有條理和更簡潔的方式自動執行簡單和重複的任務。機器人最常見的用途是在網路蜘蛛或網路爬行中。

AwarioSmartBot和AwarioRssBot是Awario傳送的合法網路爬蟲,用於發現和收集新的和更新的網路資料(這些資料被世界各地的網際網路營銷人員進一步使用)。

AwarioSmartBot和AwarioRssBot爬蟲通過具有以下形式的使用者代理來識別:

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
AwarioRssBot/1.0 (+https://awario.com/bots.html; bots@awario.com)
AwarioSmartBot/1.0 (+https://awario.com/bots.html; bots@awario.com)
AwarioRssBot/1.0 (+https://awario.com/bots.html; bots@awario.com) AwarioSmartBot/1.0 (+https://awario.com/bots.html; bots@awario.com)
AwarioRssBot/1.0 (+https://awario.com/bots.html; bots@awario.com)

AwarioSmartBot/1.0 (+https://awario.com/bots.html; bots@awario.com)

AwarioSmartBot和AwarioRssBot爬蟲可以通過上面的使用者代理來識別。請不要試圖通過IP來識別機器人,因為我們不使用任何連續的IP塊。

我們關心你的網站的效能

AwarioSmartBot和AwarioRssBot是非常友好的網站爬蟲。我們讓它們在抓取網站時儘可能地 “溫柔”:它們每3秒只發出一次請求,如果在你的robots.txt檔案中指定了另一個抓取延遲,則會更頻繁。這些機器人尊重你在 robots.txt 檔案中指定的規則。

如果出現任何問題,可能是由於你的特定網站的特殊性,或連結到你的其他網站的錯誤。因此,我們想請你 – 如果你注意到Awario機器人的任何問題,請報告給bots@awario.com。我們將迅速為您的特定網站進行獨特的設定,使抓取永遠不會影響您網站的效能。

為什麼他們會抓取我的網站?

AwarioSmartBot和AwarioRssBot收集網路資料,這些資料被Awario應用程式進一步使用,讓網路營銷人員發現誰在網上提到他們的品牌。

如果AwarioSmartBot/AwarioRssBot爬蟲訪問過你的頁面,這意味著其內容從未被收集和分析過,也不需要重新整理。由於這個原因,你不會看到AwarioSmartBot/AwarioRssBot爬蟲對同一頁面的重複請求。

用robots.txt進行攔截

AwarioSmartBot和AwarioRssBot是:

  1. 只收集可由任何隨機訪問者訪問的公開資訊。如果你認為爬蟲收集了一些敏感資訊,請將其從公開訪問中刪除。
  2. 不能使你的網站過載並對其造成任何傷害–Awario機器人的設計非常有禮貌,它們每3秒最多隻能進行一次點選。此外,你可以通過robots.txt檔案中的指令輕鬆減緩機器人的速度。

然而,即使Awario機器人是無害的,你仍然可能想阻止機器人抓取你的網站。最簡單、最快速的方法是使用 “robots.txt”。這個文字檔案包含關於機器人應如何處理你的網站資料的指示。
使用robots.txt檔案,你可以阻止Awario爬蟲進入你的網站,或減緩它們的速度,如以下例子所示:

禁用抓取你的網站的特定部分

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
User-agent: AwarioRssBot
User-agent: AwarioSmartBot
Disallow: /private/
User-agent: AwarioRssBot User-agent: AwarioSmartBot Disallow: /private/
User-agent: AwarioRssBot
User-agent: AwarioSmartBot
Disallow: /private/

整站禁用抓取

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
User-agent: AwarioRssBot
User-agent: AwarioSmartBot
Disallow: /
User-agent: AwarioRssBot User-agent: AwarioSmartBot Disallow: /
User-agent: AwarioRssBot
User-agent: AwarioSmartBot
Disallow: /

限制爬蟲頻率

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
User-agent: AwarioRssBot
User-agent: AwarioSmartBot
Crawl-delay: 10
User-agent: AwarioRssBot User-agent: AwarioSmartBot Crawl-delay: 10
User-agent: AwarioRssBot
User-agent: AwarioSmartBot
Crawl-delay: 10

關於爬蟲的更多資訊

關於爬蟲的更多資訊,請參考http://www.robotstxt.org/。

獲得支援

如果您對AwarioSmartBot或AwarioRssBot仍有任何疑問,請通過郵箱取得聯絡:bots@awario.com。

常見蜘蛛/爬蟲

Common Spiders
Matchory Bot
Matchory Bot蜘蛛/爬蟲屬於營銷型別,由Matchory GmbH開發執行。您可以繼續閱讀下方資訊,以深入瞭解Matchory Bot基本資訊,使用者代理和訪問控制等。
Googlebot
GoogleBot蜘蛛/爬蟲屬於搜尋引擎型別,由Google Inc.開發執行。您可以繼續閱讀下方資訊,以深入瞭解GoogleBot基本資訊,使用者代理和訪問控制等。
Online Domain Tools
Online Domain Tools蜘蛛/爬蟲屬於監控型別,由AITIS s.r.o.開發執行。您可以繼續閱讀下方資訊,以深入瞭解Online Domain Tools基本資訊,使用者代理和訪問控制等。
AhrefsBot
AhrefsBot蜘蛛/爬蟲屬於營銷型別,由Ahrefs Pte Ltd開發執行。您可以繼續閱讀下方資訊,以深入瞭解AhrefsBot基本資訊,使用者代理和訪問控制等。
SEMrushBot
SEMrushBot蜘蛛/爬蟲屬於營銷型別,由Semrush Inc開發執行。您可以繼續閱讀下方資訊,以深入瞭解SEMrushBot基本資訊,使用者代理和訪問控制等。
DotBot
DotBot蜘蛛/爬蟲屬於營銷型別,由SEOmoz, Inc.開發執行。您可以繼續閱讀下方資訊,以深入瞭解DotBot基本資訊,使用者代理和訪問控制等。
SentiBot
SentiBot蜘蛛/爬蟲屬於營銷型別,由SentiOne開發執行。您可以繼續閱讀下方資訊,以深入瞭解SentiBot基本資訊,使用者代理和訪問控制等。
Awario crawler
Awario crawler蜘蛛/爬蟲屬於營銷型別,由Link-Assistant.Com開發執行。您可以繼續閱讀下方資訊,以深入瞭解Awario crawler基本資訊,使用者代理和訪問控制等。

相關文章

Related Articles