SemanticScholarBot

基本資訊

SemanticScholarBot的基本資訊如下表。但部分不是很規範的蜘蛛和爬蟲，可能存在資訊不明的情況。

使用者代理

關於SemanticScholarBot蜘蛛或者爬蟲的使用者代理字串，IP地址和伺服器，所在地等資訊如下表格所示：

使用者代理字串: Mozilla/5.0 (compatible) SemanticScholarBot (+https://www.semanticscholar.org/crawler)

來源

IP地址(37)	伺服器名稱	所屬國家
35.160.27.221	ec2-35-160-27-221.us-west-2.compute.amazonaws.com	US
34.222.153.213	ec2-34-222-153-213.us-west-2.compute.amazonaws.com	US
18.237.112.80	ec2-18-237-112-80.us-west-2.compute.amazonaws.com	US
35.86.174.116	ec2-35-86-174-116.us-west-2.compute.amazonaws.com	US
34.214.0.70	ec2-34-214-0-70.us-west-2.compute.amazonaws.com	US
35.164.251.170	ec2-35-164-251-170.us-west-2.compute.amazonaws.com	US
52.25.26.144	ec2-52-25-26-144.us-west-2.compute.amazonaws.com	US
35.86.107.21	ec2-35-86-107-21.us-west-2.compute.amazonaws.com	US
54.212.223.46	ec2-54-212-223-46.us-west-2.compute.amazonaws.com	US
18.236.153.207	ec2-18-236-153-207.us-west-2.compute.amazonaws.com	US

來源

IP地址(2)	伺服器名稱	所屬國家
54.213.140.127	ec2-54-213-140-127.us-west-2.compute.amazonaws.com	US
54.191.153.30	ec2-54-191-153-30.us-west-2.compute.amazonaws.com	US

訪問控制

瞭解如何控制SemanticScholarBot訪問許可權，避免SemanticScholarBot抓取行為不當。

一般不要攔截。搜尋引擎爬蟲為搜尋引擎提供動力，是使用者發現您網站的有效途徑。事實上，攔截搜尋引擎爬蟲可能會嚴重減少網站的自然流量。

您可以通過在網站的 robots.txt 中設定使用者代理訪問規則來遮蔽 SemanticScholarBot 或限制其訪問許可權。我們建議安裝 Spider Analyser 外掛，以檢查它是否真正遵循這些規則。

# robots.txt

# 下列程式碼一般情況可以攔截該代理

User-agent: SemanticScholarBot

Disallow: /

# robots.txt # 下列程式碼一般情況可以攔截該代理 User-agent: SemanticScholarBot Disallow: /

# robots.txt
# 下列程式碼一般情況可以攔截該代理
User-agent: SemanticScholarBot
Disallow: /

您無需手動執行此操作，可通過我們的 Wordpress 外掛 Spider Analyser 來攔截不必要的蜘蛛或者爬蟲。

基本資訊