
如何做搜尋引擎蜘蛛日誌分析
搜尋引擎蜘蛛日誌檔案是一種非常強大但未被站長充分利用的檔案,分析它可以獲取有關每個搜尋引擎如何爬取網站內容的相關資訊點,及檢視搜尋引擎蜘蛛在一段時間內的行為。
IP地址(12) | 伺服器名稱 | 所屬國家 |
---|---|---|
199.47.82.17 | crawler.turnitin.com | US |
199.47.82.16 | crawler.turnitin.com | US |
199.47.82.21 | crawler.turnitin.com | US |
199.47.87.141 | 199-47-87-141.ip87.iparadigms.net | US |
199.47.87.140 | 199-47-87-140.ip87.iparadigms.net | US |
199.47.87.143 | 199-47-87-143.ip87.iparadigms.net | US |
199.47.87.145 | 199-47-87-145.ip87.iparadigms.net | US |
199.47.87.142 | 199-47-87-142.ip87.iparadigms.net | US |
199.47.87.144 | 199-47-87-144.ip87.iparadigms.net | US |
199.47.82.19 | crawler.turnitin.com | US |
199.47.82.18 | crawler.turnitin.com | US |
199.47.82.20 | crawler.turnitin.com | US |
IP地址(14) | 伺服器名稱 | 所屬國家 |
---|---|---|
199.47.87.143 | 199-47-87-143.ip87.iparadigms.net | US |
199.47.87.142 | 199-47-87-142.ip87.iparadigms.net | US |
199.47.87.140 | 199-47-87-140.ip87.iparadigms.net | US |
199.47.87.141 | 199-47-87-141.ip87.iparadigms.net | US |
38.111.147.86 | cr6.iparadigms.com | US |
38.111.147.88 | 38-111-147-088.co147.iparadigms.net | US |
38.111.147.83 | cr3.iparadigms.com | US |
38.111.147.84 | cr4.iparadigms.com | US |
3.218.67.10 | ec2-3-218-67-10.compute-1.amazonaws.com | US |
13.52.99.35 | ec2-13-52-99-35.us-west-1.compute.amazonaws.com | US |
91.92.241.173 | 91.92.241.173 | BG |
44.227.242.80 | ec2-44-227-242-80.us-west-2.compute.amazonaws.com | US |
78.153.140.179 | hostglobal.plus | GB |
3.8.211.229 | ec2-3-8-211-229.eu-west-2.compute.amazonaws.com | GB |
87.120.125.126 | 87.120.125.126 | BG |
IP地址(3) | 伺服器名稱 | 所屬國家 |
---|---|---|
38.111.147.84 | cr4.iparadigms.com | US |
38.111.147.83 | cr3.iparadigms.com | US |
38.111.147.86 | cr6.iparadigms.com | US |
IP地址(4) | 伺服器名稱 | 所屬國家 |
---|---|---|
38.111.147.83 | cr3.iparadigms.com | US |
38.111.147.86 | cr6.iparadigms.com | US |
38.111.147.84 | cr4.iparadigms.com | US |
65.98.224.7 | 65-98-224-7.static-ip.telepacific.net | US |
可能不需要,尤其是如果你自己也受益於資訊蒐集服務。不過,如果你擔心伺服器資源佔用等問題,可以選擇攔截它們。
您可以通過在網站的 robots.txt 中設定使用者代理訪問規則來遮蔽 TurnitinBot 或限制其訪問許可權。我們建議安裝 Spider Analyser 外掛,以檢查它是否真正遵循這些規則。
# robots.txt # 下列程式碼一般情況可以攔截該代理 User-agent: TurnitinBot Disallow: /
您無需手動執行此操作,可通過我們的 Wordpress 外掛 Spider Analyser 來攔截不必要的蜘蛛或者爬蟲。