如何指定抓取的起始URL?

要通過 `robots.txt` 檔案指定抓取的起始 URL,您可以使用 `Sitemap` 指令。這個指令告訴搜尋引擎蜘蛛可以在哪裡找到站點地圖檔案(sitemap.xml),而站點地圖檔案中包含了您希望搜尋引擎抓取的起始 URL。

以下是指定抓取起始 URL 的步驟:

  1. 建立一個名為 `robots.txt` 的文字檔案。您可以使用文字編輯器來建立和編輯此檔案。
  2. 在 `robots.txt` 檔案中,使用 `Sitemap` 指令,後面跟著站點地圖檔案的 URL。例如:
    Plain text
    Copy to clipboard
    Open code in new window
    EnlighterJS 3 Syntax Highlighter
    Sitemap: https://www.example.com/sitemap.xml
    Sitemap: https://www.example.com/sitemap.xml
    Sitemap: https://www.example.com/sitemap.xml
    

    這樣搜尋引擎蜘蛛就會找到並讀取該站點地圖檔案。

  3. 儲存並上傳 `robots.txt` 檔案到您的網站根目錄。確保該檔案可以通過瀏覽器直接訪問,例如 `https://www.example.com/robots.txt`。

通過指定 `Sitemap` 指令,您可以提供一個站點地圖檔案的連結,讓搜尋引擎蜘蛛知道您希望它們抓取和索引的起始 URL。請確保站點地圖檔案的連結正確,並且檔案中包含了您期望搜尋引擎蜘蛛抓取的 URL 資訊。注意,不是所有的搜尋引擎都支援 `Sitemap` 指令,但大多數搜尋引擎會遵循該指令進行抓取。

未能解決您的問題?

請提交 聯絡工單