如何建立XML網站地圖(Sitemap)以更符合搜尋引擎收錄要求

如何建立XML網站地圖(Sitemap)以更符合搜尋引擎要求

為您的網站新增網站地圖,谷歌、百度和必應就會更好地索引所有內容?要是這麼簡單就好了。XML 網站地圖是網站優化中最容易被誤解的工具。然而,正確實施網站地圖可以極大地影響搜尋引擎對網站的感知和抓取。

什麼是XML網站地圖?

XML 網站地圖是搜尋引擎的網站目錄。

普通網站地圖可以幫助訪客瀏覽網站,而 XML 網站地圖則可以幫助搜尋引擎瞭解網站的結構和內容。

下面是網站地圖的樣子:

XML網站地圖

當您新增新的產品頁面、釋出博文或更新服務專案時,您需要 Google(和其他引擎)儘快找到並索引這些內容。

網站地圖包括哪些內容?

您的 XML 網站地圖會告訴 Google 有關每個頁面的四個重要資訊。

1. 位置 (loc)

這是頁面的 URL,必須是完整的 URL。

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
<loc>https://www.dreamhost.com/products/blue-widget</loc>
<loc>https://www.dreamhost.com/products/blue-widget</loc>
<loc>https://www.dreamhost.com/products/blue-widget</loc>

2. 最後修改日期(lastmod

顯示內容更新時間的時間戳。

微軟必應團隊強調,包含 lastmod 標籤對有效抓取“至關重要”。

谷歌特別關注有意義的更新。

根據他們的文件,“如果<lastmod>值持續且可驗證(例如,通過與頁面的最後一次修改進行比較)準確,Google 就會使用該值”。

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
<lastmod>2024-11-30T14:30:00+00:00</lastmod>
<lastmod>2024-11-30T14:30:00+00:00</lastmod>
<lastmod>2024-11-30T14:30:00+00:00</lastmod>

谷歌還解釋了如何檢視頁面更新的 lastmod 日期:

“該值應反映頁面最後一次重要更新的日期和時間。例如,頁面上主要內容、結構化資料或連結的更新通常被視為重要更新;但版權日期的更新則不被視為重要更新”。

3. 更改頻率 (changefreq)

內容更新的頻率。以下是一些示例值:

  • 對於您的主頁:daily 或 always
  • 對於產品頁面:weekly
  • 部落格文章:monthly
  • 關於頁面:yearly
  • 其他頁面:never
Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
<changefreq>weekly</changefreq>
<changefreq>weekly</changefreq>
<changefreq>weekly</changefreq>

4. 優先順序(priority

與其他頁面相比的相對重要性。該值範圍為 0 至 1:

  • 主頁:1.0
  • 主分類頁面:0.8
  • 產品頁面:0.6
  • 部落格文章:0.4
  • 存檔頁面:0.2
Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
<priority>0.8</priority>
<priority>0.8</priority>
<priority>0.8</priority>

您的網站需要XML網站地圖嗎?

我們強烈建議您為網站建立網站地圖。雖然大多數人建議只有在以下情況下才建立網站地圖

  • 非常大的網站
  • 擁有大量檔案的網站
  • 只有少量連結指向的新網站
  • 使用富媒體內容的網站

谷歌認為,有了適當的內部連結,他們的爬蟲就能自然地找到您的內容。

現實是什麼?大多數網站都無法實現完美的內部連結結構。每個現代網站都能從 XML 網站地圖中獲益。

原因如下:

網際網路的複雜性與日俱增,使正確的網站索引變得越來越具有挑戰性。您應儘量為搜尋引擎提供每一個可能的細節,幫助他們找到您的內容。

XML 網站地圖不僅能幫助發現內容,還能提高整個抓取過程的效率,幫助優化利用抓取預算

網站地圖中應新增哪些頁面?

您的網站包含兩種不同型別的頁面。

網站地圖中應新增哪些頁面

1. 搜尋登陸頁面

使用者應通過搜尋找到的頁面:

  • 產品頁面
  • 類別列表
  • 部落格文章
  • 服務描述
  • 關鍵資訊頁面

2. 實用頁面

具有一定功能但不應 出現在搜尋中的頁面:

  • 登入頁面
  • 訂單確認頁面
  • 密碼重置表單
  • 感謝頁面
  • 管理部分

您的 XML 網站地圖 應僅 包含搜尋登陸頁面。包含實用頁面會降低網站的感知質量,並浪費搜尋引擎寶貴的抓取資源。

如何建立XML網站地圖?

建立 XML 網站地圖有多種選擇,包括手動建立和自動解決方案。

讓我們從最簡單的方法開始,然後再學習更高階的方法。

手動建立網站地圖

對於小型靜態網站,您可以使用任何文字編輯器手動建立 XML 網站地圖。

建立一個名為“sitemap.xml”的新檔案,並使用此基本結構:

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://www.yourwebsite.com</loc>
<lastmod>2024-01-01</lastmod>
</url>
</urlset>
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://www.yourwebsite.com</loc> <lastmod>2024-01-01</lastmod> </url> </urlset>
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://www.yourwebsite.com</loc>
<lastmod>2024-01-01</lastmod>
</url>
</urlset>

為每個要包含的頁面新增一個新的 <url> 塊。雖然這種方法適用於小型網站,但隨著網站規模的擴大,這種方法就變得不切實際了。

WordPress網站的解決方案

如果你執行的是 WordPress 網站,那麼你已經擁有了幾款強大的搜尋引擎優化工具

  • Smart SEO Tool:這是閃電博開發的外掛,提供自動 Sitemap 地圖生成支援,且還包括 TDK、圖片 SEO、連結優化和 robots.txt 等一系列功能。
  • All in One SEO 提供全面的網站地圖功能,包括支援自定義帖子型別以及根據內容年齡和型別自動計算優先順序。在“yourdomain.com/sitemap.xml”中訪問網站地圖。
  • Yoast SEO:最受歡迎的 WordPress 網站地圖生成工具。安裝後,網站地圖會在“yourdomain.com/sitemap_index.xml”中自動生成。您可以通過外掛設定控制網站地圖中出現的內容型別。
  • Rank Math:提供與 Yoast 類似的功能,但包含 Google 新聞網站地圖和視訊網站地圖等附加功能。您的網站地圖可在 “yourdomain.com/sitemap.xml ”中找到。
  • WordPress 核心:自 5.5 版起,WordPress 就包含了基本的網站地圖功能。不過,大多數搜尋引擎優化專業人員更喜歡專用外掛,因為它們具有額外的控制和功能。

非WordPress網站的解決方案

如果您使用其他平臺構建網站,它們很可能有建立這些網站地圖的內建解決方案。

如果您沒有使用其他平臺,而是建立了一個完全自定義的網站,那麼您就需要依賴外部網站地圖生成器,並定期將自動生成的網站地圖上傳到您的網站伺服器。

以下是幾款不錯的網站地圖生成器:

  • XML-Sitemaps.com上傳你的網站結構或讓它抓取你的網站來生成網站地圖。
  • Screaming Frog根據您的要求抓取您的網站並生成網站地圖。
  • Sitebulb Website Crawler通過強大的洞察力簡化 XML 網站地圖的建立,從而優化網站結構。

如何向谷歌提交網站地圖

生成網站地圖只是整個過程的開始。您需要告訴谷歌在哪裡可以找到它。

雖然谷歌最終可能會通過您的 robots.txt 檔案發現您的網站地圖,但通過谷歌搜尋控制檯直接提交會大大加快這一過程。

提交之前

首先,確保您的網站地圖能夠正常執行。一個損壞的網站地圖會浪費 Google 和你的時間。在瀏覽器中訪問 “yourdomain.com/sitemap.xml”。你應該看到一個格式正確的 XML 檔案,而不是錯誤頁面。

專業提示:如果您看到的是亂碼,不用擔心,這是正常現象。XML 檔案在瀏覽器中通常看起來很亂。重要的是您可以看到列出的 URL。

通過谷歌搜尋控制檯提交

  • 登入 Google Search Console。
  • 選擇網站屬性。
  • 從左側邊欄進入“Sitemap”部分。
  • 在“新增新網站地圖”欄位中輸入網站地圖 URL,然後點選提交

谷歌搜尋控制檯

根據您使用的是域名屬性還是 URL 字首,您需要輸入完整的 URL,或者只輸入域名後面的部分。

例如,在上圖中,你可以看到我們輸入了完整的 URL,因為它是域名屬性。

下面是 URL 字首屬性的情況–在這裡,你只需要輸入域名後面的部分:

提交Sitemap至谷歌

您通常會將 XML 網站地圖儲存為“https://yourdomain.com/sitemap.xml”或 “sitemap_index.xml”。

Google 會立即檢查網站地圖是否存在基本錯誤。您將看到以下狀態指示器之一:

  • 成功:Google 可以正確讀取網站地圖。
  • 無法獲取:Google 無法訪問您的網站地圖。
  • 無法讀取:Google 找到了您的網站地圖,但無法處理。

瞭解網站地圖報告

提交後,Google Search Console 會向您顯示

  • 您提交了多少個 URL。
  • Google 實際索引了多少個 URL。
  • Google 最後一次讀取網站地圖的時間。

重要: 如果索引的 URL 數量與提交的 URL 數量不同,請不要驚慌!谷歌不會因為網頁在網站地圖中就將其索引,請記住,這只是一個建議,而不是命令。

多個網站地圖

對於大型網站,您可能有多個網站地圖:

  • 產品網站地圖
  • 部落格文章網站地圖
  • 分類網站地圖
  • 圖片網站地圖

分別提交每個網站地圖,以幫助 Google 更好地瞭解您的網站結構,並更輕鬆地跟蹤索引問題。

向必應提交網站地圖

雖然谷歌在搜尋領域佔據主導地位,但聰明的搜尋引擎優化專業人員知道搜尋引擎多樣化的價值。必應占據了很大一部分搜尋流量,尤其是在某些人群和地區。此外,他們的網站管理員工具往往能提供其他地方找不到的獨特見解。

你會發現,當你點選“新增新網站”時,它會給你兩個選擇–“從 GSC 匯入你的網站”或“手動新增你的網站”。

向必應提交網站地圖

從Google Search Console匯入網站

已經在 Google Search Console 中驗證了您的網站?你很幸運!Bing 提供簡化的匯入流程,可為您節省寶貴的設定時間。

  1. 前往必應網站管理員工具
  2. 單擊“從 Google Search Console 匯入”。
  3. 按照驗證步驟操作。
  4. 您的網站詳細資訊(包括網站地圖)將自動傳輸!

手動提交網站地圖

對於新手或喜歡手動控制的使用者,Bing 的直接提交流程非常簡單:

  • 導航至必應網站管理員工具。
  • 選擇“手動新增網站”。
  • 輸入網站的 URL。
  • 通過首選方法驗證所有權:
    • 上傳 XML 檔案。
    • 新增元標籤。
    • 新增 CNAME 記錄。

手動提交網站地圖

從左側邊欄進入網站Sitemap,然後點選提交網站地圖

提交網站地圖

最後,新增完整的網站地圖 XML 並點選提交。

常見的提交錯誤

在必應網站管理員工具中,你只會看到“錯誤”或“成功 ”字樣,點選該行可獲得有關錯誤的更多詳細資訊。

但是,對於 Google Search Console,你會在那裡看到錯誤。

如果出現“無法獲取”,請檢查以下問題

  • 您的網站地圖 URL 是否正確。
  • 您的網站可以訪問。
  • 您的 robots.txt 檔案沒有阻止網站地圖。

如果出現“無法讀取”,請確認

  • 您的 XML 語法有效。
  • 使用了正確的 XML 模式。
  • 檔案沒有壓縮或損壞。

提交後

定期監控網站地圖狀態。注意

  • 索引頁面急劇下降。
  • 提交的URL與索引的URL之間的差距越來越大。
  • 網站地圖報告中的警告資訊。

請記住:向 Google 等搜尋引擎提交網站地圖是一個持續的過程,而非一次性任務。隨著網站的成長和變化,請不斷監測和更新網站地圖。

關於 XML 網站地圖的常見誤區

讓我們來澄清一些關於 XML 網站地圖及其在搜尋引擎優化中的作用的頑固誤解。

誤區 1:網站地圖可確保Google索引

許多網站所有者認為提交網站地圖意味著自動索引。但將網頁新增到網站地圖並不能保證谷歌會將它們收錄到搜尋結果中。

谷歌的演算法會根據頁面質量、獨特性和對使用者的整體價值等諸多因素來決定索引內容。網站地圖只是向谷歌提出一個溫和的 建議:“嘿,這些頁面值得你關注”。

就像在主導航選單中新增頁面一樣,這是 Google 用來了解網站結構和內容層次的眾多訊號之一。

誤區 2:網站地圖中應包含所有頁面

網站所有者通常會將整個網站結構新增到網站地圖中,認為越多越好。

網站地圖只應包含您真正希望使用者通過搜尋找到的頁面。儘量將網站地圖的大小保持在 50,000 個 URL 以下,未壓縮的檔案大小保持在 50MB 以下。

UTF-8編碼也有助於搜尋引擎正確讀取網站地圖,而正確的XML格式則可防止解析錯誤,以免影響您的工作。

問題是,如果您開始包含登入頁面、感謝頁面或重複內容,就會向 Google 表明,您並不瞭解哪些內容對使用者真正重要。

把網站地圖想象成餐廳選單。你不會列出廚房、儲藏室或員工浴室–你只會顯示顧客可以點的菜。

誤區 3:更新頻率並不重要

網站地圖是活文件。

即使手動更新看起來很麻煩,您也需要使用某種形式的自動化來自動更新網站地圖,將新發布的重要頁面新增到網站地圖中。

包含已刪除頁面或缺少新內容的過時網站地圖實際上會損害網站的抓取效率。谷歌爬蟲在檢查不存在的頁面時會浪費寶貴的時間,同時還有可能錯過您的新內容。

網站地圖應反映網站的當前狀態,就像地圖需要顯示當前的道路和地標才能發揮作用一樣。

誤區 4:所有 XML 標籤都同樣重要

很多人都在花時間完善自己的變更頻率和優先順序值,認為它們會對 Google 的行為產生重大影響。

URL位置(loc)和最後修改日期(lastmod)是XML網站地圖中僅有的兩個必備元素。其他標籤提供了上下文,但不會直接影響抓取或索引決策。

因此,將精力集中在維護準確的 URL 和最後修改日期上,就完全不用擔心優先順序和更改頻率了。

小結

您的 XML 網站地圖講述了您網站的組織結構和優先順序。因此,要讓搜尋引擎有時間閱讀和處理它。

這裡有一點需要注意:質量勝於數量。包含最佳頁面的網站地圖比包含所有內容的雜亂無章的目錄更勝一籌。

評論留言