如何修復“Your Sitemap Appears to Be An HTML Page”錯誤

錯誤型別:
WP內部錯誤
錯誤名稱:
您的站点地图似乎是HTML页面
英文名稱:
Your Sitemap Appears to Be An HTML Page
錯誤描述:
通常,其中一些信息位于您的主站点地图中。其他人必须有他们特殊的专用站点地图。最后,它们都需要适当地格式化为XML或其他支持的格式,而不是HTML。

如何修復“Your Sitemap Appears to Be An HTML Page”錯誤

WordPress中的錯誤訊息往往令人困惑且難以解決,但幸運的是,“您的站點地圖似乎是HTML頁面(Your sitemap appears to be an HTML page)”錯誤並不是其中之一。

如果您遇到過這個問題,您可能想知道這個錯誤是什麼意思,您的站點地圖是HTML有什麼問題,以及如何解決這個問題。如果您的站點地圖已經採用正確格式,但您仍然看到此錯誤怎麼辦?

我們將帶您瞭解所有內容:站點地圖的工作原理、它應採用的格式以及解決此問題的幾種不同方法。

  1. 什麼是站點地圖?
  2. 如何生成XML站點地圖
  3. 如何修復站點地圖錯誤
  4. 您真的需要站點地圖嗎?

什麼是站點地圖?

您知道搜尋引擎如何找到您的網站嗎?答案是使用一個叫做網路爬蟲的方便的小機器人——一種由搜尋引擎傳送的自動化工具,用於索引您網站的頁面。

網路上有數百萬個頁面,人類不可能收集有關每個站點的資訊。網路爬蟲通過網際網路,快取每個頁面和媒體上的資訊。

這看起來很簡單,但Google不會自動知道您何時向網站新增新頁面,例如何時釋出部落格文章或在您的商店中釋出新產品。他們會定期傳送網路爬蟲訪問您的網站並檢視是否有任何更改,但該過程不是即時的。

當您擁有一個龐大的網站時,即使經過多次訪問,爬蟲也很容易錯過關鍵頁面。當此類頁面不經常連結時,這主要是一個問題。

這就是站點地圖可以幫助爬​​蟲的地方。這些XML檔案不同於您網站上的常規頁面;它們通常是人類無法讀取的,也不應該被訪客看到。但是網路爬蟲可以使用它們來確保所有內容都被索引。

XML站點地圖的示例

XML站點地圖的示例

它們的工作方式是簡單地列出您網站上的所有頁面及其連結層次結構,以及您網站上的其他檔案,例如影象和視訊。它可確保Google看到您網站上的所有內容並相應地改進SEO。

如果您使用過諸如Google Analytics或Google Search Console 之類的工具,那麼您可能已經看到連結到站點地圖的選項。當Google將網路爬蟲傳送到您的網站時,他們會首先引用此資訊。

Google Search Console的主頁

Google Search Console的主頁。

HTML和XML站點地圖之間的差異

所以你的站點地圖是一個HTML頁面,但究竟有什麼問題呢?為什麼谷歌要你改變它?

站點地圖必須以特定格式編寫,以便網路爬蟲能夠理解它們。大多數情況下,它需要是一個XML檔案。他們也可以閱讀RSS、Atom、KML或文字檔案,但XML是最常見的選擇。

RSS Feed的示例

RSS Feed的示例

XML代表“可擴充套件標記語言”。它是一種與HTML非常相似的網路語言。不同之處在於它的用途:雖然它是人類可讀的,但它的主要功能是幫助機器編碼文件和讀取資料。

在這種情況下,它可以幫助網路爬蟲瞭解您網站上的頁面和其他媒體的位置以及它們如何相互互動。

但是您可能已經在非常不同的上下文中看到過“站點地圖”這個詞。HTML站點地圖確實存在,但最大的區別在於它們是為人類製作的,而不是為網路爬蟲製作的。

如果您曾經單擊過站點導航的連結,並在該站點上找到了人類可讀且設計精美的頁面列表,那麼這在技術上稱為站點地圖。但是,雖然它可以對您的訪問者有所幫助,但這並不是Google所尋找的。

對於大多數使用者來說,XML站點地圖看起來像是一堆不可讀的程式碼或一堵巨大的連結牆,因此如果您想向您的站點新增一個有用的導航頁面,請隨意在其旁邊建立一個HTML站點地圖……但您必須建立一個XML站點地圖也是如此。

站點地圖示例

站點地圖示例

其他型別的站點地圖

當您想到站點地圖時,您想到的可能是您站點上的頁面的簡單列表。但谷歌使用幾種不同型別的站點地圖來對各種資訊進行編目。這些包括:

  • 視訊:您網站上的視訊可以特別編入索引以顯示在Google視訊結果中。
  • 影象:影象也是如此。某些影象,例如嵌入在Javascript程式碼中的影象,通常不會編入索引。圖片站點地圖有助於確保您的站點出現在Google圖片中。
  • 新聞:寫專欄?Google在其搜尋中設有專門的Google新聞部分,而新聞站點地圖可以確保您正確地出現在該部分並獲得更多流量。
  • 程式碼谷歌索引程式碼片段以幫助程式設計師搜尋程式碼和檔案
  • 地理資料:您可以使用特殊的KML站點地圖向Google提供關於您的業務所在位置的更好資料。

通常,其中一些資訊位於您的主站點地圖中。其他人必須有他們特殊的專用站點地圖。最後,它們都需要適當地格式化為XML或其他支援的格式,而不是HTML。

如何生成XML站點地圖

如果您有意提交了指向HTML站點地圖的連結,則需要將其替換為XML檔案。如果您不知道如何製作,可以通過多種不同的方式使用WordPress外掛和生成器來建立它,您可以在網上找到這些外掛和生成器。

即使您的XML站點地圖無法正常工作,重新生成或提交不同的站點地圖也可以解決問題。

獲取站點地圖有兩種簡單的方法:使用外掛或使用站點地圖生成外掛。

使用外掛生成站點地圖

使用WordPress,在您的網站上獲取動態更新站點地圖的最簡單方法是下載外掛。這樣,您就不必手動將任何檔案上傳到您的伺服器。

有很多外掛可以生成站點地圖:

  • Yoast SEO儲存庫中最受歡迎的SEO外掛還附帶生成站點地圖。您可以在SEO > General > Features and XML Sitemaps下找到設定。
  • RankMath除了普通的站點地圖,這個SEO外掛還可以生成WooCommerce站點地圖和KML地理資料站點地圖。轉到RankMath > Sitemap Settings
  • XML Sitemaps顧名思義,XML Sitemaps會生成一個站點地圖。該外掛是100%免費和開源的,因此沒有隱藏費用。
  • XML Sitemap & Google News此外掛生成XML站點地圖和Google新聞站點地圖。安裝和設定也毫不費力。
  • Companion Sitemap Generator – HTML & XML如果您想在XML站點地圖旁邊生成HTML站點地圖,這是適合您的外掛。兩者都會自動更新,因此您無需進行任何手動工作。
  • Smart SEO Tool:這是閃電博專門針對國內站長開發的WordPress SEO優化外掛,附帶Sitemap生成支援。注:國外大部分Sitemap外掛生成的網站地圖不適用於百度搜尋資源平臺。

站點地圖生成器網站生成Sitemap

除了外掛,您還可以使用站點地圖生成器,例如XML-SitemapsXML Sitemap Generator。然後您可以將其上傳到您的網站。

第 1 步:使用上述站點之一或您選擇的任何生成器生成站點地圖。下載XML文件。

XML-Sitemaps生成器

XML-Sitemaps生成器

 

第 2 步:下載FileZilla或(如果支援)使用您的網路主機通過FTP連線到您的站點。

第 3 步:將XML檔案放入站點的根資料夾中。根目錄是您站點的最頂層目錄 – 與您第一次連線時開始的目錄相同。

如何修復站點地圖錯誤

站點地圖錯誤通常是由意外提交HTML頁面而不是格式正確的XML檔案引起的。但是如果您的XML站點地圖仍然聲稱是HTML頁面,那麼您可能會遇到更深層次的問題。

不用擔心:問題通常在於您的WordPress外掛中易於修復的衝突。以下是一些讓您的站點地圖再次正常工作的建議。

檢查錯誤和重定向

如果您有明確的錯誤程式碼要搜尋,則診斷問題會容易得多。您應該做的第一件事是訪問您的站點地圖頁面,看看是否有任何奇怪的錯誤程式碼。

404錯誤頁面示例

404錯誤頁面示例

如果您在訪問站點地圖時發現錯誤,這將導致Google認為它看到的是HTML頁面。使用此錯誤來幫助您搜尋以解決問題。我們的HTTP狀態程式碼列表可能會有所幫助。

如果您間歇性地注意到站點地圖錯誤 – 有時出現有時不出現怎麼辦?如果您動態生成站點地圖,則可能會發生這種情況。

次要伺服器blip和超時會讀給Google,就像您的站點地圖突然變成HTML頁面一樣,因為它顯示的是錯誤訊息而不是XML檔案。只要錯誤很少見,不是持續發生或頻繁發生,通常就不必擔心。

另一件需要注意的事情是重定向。如果您訪問站點地圖頁面並突然進入主頁或無限重定向迴圈,這也會導致事情中斷。

如果您發現任何不會消失的錯誤或重定向,則問題通常在於外掛衝突。生成站點地圖的外掛(例如 Yoast)可能會導致衝突,或者快取外掛可能是問題的根源。

但有時,即使是看似隨機的外掛也會引起衝突。使用Health Check & Troubleshooting外掛來識別它們。

安裝後的Health Check & Troubleshooting外掛

安裝後的Health Check & Troubleshooting外掛

如果它不存在,請安裝它,然後轉到工具 > 站點健康 > Troubleshooting Mode。它會暫時關閉所有外掛,而不會影響您的訪問者。

檢視錯誤或重定向現在是否在您的網站上消失了。如果是,請一一重新啟用外掛,直到站點再次中斷。查詢多個外掛之間的衝突。

您現在可以聯絡外掛作者報告錯誤並尋求幫助。

禁用快取

衝突的最大原因之一是快取外掛。當站點地圖被快取時,有時會導致Google將其作為HTML頁面讀取時出現問題,因為您不應該以這種方式快取XML檔案。

大多數快取外掛會因此避免快取站點地圖頁面,但無論如何它們可能會錯誤地這樣做,尤其是當您為站點地圖使用唯一的URL時。

幸運的是,您不需要禁用整個快取外掛。您可以新增一個例外,問題應該會自動清除。

您的外掛文件應該涵蓋這一點,但這裡是如何在WP Super CacheW3 Total Cache中做到這一點。

  • 對於WP Super Cache,請轉至設定 > WP Super Cache。在Advanced選項卡下,滾動到Add here strings (not a filename) that force a page not be cached。在此部分中,輸入站點地圖的部分URL。例如,如果您的站點地圖位於“example-site.com/sitemap.xml”,請輸入“/sitemap.xml”。
  • 對於W3 Total Cache,導航到Performance > Page Cache,然後找到Advanced > Never cache the following pages。就像使用WP Super Cache一樣,輸入站點地圖URL。您可能還會將其新增到Performance > Minify下面的Never minify the following pages,因為對XML檔案進行Minify這可能會導致問題。

檢查您的站點地圖URL

雖然這是一個小建議,但始終值得仔細檢查:您提交的連結是否正確?這是一個基本的錯誤,即使一個不正確的字元也會指向錯誤的地方。

檢查您通過Google以及任何SEO或站點地圖外掛提交的連結。

一些外掛可能會在站點地圖頁面的末尾新增一個斜槓(“example-site.com/sitemap/”而不是“example-site.com/sitemap”)。這一個字元可能會導致大量問題,尤其是當它導致重定向迴圈時。

同樣,在Health Check外掛中開啟故障排除模式並嘗試查詢導致此問題的外掛。大多數情況下,您可以將其追溯到一個單獨的外掛。

刪除額外的站點地圖

雖然只要您連結到正確的頁面,它通常不會引起問題,但啟用額外的站點地圖有時可能會給您自己帶來問題或困惑。此外,您的伺服器正在花費額外的資源來更新幾個不必要的站點地圖。

外掛可能會新增不同的站點地圖,您可能不知道 WordPress 甚至會為您生成自己的站點地圖。您應該檢查這些並刪除除您要使用的之外的所有內容。您可以在您的網站上嘗試以下幾個網址:

  • /sitemap.xml — 大多數站點地圖外掛中生成的站點地圖的常見選擇。
  • /wp-sitemap.xml — 這是自5.5版以來WordPress生成的預設站點地圖
  • /sitemap_index.xml — Yoast生成的站點地圖的URL。

如果您下載了其他SEO或站點地圖外掛,它們可能完全使用不同的URL。檢查文件並確保禁用任何不需要的站點地圖功能。

您真的需要站點地圖嗎?

有時站點地圖可能會莫名其妙地成為不斷出現問題的根源。一個簡單的修復可能不足以讓它們消失。如果您不斷遇到難以解決的問題,您可能會開始質疑站點地圖是否對您至關重要。

通常鼓勵建立站點地圖,因為谷歌自己說它永遠不會因為這樣做而懲罰你的搜尋引擎優化。它只能幫助改善您的搜尋引擎優化並使您的網站更快地被索引。

但是在某些情況下並不要求您擁有它們,並且Google本身建議某些網站不要使用它們。

假設您的網站頁面少於500個,並且不可能超過這個數量。在這種情況下,只要內部連結良好(無論如何您都應該這樣做)並且沒有很多您想要在Google圖片和Google視訊中顯示的媒體檔案,您可能根本不需要站點地圖。

另一方面,它確實可以幫助您的SEO擁有站點地圖,並且擁有站點地圖並沒有什麼害處,因此推動並解決問題只會有好處。您的網站現在可能很小,但可能不會總是如此。

小結

“站點地圖似乎是一個HTML頁面”錯誤可能是一個令人討厭的錯誤,但通常只是格式不正確的頁面或易於修復的快取衝突的結果。一旦你弄清楚了問題,解決它只是幾個額外步驟的問題。

評論留言