Google的網路爬蟲不斷在網際網路上搜尋新的和更新的網頁。
當這些爬蟲為站點的內容編制索引時,它們不僅僅使用該資訊來提供搜尋結果。他們備份頁面並將它們新增到名為 Google Cache 的統一資料庫中。
您可能已經使用 Google 快取檢視已關閉或未正確載入的舊版本網站。但是您知道您也可以使用它來解決您網站上的問題嗎?它甚至可以幫助您進行SEO工作。
本文介紹了Google Cache及其檢查方法。我們還將瞭解Google快取如何提供幫助 – 以及何時不應過分依賴它。
- 什麼是谷歌快取?
- 為什麼Google快取很重要
- 如何檢視Google快取
- 使用Google快取的原因
- Google快取的限制
- 為什麼找不到快取的網頁?
- 如何解決網站快取頁面的問題
- 如何從Google快取中刪除頁面
什麼是谷歌快取?
Google快取頁面是在Google抓取過程中獲取的頁面內容的原始HTML備份。谷歌快取作為一個整體由這些備份頁面組成。
如果您檢視網站的快取版本,它可能看起來很像該網站在被抓取時的樣子。但有幾個原因有時會出現與您預期不同的情況。
兩個主要原因是:
- 網頁由您的瀏覽器呈現,而不是由 Google呈現。這可能會導致與網站的當前版本存在差異。
- JavaScript不會儲存到快取中,因此您網站的某些部分可能會丟失。
在快取頁面的頂部,您會看到一個橫幅,顯示三件事:
- 快取頁面的URL — 這通常是您要訪問的URL。在某些情況下,例如重定向的URL,它會有所不同。
- 快取此版本頁面的日期– 您可以檢視您正在檢視的快取頁面是昨天還是上週建立的。這不一定是最後一次抓取您的網頁;我們稍後會講到。
- 版本— 您可以選擇檢視完整版本、純文字版本或頁面來源。完整版向您顯示瀏覽器呈現的頁面。純文字版本已關閉CSS且不顯示影象,但您仍會看到超連結。單擊檢視原始碼會顯示頁面的原始碼:
閃電博主頁的快取版本示例
為什麼Google快取很重要
Google Cache的主要用途是供人們瀏覽網際網路。它允許他們檢視已關閉或載入有問題的網頁。
作為網站所有者,Google快取至關重要還有其他原因。您希望您的網站永遠不會關閉或出現故障,但它確實發生了。擁有快取可使使用者可以使用您的內容,即使某些內容無法正常工作。
您還可以使用您網站的快取版本來了解您的網站是如何編入索引的並診斷問題。請繼續閱讀以瞭解更多資訊。
如何檢視Google快取
您如何從Google搜尋引擎結果訪問快取的Google頁面取決於您使用的裝置型別。在桌面Web瀏覽器中,您有兩個選擇:
- 您可以點選指向Google搜尋結果中頁面快取版本的連結。
- 可以直接進入頁面。
在移動瀏覽器上,您只能選擇使用直接URL。
從Google搜尋結果檢視快取頁面
即使您有從搜尋結果頁面檢視快取站點的經驗,您也可能希望閱讀本文,因為Google在2021年初改變了查詢快取連結的方式。
首先,在Google上搜尋您要檢視的頁面。在搜尋結果中頁面的URL旁邊,您應該會看到一個下拉的三角圖示。單擊它們,會出現一個標有“頁庫存檔”的彈出視窗:
Google 的“頁庫存檔”功能
此功能目前處於測試階段。它旨在讓您在單擊之前瞭解有關站點的更多資訊(例如它是否安全)。
在某些情況下,您可能看不到頁庫存檔按鈕。這可能意味著頁面沒有被快取;我們稍後會討論這意味著什麼。
但是,如果您使用的是移動裝置,則不會看到任何頁面的按鈕。在這種情況下,請繼續閱讀以瞭解檢視快取頁面的其他方法。
修改URL檢視快取頁面
對於這種方法,您必須知道要檢視的頁面的URL。只需進入cache:website.xyz
搜尋欄。
例如,cache:www.wbolt.com
將帶您直接訪問我們快取的主頁。
檢視谷歌快取的其他工具
您不需要任何特殊工具來檢視快取頁面;谷歌本身就讓它變得非常容易。但是有一些工具具有您可能喜歡的功能。
Chrome的Web快取檢視器擴充套件程式允許您右鍵單擊任何連結以檢視頁面的Google快取版本和Wayback Machine Web存檔版本。
來自Small SEO Tools的Google Cache Checker可讓您一次檢視最多五個頁面快取的URL和日期:
谷歌快取檢查器
使用Google快取檢視頁面的舊版本
您的頁面說它是昨天快取的,但您想檢視上週的版本。谷歌快取可以嗎?
抱歉不行。
Google只能向您顯示快取頁面的一個版本。要檢視以前的網站版本,您可以使用Wayback Machine之類的工具,這是過去網頁版本的存檔。
看看我們以前的樣子!
Wayback Machine上的2016 閃電博網站。
使用Google快取的原因
事實是,還有其他工具可用於完成以下所有工作——在許多情況下,是更復雜的工具。
但是Google快取因其快速且易於檢查而難以匹敵。這使其成為監視網頁某些方面的一種有價值的方式。
作為網站所有者,您可以通過以下五種方式使用Google快取。
1.檢查重複內容
有時,您單擊快取的連結並進入與您預期不同的頁面。
發生這種情況的原因之一是重複的內容。當Google看到兩個高度相似的頁面時,它可能會決定不在索引中將它們分開。這導致只有一個被儲存在快取中。
Google 在同一連結下快取多個頁面可以提醒您您的網站上有重複的內容。重複的內容不僅會造成令人困惑的快取情況——它對SEO不利。
請藉此機會檢查這兩個頁面並找到區分它們的方法。
2. 驗證Google是否遵循您的規範標籤
也許您網站上的重複內容是有意為之,但您已新增rel=canonical
標籤來告訴Google抓取哪個版本。
檢查您不想抓取的頁面之一的Google快取版本。您應該被帶到規範頁面的快取。
3. 確保您的營銷工作已被抓取
您已經加大了SEO或內容製作的力度,並且希望確保Google正在將這些更改編入索引。
快速檢視頁面的快取版本可以告訴您它已被抓取。
請注意,如果您的更改未出現在快取頁面上,則它們可能仍被編入索引。如果您擔心,可以前往Google Search Console的URL Inspector進行確認。但是,如果您在快取中看到您的更新,您就知道它們已被編入索引,並將開始影響您的搜尋結果排名。
4. 密切關注競爭對手網站的變化
當競爭對手突然佔據您的位置時,您會關心自己的事情,享受您在關鍵關鍵字的搜尋結果頂部的位置。他們做了什麼才能到達那裡?您可以使用Google快取來查詢。將他們的快取頁面與當前版本進行比較——您將能夠看到競爭對手最近所做的更改。
5. 檢索您網站的最新版本
您應該始終備份您的網站,以防萬一。也就是說,有時最壞的情況會發生,即使是最有準備的人。
雖然您網站的Google快取版本不會取代完整備份,但它有時確實可以讓您在災難發生之前檢視頁面的外觀。您可以使用它來檢索丟失的舊內容或程式碼。
Google快取的限制
谷歌的快取可以提供有用的資訊,如果有什麼東西看起來很奇怪,它可能值得調查。但谷歌快取有一些已知的限制。
谷歌快取不會告訴你你的頁面最後一次抓取的時間
讓我們從最大的誤解之一開始。
很多人認為每次Googlebot抓取頁面時都會更新快取。關於這個主題的許多其他文章會告訴您使用快取來檢視您的頁面被抓取的頻率。
這不是真的。
我們知道,因為谷歌的約翰·穆勒 (John Mueller) 在幫助主題中親自告訴我們,他說:
一般來說,我們並不總是在每次抓取頁面時更新快取頁面。特別是當頁面沒有顯著變化時,我們可能會選擇只保留 [原文如此] 上的舊日期。
這是一個專業提示:如果您正在尋找有關Google抓取您網站的頻率、原因以及使用哪些漫遊器的資訊,請忘記快取。該資料位於Google Search Console上。您可以在側邊欄中的“設定”下找到抓取報告。
但是,您只能在域級別檢視此資訊。Search Console不會告訴您每個頁面的抓取頻率。
頁面可能無法正確呈現
幸運的是,在這方面已經取得了一些進展。Google的Web Rendering Service用於在Web上呈現實時頁面,它曾經基於過時的Chrome版本。因此,最新的瀏覽器有時呈現快取頁面的方式與Google呈現的當前頁面不同。
自2019年以來,Google Web Rendering Service使用最新版本的Chrome。
但是,如果您的Chrome版本較舊,或者您使用的是其他瀏覽器,則快取頁面可能無法正確呈現。
另一個渲染問題與缺少資源有關。Google備份的程式碼可能會引用CSS或JavaScript等資源。如果這些資源不再存在或已更改,則頁面將無法正確呈現。
顯示錯誤頁面
我們已經研究了重複的內容或不正確的規範標籤如何導致Google快取顯示錯誤的頁面。正如您可能想象的那樣,這限制了檢視特定網頁快取的用處。
某些頁面未快取
這可能會讓人感到意外,但事實證明,許多頁面根本沒有被快取。
一個普遍的誤解是,未快取的網站意味著Google認為它不是必不可少的,但這不一定是真的。接下來,我們將檢視頁面可能不會被快取的一些原因。
為什麼我找不到快取的網頁?
並非所有被抓取的頁面都被快取。如果您的頁面沒有快取版本,請不要驚慌!這並不意味著您的頁面尚未編入索引。
404錯誤表示頁面沒有快取版本
如果您擔心它確實沒有被編入索引,您可以使用Google Search Console的URL Inspector進行檢查。
為了證明索引頁面並不總是被快取,我們回到谷歌的約翰穆勒。在Twitter上,他回答了一位使用者詢問未快取頁面的問題:
我們不會快取我們索引的所有頁面,所以這可能會發生。有時需要一段時間,有時我們根本不快取它。
當使用者問他未快取的網站是否總是低質量時,他說:
它可以是各種奇怪的技術怪癖的頁面。快取有點獨立,所以它不代表我們索引和排名的內容。
換句話說,快取頁面不是排名因素。即使您的網頁沒有快取版本,您也可以將其置於搜尋結果的頂部。
但是未快取的頁面仍然值得研究。您可以探索幾種不同的可能性。
您的頁面是基於JavaScript的
與其他網頁相比,Google可以更輕鬆地為某些基於JavaScript的網頁編制索引。但是許多JavaScript頁面最終都沒有快取,甚至沒有索引。
這是因為大多數HTML直到JavaScript執行後才會載入。如果沒有可索引的內容,Google將不會建立快取頁面。
元標記阻止快取
在你的網頁的HTML程式碼元標記noindex
是指頁面無法通過谷歌進行索引,另外noarchive
也會阻止谷歌快取阻止它。任何一個都將導致頁面不被谷歌快取。
也許這正是你想要的。但是如果您沒有意識到頁面上有一個noindex
ornoarchive
標記,刪除它可以解決您的快取丟失問題。
該頁面是重複的(或谷歌認為是)
如果Google確定您的兩個頁面是重複的,請想辦法使它們獨一無二。考慮每個頁面的不同搜尋意圖。
如何解決網站快取頁面的問題
您的頁面不必被快取,但如果您想實現它,您可以做一些事情。
將您的頁面提交給Google
如果您擔心Google根本沒有將您的網頁編入索引,您可以檢視Google Search Console。
在Search Console頂部的 URL 檢查搜尋欄中輸入頁面的URL。如果是“URL is on Google”的結果,則該頁面已被編入索引。如果該頁面最近發生了變化,並且您認為Google未將新版本編入索引,則可以單擊請求編入索引,請求Google對其重新編入索引。
您可能還會得到“Page is not on Google”的結果。如果這樣做,請向下滾動,您將能夠看到有關該頁面的一些詳細資訊。例如,您可以檢查該頁面是否允許抓取以及使用者選擇的規範是否與Google選擇的規範相匹配。要請求索引,請單擊請求索引:
Google Search Console-URL索引請求
如果你希望您的網站頁面URL可以主動提交至Google Search Console,請求編入索引,您可以安裝搜尋推送外掛來實現。
檢查常見站點問題
我們已經介紹了您的頁面可能不會被快取的幾個原因,例如大量JavaScript和重複的內容。
除此之外,鼓勵頻繁索引的最好辦法就是建立一個高質量的站點。確保您已針對移動裝置優化了您的網站,並且您的網站速度很高。
如果您的頁面載入時間太慢,它甚至會減慢Google的漫遊器速度,從而導致索引延遲。
如何從Google快取中刪除頁面
我們認為Google快取非常有用,但出於各種原因,您可能不希望將舊版本的網頁儲存在Google的伺服器上。例如,您可能不希望停產產品的頁面可用。
防止頁面快取的一種方法是使用上面提到的noindex
和noarchive
標籤。如果您想保留頁面但從不希望它們被快取,這些標籤是理想的永久解決方案。
您也可以直接要求Google從Google快取中刪除網址。要做到這一點,去谷歌搜尋控制檯,並單擊側邊欄的刪除。然後單擊新要求。此時,您有兩個選項:暫時刪除網址和清除快取的網址。
臨時刪除意味著該網址在大約六個月內不會出現在Google搜尋結果中。快取也會消失。該頁面將在再次上線時重新索引並重新快取(如果您不希望發生這種情況,則必須新增元標記)。
清除快取的URL正是它聽起來的樣子。快取會被移除,但是當網站被抓取時頁面會被再次快取。
如果您希望更新頁面的舊版本消失,這是一個很好的方法。您還可以通過在更改頁面後提交用於索引的頁面來推動Google更新頁面的快取。
小結
谷歌快取並不是傳聞中的一切。你不能用它來檢查你的網站上次被抓取的時間——擁有它不會提高你的搜尋引擎排名。有時,它儲存的網站版本很奇怪、不完整或完全錯誤。
但谷歌快取對網站所有者有其用處。這是檢查您的網站是如何編入索引的一種快速方法,它可以幫助您發現和診斷問題。您還可以使用Google Search Console來提高您的搜尋引擎排名。
評論留言