深入瞭解權威連結(Canonical URL)標籤

權威連結(Canonical URL)標籤

想要了解什麼是權威連結(Canonical URL)標籤?以及如何使用它們來避免重複內容對SEO優化的影響?權威連結標籤並不是什麼新事物。它們自 2009 年就一直存在——算是十年來出現的最好的東西。

它們由 Google、微軟和雅虎聯合建立。目的?為網站所有者提供多快好省的方法,以解決重複內容問題。

有效嗎?是的,堪稱完美…但前提是你知道如何好好利用它們!

在本指南中,你將會學習到:

什麼是權威連結標籤?

權威連結標籤是一種 HTML 程式碼片段,主要用於定義重複、近似重複或類似頁面的主要版本。換句話說,如果不同的網址上出現了相同或相似的內容,則可以使用權威連結標籤去指定一個應該被索引的主要版本。

權威連結標籤

 

權威連結標籤的形式

權威連結標籤使用簡單一致的語法,放置在網頁的 <head> 部分中:

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
<link rel="canonical" href="https://example.com/sample-page/" />
<link rel="canonical" href="https://example.com/sample-page/" />
<link rel="canonical" href="https://example.com/sample-page/" />

說得明白點,每個部分的含義如下:

  1. link rel=”canonical”:帶有此標記的連結是此網頁的主(權威)版本。
  2. href=”https://example.com/sample-page/”:可以在這個網址找到權威版本。

所有頁面均應指定有效的權威連結,以更好地幫助搜尋引擎如何處理重複的URL。當您網站上的一組URL返回相同內容時,搜尋引擎將為該內容選擇一個唯一的URL,稱為權威連結。 此URL被爬取的頻率將更高,在搜尋結果中將優先於其他重複內容的URL,並且將重複內容的URL的反向連結視為連結(權重傳遞)到權威連結。請注意,通過將頁面的權威連結設定為自身來對頁面進行 *”self-canonicalizing”* 既有效又有用,因為它可以幫助消除潛在的重複,例如當頁面可以與跟蹤URL引數連結時。要建議頁面的規範網址,您可以1)新增一個 <link rel="canonical" href="..."> 至頁面 <head> 標籤中的標記(最常見)或2)新增 Link: <...>; rel="canonical" 至頁面響應標頭。

權威連結標籤對於SEO的重要性

Google並不喜歡重複的內容,因為這讓它們很難抉擇:

  1. 要索引哪一個頁面版本?(它們只會索引一個!)
  2. 哪一個頁面版本可在相關查詢中拔得頭籌?
  3. 是否應該在一個頁面上整合出一個”連結權益”,或者在多個頁面版本之間進行拆分?

再說過多的重複內容也會影響你的”抓取配額”。這意味著Google最終可能會放棄浪費時間,抓取同一頁面的多個版本,而不是發掘出你網站上的其他重要內容。

蜘蛛頁面內容爬取

 

關於抓取配額的真相?

當然,應該儘可能避免讓Google浪費時間去抓取重複的內容。但是,Google表示,這對大多數網站來說只是小菜一碟。

如果新的網頁往往會在釋出當天被抓取,那麼抓取配額不是網站管理員需要關注的東西。同樣,如果一個站點的網址少於幾千個,那麼大多數時候它都會被有效抓取。

權威連結標籤解決了所有這些問題。它們能讓Google知道你想索引和排名哪個頁面版本,以及在哪裡鞏固 “連結權益”的位置。

未能指定權威內容頁面網址?Google會自行解決此問題

如果你沒有指明權威內容頁面網址,我們會識別出我們認為最佳版本或網址。

像這樣單純地依賴Google也並不是一個好主意。它們可能會選擇一個你並不希望成為權威頁面的版本。

重要提示:Google申明它們通常會尊重你設定的權威頁面網址,但是也不乏有例外。
請注意,即使你明確指定了你的權威頁面,Google也可能出於各種原因(例效果或內容因素)選擇另外一個。

使用權威連結標籤,其最佳效果就是可以有效降低Google忤逆我們意願設定權威網頁的風險。

但我並沒有重複的內容,不是嗎?

鑑於你可能沒有多次釋出相同的帖子和頁面,很容易推得知你的網站並沒有重複的內容。

但搜尋引擎抓取的是網址,而不是網頁。 這意味著他們將 example.com/product 和 example.com/product?color=red 視為不同的網頁,即使它們具有相同或相似的內容。

這被稱為網址引數化,它們是出現重複內容的常見原因,尤其是在帶有分面/過濾導航的電商網站上。

例如, Brown Bag Clothing 銷售的是襯衫。下列是其主目錄頁的網址:

https://www.bbclothing.co.uk/en-gb/clothing/shirts.html

如果僅僅選擇加大號的襯衫,在網址後面會加上這樣一個引數:

https://www.bbclothing.co.uk/en-gb/clothing/shirts.html?Size=XL

又如果接著你只想看加大的藍色襯衫,又是另外一個引數了:

https://www.bbclothing.co.uk/en-gb/clothing/shirts.html?Size=XL&color=Blue

在Google眼中,這些頁面都是不同的,儘管它們的內容差異微乎其微。

但並不僅僅是電商網站是此問題的受害者。

以下是重複內容出現在所有型別網站的一些其他常見原因:

  • 為搜尋引數設定了引數化網址(例如 example.com?q=search-term)
  • 為會話  ID 設定了引數化網址(例如https://example.com?sessionid=3)
  • 具有單獨的可列印的版本頁面(例如 example.com / page 和example.com/print/page)
  • 為不同類別的帖子設定唯一的網址(例如 example.com/services/SEO/ 和 example.com/specials/SEO/)
  • 擁有不同裝置型別的頁面(例如 example.com 和 m.example.com)
  • 擁有頁面的 AMP 和非 AMP 版本(例如 example.com/page 和amp.example/page)
  • 在非 www / www 和非 https / https 變體上提供相同的內容(例如 https://example.com  和 http://www.example.com)

碰到這些情況,好好利用權威連結標籤就很有必要了。

此外,跨域重複內容問題也是一個頭痛點。如果你正在進行內容聯合(例如,如果報紙想要在其網站上逐字地重發你的內容),那麼你應該要求他們為原始網址新增權威連結。

這樣做可以從該報紙上引來推薦流量,同時降低Google排名錯誤網址的風險。

小提示.

有些網站可能會拒絕新增權威連結。在這種情況下,是否想承擔風險取決於你自己。如果你這樣做,最好關注那個聯合網頁排名,以防其超過原始網頁

權威連結標籤實操的基礎知識

權威頁面操作很易實現。我們將在稍後討論四種不同的方法。但無論選擇哪種方法,都應該牢牢記住五條黃金法則。

規則一:使用絕對的網址

Google的 John Mueller 表示,最好不要使用帶有 rel =”canonical” 連結元素的相對路徑。

你可以使用其中任何一個,但為了保證它們被正確詮釋,我建議你使用絕對網址。
— @JohnMu2018 年 10 月 24 日

所以你應該使用下列架構:

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
<link rel="canonical" href="https://example.com/sample-page/" />
<link rel="canonical" href="https://example.com/sample-page/" />
<link rel="canonical" href="https://example.com/sample-page/" />

而不是:

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
<link rel="canonical" href="/sample-page/" />
<link rel="canonical" href="/sample-page/" />
<link rel="canonical" href="/sample-page/" />

規則二:使用小寫的網址

因為 Google 可能會將大寫和小寫網址視為兩個不同的網址,因此你需要先確保在伺服器上使用的是小寫網址,然後對你的權威連結標籤也使用小寫網址。

規則三:使用正確的域名版本(HTTPSHTTP

如果你切換到了 SSL,請確保未在權威連結標籤中宣告任何非 SSL(即 HTTP)的網址。這樣做理論上會導致混亂或者某些意外的結果。如果你位於安全的域名中,請確保使用以下版本的網址:

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
<link rel="canonical" href="https://example.com/sample-page/" />
<link rel="canonical" href="https://example.com/sample-page/" />
<link rel="canonical" href="https://example.com/sample-page/" />

而不是:

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
<link rel="canonical" href="http://example.com/sample-page/" />
<link rel="canonical" href="http://example.com/sample-page/" />
<link rel="canonical" href="http://example.com/sample-page/" />
小提示. 如果你使用的是 HTTP,則相反。

規則四:使用自引用權威連結標籤

Google的 John Mueller 說,雖然這不是強制性的,但我們推薦使用自引用權威連結標籤。

我建議(使用)自引用權威頁面,因為它的確可以讓我們清楚地知道你要索引哪個頁面,或索引時網址應該是什麼樣的。就算你有一個網頁,有時仍會有不同的網址變體使頁面的版本增加。例如,結尾的引數,依據情況,可能使用的是大寫小寫或 www和非 www。所有這些東西都可以通過  rel 權威連結標籤進行清理。——John Mueller, Google 網站管理員、趨勢分析師

如果你不太清楚自引用權威頁面是如何工作的,它主要是網頁中一個指向自身的頁面上的權威連結標籤。例如,假設網址為 https://example.com/sample-page,則該網頁上的自引用權威頁面標籤將為:

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
<link rel="canonical" href="https://example.com/sample-page" />
<link rel="canonical" href="https://example.com/sample-page" />
<link rel="canonical" href="https://example.com/sample-page" />

大多數現在流行的 CMS 都會自動新增自引用網址,但如果想使用自定義的 CMS,則需要讓開發人員對其進行硬編碼。

規則五:每頁一個權威連結標籤

如果該網頁包含多個權威連結標籤,則 Google 會將兩個標籤一同忽略

在我們多次宣告 rel = canonical 的情況下,Google可能會忽略所有的  rel = canonical 暗示。

如何使用權威連結標籤?

這裡有四種指定權威內容網址的方法:

  1. HTML 標籤(rel = canonical)
  2. HTTP 標頭
  3. 站點地圖
  4. 301 重定向*

有關於每種方法的優缺點,請參閱 Google 官方檔案。

1.使用 rel =”canonical”HTML 標籤設定權威內容頁面

使用 rel = canonical 標籤是指定權威內容網址最易操作又行之有效的方法。 只需將以下程式碼新增到任意帶重複內容網頁的<head> (開頭)部分。

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
<link rel="canonical" href="https://example.com/canonical-page/" />
<link rel="canonical" href="https://example.com/canonical-page/" />
<link rel="canonical" href="https://example.com/canonical-page/" />

舉例說明:假設你有一個銷售 T 恤的電商網站。你想讓 https://yourstore.com/tshirts/black-tshirts/ 成為權威內容網址,即使該頁的內容可通過其他網址來訪問(例如 https://yourstore.com/offers/black-tshirts/)

只需將任何重複的頁面新增下列的權威連結標籤:

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
<link rel="canonical" href="https://yourstore.com/tshirts/black-tshirts/" />
<link rel="canonical" href="https://yourstore.com/tshirts/black-tshirts/" />
<link rel="canonical" href="https://yourstore.com/tshirts/black-tshirts/" />

注意:如果你使用的是 CMS,則無需亂弄頁面程式碼。這裡有一種更簡單的方法。

在 WordPress 中設定權威連結標籤:我們在安裝 Yoast SEO 後,即可自動新增自引用權威連結標籤。若想要設定自定義權威頁面,請使用每個帖子或網頁上的”高階”部分。

Yoast SEO外掛權威連結設定
在 Shopify 中設定權威連結標籤:Shopify 自身預設為產品和部落格新增自引用權威連結標籤。若想要設定自定義權威頁面,我們需要直接編輯模板(.liquid)檔案。該板塊包含更多有關如何實操的資訊。

在 Squarespace 中設定權威連結標籤:與 Shopify 的情況一樣, Squarespace 也會預設新增自引用網址。但是,如果想新增自定義權威頁面,則需要直接編輯程式碼。

2. 在 HTTP 標頭中設定規範 權威頁面

對於像 PDF 這樣的文件,由於沒有網頁的 <head> 部分,因此無法在網頁開頭插入權威連結標籤。碰到這種情況,你需要使用 HTTP 標頭來設定權威頁面。
舉例說明
可以想象一下,我們建立了此博文的 PDF 版本並將其寄存在我們的部落格子資料夾(ahrefs.com/blog/*)中。

我們的HTTP標頭對那個檔案可能是長這樣的:

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
HTTP/1.1 200 OK
Content-Type: application/pdf
Link: <http://ahrefs.com/blog/canonical-tags/>; rel="canonical"
HTTP/1.1 200 OK Content-Type: application/pdf Link: <http://ahrefs.com/blog/canonical-tags/>; rel="canonical"
HTTP/1.1 200 OK 
Content-Type: application/pdf 
Link: <http://ahrefs.com/blog/canonical-tags/>; rel="canonical"

3. 在站點地圖中設定權威內容頁面標籤

Google宣告非權威內容頁面不應包含在站點地圖中,只有權威內容頁面才能位列其中。這是因為Google會將站點地圖中列出的頁面視為你向其建議的權威內容頁面。

但是,他們也並不總是選擇站點地圖中的網址作為權威內容頁面。

我們不保證我們會將站點地圖網址視為權威,但這是為大型網站定義權威內容頁面的一個簡單方法,這也是個通過站點地圖告訴Google你自己認為哪些網頁在網站上最重要的有效方式。

4. 用 301 重定向設定權威內容頁面標籤

如果想要將流量從重複網址轉移到權威內容頁面的版本上去,那就使用301重定向吧。
舉例說明
假設你的網頁可以通過以下網址訪問:

  • example.com
  • example.com/index.php
  • example.com/home/

這時選擇一個網址作為權威內容頁面,並重定向剩下的兩個網址。 對於網站的安全 HTTPS / HTTP 的 www /非 www 版本們亦如是。

選擇一個權威版本並將其餘版本重定向到該版本。

例如,ahrefs.com 的權威頁面版本是 HTTPS 的非 www 網址(https://ahrefs.com),那麼以下三個網址都要重定向:

  • http://ahrefs.com/
  • http://www.ahrefs.com/
  • https://www.ahrefs.com/

點選閱讀我們實施 301 重定向的完整指南

如何規避常見的權威化錯誤?

權威化是一個有點複雜的話題。因此,大家對於如何正確權威化仍存在著許多誤會、誤解。 以下是人們在嘗試權威化時常犯的一些錯誤:

錯誤一:用 robots.txt 阻止權威化的網址

用 robots.txt 阻止的網址不會被Google抓取到,這意味著它們無法在該網頁上看到任何權威內容頁面標籤。對應地,這也阻止了它們將”連結資產”從非權威變成權威。

錯誤二:將權威化網址設定為 “noindex”

永遠不要混淆 noindex 和 rel = canonical 這兩者。它們是相互矛盾的指示。
正如 John Mueller 在此所述,Google通常會將權威內容頁面標籤優先於 “noindex” (無索引)標籤。但這仍然是一個不好的做法。如果你想要無索引和權威化的網址,請使用 301 重定向。不然,請使用 rel = canonical。

錯誤三:為權威化網址設定 4XX HTTP 狀態程式碼

為權威化網址設定4XX HTTP狀態程式碼與使用 “noindex” 標籤會得到相同的結果:Google將無法檢視權威內容頁面標記並將”連結資產”轉移到權威頁面版本。

錯誤四:將所有分頁頁面權重化為根頁面

不應將分頁頁面權重化為系列中的根頁面。相反,應該在所有分頁頁面上使用的自引用權威內容頁面。

為什麼?正如Google的John Mueller在Reddit上所說的,這是 rel = canonical 的錯誤用法。

既然這篇文章是關於權威化的,我們主要應該避免的是使用第 2 頁上的 rel = canonical 指向第 1 頁。但第 2 頁並不等同於第 1 頁,所以如此使用 rel = canonical 是不正確的。——John Mueller, Google網站管理員、趨勢分析師

你還應該使用 rel = prev / next 標籤進行分頁。雖然Google不再使用它們了,但必應仍然在用

錯誤五:不使用帶有 hreflang 的權威內容頁面標籤

hreflang 標籤的作用是指定網頁的語言和地理定位。

Google表示,在使用 hreflang 時,你應該”使用相同的語言指定權威內容頁面,若在沒有的情況下則應使用最佳替代語言”。

如何查出並修復此類權威化錯誤?

權威化過程中很容易出錯,因此定期稽覈你的網站以查詢出與權威內容頁面標籤相關的問題並儘快修復它們是很有必要的。

這項工作,你可以交給 Ahrefs 網站診斷工具-Site Audit tool。網站診斷工具可以抓取到超過 100 個你網站存在的 SEO 問題,其中包括與權威內容頁面標籤相關的問題。

以下是網站診斷工具可能找到的 12 個與權威內容頁面標籤相關的問題,以及其解決方案:

1. 權威內容頁面指向 4XX

當一個或多個頁面被權威化為 4XX 網址時,此警告會被觸發。
問題原由:因為 4XX 頁面是無用的,所以搜尋引擎不會索引它們,這樣將會導致它們忽略指向這些頁面的任何權威內容頁面標籤,最終常常索引成錯誤的(非權威)版本頁面。
解決方法:檢視受影響的頁面,並將無用的(4XX)權威內容頁面連結替換為應編制索引的能正常工作的(200)頁面連結。

2. 權威內容頁面指向 5XX

當一個或多個頁面被權威化為 5XX 網址時,此警告會被觸發。
問題原由:5XX HTTP 狀態程式碼表示伺服器有問題,因此導致Google無法訪問權威內容頁面,而它也不太可能索引無法訪問的網頁,所以權威內容頁面有可能就這樣被忽視掉了。
解決方法:用有效網址替換所有存在錯誤的權威內容網址。如果指定的權威頁面看起來似乎是正確的,那麼請檢查伺服器配置是否錯誤。請注意,如果你的網站因維護或網站伺服器超載而導致網頁崩潰,則可能會臨時引發此類問題。

3. 權威內容頁面指向重定向

當一個或多個頁面被權威化為重定向的網址時,此警告會被觸發。
問題原由:權威內容頁面始終指向的是最具權威版本的頁面。但是對於重定向網址來說卻不是這種情況。因此,搜尋引擎可能會誤解或忽略此權威頁面。
解決方法:將出現問題的連結替換為指向頁面最權威版本的直鏈(即,回到 200 HTTP 狀態程式碼且非重定向的版本)。

4. 沒有權威內容的重複頁面

當存在一個或多個未指定權威版本的頁面重複或非常相似時,此警告會被觸發。
問題原由:由於未指定權威內容頁面,Google將會試圖在顯示的搜尋結果中選擇最合適的版本,但這可能並不是你想要索引的版本。
解決方法:檢視那些重複頁面,並選擇一個作為應在搜尋結果中被索引到的權威版本。然後將其指定為所有重複項的權威頁面版本(並將自引用權威頁面標籤新增到此版本)。

5. hreflang 到非權威內容頁面

當一個或多個頁面在其 hreflang 註釋中指定為非權威內容網址時,此警告會被觸發。
問題原由:hreflang 標籤中的連結應始終指向權威內容頁面。從hreflang註釋連結到頁面的非權威版本可能會引起搜尋引擎的混淆和誤解。
解決方法:將受影響頁面的 hreflang 註釋中的連結替換為權威內容頁面。

6. 權威內容網址沒有內部傳入連結

當存在一個或多個頁面沒有內部傳入連結時,此警告會被觸發。
問題原由:遊客們無法訪問沒有內部連結的權威內容網址。而在網站的某地,它們被定向到為非權威版本頁面。
解決方法:將所有內部連結替換為權威化頁面,並使用指向權威內容頁面的直鏈。

7. 站點地圖中存在非權威內容頁面

當存在一個或多個非權威內容頁面位列於站點地圖上時,此警告會被觸發。
問題原由:Google宣告站點地圖中不應該包含非權威內容網址。因為它們將站點地圖中的頁面視為你向其建議的權威頁面。在站點地圖中,你應該只列出你想要編入索引的頁面。
解決方法:從站點地圖中移除非權威頁面。

8. 非權威內容頁面被誤指定為權威頁面

當一個或多個頁面指定一個權威內容網址時,該網址也被權威化為不同的頁面,這將創生出一個”權威鏈”,其中頁面 A 被權威化為頁面 B,然後其又將權威化為頁面 C ,此時警告會被觸發。

權威連結頁面識別
問題原由:搜尋引擎可能會被權威鏈混淆和誤導。這樣的結果是它們可能會誤解或忽略你原本指定的權威內容頁面。
解決方法:將帶直鏈的受影響的權威頁面標籤中的非權威頁面連結替換為權威內容頁面。如果頁面 A 被權威化為頁面 B,頁面 B 又權威化為頁面 C ,則將頁面 A 上的權威頁面連結替換為指向頁面 C 的連結。

9. 開放內容網址與權威內容頁面不匹配

當一個或多個頁面上指定的權威內容頁面與開放內容網址不匹配時,此警告會被觸發。
問題原由:如果開放內容網址與權威內容頁面不匹配,那麼非權威內容頁面版本將會被共享到社交網站上。
解決方法:用權威內容頁面網址替換受影響的開放內容網址,記得確保兩者網址是一致的。

小提示. 開放內容標籤的網址必須是絕對的,並且使用的是http:// 或 https:// 協議,這與權威內容頁面情況相同。

10. 從 HTTPS 變為 HTTP 的權威內容頁面

當一個或多個安全(HTTPS)頁面將非安全(HTTP)版本指定為權威內容頁面時,此警告會被觸發。
問題原由:因為 HTTPS 是一個排名因素,所以儘可能將安全版本頁面指定為權威內容頁面是很有必要的。

小提示.Google還提出了實施 HSTS 作為可能解決方案

解決方法:HTTP 頁面等效重定向為 HTTPS。如果無法做到的話,請在 HTTP 版本頁面中新增 rel =”canonical” 連結到 HTTPS

11. 從 HTTP 變為 HTTPS 的權威內容頁面

當一個或多個非安全(HTTPS)頁面將安全(HTTP)版本指定為權威內容頁面時,此警告會被觸發。
問題原由:因為 HTTPS 優先於 HTTP,所有當擁有的 HTTP 版本的頁面時將 HTTPS 版本指定為權威內容頁面是不合邏輯的。

小提示.這種情況可能問題不大,但仍值得修復。

解決方法:實現從 HTTPHTTPS 的 301 重定向。除此之外你還應該用直接連結到 HTTPS 的頁面版本來替換所有內部連結到 HTTP 的版本。

12. 非權威內容頁面接收自然流量(organic traffic)

當一個或多個非權威內容頁面出現在搜尋結果中並獲得自然搜尋流量(Organic Search Traffic)(本不應該發生!)時,此警告會被觸發。
問題原由:要麼是權威內容頁面標籤設定錯誤要麼是Google選擇了忽略你想指定的權威頁面。
解決方法:檢查是否在所有報告的頁面上正確設定了 rel = canonical 標籤。如果不是這個問題,請使用 Google 站長工具(Google Search Console)中的網址檢查工具檢視它們是否將正確指定了你設定的權威頁面網址。如果仍然不是這個問題,請探究下為什麼會出現這種情況。

結語

權威內容頁面標籤其實也並不複雜,只是在最初很難理解。請記住,權威內容頁面標籤並不是一個指令,而是搜尋引擎的一種訊號。換句話說,它們可能會選擇與你宣告不符的權威內容頁面。

你可以使用 Google 站長工具(Google Search Console)中的網址檢查工具檢視使用者宣告的和Google選擇的權威頁面。

谷歌優先索引權威連結

評論留言