網站PDF線上文件SEO優化策略

網站PDF線上文件SEO優化策略

谷歌首次收錄PDF文件是在2001年,或者可以說從那個時候開始,搜尋引擎已經可以有能力處理PDF文件,讀取分析文件裡面的文字內容。如果您的網站存放著大量的PDF文件(如電子書),可以閱讀此文深入瞭解PDF文件SEO優化要點。

PDF格式被廣泛應用於政府,學術界以及商業環境。PDFs 有很好的相容性和一致性。他們幾乎可以應用到任何裝置且可以一直保持相同的視覺外觀。然而,如果你正在為你的網站創造新的內容,你應該考慮使用網頁而不是PDF檔案。

下面,我們會研究:

谷歌是怎樣處理PDF文件的?

PDF檔案顯示在谷歌搜尋結果裡是帶有PDF標籤的。

Google搜尋結果PDF文件標籤

譯者注:Google SEO Starter Guide (谷歌SEO新手指南)的文件格式是PDF,那麼谷歌搜尋結果會出現PDF的標籤。

PDF會被轉換並索引為HTML(超文字標記語言)。對於包含文字影象的PDF,Google使用光學字元識別(OCR)技術將文字影象轉換為文字。 PDF中的影象也會被收錄在影象搜尋結果中。

如果網頁內容跟PDF內容重複,Google會選擇索引網頁而不是PDF文件。如果頁面和PDF具有相同的內容,則Google傾向於把頁面作為重複群集(duplicate cluster)的主要版本。這意味著這些內容都會被合併到頁面中,並且這會是搜尋結果中顯示的版本。

為什麼PDF文件不利於做搜尋引擎優化(SEO)?

雖然谷歌會索引PDF且偶爾給PDF文件排名, 但是這種格式跟網頁網相比,會有一些缺點:

  1. 對移動裝置不友好。PDF 文件已被設定成在所有的裝置中都保持一致的格式。這意味著並不存在移動端友好的PDF。
  2. 缺乏定位功能。大部分PDF文件並不包括導航元素,這使人們更難搜尋其他內容。
  3. 缺乏SEO屬性。PDF檔案有很多SEO元素的等效版本,但也缺少很多單獨的連結屬性,例如nofollow,UGC和Sponsored。(編者注:WordPress出站連結可以使用Smart SEO Tool外掛自動新增nofollow屬性)
  4. 可能很少被爬蟲爬取頁面。因為PDF文件很少有變動, 與更頻繁更新的頁面相比,它們被抓取的頻率往往更低。
  5. 追蹤資料會更加困難。大多數常見的追蹤器都會在網頁上執行JavaScript, 但卻無法處理PDF文件。

話雖如此,我也很清楚某些情況下我們不得不採用PDF的形式。如果你也正面臨著這個問題,那麼繼續往下看,你會學習到該如何針對谷歌搜尋優化PDF。

如何優化PDF檔案

你常在HTML中看到的大部分頁面優化(on-page SEO)的元素,在PDF文件中具有相同的文字,並且其使用方式與以前相同。由於易訪問性特點,也有許多人仍在使用PDF文件。 因此,讓我們討論以下用一些方法對PDF檔案做搜尋引擎的優化。

  1. 寫優質的內容
  2. 增加優化過的標題
  3. 增加優化過的描述
  4. 使用相關的檔名
  5. 給圖片增加Alt屬性
  6. 使用標題
  7. 加入連結

1. 寫優質的內容

谷歌的企業使命是整合全球資訊。即使不是網頁,好內容始終是好內容。我已經在PDF文件裡看到了很多優質的內容,如技術性文件,白皮書等等。網路上一些最有價值的資訊都藏在了PDF檔案裡。

2. 增加優化過的標題

就像網頁都有標題標籤(title tag)一樣,PDF文件也有標題。請注意,許多搜尋引擎在顯示搜尋結果時,會使用PDF的標題來描述文件。如果PDF沒有標題,則檔名將顯示在SERP中。

以下是如何在Adobe Acrobat Pro中編輯PDF標題的方法:

  • 單擊檔案>屬性
  • 編輯標題欄位

PDF文件標題優化

譯者注:Adobe Acrobat Pro軟體開啟PDF文件,在導航欄選中檔案(File),點選屬性(Properties)。在彈出的彈窗中的標籤(Title)一欄即可編輯標題。

3. 增加優化的描述

與網頁的Meta描述(Meta Description)一樣,這不是排名因素(ranking factor),但可以讓你控制搜尋結果中顯示的文字。

  • 單擊檔案(File)>屬性(Properties)
  • 單擊其他Meta資料(Additional Metadata)
  • 編輯描述

PDF文件描述優化

譯者注:Adobe Acrobat Pro軟體開啟PDF文件,在導航欄選中檔案(File),點選屬性(Properties),  在彈出的彈窗右下角的藍色按鈕其他Meta資料(Additional Metadata), 編輯描述(Description)。

4. 使用相關的檔名

PDF的檔名將是URL的一部分。這將影響URL的搜尋結果顯示,且是影響很小的排名因素。

  • 單擊檔案(File)>另存為(Save As)
  • 編輯檔名(File Name)

PDF文件檔名優化

譯者注:Adobe Acrobat Pro軟體開啟PDF文件,在導航欄選中檔案(File),點選另存為(save as),編輯檔名(file name),然後儲存(save)。

5.給圖片增加Alt屬性

為了幫助搜尋引擎瞭解影象的內容,你可以在pdf文件中的影象中新增Alt文字。(編者注:這有跟文章頁面內容的圖片ALT替代文字一個代理)

  • 點選左側邊欄中的標籤(Tags)圖示
  • 在文件分層結構(document hierarchy)中查詢要新增Alt文字的影象
  • 右鍵點選圖片
  • 單擊屬性(Properties
  • 在框中新增相關的替代文字(alternate text

PDF文件影象ALT替代文字

6. 使用標題

就像網頁中的標題標籤(H1-H6)一樣,你可以給PDF裡特定的文字指定標題。

  • 點選左側邊欄中的標籤(Tags)圖示
  • 在文件層次結構中找到要編輯的文字
  • 右鍵點選標籤
  • 單擊屬性(Properties)
  • 從下拉選單中選擇相關的標題級別(Heading Level)

PDF標題層級優化

跟任何頁面一樣,內部(internal)和外部連結也會影響排名。連結之間可以傳遞權重(PageRank),其錨文字可以提供相關的語境。通過給你的PDF文件增加連結以及從你的PDF文件中的連結指向到其他頁面,可以讓整個網站的連結都在互相傳遞權重,而不是製造死衚衕。一些PDF文件會獲得很多連結。拉里·佩奇(Larry Page)曾經說過:“事實證明,獲得諾貝爾獎的人被10,000篇不同的論文引用”。

我們來看看這個GDPR檔案。它有來自823個反鏈域名(referring domains)77K的連結指向它,但他根本沒有連結指向外部。它錯失了一個大好機會,它完全可以給這個PDF檔案建立一些內部連線(internal links)來指向其他頁面,從而提高其他頁面的排名。

PDF線上文件反向連結

谷歌的這個例子就做得更好。他們的SEO入門指南(SEO Starter Guide)PDF有來自754個反鏈域名(referring domains)的3.37K連結,並且他們給其他頁面傳遞價值這方面就做得很好了,通過把PDF的連結指向外部來提高頁面的權重。

反向連結與來源地址

谷歌搜尋引擎優化入門指南

你可以按照以下步驟在PDF文件裡增加連結:

  • 單擊右側欄中的“編輯PDF”(Edit PDF)按鈕
  • 單擊連結(Link)的下拉選單,選中編輯(Edit)選單。
  • 單擊新增/編輯網站或文件連結(Add/Edit Web or Document Link
  • 在要連結的文字週圍繪製一個矩形
  • 在連結型別(Link type)設定為不可見矩形(Invisible Rectangle
  • 在連結操作(Link Action)選中開啟網頁(Open a web page)這一欄
  • 新增你的網址(URL)

PDF連結佈局

小提示. 上面的截圖和指引是用Acrobat Pro DC軟體演示的,使用方法會跟你所使用的軟體有所不同。

怎樣追蹤PDF的瀏覽量?

如前所述,PDF更加難以跟蹤。因此,許多營銷團隊會關閉PDF的下載渠道或者設定只有使用者填完表單才允許下載。通過這種方式,他們的重點將從追蹤績效轉移到了開發潛在客戶上。但是,有一些可以追蹤你的PDF情況的方法,包括:

事件追蹤

你可以追蹤PDF連結的點選量,並將其傳送到你的分析系統。這可以讓你檢視人們點選PDF檔案下載或開啟它們的次數。你可以在此處瞭解如何進行設定。

嵌入

如果你使用JavaScript或iframe將PDF嵌入到頁面中,則只能用那個頁面自身的資料做分析了。

中間跟蹤指令碼

這是一個複雜的解決方案,通過中間跟蹤指令碼(intermediate tracking script)來傳送PDF的點選量。這是一個可以在你把PDF發給使用者之前,先把點選資料先傳送到你的分析系統。在此處你可以找到示例。

伺服器日誌

由於PDF檔案儲存在伺服器上,因此對檔案的任何訪問請求都會被記錄在你的日誌檔案 (log files)中。

第三方資料

由於在分析系統中PDF很少會被追蹤,因此有時你擁有的最佳資料會來源其他地方,例如Google Search Console或Ahrefs。 Ahrefs還可以為你提供有關哪些競爭對手的PDF獲得最多自然流量的資料。只需將域名(Domain)貼上到網站分析(Site Explorer)中,然後轉到“首頁”(Top Pages)報告並搜尋包含.pdf的URL。

oracle官網PDF文件

譯者注:開啟Ahrefs,點選導航欄的網站分析(Site Explorer),並且把你想搜尋的網站的域名放到輸入框裡。點選側邊欄的Top  Pages,在搜尋選單裡選擇“Any”且輸入包含“.pdf”的頁面。

寫在最後

但願我能說服你,在大多數情況下,你應該在網頁而不是在PDF上建立新內容。但是對於舊的PDF來說,應該優化PDF還是將其轉化為頁面形式呢?在傳統的SEO方式中,我會說“這要視情況而定”。我真的認為這樣的做法沒有對與錯之分。選擇對你來說更簡單的方法就好。任何一種方法都會帶來積極的影響,但是這取決於你的精力和資源。那麼,這個問題的答案會是優化PDF文件,把PDF文件轉化為頁面,或者用其他方法。

(via ahrefs.com 譯者,Cindy Chen,文章有改動)

評論留言