早些時候,我們對AI內容生成進行了介紹並推薦了幾款AI內容檢測器。今天,我們將測試更多的AI內容生成檢測工具,羅列它們的優點和缺點,以及使用它們時應注意的事項。
隨著每天都有新的ChatGPT替代品出現,AI內容檢測器也越來越受歡迎。
在這篇文章中,我將分享16個這樣的檢測器,並向你展示它們是如何對我未發表的原創文章中的一些段落與ChatGPT中關於同一主題的一些段落進行評分。
我還將介紹人工智慧檢測器適合(和不適合)的功能型別,以及營銷人員、編輯和SEO應該如何考慮它們。
AI內容生成帶來的問題及檢測工具幫助領域
正如我在其他文章中詳述的那樣,生成性人工智慧和ChatGPT內容帶來了幾個問題:
- 人工智慧生成的資訊可能與事實不符、危險、過時或誤導。
- 人工智慧的寫作輸出可能是不合格的。
- 雖然對人工智慧內容沒有明確的懲罰,但谷歌可能並不總是像人類創造的內容那樣信任和看待它。
- 人工智慧內容可能能夠 “愚弄” 編輯或企業,他們認為自己在為人類創造的內容付費。
- 人工智慧內容可能會利用人類的創造性工作,並在沒有歸屬的情況下重新使用它。
值得注意的是,目前的人工智慧檢測器並沒有解決所有這些問題。
大多數情況下,這些工具不會對人工智慧內容進行事實核查,改善或審計內容質量,或為從其他來源獲取的資訊提供引證。
也就是說,人工智慧檢測器可以幫助的領域包括:
- 抄襲:許多這類工具都有內建的抄襲檢測功能,因此可以檢查人工智慧內容是否主要來自其他來源。
- 懲罰預防:如果你擔心人工智慧內容在搜尋結果中被貶低,這些工具可以幫助你瞭解人工智慧內容有多容易被發現。(當然,谷歌無疑會有不同的工具和檢查)。
- 稽覈人工智慧的使用:如果你有一個特定的政策或方式來補償作家的原創內容與人工智慧生成的內容,這些工具可以讓你大致瞭解作家是否使用人工智慧來生成內容。(請注意,它們也可以返回錯誤的否定和肯定結果)。
- 瞭解搜尋結果:其中一些工具提供Chrome擴充套件,可以幫助你瞭解競爭對手和其他網站是否使用AI內容。
AI生成內容檢測軟體如何工作
每個工具都是不同的,有其解決問題的方法。但在大多數情況下,ChatGPT檢測工具是根據一段內容中的短語選擇的可預測程度對內容進行評分。
換句話說,內容被評為人工智慧與人類的可能性,與檢測軟體是否認為一篇文章遵循人工智慧在生成內容時可能遵循的模式有很大關係。
圍繞這一過程的兩個核心概念被稱為:
- Burstiness: 句子結構的可預測長度和節奏。
- Perplexity: 在一個句子或句子集合中所選擇的詞語的隨機性。
例如,在一篇關於美國建國的文章中,生成性人工智慧極不可能包括一個隨機的、不均勻的關於他們第一次看到企鵝的軼事,所以在檢測工具看來,這可能是人類的寫作。
類似於ChatGPT檢測器的出現是為了檢測生成性人工智慧的寫作,人們已經在開發工具來繞過這些檢測器。(當然:檢測器可能已經在考慮如何檢測繞過者,等等)。
像Undetectable或Quillbot這樣的工具會重寫你的內容,有時會使某些AI檢測工具更難檢測到。
此外,有幾個人找到了不同的提示,讓ChatGPT和其他人工智慧寫作工具輸出的內容在人與人工智慧的評分中 “更像人”,他們使用的提示是定義突發性和困惑性,並告訴ChatGPT在寫作時要多注意這兩點。
檢測精度對你重要嗎?
在你深入研究這些工具之前,需要回答的一個重要問題是::
你對檢測內容是否為人工智慧所寫有多大的興趣?以及為什麼?
如果你使用ChatGPT改寫標題標籤或生成電子郵件副本,也許這些內容是否 “通過” 人工智慧寫作檢查根本不重要。
此外,如果作家使用人工智慧生成文案,而且文案很好,也許分數一點都不重要。
這些檢測工具很可能會與我上面提到的未檢測工具和提示語進行 “檢測軍備競賽”。
最佳人工智慧寫作檢測器的比較
如果你還在尋找一個AI/ChatGPT內容檢測器,我們將逐一介紹它們,以及它們在評估人類生成的文案與AI文案與使用該提示語試圖 “擊敗檢測” 的AI文案時的 “得分”。
注意:檢測與幾段內容的對比不一定是對這些工具的檢測能力的徹底測試。希望它能給你一個粗略的感覺,讓你知道它們是如何對不同的內容進行評分的,以及你可以從這些型別的工具中看到的結果範圍。
(你可以檢視輸入工具的實際樣本–由我編寫的 “人類” 樣本,由ChatGPT通過GPT-4編寫的 “人工智慧” 樣本,以及基於同一主題的最新副本)。
在下面的表格中,你可以看到每個工具對我從頭開始寫的副本、我從ChatGPT直接取來的、沒有修改提示的副本,以及用 “perplexity和burstiness” 提示調整的同一副本的評分:
以下是對錶中所包括的工具及其一些主要特點的簡要概述。
1. Originality.AI
Originality.AI是一個付費工具,被描述為 “為嚴肅的內容出版商建立的最準確的AI內容檢測器和抄襲檢查器”。
它的費用為每個信用點0.01美元,可掃描100個字。它在人工智慧掃描器的旁邊還設有一個抄襲掃描器。
從上圖可以看出,這是唯一的人工智慧掃描器,具有100%的信心,認為人類的內容是人類的,人工智慧的內容是人工智慧的(同時也在所有情況下是正確的)。
Hive Moderation(在文章後面討論)基本上有相同的結論,人類內容的AI得分是0%,而兩個AI生成的文字有99.9%的信心是AI。
除了有一個Chrome擴充套件程式和一個總分之外,Originality.AI還增加了一個功能,突出了你貼上的內容中它預測會是和不會是AI的具體部分。
我個人最經常使用這個工具來檢查AI內容。我最經常使用的情況是檢查與我們合作的自由撰稿人提交的內容是否為人工智慧和剽竊。
2. Writer
Writer提供了一個免費的檢測器,可以對1500個字元進行檢測,更多的則需要API訪問。
這個工具基本上認為所有提交的內容都比較可能是人類產生的。
Writer是一個人工智慧寫作平臺,免費的內容檢測器也允許你輸入一個URL來檢查。
這個工具內沒有直接的抄襲功能,它給你一個總分,但不會把特定部分標記為可能或不可能是人工智慧生成的。
3. Copyleaks AI Content Detector
Copyleaks人工智慧內容檢測器有幾個有趣的功能:
- 它給你一個總體判斷(人類或AI)。
- 如果你將滑鼠懸停在特定的文字上,它將給你一個百分比的可能性,即該文字是人類的還是AI的副本。
- 它預先載入了不同GPT和人類輸出的例子,向你展示該工具是如何工作的。
有 - 一個Chrome擴充套件。
該工具是免費的,雖然一次掃描不能同時進行,但也有一個剽竊檢測器。
它準確地將許多人類生成的內容識別為人類,將許多人工智慧生成的內容識別為人工智慧。然而,它並不總是自信,在某些個別部分是不正確的。
4. OpenAI’s AI Text Classifier
AI Text Classifier是OpenAI的一個免費工具,該公司建立了GPT(這是執行許多生成性AI工具的工具)和ChatGPT。
如果你認為製造最受歡迎的人工智慧工具的公司會有最準確的檢測器,那麼在我們的測試中,這並不正確。
該工具將人類的內容識別為 “非常不可能 “是人工智慧生成的,但將來自OpenAI自己平臺的內容識別為 “unclear” 是否是人工智慧生成的,以及 “unlikely” 是人工智慧生成的,無論是否有額外提示。
該工具是免費的(你需要一個OpenAI賬戶)。沒有太多的鈴聲和口哨,也沒有剽竊檢查。
你會得到一個結論(就像你在截圖中看到的那樣),但沒有精確的分數。它也不會突出顯示文案的特定部分,以確定其是否是人工智慧產生的可能性。
5. Crossplag AI Content Detector
Crossplag提供一些免費的掃描,不需要賬戶。登入後,你會得到無限的免費掃描。該工具確實給出了一個總體分數,但不提供檢查抄襲或標記內容的個別部分的能力。
Crossplaq將人類和人工智慧的內容識別為99%的人類內容。值得注意的是,該工具反覆呼籲,它在長文字上的表現更好。
我們這裡的樣本高於其200字的最低建議值,但偏短。
6. GPTZero
GPTZero有免費和付費版本。免費版本給你一個分數,並有一些預裝的例子。
付費版本還提供抄襲檢查器,突出人工智慧內容,以及批量上傳多篇內容的能力(這實際上是為課堂環境設計的,像許多這些工具一樣)。
網站上沒有列出付費工具的價格,但你可以填寫表格,請求訪問付費工具和API。
該工具的免費版本將我們的三個寫作樣本都識別為可能完全是人類。
7. Sapling AI Detector
Sapling AI Detector提供免費和付費版本,一個Chrome擴充套件,一個API,一個總分和句子高亮。
Sapling將人類的內容確定為大部分是人類,而人工智慧的內容幾乎完全是人工智慧。然而,它認定 “perplex” 和 “bursty” 的ChatGPT內容極有可能是人類的。
8. Content at Scale’s AI Detector
Content at Scale人工智慧檢測器是免費的,它提供了一個分數,對內容中的不同元素(可預測性、概率和模式)進行細分,並預先填充了一些例子。
不存在抄襲檢測選項,個別內容部分也沒有突出顯示。
Content at Scale將所有三個樣本都評為92%人的比例或更高。
人類確實具有最高的人類百分比,其次是經過提示修改的GPT內容和由最簡單提示產生的內容。
9. ZeroGPT
ZeroGPT是一個免費的工具,它提供了一個總分和突出顯示,但沒有剽竊檢測。
該工具返回的人工智慧生成的可能性百分比全面偏低。它大致與樣本的人性化程度相對應,由人類生成的樣本得到的人工智慧百分比最低,其次是突發性/困惑性提示,然後是更簡單的提示)。
10. GLTR
GLTR,即 “巨型語言模型測試室”,是一個免費的工具,是麻省理工學院-IBM Watson人工智慧實驗室和哈佛大學NLP的Hendrik Strobelt、Sebastian Gehrmann和Alexander Rush的合作作品。
該工具提供了一些總體評分,但主要顯示文字中的每個詞是否是10個、100個、1000個或1000個以外最可能由人工智慧根據文字中的先前上下文生成的詞之一。這裡沒有抄襲的特徵集。
對於由較簡單的提示生成的文字,該工具返回的 “可能的詞” 和特別可能的詞在前10名中的數量最高。
不過,在這個小測試中,人類和額外的提示副本的分佈還是很相似的。
11. ChatGPT Detector on Hugging Face
這是一個免費的檢測器,可以給出一個總體預測和分數。它沒有任何抄襲或突出顯示的功能。
這個工具對所有三個樣本產生了超過99.9%的人類內容的可能性。
12. Corrector AI Content Detector
Corrector AI Detector是一個免費的工具,有600字的字數限制和百分比得分。該工具沒有抄襲或突出顯示的功能。
該工具給每個樣本都貼上了 “fake” 或AI的百分比概率非常低的標籤。
13. Writefull GPT Detector
Writefull GPT檢測器是一個免費工具,具有簡單的評分和API訪問。沒有高亮顯示,也沒有抄襲檢測。
它發現所有三個樣本都可能是人類的,但確實有ChatGPT內容,其最簡單的提示具有最高的AI可能性(19%)。
14. Hive Moderation’s AI-Generated Content Detection
Hive Moderation的AI-Generated Content Detection工具是免費的(有字元限制,使用幾次後需要登入)。
它不提供抄襲或突出顯示,但允許你將內容按章節分開,並獲得特定章節的分數。
Hive基本上對每個寫作樣本進行了適當的評分,人類內容的AI可能性為0%,AI樣本的評分為99.9%。
(只有Originality.AI有類似的置信度,同時在所有樣本中都是準確的)。
15. Paraphrasing Tool AI Content Detector
Paraphrasing Tool是一個重寫器,他們提供這個免費的AI內容檢測器,有一個整體的結論和突出顯示,沒有抄襲的功能。
Paraphrasing Tool的結論是,每個文字都可能是人類的。
16. AI Writing Check
AI寫作檢查是一個免費的工具,提供分數,有字數上限,沒有AI概率的文字高亮或抄襲功能。
AI寫作檢查確定所有三個寫作樣本都是人類的。
結論
同樣,在這裡必須對我的主要發現進行警告,因為三個簡短的寫作樣本是非常小的樣本,無法對個別工具得出堅定的結論。
也就是說,我發現了一些與人工智慧寫作檢測器有關的有趣的模式,一般來說:
- 校準:大多數工具發現所有三個寫作樣本要麼極有可能是人類,要麼極不可能是人類。當涉及到對內容進行人類與人工智慧的評分時,不同的工具可能是 “harder” 或 “softer” 的分級器,因此瞭解工具的校準方式有助於確定它們的有用程度。
- 最亮點特徵:這些工具的一些亮點功能包括:批量上傳、抄襲檢測、擁有Chrome瀏覽器擴充套件,以及突出顯示人工智慧與人類的可能性的特定部分。
- 免費與付費:除了Originality.AI,這裡介紹的所有工具都至少有免費版本。但是,具有最準確的結果和最 “亮點的功能” 的工具往往是具有付費版本的工具。
如果你覺得人工智慧檢測在你的專案中很有用,我建議你至少關注這些工具中的幾個。
在人工智慧內容生成、編輯和檢測方面的創新速度可能很快就會使你最喜歡的工具過時。
評論留言