早些时候,我们对AI内容生成进行了介绍并推荐了几款AI内容检测器。今天,我们将测试更多的AI内容生成检测工具,罗列它们的优点和缺点,以及使用它们时应注意的事项。
随着每天都有新的ChatGPT替代品出现,AI内容检测器也越来越受欢迎。
在这篇文章中,我将分享16个这样的检测器,并向你展示它们是如何对我未发表的原创文章中的一些段落与ChatGPT中关于同一主题的一些段落进行评分。
我还将介绍人工智能检测器适合(和不适合)的功能类型,以及营销人员、编辑和SEO应该如何考虑它们。
AI内容生成带来的问题及检测工具帮助领域
正如我在其他文章中详述的那样,生成性人工智能和ChatGPT内容带来了几个问题:
- 人工智能生成的信息可能与事实不符、危险、过时或误导。
- 人工智能的写作输出可能是不合格的。
- 虽然对人工智能内容没有明确的惩罚,但谷歌可能并不总是像人类创造的内容那样信任和看待它。
- 人工智能内容可能能够 “愚弄” 编辑或企业,他们认为自己在为人类创造的内容付费。
- 人工智能内容可能会利用人类的创造性工作,并在没有归属的情况下重新使用它。
值得注意的是,目前的人工智能检测器并没有解决所有这些问题。
大多数情况下,这些工具不会对人工智能内容进行事实核查,改善或审计内容质量,或为从其他来源获取的信息提供引证。
也就是说,人工智能检测器可以帮助的领域包括:
- 抄袭:许多这类工具都有内置的抄袭检测功能,因此可以检查人工智能内容是否主要来自其他来源。
- 惩罚预防:如果你担心人工智能内容在搜索结果中被贬低,这些工具可以帮助你了解人工智能内容有多容易被发现。(当然,谷歌无疑会有不同的工具和检查)。
- 审核人工智能的使用:如果你有一个特定的政策或方式来补偿作家的原创内容与人工智能生成的内容,这些工具可以让你大致了解作家是否使用人工智能来生成内容。(请注意,它们也可以返回错误的否定和肯定结果)。
- 了解搜索结果:其中一些工具提供Chrome扩展,可以帮助你了解竞争对手和其他网站是否使用AI内容。
AI生成内容检测软件如何工作
每个工具都是不同的,有其解决问题的方法。但在大多数情况下,ChatGPT检测工具是根据一段内容中的短语选择的可预测程度对内容进行评分。
换句话说,内容被评为人工智能与人类的可能性,与检测软件是否认为一篇文章遵循人工智能在生成内容时可能遵循的模式有很大关系。
围绕这一过程的两个核心概念被称为:
- Burstiness: 句子结构的可预测长度和节奏。
- Perplexity: 在一个句子或句子集合中所选择的词语的随机性。
例如,在一篇关于美国建国的文章中,生成性人工智能极不可能包括一个随机的、不均匀的关于他们第一次看到企鹅的轶事,所以在检测工具看来,这可能是人类的写作。
类似于ChatGPT检测器的出现是为了检测生成性人工智能的写作,人们已经在开发工具来绕过这些检测器。(当然:检测器可能已经在考虑如何检测绕过者,等等)。
像Undetectable或Quillbot这样的工具会重写你的内容,有时会使某些AI检测工具更难检测到。
此外,有几个人找到了不同的提示,让ChatGPT和其他人工智能写作工具输出的内容在人与人工智能的评分中 “更像人”,他们使用的提示是定义突发性和困惑性,并告诉ChatGPT在写作时要多注意这两点。
检测精度对你重要吗?
在你深入研究这些工具之前,需要回答的一个重要问题是::
你对检测内容是否为人工智能所写有多大的兴趣?以及为什么?
如果你使用ChatGPT改写标题标签或生成电子邮件副本,也许这些内容是否 “通过” 人工智能写作检查根本不重要。
此外,如果作家使用人工智能生成文案,而且文案很好,也许分数一点都不重要。
这些检测工具很可能会与我上面提到的未检测工具和提示语进行 “检测军备竞赛”。
最佳人工智能写作检测器的比较
如果你还在寻找一个AI/ChatGPT内容检测器,我们将逐一介绍它们,以及它们在评估人类生成的文案与AI文案与使用该提示语试图 “击败检测” 的AI文案时的 “得分”。
注意:检测与几段内容的对比不一定是对这些工具的检测能力的彻底测试。希望它能给你一个粗略的感觉,让你知道它们是如何对不同的内容进行评分的,以及你可以从这些类型的工具中看到的结果范围。
(你可以查看输入工具的实际样本–由我编写的 “人类” 样本,由ChatGPT通过GPT-4编写的 “人工智能” 样本,以及基于同一主题的最新副本)。
在下面的表格中,你可以看到每个工具对我从头开始写的副本、我从ChatGPT直接取来的、没有修改提示的副本,以及用 “perplexity和burstiness” 提示调整的同一副本的评分:
以下是对表中所包括的工具及其一些主要特点的简要概述。
1. Originality.AI
Originality.AI是一个付费工具,被描述为 “为严肃的内容出版商建立的最准确的AI内容检测器和抄袭检查器”。
它的费用为每个信用点0.01美元,可扫描100个字。它在人工智能扫描器的旁边还设有一个抄袭扫描仪。
从上图可以看出,这是唯一的人工智能扫描器,具有100%的信心,认为人类的内容是人类的,人工智能的内容是人工智能的(同时也在所有情况下是正确的)。
Hive Moderation(在文章后面讨论)基本上有相同的结论,人类内容的AI得分是0%,而两个AI生成的文本有99.9%的信心是AI。
除了有一个Chrome扩展程序和一个总分之外,Originality.AI还增加了一个功能,突出了你粘贴的内容中它预测会是和不会是AI的具体部分。
我个人最经常使用这个工具来检查AI内容。我最经常使用的情况是检查与我们合作的自由撰稿人提交的内容是否为人工智能和剽窃。
2. Writer
Writer提供了一个免费的检测器,可以对1500个字符进行检测,更多的则需要API访问。
这个工具基本上认为所有提交的内容都比较可能是人类产生的。
Writer是一个人工智能写作平台,免费的内容检测器也允许你输入一个URL来检查。
这个工具内没有直接的抄袭功能,它给你一个总分,但不会把特定部分标记为可能或不可能是人工智能生成的。
3. Copyleaks AI Content Detector
Copyleaks人工智能内容检测器有几个有趣的功能:
- 它给你一个总体判断(人类或AI)。
- 如果你将鼠标悬停在特定的文本上,它将给你一个百分比的可能性,即该文本是人类的还是AI的副本。
- 它预先加载了不同GPT和人类输出的例子,向你展示该工具是如何工作的。
有 - 一个Chrome扩展。
该工具是免费的,虽然一次扫描不能同时进行,但也有一个剽窃检测器。
它准确地将许多人类生成的内容识别为人类,将许多人工智能生成的内容识别为人工智能。然而,它并不总是自信,在某些个别部分是不正确的。
4. OpenAI’s AI Text Classifier
AI Text Classifier是OpenAI的一个免费工具,该公司创建了GPT(这是运行许多生成性AI工具的工具)和ChatGPT。
如果你认为制造最受欢迎的人工智能工具的公司会有最准确的检测器,那么在我们的测试中,这并不正确。
该工具将人类的内容识别为 “非常不可能 “是人工智能生成的,但将来自OpenAI自己平台的内容识别为 “unclear” 是否是人工智能生成的,以及 “unlikely” 是人工智能生成的,无论是否有额外提示。
该工具是免费的(你需要一个OpenAI账户)。没有太多的铃声和口哨,也没有剽窃检查。
你会得到一个结论(就像你在截图中看到的那样),但没有精确的分数。它也不会突出显示文案的特定部分,以确定其是否是人工智能产生的可能性。
5. Crossplag AI Content Detector
Crossplag提供一些免费的扫描,不需要账户。登录后,你会得到无限的免费扫描。该工具确实给出了一个总体分数,但不提供检查抄袭或标记内容的个别部分的能力。
Crossplaq将人类和人工智能的内容识别为99%的人类内容。值得注意的是,该工具反复呼吁,它在长文本上的表现更好。
我们这里的样本高于其200字的最低建议值,但偏短。
6. GPTZero
GPTZero有免费和付费版本。免费版本给你一个分数,并有一些预装的例子。
付费版本还提供抄袭检查器,突出人工智能内容,以及批量上传多篇内容的能力(这实际上是为课堂环境设计的,像许多这些工具一样)。
网站上没有列出付费工具的价格,但你可以填写表格,请求访问付费工具和API。
该工具的免费版本将我们的三个写作样本都识别为可能完全是人类。
7. Sapling AI Detector
Sapling AI Detector提供免费和付费版本,一个Chrome扩展,一个API,一个总分和句子高亮。
Sapling将人类的内容确定为大部分是人类,而人工智能的内容几乎完全是人工智能。然而,它认定 “perplex” 和 “bursty” 的ChatGPT内容极有可能是人类的。
8. Content at Scale’s AI Detector
Content at Scale人工智能检测器是免费的,它提供了一个分数,对内容中的不同元素(可预测性、概率和模式)进行细分,并预先填充了一些例子。
不存在抄袭检测选项,个别内容部分也没有突出显示。
Content at Scale将所有三个样本都评为92%人的比例或更高。
人类确实具有最高的人类百分比,其次是经过提示修改的GPT内容和由最简单提示产生的内容。
9. ZeroGPT
ZeroGPT是一个免费的工具,它提供了一个总分和突出显示,但没有剽窃检测。
该工具返回的人工智能生成的可能性百分比全面偏低。它大致与样本的人性化程度相对应,由人类生成的样本得到的人工智能百分比最低,其次是突发性/困惑性提示,然后是更简单的提示)。
10. GLTR
GLTR,即 “巨型语言模型测试室”,是一个免费的工具,是麻省理工学院-IBM Watson人工智能实验室和哈佛大学NLP的Hendrik Strobelt、Sebastian Gehrmann和Alexander Rush的合作作品。
该工具提供了一些总体评分,但主要显示文本中的每个词是否是10个、100个、1000个或1000个以外最可能由人工智能根据文本中的先前上下文生成的词之一。这里没有抄袭的特征集。
对于由较简单的提示生成的文本,该工具返回的 “可能的词” 和特别可能的词在前10名中的数量最高。
不过,在这个小测试中,人类和额外的提示副本的分布还是很相似的。
11. ChatGPT Detector on Hugging Face
这是一个免费的检测器,可以给出一个总体预测和分数。它没有任何抄袭或突出显示的功能。
这个工具对所有三个样本产生了超过99.9%的人类内容的可能性。
12. Corrector AI Content Detector
Corrector AI Detector是一个免费的工具,有600字的字数限制和百分比得分。该工具没有抄袭或突出显示的功能。
该工具给每个样本都贴上了 “fake” 或AI的百分比概率非常低的标签。
13. Writefull GPT Detector
Writefull GPT检测器是一个免费工具,具有简单的评分和API访问。没有高亮显示,也没有抄袭检测。
它发现所有三个样本都可能是人类的,但确实有ChatGPT内容,其最简单的提示具有最高的AI可能性(19%)。
14. Hive Moderation’s AI-Generated Content Detection
Hive Moderation的AI-Generated Content Detection工具是免费的(有字符限制,使用几次后需要登录)。
它不提供抄袭或突出显示,但允许你将内容按章节分开,并获得特定章节的分数。
Hive基本上对每个写作样本进行了适当的评分,人类内容的AI可能性为0%,AI样本的评分为99.9%。
(只有Originality.AI有类似的置信度,同时在所有样本中都是准确的)。
15. Paraphrasing Tool AI Content Detector
Paraphrasing Tool是一个重写器,他们提供这个免费的AI内容检测器,有一个整体的结论和突出显示,没有抄袭的功能。
Paraphrasing Tool的结论是,每个文本都可能是人类的。
16. AI Writing Check
AI写作检查是一个免费的工具,提供分数,有字数上限,没有AI概率的文本高亮或抄袭功能。
AI写作检查确定所有三个写作样本都是人类的。
结论
同样,在这里必须对我的主要发现进行警告,因为三个简短的写作样本是非常小的样本,无法对个别工具得出坚定的结论。
也就是说,我发现了一些与人工智能写作检测器有关的有趣的模式,一般来说:
- 校准:大多数工具发现所有三个写作样本要么极有可能是人类,要么极不可能是人类。当涉及到对内容进行人类与人工智能的评分时,不同的工具可能是 “harder” 或 “softer” 的分级器,因此了解工具的校准方式有助于确定它们的有用程度。
- 最亮点特征:这些工具的一些亮点功能包括:批量上传、抄袭检测、拥有Chrome浏览器扩展,以及突出显示人工智能与人类的可能性的特定部分。
- 免费与付费:除了Originality.AI,这里介绍的所有工具都至少有免费版本。但是,具有最准确的结果和最 “亮点的功能” 的工具往往是具有付费版本的工具。
如果你觉得人工智能检测在你的项目中很有用,我建议你至少关注这些工具中的几个。
在人工智能内容生成、编辑和检测方面的创新速度可能很快就会使你最喜欢的工具过时。
评论留言