如何使用ElevenLabs AI克隆语音并从文本生成自然语音

如何使用ElevenLabs AI克隆语音并从文本生成自然语音

2023 年,在讨论技术时,你不能不谈到生成式人工智能。无论是人工智能编码工具、本地法学硕士,还是人工智能图像生成器,这项技术几乎已经侵入了一切领域,各家公司也在迅速适应这项新技术。ElevenLabs 就是这样一家利用人工智能专门从事语音合成和语音克隆的公司。你可以使用 ElevenLabs AI 从文本生成自然语音,并以近乎完美的准确度克隆你的声音。请阅读本教程,了解如何做到这一点。

如何使用 ElevenLabs AI 从文本生成自然语音

ElevenLabs 对个人用户免费开放。在免费级别下,您可以在一个月内从文本中生成多达 10,000 个字符的语音。您还可以生成多种语言和口音的语音。下面是这款人工智能工具的工作原理:

1. 前往 ElevenLabs 网站(访问),点击 “Sign up” 创建免费账户。

创建ElevenLabs免费账户

2. 注册后,您将进入语音合成页面。在这里的 “Settings” 中,您可以预览不同的语音,并选择自己喜欢的语音。

选择自己喜欢的语音

3. 您还可以在下方选择音频模式。如果文本为英文,请选择 “Eleven Monolingual v1“;如果文本为其他语言,包括英语、德语、印地语、西班牙语、意大利语、法语、葡萄牙语或波兰语,请选择 “Eleven Multilingual v1″。

选择 "Eleven Monolingual v1"

4. 最后,输入下面的文本,点击 “Generate“,ElevenLabs AI 就会将您的文本转换为语音。

将您的文本转换为语音

5. 在这里,我用 Sam 的声音从样本文本中生成了语音。您可以点击 “Download” 按钮,获取 MP3 格式的生成语音。

获取 MP3 格式的生成语音

6. 您还可以输入不同语言的文本,它也能完美地生成语音。请确保从下拉菜单中选择 “Multilingual” 模式。

选择 "Multilingual" 模式

7. 你还可以使用 ElevenLabs AI 克隆自己的声音,我们在下面进行了演示。不过,你可以从Voice Library中添加不同口音的语音样本。

使用 ElevenLabs AI 克隆自己的声音

8. 点击所选语音旁的 “Add to VoiceLab“。例如,我在这里添加的是一个英国口音的年轻男声。

添加的是一个英国口音的年轻男声

9. 现在,只需从下拉菜单中选择语音并生成语音。这样就完成了。

选择语音并生成语音

如何使用 ElevenLabs AI 克隆语音?

你可能已经在 Instagram 和 TikTok 上看到过有人使用语音克隆技术,让奥巴马、德雷克等知名人士随意说话。ElevenLabs 曾经免费提供语音克隆服务,但现在你需要支付 5 美元才能创建多达 10 个自定义语音。如果你不想付费,可以使用 PlayHT(访问)免费克隆你的声音。在本文中,我将使用 ElevenLabs AI 克隆我的声音。

1. 要使用 ElevenLabs AI 克隆语音,请点击顶部的 “Voice Lab”。然后点击 “Add Generative or Cloned Voice“。

Voice Lab

2. 接下来,点击 “Instant Voice Cloning“。

立即克隆语音

3. 在此,为您的声音命名。然后,上传您录制的音频。确保录音中没有大声的背景噪音。建议上传至少 5 分钟的音频,以便更好地进行语音合成。在下面写一段描述,然后点击 “Add Voice” 按钮。

上传您录制的音频

4. 几秒钟后,你的语音就会被克隆出来,可以随时使用。点击 “Use“,即可使用它将文本转换为语音。

将文本转换为语音

5. 在此,确保您的语音已在下拉菜单中被选中。现在,添加文本,然后点击 “Generate“。合成语音和生成音频需要几秒钟的时间。现在还可以下载音频。

合成语音和生成音频

在我看来,尽管上传了 5 分钟的音频文件,但 ElevenLabs AI 在克隆我的声音方面做得并不好。也许,我需要添加更多的音频样本并再次训练模型。或者,这可能是因为人工智能模型以英语(美国)输出,而不是针对印度口音进行本地化。另外,在我的音频样本中,有一些背景噪音,可能降低了质量。尽管如此,这是一个令人兴奋的人工智能项目,我们将继续跟踪语音合成领域的所有新进展。

评论留言