随着人工智能领域的一些巨大进步,自然语言系统正在迅速进步。大型语言模型(LLMs)随着每一次的升级和创新而变得更好、更受欢迎。几乎每天都有新的功能或修改被添加进来,使LLMs能够在几乎所有领域的不同应用中发挥作用。LLM无处不在,从机器翻译和文本总结到情感分析和问题回答。
开源社区在开发基于聊天的LLM方面取得了一些显著的进展,但主要是在英语方面。对于在LLM中开发类似的多语言聊天功能,人们的关注度略低。为了解决这个问题,专注于生成性人工智能解决方案的软件公司SambaNova推出了一款名为BLOOMChat的开源多语言聊天LLM。BLOOMChat是与Together合作开发的,Together是一个开放的、可扩展的、去中心化的人工智能云,它是一个建立在BLOOM模型之上的1760亿个参数的多语言聊天LLM。
什么是BLOOMChat?
BLOOMChat是SambaNova和Together之间的一个令人兴奋的合作,提出了一个1760亿参数的多语言聊天大型语言模型(LLM)。它在Apache 2.0的修改版下提供给研究和商业使用,并纳入了BLOOM传下来的RAIL的使用限制。
这个新的、开放的、多语言的聊天LLM是在SambaNova RDUs(可重构数据流单元)上训练的。在一项人类偏好研究中,与GPT-4相比,BLOOMChat实现了45.25%的胜率,在六种语言中,它比主流开源聊天LLM有66%的优先权。它在WMT翻译任务上也表现出了卓越的性能,在BLOOM变体和主流开源聊天模型中处于领先地位。
虽然这仍处于早期开发阶段,但BLOOMChat有望成为开源社区的宝贵资源,并成为在该领域取得进一步进展的垫脚石。目前,BLOOMChat在有限的时间内可用于Hugging Face的实时聊天,模型托管和前端UI由Together提供。
BLOOM模型有能力生成46种自然语言和13种编程语言的文本。对于西班牙语、法语和阿拉伯语等语言,BLOOM代表了有史以来第一个拥有超过1000亿个参数的语言模型。BLOOM是由BigScience组织开发的,该组织是一个由1000多名研究人员组成的国际合作组织。通过在OpenChatKit、Dolly 2.0和OASST1等项目的开放对话和对齐数据集上对BLOOM进行微调,BLOOM的核心能力被扩展到聊天领域。
为了开发多语言聊天LLM,BLOOMChat、SambaNova和Together使用了SambaNova DataScale系统,该系统利用SambaNova独特的可重构数据流架构进行训练。合成的对话数据和人写的样本已被结合起来创建BLOOMChat。一个名为OpenChatKit的大型合成数据集已经成为聊天功能的基础,而像Dolly 2.0和OASST1这样更高质量的人类生成的数据集也被用来大幅提升性能。用于OpenChatKit和Dolly-v2数据集的指令调整的代码和脚本已在SambaNova的GitHub上公布。
在对六种语言进行的人类评估中,BLOOMChat的回答比GPT-4的回答有45.25%的时间更受欢迎。与同样的六种语言的其他四种开源聊天对齐模型相比,BLOOMChat的回应在65.92%的时间里排名最佳。这一成就成功地缩小了开源市场的多语言聊天能力差距。在WMT翻译测试中,BLOOMChat的表现优于其他BLOOM模型的迭代以及流行的开源对话模型。
BLOOMChat和其他聊天LLM一样,也有局限性。它可能会产生与事实不符或不相关的信息,也可能会错误地切换语言。它甚至会重复短语,编码或数学能力有限,有时还会产生有毒内容。进一步的研究正在努力解决这些挑战并确保更好的使用。
BLOOMChat的特点
1. 更快的响应速度:BLOOMChat提供了一个显著的响应速度,确保快速有效的互动。
2. 176亿个参数:BLOOMChat拥有广泛的参数数,是一个更强大的人工智能聊天机器人,使其能够处理复杂的查询并提供详细的答复。
3. 语境理解:BLOOMChat擅长在整个对话中理解和保持上下文。它有能力记住以前的互动,并提供与正在进行的对话相一致的回应,创造一个更自然和无缝的对话流程。
4. 不需要登录:截至2023年5月通过Hugging Face的有限访问,BLOOMChat不需要任何登录,方便用户立即开始使用该聊天机器人。
5. 停机时间少:与其他聊天机器人相比,BLOOMChat的停机时间最小,确保了用户的无缝体验。
如何使用BLOOMChat?
目前,BLOOMChat可通过Hugging Face向所有用户免费提供。然而,请注意,这种可用性可能会发生变化,因为BLOOMChat可能在未来几周内过渡到另一个域名。
要访问和使用BLOOMChat,你也可以直接访问以下网址:在HuggingFace Space BLOOM Chat上
请随意向人工智能提出任何问题,并期待得到类似人类的回应。需要注意的是,BLOOMChat目前正处于开发阶段,为测试目的,访问仅限于HuggingFace。一旦BLOOMChat在官方领域可用,本文将提供未来的更新。目前,HuggingFace是体验这个令人难以置信的人工智能聊天机器人的主要平台。
小结
总的来说,BLOOMChat是一个创新和强大的人工智能聊天机器人,它提供了令人印象深刻的性能,多语言能力,更快的响应速度,以及用户友好的体验。凭借其对SambaNova RDU的广泛培训和1760亿个参数,BLOOMChat在开源聊天LLM中脱颖而出。无论是用于研究还是商业用途,BLOOMChat都为提高生产力、学习和沟通能力提供了宝贵的资源。
评论留言