当前位置: 首页 > news >正文

这款新的 AI 语音助手击败了 OpenAI,成为 ChatGPT 最受期待的功能之一

OpenAI 推迟了 ChatGPT 令人印象深刻的语音模式,这让许多 AI 聊天机器人的粉丝感到不安,但他们现在可能已经被挖走了。法国人工智能开发商 Kyutai 推出了一款名为 Moshi 的实时语音 AI 助手。

在这里插入图片描述

Moshi 旨在通过语音(如 Alexa 或 Google Assistant)与用户提供逼真的对话,但由 ChatGPT 及其竞争对手(在本例中为 Helium 7B 模型)背后的大型语言模型提供支持。根据 Kyutai 的说法,Moshi 可以用各种口音说话,并且有 70 种不同的情感和说话风格。AI 甚至可以同时处理两个音频流,让 Moshi 可以同时听和说话。

Kyutai 对 Moshi 的开发涉及对使用 Text-to-Speech (TTS) 技术制作的 100,000 多个合成对话进行微调。目的是帮助 Moshi 了解人类交流的细微差别和语气。该品牌甚至与专业配音师合作,以提高 Moshi 的语音质量。

这款 AI 助手集成了文本和音频训练,针对多个后端进行了优化,这意味着它可以在笔记本电脑等设备上运行,而无需与云交互。该公司将其作为通过防止敏感数据在互联网上传输来维护隐私和安全的一种方式。您可以在此处查看 Moshi 的演示。

公开对话

Kyutai 宣称 Moshi 将是一个开源项目,包括模型的代码和框架,为进一步创新奠定基础。开源方法还可能有助于减轻大型人工智能公司正在处理的有关其封闭模型的安全和道德的投诉。Kyutai 的支持者,包括法国亿万富翁 Xavier Niel,正在推动开源方法。

Kyutai 还在开发 AI 音频识别、水印和签名跟踪系统,这些系统将被整合到 Moshi 中。这些功能将有助于识别 AI 生成的音频,促进问责制和可追溯性,同时确保 AI 生成的内容可以被监控和验证。

Moshi 仍在开发中,但演示文稿中的语音模式令人印象深刻。如果 Moshi 流行起来并流行起来,这种语音方法可能会成为 ChatGPT 竞争对手其他支持语音版本的催化剂,或者加速向 Alexa 和其他语音助手添加 LLM。

https://kyutai.org/

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • Java 7新特性深度解析:提升效率与功能
  • Java中的数据可视化与图表库选择
  • 【TORCH】绘制权重分布直方图,权重torch.fmod对torch.normal生成的随机数进行取模运算
  • Codeforces Round 954 (Div. 3)
  • 软件设计之Java入门视频(12)
  • 玩转springboot之springboot使用外置tomcat进行运行
  • 缓存-缓存的使用与基本详解
  • Vue3从入门到精通(三)
  • Python实现Mybatis Plus
  • 常见反爬及应对
  • C# Socket
  • 多个tomcat同时使用 不设置CATALINA_HOME环境变量
  • Oracle 11.2.0.1升级到11.2.0.4并做rman备份异机恢复
  • 如何用Java写一个整理Java方法调用关系网络的程序
  • 银河麒麟V10 SP1 审计工具 auditd更新
  • 【Under-the-hood-ReactJS-Part0】React源码解读
  • 【跃迁之路】【585天】程序员高效学习方法论探索系列(实验阶段342-2018.09.13)...
  • Android Volley源码解析
  • ECS应用管理最佳实践
  • java 多线程基础, 我觉得还是有必要看看的
  • Javascript设计模式学习之Observer(观察者)模式
  • jdbc就是这么简单
  • Koa2 之文件上传下载
  • python学习笔记 - ThreadLocal
  • SAP云平台里Global Account和Sub Account的关系
  • SQL 难点解决:记录的引用
  • 测试如何在敏捷团队中工作?
  • 分享一个自己写的基于canvas的原生js图片爆炸插件
  • 工作踩坑系列——https访问遇到“已阻止载入混合活动内容”
  • 极限编程 (Extreme Programming) - 发布计划 (Release Planning)
  • 每天10道Java面试题,跟我走,offer有!
  • 一份游戏开发学习路线
  • 第二十章:异步和文件I/O.(二十三)
  • # dbt source dbt source freshness命令详解
  • #stm32驱动外设模块总结w5500模块
  • (173)FPGA约束:单周期时序分析或默认时序分析
  • (3)选择元素——(14)接触DOM元素(Accessing DOM elements)
  • (delphi11最新学习资料) Object Pascal 学习笔记---第5章第5节(delphi中的指针)
  • (ibm)Java 语言的 XPath API
  • (层次遍历)104. 二叉树的最大深度
  • (七)MySQL是如何将LRU链表的使用性能优化到极致的?
  • (亲测成功)在centos7.5上安装kvm,通过VNC远程连接并创建多台ubuntu虚拟机(ubuntu server版本)...
  • (四)linux文件内容查看
  • (五)大数据实战——使用模板虚拟机实现hadoop集群虚拟机克隆及网络相关配置
  • (一)模式识别——基于SVM的道路分割实验(附资源)
  • . NET自动找可写目录
  • .[backups@airmail.cc].faust勒索病毒的最新威胁:如何恢复您的数据?
  • .NET高级面试指南专题十一【 设计模式介绍,为什么要用设计模式】
  • @AliasFor注解
  • @manytomany 保存后数据被删除_[Windows] 数据恢复软件RStudio v8.14.179675 便携特别版...
  • @Transactional 参数详解
  • [ C++ ] STL_vector -- 迭代器失效问题
  • [ vulhub漏洞复现篇 ] Hadoop-yarn-RPC 未授权访问漏洞复现
  • [3D游戏开发实践] Cocos Cyberpunk 源码解读-高中低端机性能适配策略
  • [android] 切换界面的通用处理