当前位置: 首页 > news >正文

语音识别技术受追捧,无法独立工作的“速记神器”何时才能成为新亮点?

从当前来看,速记神器确实为特定人群所需。

近日,搜狗召开发布会,正式推出其自研的速记神器——搜狗听写。这是一款能够将语音实时转变成文字的速记工具,拥有转写和听写两种模式,主要面向记者、编辑、作家等文字工作者。

语音识别技术受追捧,无法独立工作的速记神器能否成为行业新亮点?

由搜索而知名的搜狗,在人工智能领域似乎也玩的风生水起

众所周知,搜狗以搜索业务起家。除搜索业务外,其在近年还因搜狗输入法、搜狗高速浏览器等在行业内颇具名气。

如果仅从以上这些来看,搜狗此次推出“搜狗听写”似乎显得有些无厘头。然而,搜狗CEO王小川曾表示,搜索本身也是一种AI。

语音识别技术受追捧,无法独立工作的速记神器能否成为行业新亮点?

回顾搜狗的发展史,除去初期产品,搜狗在其产品迭代或新品中都或多或少的运用到了人工智能技术,例如搜狗云输入法、加入了云计算技术的搜狗输入法5.0版本、儿童智能手表“糖猫”等。

很显然,这一次搜狗将目光瞄准了语音识别领域,也似乎做出了点成绩。搜狗语音交互技术中心总经理王砚峰表示,搜狗听写中涉及到了大量前沿技术,例如大规模的优质语音数据训练和深度学习的技术能力积累等,不仅可应用于多个场景,其语音识别准确率也高达97%以上。

产品并无明显差异化竞争优势,搜狗听写要拿什么去竞争?

从搜狗方面的介绍看,搜狗听写可提供两种服务,语音转写和语音听写。此外,它还同时具备了边听边改、无线标重点、多端同步、信息分享等多个功能。而这样的语音转写工具,似乎在行业内并没有什么明显的差异化竞争优势。

语音识别技术受追捧,无法独立工作的速记神器能否成为行业新亮点?

除新鲜出炉的搜狗听写之外,科大讯飞的云犀、思必驰的语音输入板等,都是能够将语音转换成文字的工具。此外,仅在中国,除去普通话,大方言就有八种,各小地区方言更是多不胜数。这其中所涉及到的语音识别、语义识别、深度学习、算法训练等多个人工智能尖端技术,难度不可谓不大。

很显然,与一直致力于语音识别领域技术开发的企业相比,搜狗在专业程度及行业经验方面都有不做。而除去这些专业性企业和产品之外,当下很多输入法及搜索工具也有类似的功能,搜狗并没有赋予搜狗听写具有差异化竞争力的功能。在市场逐渐开拓的当下,搜狗想要凭借搜狗听写搏得一方市场,显然不容易。

技术+人工,AI至今未能真正做到全智能

在语音转化文字方面,除去偏C端的工具外,专业性系统或软件也有很多,例如科大讯飞的听见智能会议系统。在大多数的专业性会议,主办方都会聘请的专业速记人员。而与前几年相比,现今的速记工作已经有了更多人工智能的参与。

只是这其中存在着一个的现象,当前的语音转写技术并不能一力承担整场专业性会议,还需要有专业速记员全程盯着,实时进行纠错没有识别出的内容、标点等。

语音识别技术受追捧,无法独立工作的速记神器能否成为行业新亮点?

科大讯飞负责会议现场速记的一位专业速记员表示,在以科大讯飞听见智能会议系统为主导、没有纯正方言的情况下,正常会议速记工作的人工参与率是5%—10%。

不过,在人工智能相关技术不够成熟的当下,这样的人工参与率已经是很低的了。虽然目前我们并不能做到完全智能,但仅就速记AI领域来说,有了专业速记员的配合,不仅能够保证速记内容的精准,还能为开发者提供更为直观的现场反馈,为技术的进一步发展助力。

总结

随着人工智能相关技术的发展与前景的逐渐明朗,似乎所有行业都想在这一领域插上一脚,大公司更是不例外。当然,企业发展需要新鲜元素的加入,但如果只是为了与“AI”沾亲带故以获得“宣传”的理由,对于行业来说,这样的企业或从业者也许就是毒瘤。

从当前来看,速记神器确实为特定人群所需,但想要让这类产品成为刚需,还需行业者切实考虑用户需求,尽快让AI成为真正的全智能技术。


原文发布时间: 2017-08-09 19:13
本文作者: 伶轩
本文来自云栖社区合作伙伴镁客网,了解相关信息可以关注镁客网。

相关文章:

  • 还在啃老?是该来场逼格满满的产品展示了!
  • 2018年微信小程序风口最新发展趋势分析
  • Fortinet安全能力融入华为CloudEPN 联合防御网络威胁
  • 【Java资源免费分享,网盘自己拿】
  • 洛谷2774:[网络流24题]方格取数问题——题解
  • 第五届全球云计算大会暨国际网络通信展览会·中国站圆满落幕
  • BlockChange | 区块链将如何颠覆金融服务业
  • html学习笔记
  • Can I use 一款前端兼容性自查工具
  • 2016年人工智能产业梳理:一朝引爆,稳步前进(下篇)
  • python day3
  • 3A级VR游戏将至?汪丛青力挺G胖正在开发的三款VR游戏
  • [译]pt.2 几何体 Geometry
  • WiFi万能钥匙蹭网原理详细剖析
  • V8 的 Error 对象与栈追踪的妙用
  • IE9 : DOM Exception: INVALID_CHARACTER_ERR (5)
  • ABAP的include关键字,Java的import, C的include和C4C ABSL 的import比较
  • CNN 在图像分割中的简史:从 R-CNN 到 Mask R-CNN
  • ES6语法详解(一)
  • ES学习笔记(10)--ES6中的函数和数组补漏
  • Git初体验
  • Git学习与使用心得(1)—— 初始化
  • idea + plantuml 画流程图
  • JavaScript 基本功--面试宝典
  • JS数组方法汇总
  • leetcode-27. Remove Element
  • Mac 鼠须管 Rime 输入法 安装五笔输入法 教程
  • Node项目之评分系统(二)- 数据库设计
  • Quartz初级教程
  • 分享几个不错的工具
  • 计算机在识别图像时“看到”了什么?
  • 简析gRPC client 连接管理
  • 如何优雅地使用 Sublime Text
  • 使用 @font-face
  • 原生js练习题---第五课
  • 正则与JS中的正则
  • 职业生涯 一个六年开发经验的女程序员的心声。
  • MPAndroidChart 教程:Y轴 YAxis
  • PostgreSQL之连接数修改
  • 阿里云重庆大学大数据训练营落地分享
  • ​ssh免密码登录设置及问题总结
  • # Swust 12th acm 邀请赛# [ K ] 三角形判定 [题解]
  • #100天计划# 2013年9月29日
  • #vue3 实现前端下载excel文件模板功能
  • (C语言版)链表(三)——实现双向链表创建、删除、插入、释放内存等简单操作...
  • (pytorch进阶之路)CLIP模型 实现图像多模态检索任务
  • (附源码)ssm旅游企业财务管理系统 毕业设计 102100
  • (六)激光线扫描-三维重建
  • (论文阅读32/100)Flowing convnets for human pose estimation in videos
  • (十一)手动添加用户和文件的特殊权限
  • (五)大数据实战——使用模板虚拟机实现hadoop集群虚拟机克隆及网络相关配置
  • (译) 理解 Elixir 中的宏 Macro, 第四部分:深入化
  • (转) Android中ViewStub组件使用
  • (转) Face-Resources
  • .“空心村”成因分析及解决对策122344