当前位置: 首页 > news >正文

语音识别(SR)的秘密

        语音识别(SR)功能是当今国外操作系统的标准特征,而国产操作系统根本不具备这样的特质,并且国家队没有相关的主观动力。去开发实际可用的语音识别系统。与国外相比,国产操作系统落后了一大节子,怪谁?



如何让机器识别人的语音?事实上大道理并不复杂。首先,让机器设备听懂元音,然后听懂辅音。将两者合成起来成为单词,再做进一步的处理。可是。实际做起来就复杂了。

怎么做?



建立“语料库”(Corpus),就是建立语音的声学模型库。比方。”猫“这个单词的发音,必须让机器记住“猫”的发音,设法让机器听到“猫”所相应的“声音”(所谓”生物信号“)就知道主人对它说的是“猫”。语料库就是建立单词与语音的相应关系。这是基本建设,须要投入大量的人力、物力。别无他法。



不论什么语音都有个人特征,尽管100个人的发音基本同样,可是,存在一定的差异。

所以机器的听觉总是存在“错误率”,这是必定的。减少机器识别错误率是必要的。这是一个基本认识,对机器不能要求过高。机器耳朵永远比只是人耳。



微软、谷歌、百度语音识别巨头都拥有各自的数万小时的语料库,可是,我们却没有,Linux社区也没有GPL可用的语料库(VoxForge不带我们玩)。

怎么办?天上不会自己主动掉馅饼。

要知道。私有公司建立自己的版权大型语料库总是要付出巨大的投入成本。而我们有人喜欢天上掉馅饼。整天坐在院子里面张着大嘴巴对着蓝天等着天上掉下馅饼来。



袁萌 714



相关文章:

  • iOS 高德地图轨迹回放的 思路, 及方法
  • Redis - 事务
  • P1077 摆花
  • 过滤器与监听器知识总结
  • 数位DP入门
  • js匿名函数
  • Could not resolve resource location pattern错误解决方案
  • PAT乙级-1026. 程序运行时间(15)
  • HTTP中GET与POST的区别 99%的错误认识
  • 好汉两个半第十二季/全集Two and a Half Men迅雷下载
  • Learning How to Learn
  • 一起玩树莓派3+使用Gitlab搭建专业Git服务
  • Android Finalizing a Cursor that has not been deactivated or closed
  • 土耳其重大数据泄露事件 数据库安全受关注
  • 互联网分析师:5G距离我们还有多远?
  • CSS3 变换
  • CSS居中完全指南——构建CSS居中决策树
  • ECMAScript入门(七)--Module语法
  • Java新版本的开发已正式进入轨道,版本号18.3
  • Linux下的乱码问题
  • SegmentFault 社区上线小程序开发频道,助力小程序开发者生态
  • sessionStorage和localStorage
  • spring学习第二天
  • SQLServer之创建显式事务
  • Windows Containers 大冒险: 容器网络
  • 闭包,sync使用细节
  • 面试遇到的一些题
  • 深度解析利用ES6进行Promise封装总结
  • 算法-插入排序
  • 新版博客前端前瞻
  • ​ 无限可能性的探索:Amazon Lightsail轻量应用服务器引领数字化时代创新发展
  • ​LeetCode解法汇总1410. HTML 实体解析器
  • # 再次尝试 连接失败_无线WiFi无法连接到网络怎么办【解决方法】
  • ( 10 )MySQL中的外键
  • (1)安装hadoop之虚拟机准备(配置IP与主机名)
  • (function(){})()的分步解析
  • (Redis使用系列) Springboot 整合Redisson 实现分布式锁 七
  • (八)Docker网络跨主机通讯vxlan和vlan
  • (附源码)ssm教师工作量核算统计系统 毕业设计 162307
  • (附源码)计算机毕业设计ssm-Java网名推荐系统
  • (附源码)计算机毕业设计ssm电影分享网站
  • (排序详解之 堆排序)
  • (转)大型网站架构演变和知识体系
  • (转)详解PHP处理密码的几种方式
  • *Django中的Ajax 纯js的书写样式1
  • ./mysql.server: 没有那个文件或目录_Linux下安装MySQL出现“ls: /var/lib/mysql/*.pid: 没有那个文件或目录”...
  • .bat批处理(七):PC端从手机内复制文件到本地
  • .helper勒索病毒的最新威胁:如何恢复您的数据?
  • .Net IE10 _doPostBack 未定义
  • .net refrector
  • .net 按比例显示图片的缩略图
  • .NET 设计一套高性能的弱事件机制
  • .NET/C# 将一个命令行参数字符串转换为命令行参数数组 args
  • .Net下C#针对Excel开发控件汇总(ClosedXML,EPPlus,NPOI)
  • @html.ActionLink的几种参数格式