当前位置: 首页 > news >正文

sherpa-onnx说话人识别+语音识别自动开启(VAD)+语音识别Python API

专栏总目录

        获取该开源项目的渠道,是我在b站上,看到了由csukuangfj制作的一套语音识别视频。以下地址均为csukuangfj在视频中提供,感谢分享!

新一代 Kaldi: 说话人识别+VAD+语音识别之 Python API_哔哩哔哩_bilibili

开源项目地址:GitHub - k2-fsa/sherpa-onnx: Speech-to-text, text-to-speech, and speaker recognition using next-gen Kaldi with onnxruntime without Internet connection. Support embedded systems, Android, iOS, Raspberry Pi, RISC-V, x86_64 servers, websocket server/client, C/C++, Python, Kotlin, C#, Go, NodeJS, Java, Swift, Dart, JavaScript

文档地址:sherpa-onnx — sherpa 1.3 documentation

        我之前已经使用了sherpa-ncnn和安装了kaldi,所以有些需要安装依赖的情况,跟大家会有不同。相关依赖安装情况,可以参考使用sherpa-ncnn进行中文语音识别(ubuntu22)-CSDN博客和详细解析Ubuntu22 部署Kaldi大模型_kaldi布署-CSDN博客两篇文章。

一、安装sherpa-onnx模型

        文档中介绍了多种语言及环境的使用方法,这里只针对python开发包的安装使用进行测试。

(一)下载模型脚本文件

从开源项目地址下载文件:GitHub - k2-fsa/sherpa-onnx: Speech-to-text, text-to-speech, and speaker recogni

相关文章:

  • Win11下安装VS2022失败的解决办法
  • Java编程小练习题目
  • 外包IT运维解决方案
  • CATO原理中的数学与魔术(十四)——流程设计思路与升华
  • 强化学习中的自我博弈(self-play)
  • 数据库精选题(三)(SQL语言精选题)(按语句类型分类)
  • 解决 uniapp h5 页面在私有企微iOS平台 间歇性调用uni api不成功问题(uni.previewImage为例)。
  • uniapp实现幻灯功能方法及代码
  • springboot 搭建一个 测试redis 集群连通性demo
  • Java热部署:让应用更新如丝般顺滑,告别繁琐重启!
  • openEuler2203SP3自定义ios
  • android怎么知道FileProvider应该导入的包名是什么?androidx.core.content.FileProvider
  • 华为开发者大会:全场景智能操作系统HarmonyOS NEXT
  • python web框架哪家强?Flask、Django、FastAPI对比
  • idea导入文件里面的子模块maven未识别处理解决办法
  • Python3爬取英雄联盟英雄皮肤大图
  • Python十分钟制作属于你自己的个性logo
  • Spring-boot 启动时碰到的错误
  • Travix是如何部署应用程序到Kubernetes上的
  • windows下mongoDB的环境配置
  • 分享几个不错的工具
  • 复习Javascript专题(四):js中的深浅拷贝
  • 前端相关框架总和
  • 如何设计一个微型分布式架构?
  • 什么软件可以提取视频中的音频制作成手机铃声
  • 为视图添加丝滑的水波纹
  • 我与Jetbrains的这些年
  • 正则学习笔记
  • ​3ds Max插件CG MAGIC图形板块为您提升线条效率!
  • ​Linux Ubuntu环境下使用docker构建spark运行环境(超级详细)
  • ###C语言程序设计-----C语言学习(6)#
  • #{}和${}的区别是什么 -- java面试
  • #我与Java虚拟机的故事#连载07:我放弃了对JVM的进一步学习
  • (2015)JS ES6 必知的十个 特性
  • (3) cmake编译多个cpp文件
  • (6)添加vue-cookie
  • (pojstep1.1.1)poj 1298(直叙式模拟)
  • (编程语言界的丐帮 C#).NET MD5 HASH 哈希 加密 与JAVA 互通
  • (二)基于wpr_simulation 的Ros机器人运动控制,gazebo仿真
  • (过滤器)Filter和(监听器)listener
  • (十七)Flask之大型项目目录结构示例【二扣蓝图】
  • (四)七种元启发算法(DBO、LO、SWO、COA、LSO、KOA、GRO)求解无人机路径规划MATLAB
  • (一)Docker基本介绍
  • (一)插入排序
  • (原創) 未来三学期想要修的课 (日記)
  • .“空心村”成因分析及解决对策122344
  • .NET Core引入性能分析引导优化
  • .NET 程序如何获取图片的宽高(框架自带多种方法的不同性能)
  • .NET平台开源项目速览(15)文档数据库RavenDB-介绍与初体验
  • .net使用excel的cells对象没有value方法——学习.net的Excel工作表问题
  • .NET学习教程二——.net基础定义+VS常用设置
  • .so文件(linux系统)
  • /var/lib/dpkg/lock 锁定问题
  • @PostConstruct 注解的方法用于资源的初始化
  • @RestController注解的使用