当前位置: 首页 > news >正文

python-录音文件转换成文字

大多数语音转文字工具都是要收费的,免费的很少,而且质量也不太高,python有自己的语音识别库,因此尝试使用一下。

先安装库:

pip install pydub speechrecognition
pip install pydub

安装 ffmpeg

brew install ffmpeg

录音格式要转换成wav 

# 定义音频文件路径
audio_file_path = "path_to_your_audio_file.m4a"
wav_file_path = "path_to_your_audio_file.wav"# 将M4A文件转换为WAV格式
audio = pydub.AudioSegment.from_file('a1.m4a', format="m4a")
audio.export(wav_file_path, format="wav")
import pydub
import speech_recognition as sr# 定义音频文件路径
audio_file_path = "path_to_your_audio_file.m4a"
wav_file_path = "path_to_your_audio_file.wav"# 将M4A文件转换为WAV格式
audio = pydub.AudioSegment.from_file('a1.m4a', format="m4a")
audio.export(wav_file_path, format="wav")# 初始化识别器
recognizer = sr.Recognizer()# 使用识别器识别音频文件中的语音
with sr.AudioFile(wav_file_path) as source:audio_data = recognizer.record(source)try:# 使用Google Web Speech API识别语音text = recognizer.recognize_google(audio_data, language="zh-CN")print("识别的文本:", text)except sr.UnknownValueError:print("无法识别音频中的语音")except sr.RequestError as e:print("无法处理音频请求; {0}".format(e))

运行:

python voice.py

相关文章:

  • 智谱API调用
  • Apollo9.0 PNC源码学习之Routing模块
  • Linux top 命令使用教程
  • 【单片机毕业设计选题24018】-基于STM32和阿里云的农业大棚系统
  • 思科配置路由器,四台主机互相ping通
  • 在Android Studio中将某个文件移出Git版本管理
  • 命令行脚本批量转换工具说明
  • 设置浏览器互不干扰
  • 【Android面试八股文】odex了解吗?解释型语言和编译型语言有什么区别?JAVA是编译型语言还是解释型语言?
  • 逻辑回归(Logistic Regression)及其在机器学习中的应用
  • 从移动、桌面端到AR/VR:HOOPS Visualize如何实现卓越的3D模型可视化?
  • 手写方法实现整型例如:123与字符串例如:“123“相互转化(下篇)
  • Django REST framework序列化器详解:普通序列化器与模型序列化器的选择与运用
  • Redis高并发高可用
  • 76.最小覆盖子串
  • 10个最佳ES6特性 ES7与ES8的特性
  • 2017年终总结、随想
  • CentOS学习笔记 - 12. Nginx搭建Centos7.5远程repo
  • const let
  • Django 博客开发教程 16 - 统计文章阅读量
  • ES6核心特性
  • Laravel 实践之路: 数据库迁移与数据填充
  • Laravel深入学习6 - 应用体系结构:解耦事件处理器
  • leetcode-27. Remove Element
  • Node 版本管理
  • Objective-C 中关联引用的概念
  • Python代码面试必读 - Data Structures and Algorithms in Python
  • tensorflow学习笔记3——MNIST应用篇
  • windows-nginx-https-本地配置
  • 翻译:Hystrix - How To Use
  • 关于 Linux 进程的 UID、EUID、GID 和 EGID
  • 利用DataURL技术在网页上显示图片
  • 文本多行溢出显示...之最后一行不到行尾的解决
  • 想晋级高级工程师只知道表面是不够的!Git内部原理介绍
  • 一、python与pycharm的安装
  • 翻译 | The Principles of OOD 面向对象设计原则
  • 新海诚画集[秒速5センチメートル:樱花抄·春]
  • #php的pecl工具#
  • #VERDI# 关于如何查看FSM状态机的方法
  • #我与Java虚拟机的故事#连载04:一本让自己没面子的书
  • (2015)JS ES6 必知的十个 特性
  • (2024,RWKV-5/6,RNN,矩阵值注意力状态,数据依赖线性插值,LoRA,多语言分词器)Eagle 和 Finch
  • (2024最新)CentOS 7上在线安装MySQL 5.7|喂饭级教程
  • (Ruby)Ubuntu12.04安装Rails环境
  • (笔记)M1使用hombrew安装qemu
  • (二十五)admin-boot项目之集成消息队列Rabbitmq
  • (简单) HDU 2612 Find a way,BFS。
  • (力扣)循环队列的实现与详解(C语言)
  • (论文阅读31/100)Stacked hourglass networks for human pose estimation
  • (算法)大数的进制转换
  • (一) storm的集群安装与配置
  • (转)编辑寄语:因为爱心,所以美丽
  • **python多态
  • *算法训练(leetcode)第四十天 | 647. 回文子串、516. 最长回文子序列
  • .cfg\.dat\.mak(持续补充)