当前位置: 首页 > news >正文

制作语音数据集: 爬取B站音视频+基于whisper语音识别标注

本文以制作小学课堂音频数据集为例子

在这里插入图片描述

1. 搜索关键字获取音视频链接


if __name__ == "__main__":with sync_playwright() as playwright:searcher = BLVideoSearch(playwright, headless=True)url = searcher.make_url(keyword=["小学公开课"])searcher.run(url, outfile="videos_url.txt")

得到链接列表
在这里插入图片描述

2. 批量下载和实时视频转音频

you-get: 根据链接下载视频文件
ffmpeg: 将视频实时转音频
subprocess: 通过子进程执行上述命令

2.1 多线程批量下载 (you-get)

you-get 子进程:

command = [YOUGET, "-o", self.video_dir, "-O", utt, task]subprocess.run(command, check=True, stdout=subprocess.DEVNULL, stderr=subprocess.DEVNULL)

2.2 实时视频转音频

ffmpeg 子进程:

command = [FFMPEG, "-i", video_file, '-ac', '1', '-ar', '16000', audio_file]subprocess.run(command, check=True, stdout=subprocess.DEVNULL, stderr=subprocess.DEVNULL)

下载视频文件信息如下:
在这里插入图片描述
最终保存为音频文件
在这里插入图片描述

3. 使用whisper进行断句和语音识别

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • SD NAND的SD模式与SPI模式的初始化
  • Linux使用 firewalld管理防火墙命令
  • 零基础学习Redis(5) -- redis单线程模型介绍
  • Mybatis笔记的后续补充
  • 用C#写一个随机音乐播放器
  • 【现代通信技术】第八章 SDH技术
  • 探索顶级PDF水印API:PDFBlocks(2024年更新)
  • LCD 图片格式转换
  • FreeRTOS 快速入门(三)之任务管理
  • ensp小实验(ospf+dhcp+防火墙)
  • PHP模拟高并发异步请求测试+redis的setnx处理并发和防止死锁处理
  • PINCE——Linux 原生游戏内存修改器,一款替代 Cheat Engine 的强大游戏修改器,Linux 游戏玩家必备神器!
  • 【论文学习与撰写】论文中公式的编辑,Mathtype的使用,全文编号排版,智能截图识别公式,公式编号自动更新
  • 一键更换Linux优质的软件源和docker源 —— 筑梦之路
  • 超全MySQL优化清单
  • Angular Elements 及其运作原理
  • Effective Java 笔记(一)
  • flutter的key在widget list的作用以及必要性
  • java8-模拟hadoop
  • JavaScript HTML DOM
  • Laravel Telescope:优雅的应用调试工具
  • Python学习笔记 字符串拼接
  • SpringCloud集成分布式事务LCN (一)
  • vue 个人积累(使用工具,组件)
  • 对话:中国为什么有前途/ 写给中国的经济学
  • 如何使用 OAuth 2.0 将 LinkedIn 集成入 iOS 应用
  • 适配iPhoneX、iPhoneXs、iPhoneXs Max、iPhoneXr 屏幕尺寸及安全区域
  • 跳前端坑前,先看看这个!!
  • 用 Swift 编写面向协议的视图
  • 在Unity中实现一个简单的消息管理器
  • 自动记录MySQL慢查询快照脚本
  • 【干货分享】dos命令大全
  • 昨天1024程序员节,我故意写了个死循环~
  • # Java NIO(一)FileChannel
  • #define、const、typedef的差别
  • #include<初见C语言之指针(5)>
  • #Lua:Lua调用C++生成的DLL库
  • #控制台大学课堂点名问题_课堂随机点名
  • #数据结构 笔记三
  • $.ajax()参数及用法
  • (6)【Python/机器学习/深度学习】Machine-Learning模型与算法应用—使用Adaboost建模及工作环境下的数据分析整理
  • (7) cmake 编译C++程序(二)
  • (Matalb时序预测)PSO-BP粒子群算法优化BP神经网络的多维时序回归预测
  • (Matlab)遗传算法优化的BP神经网络实现回归预测
  • (Python) SOAP Web Service (HTTP POST)
  • (二) 初入MySQL 【数据库管理】
  • (二)测试工具
  • (每日持续更新)jdk api之StringBufferInputStream基础、应用、实战
  • (三)Honghu Cloud云架构一定时调度平台
  • (十三)Java springcloud B2B2C o2o多用户商城 springcloud架构 - SSO单点登录之OAuth2.0 根据token获取用户信息(4)...
  • (十一)c52学习之旅-动态数码管
  • (一)u-boot-nand.bin的下载
  • (转)iOS字体
  • (转)原始图像数据和PDF中的图像数据
  • .form文件_SSM框架文件上传篇