当前位置: 首页 > news >正文

调研-音视频

音视频

  • 基础概念
  • 主要内容
    • 音频
      • 基础概念
      • 音频量化过程
      • 音频压缩技术
    • 视频
      • 基础概念
      • 视频bug
      • 视频编码
        • H264
      • 视频像素格式
        • YUV
        • RGB
  • 参考文献

基础概念

● 实时音视频应用环节
○ 采集、编码、前后处理、传输、解码、缓冲、渲染等很多环节。

主要内容

音频

基础概念

  • 三要素:音调(音频)、音量、音色
  • 工具:ffmpeg、ffplay、flashplayer
  • 听觉范围:20HZ~20KHZ,可以听见的

音频量化过程

  • 音频量化过程
    • 模拟信号(连续)

    • 采样:在一段时间内等间隔地获取模拟信号的幅度值,得到一系列采样点。

      • 采样率(Sample Rate)决定了每秒钟对模拟信号进行采样的次数,常见的采样率有44.1 kHz、48 kHz等。较高的采样率可以更准确地还原原始声音,但也会增加数据量。
      • 采样大小:即采样的纵坐标对应值,表示一个采样用多少位存放。
    • 量化:为了更高效地保存和传输每个采样点的数值,将这些振幅值进行规整,这一过程称为量化。

      • 量化精度:量化的精度等于相邻两个整数所表示的实数的差值(标准),如果两个实数之间的差距小于这个差值,他们便会被量化为同一个整数。(图像变化:连续的信号最后被转变为了阶梯状的图像)
      • 量化的过程会损失一定的精度,按照精度可以将量化分为8位量化、16位量化、32位量化等。
    • 编码

      • 将量化后离散整数序列转化为计算机实际储存所用的二进制字节序列的过程叫做音频编码。反之,将二进制字节恢复成音频信号的过程称为解码。
    • 在这里插入图片描述

    • 码率(/音频的比特率)
      - 指 每秒传输的音频的比特数。单位:bps。
      - 计算公式=采样率 x 采样大小 (位数)x 声道数。

音频压缩技术

  • 音频压缩技术基础概念
    • 数字音频信号中存在冗余信息,对这些冗余成份进行去除可以降低传输带宽,提高效率。
    • 冗余信息:人耳听觉范围外的音频信号以及被掩蔽掉的音频信号等。
    • 人耳听觉范围之外:20Hz~20KHz之外。
    • 掩蔽效应:
      • 频谱掩蔽效应:一个频率的声音能量小于某个阈值之后,人耳就会听不到,这个阈值称为最小可闻阈。当有另外能量较大的声音出现的时候,该声音频率附近的阈值会提高很多,即所谓的掩蔽效应。
      • 时域掩蔽效应:当强音信号和弱音信号同时发生或发生时间很接近的时候,会发生掩蔽效应,分为前掩蔽、同时掩蔽和后掩蔽三部分。
        • 前掩蔽是指人耳在听到强信号之前的短暂时间内,已经存在的弱信号会被掩蔽而听不到。
        • 同时掩蔽是指当强信号与弱信号同时存在时,弱信号会被强信号所掩蔽而听不到。
        • 后掩蔽是指当强信号消失后,需经过较长的一段时间才能重新听见弱信号,称为后掩蔽。这些被掩蔽的弱信号即可视为冗余信号。
  • 压缩类型
    • 有损压缩(还原回来的数据和原数据不一样):消除冗余的数据
    • 无损压缩:以哈夫曼无损编码为代表。
  • 压缩编码方式
    • 基本编码思路
      • 在这里插入图片描述

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • T/CECS 10035-2019 绿色建材评价 金属复合装饰材料
  • 数字赋能下的艺术蝶变:沃可趣如何重塑乐园演艺人才培训?
  • js中filter函数使用箭头函数的时候注意事项
  • 基于x86 平台opencv的图像采集和seetaface6的静默活体功能
  • H5实现带电话号码跳转到手机呼叫
  • Java二十三种设计模式-状态模式(20/23)
  • uniapp微信小程序 分享功能
  • Python计算机视觉编程 第六章
  • MySQL 视图(VIEW)的使用
  • AI在医学领域:HYDEN一种针对医学图像和报告的跨模态表示学习方法
  • IOS 13 网络请求和Moya框架
  • k8s高版本(1,28)部署NodePort模式下的ingress-nginx的详细过程及应用案例
  • 图片转pdf:tif是什么格式?如何将tif转成PDF?
  • 【hot100篇-python刷题记录】【找到字符串中所有字母异位词】
  • 工厂模式和策略模式区别
  • 时间复杂度分析经典问题——最大子序列和
  • [ 一起学React系列 -- 8 ] React中的文件上传
  • [译] 怎样写一个基础的编译器
  • “Material Design”设计规范在 ComponentOne For WinForm 的全新尝试!
  • CSS3 变换
  • Flannel解读
  • MD5加密原理解析及OC版原理实现
  • Promise初体验
  • Python_OOP
  • socket.io+express实现聊天室的思考(三)
  • 回顾2016
  • 回流、重绘及其优化
  • 今年的LC3大会没了?
  • 十年未变!安全,谁之责?(下)
  • 微信开源mars源码分析1—上层samples分析
  • 想写好前端,先练好内功
  • 消息队列系列二(IOT中消息队列的应用)
  • 不要一棍子打翻所有黑盒模型,其实可以让它们发挥作用 ...
  • # include “ “ 和 # include < >两者的区别
  • $.extend({},旧的,新的);合并对象,后面的覆盖前面的
  • (1)STL算法之遍历容器
  • (6)添加vue-cookie
  • (aiohttp-asyncio-FFmpeg-Docker-SRS)实现异步摄像头转码服务器
  • (C语言)输入自定义个数的整数,打印出最大值和最小值
  • (STM32笔记)九、RCC时钟树与时钟 第二部分
  • (笔试题)合法字符串
  • (非本人原创)我们工作到底是为了什么?​——HP大中华区总裁孙振耀退休感言(r4笔记第60天)...
  • (利用IDEA+Maven)定制属于自己的jar包
  • (排序详解之 堆排序)
  • (数位dp) 算法竞赛入门到进阶 书本题集
  • (四)c52学习之旅-流水LED灯
  • (一)C语言之入门:使用Visual Studio Community 2022运行hello world
  • (一)u-boot-nand.bin的下载
  • (一)基于IDEA的JAVA基础1
  • *上位机的定义
  • .net core webapi 部署iis_一键部署VS插件:让.NET开发者更幸福
  • .NET Standard 支持的 .NET Framework 和 .NET Core
  • .NET 服务 ServiceController
  • .NET 直连SAP HANA数据库
  • .Net 中的反射(动态创建类型实例) - Part.4(转自http://www.tracefact.net/CLR-and-Framework/Reflection-Part4.aspx)...