当前位置: 首页 > news >正文

一个简单的录音软件(利用QT录音,ffmpeg进行音频重采样,fdk-aac编码)

         录音软件是一种非常有用的工具,可以帮助我们记录和存储语音信息。在本文中,我们将介绍一个简单的录音软件,该软件利用QT进行录音,使用ffmpeg进行音频重采样,并使用fdk-aac编码。

一、 环境介绍    

1、QT版本: QT5.12.6

2、编译器:  MSVC2017 64

3、ffmpeg版本: 6.1.1

4、完整工程下载地址(下载即可编译运行): https://download.csdn.net/download/u012959478/89624722

二、软件介绍

         本文是一个简单的录音软件的示例,使用QT的QAudioInput来录制原始音频数据,并使用QIODevice作为输入和输出来读取和写入数据,ffmpeg进行音频重采样,fdk-aac进行编码。最终的编码结果保存为AAC格式的文件。

        首先,让我们来介绍一下QT。QT是一个跨平台的应用程序开发框架,它提供了丰富的功能和界面设计工具,可以帮助我们快速开发各种应用程序。在我们的录音软件中,我们将使用QT的多媒体模块的QAudioInput来进行录音。

        接下来,让我们来了解一下ffmpeg。ffmpeg是一个开源的跨平台多媒体处理工具,它可以处理各种音频和视频格式。在我们的录音软件中,我们将使用ffmpeg的音频重采样功能来将录制的音频转换为我们需要的格式。

        最后,让我们来介绍一下fdk-aac。fdk-aac是一个高质量的音频编码器,它可以将音频转换为AAC格式。在我们的录音软件中,我们将使用fdk-aac来对录制的音频进行编码。

        现在,让我们来看看录音软件的主要功能。首先,我们需要实现一个界面,用户可以点击开始录音按钮来开始录音。当用户点击停止录音按钮时,录音将停止并保存为一个音频文件。

        在录音过程中,我们将使用QT的录音类来实现录音功能。当录音停止后,我们将使用ffmpeg进行音频重采样,以将音频转换为我们所需的采样率和格式。最后,我们将使用fdk-aac对音频进行编码,并将其保存为AAC格式的文件。

        在我们的录音软件中,用户还可以选择保存音频文件的路径和文件名。当用户点击保存按钮时,我们将使用QT的文件对话框来选择保存路径和文件名。

三、示例代码  

 audiothread.h

#ifndef AUDIOTHREAD_H
#define AUDIOTHREAD_H#include <QThread>
#include <QFile>extern "C"
{
#include <libswresample/swresample.h>
#include <libavformat/avformat.h>
#include <libavcodec/avcodec.h>
#include <libavutil/avutil.h>
#include <libavutil/audio_fifo.h>
}class QAudioInput;
class AudioThread : public QThread
{Q_OBJECT
public:explicit AudioThread(QObject *parent = nullptr);~AudioThread();signals:void timeChanged(unsigned long long ms);private:void run();bool init();bool initResample();//初始化重采样bool InitAudioCodec();//初始化音频编码器void encode(AVCodecContext *ctx,AVFrame *frame,AVPacket *pkt, QFile &outFile);void increaseVolume(AVFrame *frame, double volume);//提高音量private:SwrContext *_swr_ctx = nullptr;QAudioInput *_input = nullptr;AVCodecContext *_ac = nullptr;
};#endif // AUDIOTHREAD_H

audiothread.cpp 

#include "audiothread.h"
#include <QAudioInput>
#include <QMutex>
#include <QDebug>
#include <iostream>extern QString g_srcDirPath;AudioThread::AudioThread(QObject *parent):QThread(parent)
{connect(this, &AudioThread::finished,this, &AudioThread::deleteLater);initResample();InitAudioCodec();
}AudioThread::~AudioThread()
{requestInterruption();swr_free(&_swr_ctx);avcodec_free_context(&_ac);// 安全退出quit();wait();
}void AudioThread::run()
{if(!init())return;QFile outFile(g_srcDirPath);if (!outFile.open(QFile::WriteOnly)) {return;}//开始录制音频QIODevice *io = _input->start();//音频重采样输出空间分配AVFrame *pcm = av_frame_alloc();pcm->format = AV_SAMPLE_FMT_S16;pcm->channels = 2;pcm->channel_layout = av_get_default_channel_layout(pcm->channels);pcm->nb_samples = 1024; //一帧音频一通道的采用数量int ret = av_frame_get_buffer(pcm, 0); // 给pcm分配存储空间if (ret != 0){return;}//一次读取一帧音频的字节数int in_nb_samples = av_rescale_rnd(1024, 48000, 44100, AV_ROUND_UP);int readSize = in_nb_samples*_input->format().bytesPerFrame();char *buf = new char[readSize];AVPacket pkt = { 0 };while (!isInterruptionRequested()){//一次读取一帧音频if (_input->bytesReady() < readSize){QThread::msleep(1);continue;}int size = 0;while (size != readSize){int len = io->read(buf + size, readSize - size);if (len < 0)break;size += len;}if (size != readSize)continue;//已经读一帧源数据//重采样源数据const uint8_t *indata[AV_NUM_DATA_POINTERS] = { 0 };indata[0] = (uint8_t *)buf;swr_convert(_swr_ctx, pcm->data, pcm->nb_samples, indata, in_nb_samples);increaseVolume(pcm,10);//麦克风录音声音轻,提高点音量encode(_ac,pcm,&pkt,outFile);}_input->stop();delete []buf;outFile.close();av_frame_free(&pcm);
}bool AudioThread::init()
{if(QAudioDeviceInfo::availableDevices(QAudio::AudioInput).size()<1){qDebug()<<"没有录音设备";return false;}int sampleRate = 48000;int channels = 2;int sampleByte = 2;//qt音频参数设置QAudioFormat fmt;fmt.setSampleRate(sampleRate);fmt.setChannelCount(channels);fmt.setSampleSize(sampleByte * 8);fmt.setCodec("audio/pcm");fmt.setByteOrder(QAudioFormat::LittleEndian);fmt.setSampleType(QAudioFormat::SignedInt);QAudioDeviceInfo info=QAudioDeviceInfo::defaultInputDevice();if (!info.isFormatSupported(fmt)){qDebug() << "Audio format not support!";fmt = info.nearestFormat(fmt);}_input = new QAudioInput(fmt);if( !initResample() || !InitAudioCodec())return false;return true;
}bool AudioThread::InitAudioCodec()
{const AVCodec *codec = avcodec_find_encoder_by_name("libfdk_aac");if(!codec){return false;}_ac = avcodec_alloc_context3(codec);if (!_ac) {return false;}_ac->sample_fmt = AV_SAMPLE_FMT_S16;       // 输入音频的采样大小。fdk_aac需要16位的音频输													                入数据_ac->channel_layout = AV_CH_LAYOUT_STEREO; // 输入音频的CHANNEL LAYOUT_ac->channels = 2;                         // 输入音频的声道数_ac->sample_rate = 44100;                  // 输入音频的采样率_ac->bit_rate = 0;                         // AAC : 128K   AAV_HE: 64K  AAC_HE_V2: 32K. bit_rate为0时会查找profile属性值// 打开编码器int ret = avcodec_open2(_ac,codec,nullptr);if (ret < 0) {return false;}return true;
}bool AudioThread::initResample()
{_swr_ctx = swr_alloc_set_opts(nullptr,AV_CH_LAYOUT_STEREO,AV_SAMPLE_FMT_S16,44100, //输出参数AV_CH_LAYOUT_STEREO,AV_SAMPLE_FMT_S16,48000, //输入参数0,nullptr);if (swr_init(_swr_ctx) < 0){return false;}return true;
}void AudioThread::encode(AVCodecContext *ctx,AVFrame *frame,AVPacket *pkt, QFile &outFile)
{// 发送数据到编码器int ret = avcodec_send_frame(ctx, frame);if (ret < 0){qDebug() << "avcodec_send_frame error" ;return;}// 不断从编码器中取出编码后的数据while (true){// 获取编码后的音频数据ret = avcodec_receive_packet(ctx, pkt);if (ret == AVERROR(EAGAIN) || ret == AVERROR_EOF){return;}else if (ret < 0){return;}// 将编码后的数据写入文件outFile.write((char *) pkt->data, pkt->size);// 释放pkt内部的资源av_packet_unref(pkt);}
}void AudioThread::increaseVolume(AVFrame *frame, double volume)
{int16_t *samples = (int16_t *)frame->data[0];int nb_samples = frame->nb_samples;int channels = av_get_channel_layout_nb_channels(frame->channel_layout);// 提高音量for (int i = 0; i < nb_samples; i++){for (int ch = 0; ch < channels; ch++){// 使用线性插值来提高音量int pcmval = samples[ch] * volume;if (pcmval < 32767 && pcmval > -32768){samples[ch] = pcmval;}else if (pcmval > 32767){samples[ch] = 32767;}else if (pcmval < -32768){samples[ch] = -32768;}}samples += channels;}
}

 界面设计mainwindow.ui

mainwindow.h

#ifndef MAINWINDOW_H
#define MAINWINDOW_H#include <QMainWindow>
#include <QTimer>
#include "audiothread.h"QT_BEGIN_NAMESPACE
namespace Ui { class MainWindow; }
QT_END_NAMESPACEclass MainWindow : public QMainWindow
{Q_OBJECTpublic:MainWindow(QWidget *parent = nullptr);~MainWindow();private slots:void on_audioButton_clicked();void onTimeChanged();void onAudioThreadFinished();void on_saveButton_clicked();private:Ui::MainWindow *ui;AudioThread *_audioThread = nullptr;int m_num;QTimer *_timer;
};
#endif // MAINWINDOW_H

mainwindow.cpp

#include "mainwindow.h"
#include "ui_mainwindow.h"
#include <QTime>
#include <QFileDialog>
#include <QMessageBox>QString g_srcDirPath;
MainWindow::MainWindow(QWidget *parent): QMainWindow(parent), ui(new Ui::MainWindow)
{ui->setupUi(this);ui->lcdNumber->setDigitCount(8);m_num =  -1;onTimeChanged();_timer = new QTimer(this);connect(_timer,&QTimer::timeout,this,&MainWindow::onTimeChanged);
}MainWindow::~MainWindow()
{delete ui;
}void MainWindow::on_audioButton_clicked()
{if(g_srcDirPath.isEmpty()){QMessageBox::warning(NULL, "warning", "请设置文件保存路径!\n", QMessageBox::Yes, QMessageBox::Yes);return;}if(!_audioThread){_audioThread = new AudioThread(this);_audioThread->start();connect(_audioThread,&AudioThread::finished,this,&MainWindow::onAudioThreadFinished);ui->audioButton->setText("结束录音");m_num =  -1;onTimeChanged();_timer->start(1000);}else{_audioThread->requestInterruption();}
}void MainWindow::onTimeChanged()
{m_num++;QTime time(0, 0, 0);QString text = time.addSecs(m_num).toString("HH:mm:ss");ui->lcdNumber->display(text);
}void MainWindow::onAudioThreadFinished()
{_audioThread = nullptr;ui->audioButton->setText("开始录音");_timer->stop();
}void MainWindow::on_saveButton_clicked()
{QString runPath = g_srcDirPath;if(runPath.isEmpty()){runPath = QCoreApplication::applicationDirPath() + "/save.aac";}g_srcDirPath = QFileDialog::getSaveFileName(this, "保存文件",runPath,"AAC文件(*.aac)",nullptr,QFileDialog::DontConfirmOverwrite);
}

        通过以上的实现,我们就可以得到一个简单的录音软件,它可以利用QT实现录音,使用ffmpeg进行音频重采样,并使用fdk-aac进行编码。这个录音软件不仅简单易用,可以帮助我们记录和存储语音信息,是一个非常实用的工具。

四、运行效果

        谢谢您的阅读。希望本文能对您有所帮助,并且给您带来了一些新的观点和思考。如果您有任何问题或意见,请随时与我联系。再次感谢您的支持!

 五、相关文章

Windosw下Visual Studio2022编译FFmpeg(支持x264、x265、fdk-acc)-CSDN博客

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • Qt 串口通信(C++)
  • 自动化报表实践小结
  • JVM 加载阶段 Class对象加载位置是在 堆中还是方法区?
  • docker代理
  • Llama 3.1论文中文对照翻译
  • 代码随想录算法训练营Day35 | 01背包问题 | 416. 分割等和子集
  • FFMPEG 序列帧图片合成视频
  • Summer School science communication project--Laptop Selection Suggestion
  • 《学会 SpringMVC 系列 · 参数解析器 ArgumentResolvers》
  • Java学习笔记(二十):反射、动态代理、日志、类加载器、xml、单元测试Junit、注解
  • EasyX自学笔记3(割草游戏1)
  • Linux字符设备驱动开发
  • SpringBoot3无法注入RocketMQTemplate Bean
  • TabLayout使用以及自定义tab标签
  • MySQL和Redis的数据一致性
  • 网络传输文件的问题
  • es6(二):字符串的扩展
  • iOS 颜色设置看我就够了
  • Linux学习笔记6-使用fdisk进行磁盘管理
  • nodejs实现webservice问题总结
  • pdf文件如何在线转换为jpg图片
  • Phpstorm怎样批量删除空行?
  • python学习笔记 - ThreadLocal
  • Spring Boot MyBatis配置多种数据库
  • 阿里云应用高可用服务公测发布
  • 包装类对象
  • 基于 Babel 的 npm 包最小化设置
  • 区块链将重新定义世界
  • nb
  • (¥1011)-(一千零一拾一元整)输出
  • (02)vite环境变量配置
  • (152)时序收敛--->(02)时序收敛二
  • (2024,Vision-LSTM,ViL,xLSTM,ViT,ViM,双向扫描)xLSTM 作为通用视觉骨干
  • (9)STL算法之逆转旋转
  • (arch)linux 转换文件编码格式
  • (done) NLP “bag-of-words“ 方法 (带有二元分类和多元分类两个例子)词袋模型、BoW
  • (附源码)spring boot建达集团公司平台 毕业设计 141538
  • (四)【Jmeter】 JMeter的界面布局与组件概述
  • (转)Android中使用ormlite实现持久化(一)--HelloOrmLite
  • *** 2003
  • .chm格式文件如何阅读
  • .libPaths()设置包加载目录
  • .NET 4.0中的泛型协变和反变
  • .NET Entity FrameWork 总结 ,在项目中用处个人感觉不大。适合初级用用,不涉及到与数据库通信。
  • .Net Remoting常用部署结构
  • .NET成年了,然后呢?
  • .NET构架之我见
  • .NET开源项目介绍及资源推荐:数据持久层 (微软MVP写作)
  • .net生成的类,跨工程调用显示注释
  • /ThinkPHP/Library/Think/Storage/Driver/File.class.php  LINE: 48
  • ??在JSP中,java和JavaScript如何交互?
  • @取消转义
  • [ C++ ] STL---stack与queue
  • [240812] X-CMD 发布 v0.4.5:更新 gtb、cd、chat、hashdir 模块功能
  • [5] CUDA线程调用与存储器架构