当前位置: 首页 > news >正文

第九届信也科技杯全球AI算法大赛——语音深度鉴伪识别参赛A榜 0.968961分

  遗憾没有进复赛,只是第41名。先贴个A榜的成绩。A榜的前三十名晋级,个个都是99分的大佬,但是B榜的成绩就有点低了,应该是数据不同源的问题,第一名0.78分。官网链接:语音深度鉴伪识别
在这里插入图片描述在这里插入图片描述
官方baselin:https://github.com/xinyebei/2024_finvcup_baseline
baseline源码:https://github.com/xieyuankun/Codecfake
实验的 源码:https://github.com/Shybert-AI/Codecfake_ResNet
任务描述:

在这里插入图片描述

  简单的说一下本次比赛方案的想法,首先明确是语音深度鉴伪识别任务,于是发动互联网的强大的搜索功能,尽可能多的搜索到更多的语音深度鉴伪识别算法。也相应的搜索对应的数据集,在看到此帖子[深度伪造音频普遍检测的Codecfake数据集和对策],同时在github上找到相应的源码,因此方案基于Codecfake进行。通过将网络结构修改成ResNet等实验,提出Codecfake_ResNet模型,让语音鉴别模型的分类指标达到0.968961。(https://blog.csdn.net/robinfang2019/article/details/138673202)
模型架构:
在这里插入图片描述训练步骤:

1.下载finvcup9th_1st_ds5数据集,解压到data目录下
2.执行data_prepare.py 脚本生成训练的csv文件,修改finvcup9th_1st_ds5_valid_data.csv为finvcup9th_1st_ds5_dev_data.csv
python data_prepare.py
3.执行提取特征文件
python preprocess.py 
4.训练
python main_train.py  --path_to_features preprocess_xls-r-5  -f1 preprocess_xls-r-5 --out_fold ./pretrained_model/codec_w2v2aasist_ResNet50_CSAM_xls-r-5_300m/ --CSAM True --train_task codecfake  --num_epochs 50  --batch_size 16 --lr 0.001  --gpu 0   --seed  2024   --num_workers 1
5.预测
python predict.py

实验结果:
在这里插入图片描述
通过实验分析提升网络的层数和多模型融合可以提升。

相关文章:

  • Python爬虫小白入门(二)BeautifulSoup库
  • SpringBoot配置第三方专业缓存技术Ehcache
  • React入门教程:构建你的第一个React应用
  • 数据库 | 试卷五试卷六试卷七
  • jpg格式图片无法打开可以修复吗?有哪些方法?
  • ADS1220芯片写寄存器失败
  • QSharedMemory使用详解
  • spark 整合 yarn
  • Elementui的el-dropdown组件使用与案例
  • ansible 模块进阶及变量
  • JS学习总结
  • 安卓开发拉起其他应用的常用方式
  • 项目经理究竟一年能挣多少钱?一起来看看
  • 人力资源招聘社会校企类型招聘系统校园招聘小程序
  • 基于PLC的全自动洗衣机控制系统课设
  • 2017 前端面试准备 - 收藏集 - 掘金
  • Docker 笔记(1):介绍、镜像、容器及其基本操作
  • javascript从右向左截取指定位数字符的3种方法
  • Java应用性能调优
  • leetcode386. Lexicographical Numbers
  • Redis提升并发能力 | 从0开始构建SpringCloud微服务(2)
  • Synchronized 关键字使用、底层原理、JDK1.6 之后的底层优化以及 和ReenTrantLock 的对比...
  • 大数据与云计算学习:数据分析(二)
  • 第三十一到第三十三天:我是精明的小卖家(一)
  • 动手做个聊天室,前端工程师百无聊赖的人生
  • 记录:CentOS7.2配置LNMP环境记录
  • 检测对象或数组
  • 简单数学运算程序(不定期更新)
  • 浅谈JavaScript的面向对象和它的封装、继承、多态
  • 设计模式 开闭原则
  • 深度学习在携程攻略社区的应用
  • 我从编程教室毕业
  • Oracle Portal 11g Diagnostics using Remote Diagnostic Agent (RDA) [ID 1059805.
  • hi-nginx-1.3.4编译安装
  • 仓管云——企业云erp功能有哪些?
  • 函数计算新功能-----支持C#函数
  • # linux从入门到精通(三)
  • #1014 : Trie树
  • $$$$GB2312-80区位编码表$$$$
  • (10)Linux冯诺依曼结构操作系统的再次理解
  • (day 12)JavaScript学习笔记(数组3)
  • (Redis使用系列) Springboot 使用redis实现接口Api限流 十
  • (TipsTricks)用客户端模板精简JavaScript代码
  • (笔试题)分解质因式
  • (创新)基于VMD-CNN-BiLSTM的电力负荷预测—代码+数据
  • (附源码)php新闻发布平台 毕业设计 141646
  • (切换多语言)vantUI+vue-i18n进行国际化配置及新增没有的语言包
  • (十二)devops持续集成开发——jenkins的全局工具配置之sonar qube环境安装及配置
  • (一)【Jmeter】JDK及Jmeter的安装部署及简单配置
  • (原创)boost.property_tree解析xml的帮助类以及中文解析问题的解决
  • (转)jdk与jre的区别
  • *1 计算机基础和操作系统基础及几大协议
  • 、写入Shellcode到注册表上线
  • .bat批处理(九):替换带有等号=的字符串的子串
  • .net core 6 集成和使用 mongodb