当前位置: 首页 > news >正文

《昇思25天学习打卡营第9天|onereal》

继续学习昨天的  基于MindNLP+MusicGen生成自己的个性化音乐

生成音乐

MusicGen支持两种生成模式:贪心(greedy)和采样(sampling)。在实际执行过程中,采样模式得到的结果要显著优于贪心模式。因此我们默认启用采样模式,并且可以在调用MusicgenForConditionalGeneration.generate时设置do_sample=True来显式指定使用采样模式。

无提示生成¶

我们可以通过方法 MusicgenForConditionalGeneration.get_unconditional_inputs 获得网络的随机输入,然后使用 .generate 方法进行自回归生成,指定 do_sample=True 来启用采样模式:

音频输出是格式是: a Torch tensor of shape (batch_size, num_channels, sequence_length)

使用第三方库scipy将输出的音频保存为musicgen_out.wav 文件。

文本提示生成

首先基于文本提示,通过AutoProcessor对输入进行预处理。然后将预处理后的输入传递给 .generate 方法以生成文本条件音频样本。同样,我们通过设置“do_sample=True”来启用采样模式。

其中,guidance_scale 用于无分类器指导(CFG),设置条件对数之间的权重(从文本提示中预测)和无条件对数(从无条件或空文本中预测)。guidance_scale越高表示生成的模型与输入的文本更加紧密。通过设置guidance_scale > 1来启用 CFG。为获得最佳效果,使用guidance_scale=3(默认值)生成文本提示音频。

  可能是算力不够,一直在运行,没有出结果。

不过经过等待终于出了点声音。

声音很短:只是5秒。但是的确是生成的。其他的代码运行还未结束。

相关文章:

  • adb shell logcat -b all|grep如何可以grep两个子串?
  • Rust Eq 和 PartialEq
  • 第三节:如何理解Spring的两个特性IOC和AOP(自学Spring boot 3.x第一天)
  • 嵌入式学习(Day 51:ARM指令/汇编与c语言函数相互调用)
  • 红酒SPA:享受放松与奢华的很好结合
  • (四)opengl函数加载和错误处理
  • 【RNN练习】LSTM-火灾温度预测
  • 【软考论文】论基于架构的软件设计方法及应用(ABSD)
  • 【C++】数组、字符串
  • .NET编程C#线程之旅:十种开启线程的方式以及各自使用场景和优缺点
  • 【ajax实战08】分页功能
  • Lua博客网站支持搜索、评论、登录注册
  • postman
  • linux 下neo4j的安装
  • 重榜:鸿蒙 Charles 抓包设置
  • 「面试题」如何实现一个圣杯布局?
  • 【Redis学习笔记】2018-06-28 redis命令源码学习1
  • 【剑指offer】让抽象问题具体化
  • chrome扩展demo1-小时钟
  • CSS3 聊天气泡框以及 inherit、currentColor 关键字
  • css属性的继承、初识值、计算值、当前值、应用值
  • express.js的介绍及使用
  • iBatis和MyBatis在使用ResultMap对应关系时的区别
  • Invalidate和postInvalidate的区别
  • Js基础知识(四) - js运行原理与机制
  • Nodejs和JavaWeb协助开发
  • OpenStack安装流程(juno版)- 添加网络服务(neutron)- controller节点
  • sessionStorage和localStorage
  • text-decoration与color属性
  • use Google search engine
  • vagrant 添加本地 box 安装 laravel homestead
  • 记一次删除Git记录中的大文件的过程
  • 聊聊hikari连接池的leakDetectionThreshold
  • 爬虫模拟登陆 SegmentFault
  • 山寨一个 Promise
  • 线上 python http server profile 实践
  • 携程小程序初体验
  • 一个6年java程序员的工作感悟,写给还在迷茫的你
  • 中文输入法与React文本输入框的问题与解决方案
  • 阿里云IoT边缘计算助力企业零改造实现远程运维 ...
  • 没有任何编程基础可以直接学习python语言吗?学会后能够做什么? ...
  • ​LeetCode解法汇总2304. 网格中的最小路径代价
  • ​渐进式Web应用PWA的未来
  • #经典论文 异质山坡的物理模型 2 有效导水率
  • (01)ORB-SLAM2源码无死角解析-(56) 闭环线程→计算Sim3:理论推导(1)求解s,t
  • (04)Hive的相关概念——order by 、sort by、distribute by 、cluster by
  • (2)MFC+openGL单文档框架glFrame
  • (26)4.7 字符函数和字符串函数
  • (4)logging(日志模块)
  • (delphi11最新学习资料) Object Pascal 学习笔记---第13章第1节 (全局数据、栈和堆)
  • (差分)胡桃爱原石
  • (附源码)ssm捐赠救助系统 毕业设计 060945
  • (九十四)函数和二维数组
  • (原创)可支持最大高度的NestedScrollView
  • .Net - 类的介绍