当前位置: 首页 > news >正文

视频剪辑的重磅AI神器:FunClip

内空摘要

  • 基于阿里巴巴通义实验室自研并开源的FunASR工具包
  • 集成了阿里巴巴开源的工业级模型Paraformer-Large
  • 集成了SeACo-Paraformer的热词定制化功能,提升识别效果
  • 集成了CAM++说话人识别模型,自动识别出的说话人ID
  • 支持多段自由剪辑,并且会自动返回全视频SRT字幕、目标段落SRT字幕
  • 项目仓库:https://github.com/alibaba-damo-academy/FunClip
  • 博文地址:https://blog.i68.ltd/archives/funclip

主要特点

  • FunClip集成了多种大语言模型调用方式并提供了prompt配置接口,尝试通过大语言模型进行视频裁剪
  • FunClip集成了阿里巴巴开源的工业级模型Paraformer-Large,是当前识别效果最优的开源中文ASR模型之一,Modelscope下载量1300w+次,并且能够一体化的准确预测时间戳。
  • FunClip集成了SeACo-Paraformer的热词定制化功能,在ASR过程中可以指定一些实体词、人名等作为热词,提升识别效果。
  • FunClip集成了CAM++说话人识别模型,用户可以将自动识别出的说话人ID作为裁剪目标,将某一说话人的段落裁剪出来。
  • 通过Gradio交互实现上述功能,安装简单使用方便,并且可以在服务端搭建服务通过浏览器使用。
  • FunClip支持多段自由剪辑,并且会自动返回全视频SRT字幕、目标段落SRT字幕,使用简单方便。

安装使用

  • FunClip的运行仅依赖于一个Python环境
# 克隆funclip仓库
git clone https://github.com/alibaba-damo-academy/FunClip.git
cd FunClip
# 安装相关Python依赖
pip install -r ./requirements.txt

安装imagemagick(可选)

  1. 如果你希望使用自动生成字幕的视频裁剪功能,需要安装imagemagick
  • Ubuntu
apt-get -y update && apt-get -y install ffmpeg imagemagick
sed -i 's/none/read,write/g' /etc/ImageMagick-6/policy.xml
  • MacOS
brew install imagemagick
sed -i 's/none/read,write/g' /usr/local/Cellar/imagemagick/7.1.1-8_1/etc/ImageMagick-7/policy.xml 
  • Windows

首先下载并安装imagemagick ImageMagick – Download

然后确定您的Python安装位置,在其中的site-packages\moviepy\config_defaults.py文件中修改IMAGEMAGICK_BINARY为imagemagick的exe路径

  1. 下载你需要的字体文件,这里我们提供一个默认的黑体字体文件
wget https://isv-data.oss-cn-hangzhou.aliyuncs.com/ics/MaaS/ClipVideo/STHeitiMedium.ttc -O font/STHeitiMedium.ttc

使用FunClip

A.在本地启动Gradio服务

python funclip/launch.py
# '-l en' for English audio recognize
# '-p xxx' for setting port number
# '-s True' for establishing service for public accessing

随后在浏览器中访问localhost:7860即可看到如下图所示的界面,按如下步骤即可进行视频剪辑

  1. 上传你的视频(或使用下方的视频用例)
  2. (可选)设置热词,设置文件输出路径(保存识别结果、视频等)
  3. 点击识别按钮获取识别结果,或点击识别+区分说话人在语音识别基础上识别说话人ID
  4. 将识别结果中的选段复制到对应位置,或者将说话人ID输入到对应为止
  5. (可选)配置剪辑参数,偏移量与字幕设置等
  6. 点击“裁剪”或“裁剪+字幕”按钮

使用大语言模型裁剪请参考如下教程

B.通过命令行调用使用FunClip的相关功能

# 步骤一:识别
python funclip/videoclipper.py --stage 1 \--file examples/2022云栖大会_片段.mp4 \--output_dir ./output
# ./output中生成了识别结果与srt字幕等
# 步骤二:裁剪
python funclip/videoclipper.py --stage 2 \--file examples/2022云栖大会_片段.mp4 \--output_dir ./output \--dest_text '我们把它跟乡村振兴去结合起来,利用我们的设计的能力' \--start_ost 0 \--end_ost 100 \--output_file './output/res.mp4'

C.通过创空间与Space体验FunClip

FunClip@Modelscope创空间⭐

FunClip@HuggingFace Space🤗

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • C语言:扫雷游戏实现
  • 探索Django
  • C语言中数组的各种排序
  • 数据结构与算法 - 链表
  • 项目实战_表白墙(简易版)
  • mysql忘记root密码 解决办法
  • 如何通过前端表格控件实现自动化报表?
  • 教育教学质量评测系统开发之软件技术分析
  • ConversationChain记忆功能案例演示
  • win10桌面任务栏美化(不用软件)(任务栏应用居中,透明任务栏)
  • 科普文:分布式数据一致性协议Paxos
  • 游戏开发规范
  • 如何通过阿里云服务器部署hexo博客(超详细)
  • 如何通过Facebook的API获取用户信息:电商营销方向详解
  • 江森自控引入电子签,“碳”索智能建筑数字未来
  • #Java异常处理
  • 【跃迁之路】【585天】程序员高效学习方法论探索系列(实验阶段342-2018.09.13)...
  • 2018以太坊智能合约编程语言solidity的最佳IDEs
  • Angular Elements 及其运作原理
  • C# 免费离线人脸识别 2.0 Demo
  • Django 博客开发教程 16 - 统计文章阅读量
  • EOS是什么
  • MaxCompute访问TableStore(OTS) 数据
  • Rancher如何对接Ceph-RBD块存储
  • React 快速上手 - 07 前端路由 react-router
  • Swift 中的尾递归和蹦床
  • swift基础之_对象 实例方法 对象方法。
  • 如何使用 OAuth 2.0 将 LinkedIn 集成入 iOS 应用
  • 三分钟教你同步 Visual Studio Code 设置
  • 事件委托的小应用
  • 温故知新之javascript面向对象
  • 远离DoS攻击 Windows Server 2016发布DNS政策
  • !!Dom4j 学习笔记
  • #我与Java虚拟机的故事#连载03:面试过的百度,滴滴,快手都问了这些问题
  • #我与Java虚拟机的故事#连载08:书读百遍其义自见
  • (done) ROC曲线 和 AUC值 分别是什么?
  • (javascript)再说document.body.scrollTop的使用问题
  • (Java岗)秋招打卡!一本学历拿下美团、阿里、快手、米哈游offer
  • (js)循环条件满足时终止循环
  • (pojstep1.1.2)2654(直叙式模拟)
  • (Python) SOAP Web Service (HTTP POST)
  • (Redis使用系列) Springboot 在redis中使用BloomFilter布隆过滤器机制 六
  • (第61天)多租户架构(CDB/PDB)
  • (翻译)Quartz官方教程——第一课:Quartz入门
  • (附源码)node.js知识分享网站 毕业设计 202038
  • (回溯) LeetCode 77. 组合
  • (三)docker:Dockerfile构建容器运行jar包
  • (实战)静默dbca安装创建数据库 --参数说明+举例
  • (一)插入排序
  • (一)十分简易快速 自己训练样本 opencv级联haar分类器 车牌识别
  • (原創) 如何刪除Windows Live Writer留在本機的文章? (Web) (Windows Live Writer)
  • (转)linux自定义开机启动服务和chkconfig使用方法
  • (转)菜鸟学数据库(三)——存储过程
  • * 论文笔记 【Wide Deep Learning for Recommender Systems】
  • .dwp和.webpart的区别