当前位置: 首页 > news >正文

【一步一步手把手教会你】Deep_live_cam一键克隆动态的目标对象

引言

每当科研累了的时候,总想找一些有趣的AI项目上手试一下效果,感受最新的AI进展。前两天deep_live_cam又火了一圈,今天花了半天的时间进行了一次复现部署,快速给出它的介绍。

在这里插入图片描述

网上有很多集成包,但是大部分都是付费的骗子,实际上,由于这个包依赖较多,很难集成到一个程序就能搞定的地步。因此,本文主要按照顺序一步一步教会你在Win10/11下进行此程序。

该项目在github上已经开源,并且也给出了详细的指南。大家按照指南就可以运行。本文是一个复现指导。

1. 下载源文件

首先,我们准备环境,首先安装conda/mini-conda,获得anaconda prompt命令行。这里需要设置一下pip的镜像源,建议阿里云,比清华云镜像全一些。

pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/

然后安装git。

然后安装ffmpeg,这里我没有使用它官方的安装,而是采用了GPT-4o给我的意见:

在Windows上安装 ffmpeg
下载 ffmpeg:前往 ffmpeg 的官网下载页面(https://ffmpeg.org/download.html)。
选择 Windows 版本,下载 ffmpeg-release-essentials 压缩包。
解压 ffmpeg:将下载的压缩包解压到一个目录(例如 C:\ffmpeg)。
配置系统环境变量:打开“系统属性” > “高级系统设置” > “环境变量”。
在“系统变量”中,找到 Path,并点击“编辑”。
点击“新建”,然后将 C:\ffmpeg\bin (根据你解压的目录设置)添加到 Path 中。
确定所有对话框,保存设置。
验证安装:打开命令提示符,输入 ffmpeg -version。如果显示版本信息,说明安装成功。

这里选择:
在这里插入图片描述
在这里插入图片描述
需要注意的是,这里设置完环境变量后,需要重启命令行。

然后安装VS 2022 runtimes,这里下载运行后,不知道该安装什么,这里选择左上角第一个。

最后,克隆仓库:

git clone https://github.com/hacksider/Deep-Live-Cam.git

然后,还需要下载两个模型,并且将其放置在models文件夹下:
GFPGANv1.4
inswapper_128_fp16.onnx

2. 安装依赖

首先创建conda的独立的python=3.10的环境:

conda create -n deep_live python=3.10

然后,进入deep_live_cam的文件夹目录,安装依赖项:

pip install -r requirements.txt

这里安装容易因为网络问题,安装失败,建议多尝试几次。

如果你没有GPU的话,到此就结束了。然后直接运行python run.py即可。但是建议还是需要显卡运行(这里我是4090,网上传闻最低6G显卡,那么60系以上的显卡都是支持的。)

如果需要安装CUDA的,还需要下面一道工序。

pip uninstall onnxruntime onnxruntime-gpu
pip install onnxruntime-gpu==1.16.3

然后运行就可以了:

python run.py --execution-provider cuda

运行完的界面如图所示:
在这里插入图片描述
首先点击Select a face,这里选择你想要克隆的对象照片,记住要有可以识别的脸,如果没有的话,容易出现报错。然后点击Live就可以了。如果显卡性能好的话,左边3个选项都可以开,能获得更高的视频性能。

3. 视频录制/直播

这里我们选择OBS就可以。至于更高级的直播教程我们这里就不赘述了,大家可以自己尝试。

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 用AI来学习英语口语(白嫖,所以稍微麻烦些)
  • Python数据可视化库之bqplot使用详解
  • OpenMax算法详解:深度学习中的高效开集识别技术
  • 注册安全分析报告:助通信息
  • 前端环境搭建:node.js、npm的下载和安装
  • 气膜建筑与装配式建筑的对比分析—轻空间
  • 优化uni-app页面间的传参跳转【兼容多端】
  • 网络编程Day9_IO多路复用 20240821
  • Python编码系列—Python WebSocket 实时通信:构建高效互动的网络应用
  • 什么是云原生?
  • HTTPS证书申请简明指南
  • redis能正常访问,但是springboot编译报错
  • Mobile-Agent项目部署与学习总结(DataWhale AI夏令营)
  • 前端宝典十四:Node缓存、安全与鉴权
  • FastAdmin 和 Dcat Admin从使用场景、适合人群、使用成本、资源完善程度、bug 解决、安全性全方位解析
  • (三)从jvm层面了解线程的启动和停止
  • [译]Python中的类属性与实例属性的区别
  • 「前端」从UglifyJSPlugin强制开启css压缩探究webpack插件运行机制
  • Angular js 常用指令ng-if、ng-class、ng-option、ng-value、ng-click是如何使用的?
  • angular2 简述
  • Bootstrap JS插件Alert源码分析
  • Cookie 在前端中的实践
  • egg(89)--egg之redis的发布和订阅
  • Fastjson的基本使用方法大全
  • Iterator 和 for...of 循环
  • java第三方包学习之lombok
  • LeetCode541. Reverse String II -- 按步长反转字符串
  • PAT A1050
  • Python语法速览与机器学习开发环境搭建
  • springboot_database项目介绍
  • SSH 免密登录
  • vue:响应原理
  • Web Storage相关
  • webpack+react项目初体验——记录我的webpack环境配置
  • 讲清楚之javascript作用域
  • 前端之React实战:创建跨平台的项目架构
  • 如何实现 font-size 的响应式
  • 深度学习入门:10门免费线上课程推荐
  • 手机端车牌号码键盘的vue组件
  • 想使用 MongoDB ,你应该了解这8个方面!
  • JavaScript 新语法详解:Class 的私有属性与私有方法 ...
  • 树莓派用上kodexplorer也能玩成私有网盘
  • ​3ds Max插件CG MAGIC图形板块为您提升线条效率!
  • ​补​充​经​纬​恒​润​一​面​
  • ​低代码平台的核心价值与优势
  • ​七周四次课(5月9日)iptables filter表案例、iptables nat表应用
  • ### Error querying database. Cause: com.mysql.jdbc.exceptions.jdbc4.CommunicationsException
  • #我与Java虚拟机的故事#连载03:面试过的百度,滴滴,快手都问了这些问题
  • $Django python中使用redis, django中使用(封装了),redis开启事务(管道)
  • (2)MFC+openGL单文档框架glFrame
  • (delphi11最新学习资料) Object Pascal 学习笔记---第14章泛型第2节(泛型类的类构造函数)
  • (html转换)StringEscapeUtils类的转义与反转义方法
  • (NO.00004)iOS实现打砖块游戏(九):游戏中小球与反弹棒的碰撞
  • (多级缓存)缓存同步
  • (附源码)spring boot建达集团公司平台 毕业设计 141538