当前位置: 首页 > news >正文

使用 ModelScope 本地部署图片变视频模型

最近在抖音上看到很多视频可以让图片动起来,搜了一下,stabilityai/stable-video-diffusion-img2vid-xt 这个模型可以实现图片到视频,可以生成 25 帧的视频。Kling 和 Runway 都支持从图片生成视频,本文将通过 ModelScope 搭建一个可以运行在本地的图片到视频的模型。
请添加图片描述

运行 ModelScope

这里使用容器的方式运行 ModelScope,关于容器的信息,详见官网介绍
https://modelscope.cn/docs/%E7%8E%AF%E5%A2%83%E5%AE%89%E8%A3%85

  1. /opt/modelscope/models:/mnt/workspace/.cache, 将模型下载路径映射到主机上,模型数据可以保留
  2. /opt/modelscope/notebook:/notebook,notebook 数据进行保留
  3. -p 8890:8888 -p 8891-8895:8891-8895,根据需要映射端口
docker run --rm --runtime=nvidia  --shm-size=32g --gpus all  -p 8890:8888 -p 8891-8895:8891-8895 \
-v /opt/modelscope/models:/mnt/workspace/.cache \
-v /opt/modelscope/notebook:/notebook \-it registry.cn-beijing.aliyuncs.com/modelscope-repo/modelscope:ubuntu22.04-cuda12.1.0-py310-torch2.1.2-tf2.14.0-1.13.1 /bin/bash 

运行模型

下载模型

from diffusers import DiffusionPipeline
from modelscope import snapshot_downloadmodel_dir = snapshot_download("AI-ModelScope/stable-video-diffusion-img2vid-xt")

运行模型

import torch
from diffusers import StableVideoDiffusionPipeline
from diffusers.utils import load_image, export_to_video
pipe = StableVideoDiffusionPipeline.from_pretrained(model_dir, torch_dtype=torch.float16, variant="fp16")pipe.enable_model_cpu_offload()# Load the conditioning image
image = load_image("route-fifty-lead-image.jpg")
image = image.resize((1024, 576))generator = torch.manual_seed(44)
frames = pipe(image, decode_chunk_size=8, generator=generator).frames[0]export_to_video(frames, "generated.mp4", fps=7)

原图
在这里插入图片描述
生成的视频

请添加图片描述

总结

ModelScope 最大的优点就是安装了所有运行模型需要的依赖库,可以说是一键运行。下载模型速度也非常快,能够快速体验所有的模型,如果本地没有资源也可以是使用 ModelScope 提供的工作空间,需要付费。

本文使用的环境

操作系统 Ubuntu、GPU 2080ti 22G。

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 深入理解Java注解
  • [网鼎杯 2020 青龙组]AreUSerialz1
  • vue后台管理系统 vue3+vite+pinia+elementui+axios下
  • 接口测试框架中测试用例管理模块的优化与思考!
  • 理解ThreadLocal 变量副本,为什么不同线程的 ThreadLocalMap互不干扰
  • LSTM与GNN强强结合!全新架构带来10倍推理速度提升
  • centos7 中安装 mysql 8.x以及对数据库的管理(数据库、表的增删改查、插入删除数据)
  • Electron工作流程(2)——进程间通信
  • JavaScript青少年简明教程:面向对象编程入门
  • WEB服务器的详解与部署
  • 数学建模评价类模型—层次分析法(无数据情况下)
  • 解决VideoReader出现Thread worker: Error sending packet报错
  • Harmony-(2)-ArkTs
  • 精通Python爬虫中的XPath:从安装到实战演示
  • spring security和核心流程
  • 【comparator, comparable】小总结
  • 2017前端实习生面试总结
  • ES6, React, Redux, Webpack写的一个爬 GitHub 的网页
  • JavaScript HTML DOM
  • Java多态
  • MYSQL 的 IF 函数
  • ReactNativeweexDeviceOne对比
  • SpringCloud(第 039 篇)链接Mysql数据库,通过JpaRepository编写数据库访问
  • Sublime text 3 3103 注册码
  • Vue UI框架库开发介绍
  • 阿里中间件开源组件:Sentinel 0.2.0正式发布
  • 成为一名优秀的Developer的书单
  • 简析gRPC client 连接管理
  • 开年巨制!千人千面回放技术让你“看到”Flutter用户侧问题
  • 如何优雅地使用 Sublime Text
  • 如何抓住下一波零售风口?看RPA玩转零售自动化
  • 扫描识别控件Dynamic Web TWAIN v12.2发布,改进SSL证书
  • 温故知新之javascript面向对象
  • 想写好前端,先练好内功
  • 关于Android全面屏虚拟导航栏的适配总结
  • ​14:00面试,14:06就出来了,问的问题有点变态。。。
  • ​DB-Engines 12月数据库排名: PostgreSQL有望获得「2020年度数据库」荣誉?
  • ​Redis 实现计数器和限速器的
  • #中国IT界的第一本漂流日记 传递IT正能量# 【分享得“IT漂友”勋章】
  • (+3)1.3敏捷宣言与敏捷过程的特点
  • (3)llvm ir转换过程
  • (二)学习JVM —— 垃圾回收机制
  • (分享)一个图片添加水印的小demo的页面,可自定义样式
  • (附源码)spring boot智能服药提醒app 毕业设计 102151
  • (附源码)springboot“微印象”在线打印预约系统 毕业设计 061642
  • (附源码)springboot人体健康检测微信小程序 毕业设计 012142
  • (附源码)计算机毕业设计ssm本地美食推荐平台
  • (循环依赖问题)学习spring的第九天
  • (转)我也是一只IT小小鸟
  • (转贴)用VML开发工作流设计器 UCML.NET工作流管理系统
  • (自用)仿写程序
  • .[hudsonL@cock.li].mkp勒索加密数据库完美恢复---惜分飞
  • .Net Core缓存组件(MemoryCache)源码解析
  • .NET Core中如何集成RabbitMQ
  • .NET Framework 和 .NET Core 在默认情况下垃圾回收(GC)机制的不同(局部变量部分)