当前位置: 首页 > news >正文

[AI StoryDiffusion] 创造神奇故事,AI漫画大乱斗!

今天介绍一个新的AI项目,StoryDiffusion,用于生成一致性连贯的图像和视频。

因为它的一致性,因此可以用于创建漫画,或者长视频。

官方示例可看文末链接,这里不再赘述。

关键特性:

StoryDiffusion 可以通过生成连贯的图像和视频来创造一个神奇的故事。我们的工作主要包括两个部分:

  1. 长距离序列中角色一致的图像生成的连贯自注意力机制。它是即插即用的,与所有基于SD1.5和SDXL的图像扩散模型兼容。在当前的实现中,用户需要为连贯自注意力模块提供至少3个文本提示。我们建议至少提供5-6个文本提示以获得更好的布局安排。
  2. 长距离视频生成的运动预测器,它在压缩的图像语义空间中预测条件图像之间的运动,实现更大范围的运动预测。

安装

安装很简单,依次执行几个命令

conda create --name storydiffusion python=3.10
conda activate storydiffusion
pip install -U pip
pip install -r requirements.txtpython gradio_app_sdxl_specific_id_low_vram.py

使用

我们看下界面

ui-1

ui-2

所以,需要输入“角色描述” 和 “漫画描述”,基本上就可以了。

程序员经常争论代码对齐用 tab 还是 space,我们考虑用这个话题做个漫画。

角色描述

[汤姆] 一个戴眼镜的年轻程序员,穿着带有编程口号的T恤。
[丽莎] 一个女开发者,短发,笔记本电脑上贴满了科技标志的贴纸。

漫画描述

[汤姆] 在办公室,正在键盘上打字 #汤姆正在编写一段代码。
[丽莎] 在同一个办公室,正在她的笔记本电脑上查看汤姆的代码 #丽莎问汤姆他是用的tab还是空格。
[汤姆] 和 [丽莎] 争论,双方都显得很沮丧 #汤姆辩解用tab,丽莎坚持用空格。
[汤姆] 和 [丽莎] 打起来了,纸张和笔记本飞得到处都是 #他们的争论升级成了肢体冲突。

然后点“Generate”,出图!

tab-or-space

样例

我们再来看几个例子。还是 tab or space 主题,换漫画风格试试

tab-or-space-comicbook

tab-or-space-lineart

tab-or-space-photographic

tab-or-space-realvision

再换几个主题试试

人工智能是否会取代人类工作?

ai-replace-human-anime

猫和狗哪个是更好的宠物?

dog-or-cat-anime

哪个操作系统更好:Windows还是macOS?

win-or-mac-anime


  • github
  • 官网
  • AI 博客 - 从零开始学AI
  • 公众号 - 从零开始学AI

相关文章:

  • 钉钉魔点指纹考勤机多少钱一台,指纹门禁考勤一体机价格
  • 【虚拟现实】二、主要的AR/VR硬件设备
  • Bybatis动态SQL的绑定和公共sql语句片段
  • C# WinForm —— 34 ToolStrip 工具栏 介绍
  • Xinstall:解决App安装跳转难题,让你的用户流畅体验不再受阻
  • Python初学笔记
  • 从零实现ChatGPT:第二章使用注意力Dropout减少过拟合
  • CMS与AI的融合:构建万能表单小程序系统
  • linux的一些知识点分享-------关于操作维护的一些知识点
  • 【通信原理】数字频带传输系统
  • 数据加密技术起到了什么作用?一分钟带你详细了解!
  • openGauss学习笔记-299 openGauss AI特性-AI4DB数据库自治运维-DBMind的AI子功能-SQLdiag慢SQL发现
  • 本地GPT-window平台 搭建ChatGLM3-6B
  • Oracle最终会扼杀MySQL?(译)
  • 最新下载:CorelDraw 2023【软件附加安装教程】
  • 《Java8实战》-第四章读书笔记(引入流Stream)
  • 【每日笔记】【Go学习笔记】2019-01-10 codis proxy处理流程
  • 2017-09-12 前端日报
  • AzureCon上微软宣布了哪些容器相关的重磅消息
  • mysql innodb 索引使用指南
  • Python语法速览与机器学习开发环境搭建
  • webgl (原生)基础入门指南【一】
  • 复习Javascript专题(四):js中的深浅拷贝
  • 简单数学运算程序(不定期更新)
  • 开发基于以太坊智能合约的DApp
  • 聊聊directory traversal attack
  • 聊聊redis的数据结构的应用
  • 我的业余项目总结
  • 想使用 MongoDB ,你应该了解这8个方面!
  • 一个项目push到多个远程Git仓库
  • 昨天1024程序员节,我故意写了个死循环~
  • ​直流电和交流电有什么区别为什么这个时候又要变成直流电呢?交流转换到直流(整流器)直流变交流(逆变器)​
  • #中国IT界的第一本漂流日记 传递IT正能量# 【分享得“IT漂友”勋章】
  • #周末课堂# 【Linux + JVM + Mysql高级性能优化班】(火热报名中~~~)
  • $(document).ready(function(){}), $().ready(function(){})和$(function(){})三者区别
  • (5)STL算法之复制
  • (Git) gitignore基础使用
  • (第一天)包装对象、作用域、创建对象
  • (免费领源码)python#django#mysql公交线路查询系统85021- 计算机毕业设计项目选题推荐
  • (十八)devops持续集成开发——使用docker安装部署jenkins流水线服务
  • (转)Sql Server 保留几位小数的两种做法
  • (转)视频码率,帧率和分辨率的联系与区别
  • .libPaths()设置包加载目录
  • .NET Core WebAPI中封装Swagger配置
  • .NET Framework 4.6.2改进了WPF和安全性
  • .NET WebClient 类下载部分文件会错误?可能是解压缩的锅
  • .Net程序猿乐Android发展---(10)框架布局FrameLayout
  • [ai笔记4] 将AI工具场景化,应用于生活和工作
  • [Android Pro] Notification的使用
  • [CC-FNCS]Chef and Churu
  • [emuch.net]MatrixComputations(7-12)
  • [JavaScript]如何讓IE9, IE8, IE7, IE6關閉視窗時不彈出對話訊息
  • [Linux内核驱动]模块参数
  • [Oh My C++ Diary]头文件使用之math.h与cmath
  • [one_demo_18]js定时器的示例