当前位置: 首页 > news >正文

AI绘画逆着玩火了,敢不敢发自拍看AI如何用文字形容你?

梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

笑不活了家人们,最近突然流行起一个新玩法:

给AI发自拍,看AI如何描述你

比如这位勇敢晒出自拍的纽约大学助理教授,他的笑容在AI看来居然是“兽人式微笑”

3a285c6561123a7dfb6db1e9bf8e1119.png

AI还吐槽他胡子没有打理,但他表示拍照那天胡子要比平常整齐多了。

f6af489667528cd2ddebd403209b1e28.png

在评论区里还有一位也被评价为兽人微笑的网友现身。

2bfe49fda9c645dd2d169f0be36ca877.png

两位“部落勇士”就这样赛博认了个亲。

9c32816ccd58fee15f58a2b069861be0.png

这还不算完,有了AI生成的描述就可以再当作提示词喂回给AI,看看能画出些什么来。

eaa7e7f9318114b0e97085b3c6aa02ad.png

不得不说,与他本人还是有一些神似的~

AI绘画逆着玩,火到服务器被挤爆

上面这个玩法,相当于把最近火爆的AI绘画逆过来玩,输入图片输出文字描述

负责文字描述的正是大名鼎鼎的CLIP,也就是DALL·E、Stable Diffusion等AI绘画模型中负责理解语言的那部分。

目前这个CLIP Interrogator(CLIP审问官),在HuggingFace上已有现成的Demo可玩。

71e1c583bd3a146303410641c2142246.png

玩法也非常简单,只需打开网页→上传图片→一键提交即可,另外还提供了简单的裁剪编辑功能,方便选择图片中想要描述的对象。

(地址放在文末)

3c94be692ed9bc9ec83cf487c529bc75.png

不过因为现在实在是太火爆,服务器资源有限经常排不上队,要多尝试几次才行。

893eae2b29162b621dd08f8b8cc601e5.png

除了上传自拍之外,更实用的玩法是上传一张心仪的图片,看看AI给出怎样的提示词。

因为与市面上常见的AI绘画模型使用了同款算法,所以这些提示词也就格外准确。

(谷歌系的Imagen等用的是自家T5语言模型,其他大部分用的是CLIP。)

先来举个栗子。

56a518f80f7735ddb827d008a57d11a0.png

AI生成的描述会包含主体内容“海龟”、艺术风格“水彩画”、作者或风格相似的作者、可能出现在什么网站、主要颜色、饱和度等等,甚至还能给出专业的绘画技法“wet-on-wet”。

584be3215eca8a4b0b2cc3c80b94501b.png

拿着这段提示词,就可以再喂回给指定的AI轻松出图了。

f95c0aaad7e88bf1a3ecfeffc772c062.png

如果稍作修改,也可以做到更换画风,或保留画风更换主体内容等众多玩法。

HuggingFace的一位工程师,还用这套流程搞出了想要很久的羊驼纹身。

c9c93d5d850d1eb4949193a4154ac104.png

看到这里,你有没有产生一些大胆的想法?

作者的个人网站是个宝藏

应用的作者,是AI绘画圈子里的大佬@pharmapsychotic。

b09bc8a3d2cd6fe6272a72d719d2f728.png

他之前做过一套高质量的机器人图集也非常火。

05a21a57201518fbf870afbe0b52d11f.png

CLIP Interrogator最早8月就推出第一版,不过一开始还不够完善,经常出现离谱的结果。

b9bee7864c9017edbfb7a3e4f91f9411.png

他在网友提的建议下不断改进,也越来越流行。

甚至最近HuggingFace官方还给他特批了4张GPU,让更多人能够玩上。

297ccb3cbbfb152884ea2860d783486e.png

在作者的个人网站上,还收集了从去年7月以来诞生的AI艺术相关工具和资源大全。

090eea89d6828e1e50d2b806737c841c.png

除了AI画画模型以外,还有超分辨等后续步骤的工具,音乐生成、视频生成工具等等,以及相关学习资料。

也是一个宝藏了~

在线试玩:
https://huggingface.co/spaces/pharma/CLIP-Interrogator

工具大全:
https://pharmapsychotic.com/tools.html

参考链接:
[1]https://twitter.com/moyix/status/1582769088807305218
[2]https://pharmapsychotic.com/

相关文章:

  • 是时候掌握SpringMVC源码了-初探篇
  • 上手Python之set(集合)
  • Visual Studio 2022开发Arduino详述
  • 【机器人定位引导中的机器视觉技术】
  • 零售商贩mysql表设计:主题信息表(theme)
  • 本文带你了解透彻云计算(前世,今生,未来)
  • ARM发布Cortex-X3和Cortex-A715
  • 麻雀算法极限学习机SSA-ELM回归预测及其MATLAB代码实现
  • 云原生DevOps篇:jenkins发送通知到企业微信机器人
  • LeetCode337:打家劫舍III
  • 【飞桨PaddleSpeech语音技术课程】— 语音识别-流式服务-模型部分
  • isomap降维算法--学习笔记
  • 【Linux】yum vim 基础工具的使用
  • QT学习_03_坐标系统和内存回收机制
  • cookies,session,token都是相对安全,并不能完全防窃取
  • 「译」Node.js Streams 基础
  • 【402天】跃迁之路——程序员高效学习方法论探索系列(实验阶段159-2018.03.14)...
  • Create React App 使用
  • Java 内存分配及垃圾回收机制初探
  • javascript面向对象之创建对象
  • Javascript设计模式学习之Observer(观察者)模式
  • Joomla 2.x, 3.x useful code cheatsheet
  • nginx 负载服务器优化
  • PHP CLI应用的调试原理
  • RxJS 实现摩斯密码(Morse) 【内附脑图】
  • SAP云平台里Global Account和Sub Account的关系
  • 道格拉斯-普克 抽稀算法 附javascript实现
  • 汉诺塔算法
  • 基于 Babel 的 npm 包最小化设置
  • 解决jsp引用其他项目时出现的 cannot be resolved to a type错误
  • ​flutter 代码混淆
  • ​ssh-keyscan命令--Linux命令应用大词典729个命令解读
  • #android不同版本废弃api,新api。
  • ( )的作用是将计算机中的信息传送给用户,计算机应用基础 吉大15春学期《计算机应用基础》在线作业二及答案...
  • (1) caustics\
  • (51单片机)第五章-A/D和D/A工作原理-A/D
  • (C#)一个最简单的链表类
  • (MIT博士)林达华老师-概率模型与计算机视觉”
  • (zt)基于Facebook和Flash平台的应用架构解析
  • (编程语言界的丐帮 C#).NET MD5 HASH 哈希 加密 与JAVA 互通
  • (二十五)admin-boot项目之集成消息队列Rabbitmq
  • (分布式缓存)Redis持久化
  • (原创)Stanford Machine Learning (by Andrew NG) --- (week 9) Anomaly DetectionRecommender Systems...
  • (转)编辑寄语:因为爱心,所以美丽
  • .apk 成为历史!
  • .NET CORE 3.1 集成JWT鉴权和授权2
  • .Net多线程总结
  • .Net转Java自学之路—SpringMVC框架篇六(异常处理)
  • @Async注解的坑,小心
  • @GetMapping和@RequestMapping的区别
  • [ C++ ] STL_vector -- 迭代器失效问题
  • [2016.7 test.5] T1
  • [2021 蓝帽杯] One Pointer PHP
  • [Android]一个简单使用Handler做Timer的例子
  • [APIO2012] 派遣 dispatching