当前位置: 首页 > news >正文

【腾讯云 HAI域探秘】探索AI绘画之路:利用腾讯云HAI服务打造智能画家

目录

  • 前言
  • 1 使用HAI服务作画的步骤
    • 1.1 注册腾讯云账户
    • 1.2 创建算力服务器
    • 1.3 进入模型管理界面
    • 1.4 汉化界面
    • 1.5 探索AI绘画
  • 2 模型参数的含义和调整建议
    • 2.1 模型参数的含义和示例
    • 2.2 模型参数的调整建议
  • 3 调整参数作画的实践和效果
    • 3.1 实践说明
    • 3.2 实践效果1
    • 3.3 实践效果2
    • 3.4 实践效果3
    • 3.5 实践效果4
    • 3.6 实践效果5
  • 4 实践的思考
    • 4.1 提升算力
    • 4.2 参数调整与观察
  • 结语
  • 参考文献

前言

随着人工智能的飞速发展,AI在艺术创作领域的应用正经历着一场革命性的变革。在这个数字时代,腾讯云的高性能应用服务HAI(Hyper Application Inventor)为艺术家和创作者提供了前所未有的机会,让他们能够借助先进的技术实现更加创新和引人入胜的艺术创作。

在本博客中,我将分享如何巧妙地运用腾讯云的HAI服务进行AI绘画,通过对模型参数的微妙调整,观察图画效果,从而深入测试HAI在AI绘画领域的无限潜力。而通过对界面进行汉化,我们不仅提高了使用的便捷性,也为创作者提供了更加亲切的操作体验,使整个创作过程更加流畅而愉悦。在这个充满创意的旅程中,我们将揭开AI绘画的神秘面纱,探寻其在艺术创作中的独特魅力。

1 使用HAI服务作画的步骤

1.1 注册腾讯云账户

首先,你需要在腾讯云上注册一个账户。在完成注册后,申请高性能应用服务HAI,通过审核后,你将能够使用其强大的算力服务。

1.2 创建算力服务器

在HAI服务中的算力管理中,新建一个算力服务器。选择AI模型中的stable diffusion模型服务。根据你的需求选择服务器的具体参数,如果不确定,可以先使用提供的默认配置。生成算力服务器的过程可能需要2-8分钟,耐心等待生成完成。
在这里插入图片描述

1.3 进入模型管理界面

生成服务器后,点击算力链接,选择Gradio WebUI,进入模型管理界面。

在这里插入图片描述

1.4 汉化界面

在模型管理界面中,依次选择extension,available,勾选script,ads,installed,取消勾选localization,然后点击load from。在插件列表中搜索zh_CN,找到以zh_CN开头的插件并安装。
在这里插入图片描述

接着,选择setting,点击Reload UI,重启服务。再次选择setting,找到User Interface选项,下拉选择语言 zh_CN,点击Apply settings保存设置,点击Reload UI重启服务。
在这里插入图片描述

此时,你将得到一个汉化后的界面,使操作更加直观和友好。
在这里插入图片描述

1.5 探索AI绘画

现在,你可以开始探索AI绘画的奇妙世界了。通过Gradio WebUI,你可以轻松上传图片、调整参数,并观察AI模型的绘画效果。尝试不同的输入,看看AI是如何理解和呈现你的创意的。
在这里插入图片描述

2 模型参数的含义和调整建议

在使用腾讯云的HAI服务进行AI绘画时,理解并调整模型的参数是关键的一步,可以通过合理设置参数来获得更满意的绘画效果。

2.1 模型参数的含义和示例

参数名称描述示例
提示词(Prompt)主要描述图像的关键信息,包括内容、风格等。这些词将直接影响模型生成的图像。提示词可以包括多个关键词,以逗号分隔。a pretty cat, cyberpunk art, kerem beyit, very cute robot zen, Playful, Independent, beeple
反向提示词(Negative Prompt)反向提示词是为了告诉模型我们不需要的风格或内容,以避免生成不符合期望的图像。(deformed, distorted, disfigured:1.0), poorly drawn, bad anatomy, wrong anatomy, extra limb, missing limb, floating limbs, (mutated hands and fingers:1.5), disconnected limbs, mutation, mutated, ugly, disgusting, blurry, amputation, flowers, human, man, woman
提示词相关性(CFG Scale)分类器自由引导尺度,即图像与提示符的一致程度。值越低,生成的结果越有创意。7
采样方法(Sampling Method)采样模式,影响扩散算法的去噪声采样模式。不同的采样模式会产生不同的效果。默认选择 “Euler”,具体效果可以逐步尝试中。
采样迭代步数(Sampling Steps)在生成图片时进行的迭代步骤。更高的迭代步数会增加计算时间和成本,但不一定意味着更好的结果。80(注意:不少于50,过少可能导致图像质量下降)
随机种子(Seed)随机数种子,用于确定扩散的初始状态。不懂的话,可以使用随机的种子。1791574510

2.2 模型参数的调整建议

  • 提示词:
    这是启发AI模型的关键信息。在提示词中,可以包含描述图像内容、风格等方面的关键词。通过精准的提示词,可以引导模型生成符合期望的图像。

  • 反向提示词:
    这些词用于告诉模型生成图像时避免的风格或内容。通过添加反向提示词,可以有效地控制生成图像的质量和风格,确保结果更符合预期。

  • 提示词相关性:
    这个参数用于调整图像生成时分类器的自由引导尺度。较低的值可以产生更有创意的结果,但也可能导致图像与提示词之间的一致性减弱。建议先尝试默认值,再根据创意需求逐步调整。

  • 采样方法:
    选择不同的采样模式可以影响扩散算法的去噪声采样模式,从而影响生成的图像效果。默认选择 “Euler”,但可以尝试其他模式以观察不同效果,找到最适合你需求的采样方法。

  • 采样迭代步数:
    这个参数决定在生成图像时进行的迭代步骤。更高的迭代步数允许模型更多次地比对提示词和当前结果,但也会增加计算时间和成本。建议先使用默认值,再根据所需的图像质量和计算资源逐步调整。

  • 随机种子:
    随机种子用于确定扩散的初始状态。如果不理解其作用,可以使用默认的随机值。如果希望生成一组相似的图像,可以尝试不同的种子值,这样可以探索到多样性的图像生成效果。

通过灵活地调整这些参数,你可以在绘画过程中找到平衡点,确保生成的图像符合你的预期和创意需求。尽管每个参数的影响可能有些微妙,但通过逐步尝试和观察,你将能够更好地理解如何优化这些参数以获得最佳结果。

3 调整参数作画的实践和效果

3.1 实践说明

不同参数下图片效果,为了方便比较,采用了相同的提示词和反向提示词,采样方法都使用了Euler。调整采样步数的时候,会出现报错,所以采样步数也统一使用了80。

提示词:
A serene and picturesque riverbank scene unfolds, capturing the essence of tranquility as it portrays a delightful moment—a little girl, with genuine joy, feeding a group of charming ducks by the water’s edge.

一幅宁静而如画的河岸场景展现在眼前,捕捉到了宁静的精髓,描绘了一个令人愉悦的瞬间:一个小女孩带着真挚的喜悦,在水边喂食一群迷人的鸭子。

反向提示词:
Deformed, distorted, disfigured: 1.0, poorly drawn, bad anatomy, wrong anatomy: 1.0, extra limb, missing limb, floating limbs: 1.0, mutated hands and fingers: 1.5, disconnected limbs: 1.0, mutation, mutated: 1.0, ugly, disgusting: 1.0, blurry: 1.0, amputation: 1.0, flowers: 1.0, human, man, woman: 1.0.

以下是不同的尺寸、提示词相关性、随机种子等对应生成的图片效果。

3.2 实践效果1

  • 参数
参数名称参数值
宽度512
高度512
提示词相关性7
随机种子-2
  • 图画效果

在这里插入图片描述

3.3 实践效果2

  • 参数
参数名称参数值
宽度800
高度450
提示词相关性7
随机种子-2
  • 图画效果

在这里插入图片描述

  • 参数详情

A serene and picturesque riverbank scene unfolds, capturing the essence of tranquility as it portrays a delightful moment—a little girl, with genuine joy, feeding a group of charming ducks by the water’s edge.
Negative prompt: Deformed, distorted, disfigured: 1.0, poorly drawn, bad anatomy, wrong anatomy: 1.0, extra limb, missing limb, floating limbs: 1.0, mutated hands and fingers: 1.5, disconnected limbs: 1.0, mutation, mutated: 1.0, ugly, disgusting: 1.0, blurry: 1.0, amputation: 1.0, flowers: 1.0, human, man, woman: 1.0.
Steps: 80, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: -2, Size: 800x450, Model hash: 6ce0161689, Model: v1-5-pruned-emaonly, Version: v1.6.0-2-g4afaaf8a

用时:20.6 sec.

A: 2.75 GB, R: 4.07 GB, Sys: 5.1/14.5791 GB (35.3%)

3.4 实践效果3

  • 参数
参数名称参数值
宽度800
高度450
提示词相关性5
随机种子-2
  • 图画效果

在这里插入图片描述

3.5 实践效果4

  • 参数
参数名称参数值
宽度800
高度450
提示词相关性14
随机种子-2
  • 图画效果

在这里插入图片描述

3.6 实践效果5

  • 参数
参数名称参数值
宽度800
高度450
提示词相关性14
随机种子123456
  • 图画效果

在这里插入图片描述

4 实践的思考

在我们的实践中,我们使用了基础的HAI算力,这意味着在设置采样步数和图像尺寸等参数时,存在一定的限制,可能会面临内存溢出或其他错误的问题。为了克服这些限制,我们有两个主要的调整方向:

4.1 提升算力

通过升级到更高级别的算力,我们可以获得更大的计算资源,从而能够处理更大尺寸的图像或者使用更复杂、细致的模型。这不仅可以提高生成图像的分辨率,还可以尝试使用更先进的算法和模型,以获得更具创意和艺术性的结果。

4.2 参数调整与观察

在相同算力下,我们可以进一步调整模型的参数,以观察不同参数值对生成图像的影响。例如,可以尝试不同的采样步数、提示词相关性或者其他模型特定的参数。通过系统地调整这些参数,我们能够找到最适合我们需求的组合,使图像达到最佳效果。

在调整参数时,需要注意的是权衡计算资源的使用和生成图像的质量。过高的参数值可能导致内存溢出或计算时间过长,而过低的值可能会影响图像的清晰度和艺术性。因此,调整参数时要根据实际情况权衡各种因素,以达到最佳的生成效果。

通过这样的调整和优化过程,我们能够在不同的算力和参数设置下,探索到更广泛的创作空间,创造出更令人惊叹的AI绘画作品。

结语

在整个实践过程中,我们不仅仅是在使用技术,更是在与AI进行一场创意的对话。AI绘画不仅可以为艺术家提供灵感,也为普通用户提供了一个轻松而有趣的创作平台。

通过腾讯云的HAI服务,我们不仅能够体验到先进的算力计算,还能享受到用户友好的界面和强大的功能。对于初学者来说,这是一个非常好的平台,可以在不深入了解复杂技术的情况下,快速上手AI绘画。

利用腾讯云的HAI服务进行AI作画是一次愉快的体验。这种技术的普及不仅为艺术家提供了更多可能性,也为普通用户打开了艺术创作的大门。在未来,随着技术的不断发展,我们可以期待更多有趣、实用的AI艺术应用的涌现。愿我们能在这个数字化的创作世界中,发现更多的惊喜和创新。

参考文献

https://csdn-res-1253910586.cos.ap-nanjing.myqcloud.com/HAI-AIGC.html

相关文章:

  • 二分法
  • 出口美国操作要点汇总│走美国海运拼箱的注意事项│箱讯科技
  • Linux学习教程(第一章 简介)3
  • 抢占全球30%碳化硅市场份额!英飞凌押注低碳化和数字化“新时代”
  • AD教程 (十二)原理图的编译设置和检查
  • 特殊矩阵的压缩存储(对称矩阵,三角矩阵,三对角矩阵,稀疏矩阵)
  • vue中数据代理和事件处理
  • 微服务架构下如何使用多环境多服务联合调试
  • 基于GCC的工具objdump实现反汇编
  • 禅道项目信息通知到钉钉群配置步骤
  • 1438 绝对差不超过限制的最长连续子数组(单调队列)
  • SQL触发器
  • Hadoop架构、Hive相关知识点及Hive执行流程
  • 个人app编程的好处及条件
  • CSS知识点梳理(一)
  • [译]前端离线指南(上)
  • 《网管员必读——网络组建》(第2版)电子课件下载
  • HashMap ConcurrentHashMap
  • iBatis和MyBatis在使用ResultMap对应关系时的区别
  • Kibana配置logstash,报表一体化
  • learning koa2.x
  • Linux快速配置 VIM 实现语法高亮 补全 缩进等功能
  • mysql 5.6 原生Online DDL解析
  • Octave 入门
  • python3 使用 asyncio 代替线程
  • Python代码面试必读 - Data Structures and Algorithms in Python
  • React 快速上手 - 07 前端路由 react-router
  • React16时代,该用什么姿势写 React ?
  • React-redux的原理以及使用
  • SQLServer之创建显式事务
  • vue-cli3搭建项目
  • vue-router的history模式发布配置
  • Vue小说阅读器(仿追书神器)
  • 驱动程序原理
  • 如何合理的规划jvm性能调优
  • 如何优雅的使用vue+Dcloud(Hbuild)开发混合app
  • 说说动画卡顿的解决方案
  • 新版博客前端前瞻
  • ​DB-Engines 12月数据库排名: PostgreSQL有望获得「2020年度数据库」荣誉?
  • #### go map 底层结构 ####
  • #Linux(make工具和makefile文件以及makefile语法)
  • #快捷键# 大学四年我常用的软件快捷键大全,教你成为电脑高手!!
  • (03)光刻——半导体电路的绘制
  • (webRTC、RecordRTC):navigator.mediaDevices undefined
  • (附源码)springboot码头作业管理系统 毕业设计 341654
  • (附源码)计算机毕业设计大学生兼职系统
  • (三)elasticsearch 源码之启动流程分析
  • (十六)Flask之蓝图
  • (四)七种元启发算法(DBO、LO、SWO、COA、LSO、KOA、GRO)求解无人机路径规划MATLAB
  • (学习日记)2024.02.29:UCOSIII第二节
  • (转)关于如何学好游戏3D引擎编程的一些经验
  • .bat批处理(八):各种形式的变量%0、%i、%%i、var、%var%、!var!的含义和区别
  • .mat 文件的加载与创建 矩阵变图像? ∈ Matlab 使用笔记
  • .NET 表达式计算:Expression Evaluator
  • .NET 中 GetHashCode 的哈希值有多大概率会相同(哈希碰撞)