LikeGiver

图片生成技术调研

技术

40

0

0

2023-11-05

图片生成技术调研

一、总览

AI绘画是根据你输入的文字描述生成图片
stable diffusion （这里主要指A1111的stable diffusion WebUI，还有其他类似版本）开源，免费，插件和模型众多，灵活，可控
midjoruney 收费，需要魔法，能生成高质量图片，生成结果比较随机
huggingface的diffusers库支持便捷实现图片、音频生成（支持stable diffusion模型）

SD中文简短教程（五个月前停止更新）https://www.yuque.com/a-chao/sd/ydclseab10ca6c7t

Diffusion model概念：What are Diffusion Models?'

一个简单的google drive demo： https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/diffusers_intro.ipynb#scrollTo=V2Rk_bZeBTVq

Datawhale 的diffusers的教程：《扩散模型从原理到实践》学习手册

生成加速教程：Speed up Stable Diffusion - Stable Diffusion Art

prompt教程：Stable Diffusion prompt: a definitive guide - Stable Diffusion Art

二、功能

文生图、图生图（蒙版、填充）
光影文字

结合controlnet实现

三、A1111版本SD-WebUI使用

SDXL使用基本教程参考：https://aituts.com/sdxl/#Prompting_in_SDXL

风格prompt参考：https://aituts.com/sdxl-prompts/

#technology ²² #技术 ¹⁸

笔者目前在干啥