LikeGiver

LikeGiver

图片生成技术调研

39
0
0
2023-11-05
图片生成技术调研

一、总览

  • AI绘画是根据你输入的文字描述生成图片

  • stable diffusion (这里主要指A1111的stable diffusion WebUI,还有其他类似版本)开源,免费,插件和模型众多,灵活,可控

  • midjoruney 收费,需要魔法,能生成高质量图片,生成结果比较随机

  • huggingface的diffusers库支持便捷实现图片、音频生成(支持stable diffusion模型)

SD中文简短教程(五个月前停止更新)https://www.yuque.com/a-chao/sd/ydclseab10ca6c7t

Diffusion model概念:What are Diffusion Models?'

一个简单的google drive demo: https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/diffusers_intro.ipynb#scrollTo=V2Rk_bZeBTVq

Datawhale 的diffusers的教程:《扩散模型从原理到实践》学习手册

生成加速教程:Speed up Stable Diffusion - Stable Diffusion Art

prompt教程:Stable Diffusion prompt: a definitive guide - Stable Diffusion Art

二、功能

  • 文生图、图生图(蒙版、填充)

  • 光影文字

image.png结合controlnet实现

三、A1111版本SD-WebUI使用

SDXL使用基本教程参考:https://aituts.com/sdxl/#Prompting_in_SDXL

风格prompt参考:https://aituts.com/sdxl-prompts/