图片生成技术调研
一、总览
AI绘画是根据你输入的文字描述生成图片
stable diffusion (这里主要指A1111的stable diffusion WebUI,还有其他类似版本)开源,免费,插件和模型众多,灵活,可控
midjoruney 收费,需要魔法,能生成高质量图片,生成结果比较随机
huggingface的diffusers库支持便捷实现图片、音频生成(支持stable diffusion模型)
SD中文简短教程(五个月前停止更新)https://www.yuque.com/a-chao/sd/ydclseab10ca6c7t
Diffusion model概念:What are Diffusion Models?'
一个简单的google drive demo: https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/diffusers_intro.ipynb#scrollTo=V2Rk_bZeBTVq
Datawhale 的diffusers的教程:《扩散模型从原理到实践》学习手册
生成加速教程:Speed up Stable Diffusion - Stable Diffusion Art
prompt教程:Stable Diffusion prompt: a definitive guide - Stable Diffusion Art
二、功能
文生图、图生图(蒙版、填充)
光影文字
结合controlnet实现
三、A1111版本SD-WebUI使用
SDXL使用基本教程参考:https://aituts.com/sdxl/#Prompting_in_SDXL
风格prompt参考:https://aituts.com/sdxl-prompts/