From Noise to Image – interactive guide to diffusion
3 months ago
- #AI
- #Text-to-Image
- #Diffusion Models
- 可能的图像数量极其庞大,约为10^400000,其中大部分是随机噪声。
- 扩散模型从随机噪声开始逐步去除噪声形成连贯图像,与人类从空白画布开始创作不同。
- 模型在压缩的'潜空间'中运作,其维度比完整图像空间少得多,使处理过程更易管理。
- 文本提示被映射到高维'嵌入空间',作为扩散过程的指南针。
- 随机种子决定了图像空间的起点,导致相同提示也会产生略微不同的结果。
- 推理步骤数量影响图像质量:步骤过少可能导致偏离预期,步骤过多则可能无法显著提升质量。
- 详细提示能更严格地约束方向,相比模糊提示可获得更好效果。
- '引导尺度'决定模型遵循提示的强度,值越高图像受约束越强但可能显得不自然。
- 扩散模型从噪声到图像的旅程,是在提示、随机种子、步数和引导尺度的共同指引下穿越巨大空间的过程。