打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
AI绘画不再难!SD webui 参数详细解析,一文读懂!(上)
userphoto

2023.08.12 陕西

关注

目录

一、引言

二、txt2img 标签页

        1、Prompt(正向提示词)

        2、Negative prompt(反向提示词)

        3、Width & Height(图片尺寸)

        4、CFG Scale(CFG值)

        5、Seed(种子)

        6、sampler methods(采样方法)

        7、Sampler steps(迭代步数)

        8、Batch count & Batch size(批量处理)

        9、Restore faces(脸部修复)

        10、Tiling(瓷砖化)

        11、Hires. fix.(高分修复)

1

引言

在上一篇文章中,我已经详细讲解了如何在电脑上安装能够使用 SD 模型的 SD webui 。如果你尚未完成安装过程,建议你先按照我提供的步骤进行操作,完成安装再接着往下看。

上期文章传送门:超全攻略!免费AI 绘图模型Stable Diffusion的全面安装指南!

SD webui ,作为 SD 模型的用户界面,具备了一套丰富且完善的功能,包括多种可自定义的参数选项。这些参数在图像生成过程中起着关键性的作用,因为它们可以极大影响最终生成图像的效果和质量

实际上,许多在线的AI图片生成器也提供了类似的参数调整功能。但是,SD webui 不仅覆盖了这些功能,还提供了更多的自定义选项,以满足更复杂的需求。

在本篇文章中,我将首先介绍 SD webui 的一些基本参数。这些参数是控制 SD 模型的核心,理解它们的工作原理和作用,可以帮助你更好地掌握 SD 模型。

在后续的文章中,我还将进一步探讨 SD webui 的更多参数和特性,以便你能够更深入地了解和使用 SD 模型。

2

txt2img 标签页

以下是各个参数的详细信息:

1、Prompt

Prompt 即提示词,这个参数也被称为 Positive prompt(正向提示词)。它是决定生成图片内容的最主要的参数。我们只需要在 Prompt 输入框中键入相关的英文单词或句子,就可以生成与之相关的图像。你的描述越精确,生成的图像就越接近你所期望的效果。

需要注意的是,目前 SD webui 仅支持英文输入

Prompt 参数的设定在掌握 AI 绘画技术中占据了关键位置。一个优质的 Prompt 应当尽可能具体和详细,以便引导模型准确理解并生成出你所期望的图像。例如,如果你想绘制一只,你不应该只是在 prompt 写 “a cat”,你应当提供更多的信息,如它的品种毛色,甚至包括它的姿态

以下是一个例子:

Prompt: a cat(一只猫)

Prompt: a cute cat sitting on the ground, Persian cat(一只坐在地上的可爱的猫,波斯猫)

可以发现,更具体的描述能够获得更接近期望的结果。因此你需要尽可能描述得更具体更精确,以便生成更接近你所期待的图像。当然,如果你只是为了体验 AI 绘画的乐趣,而无具体的构图需求,那么这个原则就不那么重要了。

另外,你可能注意到框的右上角有 “0/75” 的标识,意思是你能输入的 tokens 数量上限为75。在这里, “tokens” 可以理解为模型读取和处理语言的基本单元,它可以是一个单词,也可以是一个字符,取决于具体的语言和模型的设计。

许多网络上的图片生成式AI都不能输入超过75  tokens 的提示词。然而,在 SD webui ,你实际上可以输入超过75个 tokens。这得益于 SD webui 的一种特殊机制,该机制能够处理超出标准限制的 tokens 数量。也就意味着,你可以输入更长的描述,提供更多的细节和指示,以帮助模型更准确地生成你所期望的图像。

尽管如此,你仍然需要注意描述的简洁性明确性,以避免过于冗长和复杂的描述导致模型理解困难。因此,如何在保证描述清晰度的同时,尽量控制 tokens 数量,也是使用 SD webui 时需要注意的一点。

2、Negative prompt

Negative prompt 即负向提示词,是另一个重要的参数,它可以帮助你更精确地控制生成图像的内容。正如其名字所示,负向提示词是用来指导模型避免生成某些特定内容的。

与正向提示词直接描述你期望出现在图像中的内容不同,负向提示词则用于描述你不希望出现在图像中的内容。通过这种方式,负向提示词可以作为正向提示词的补充,提供额外的指导信息,帮助模型更精确地生成你期待的图像。

例如,如果你在正向提示词中输入 'a serene forest scene'(一个宁静的森林景观),AI 可能偶尔会描绘出河流,但你希望避免图像中出现河流,那么你可以在负向提示词中输入 'water'(水),这样,模型在生成图像时,会尽可能地避免描绘出与水有关的事物。

以下是一个例子:

Prompt:a serene forest scene (一个宁静的森林景观)

Negative prompt:无

Prompt:a serene forest scene(一个宁静的森林景观)

Negative prompt:water(水)

可以发现,在负向提示词中添加了 'water' 后,森林中的水消失了

总的来说,负向提示词是一个很不错的工具,能够提供额外的控制能力,帮助你生成更接近理想的图像。通过熟练使用正向提示词和负向提示词,你可以更好地驾驭AI绘画,创作出满意的作品。

3、Width & Height

'Width' 与 'Height' 指的是生成图片的宽度和高度,它们决定了生成图片的尺寸和长宽比。通过调整这两个参数,你可以根据需要更改图像的大小以及宽高比。

基础的SD模型——Stable Diffusion v1.5 是使用 512x512 尺寸的图片进行训练的,因此,如果你维持这个尺寸,将更有可能获得理想的生成结果。这是因为在该尺寸下,模型的预测能力最强,可以更准确地生成符合描述的图像。

当然,你也可以根据具体需求,尝试其他的尺寸设置。例如,如果你的目标是生成人物图像,建议采用512x768的尺寸;如果是生成风景图像,则建议采用768x512的尺寸。

需要注意的是,使用过宽的尺寸生成人像可能会产生不正常的效果,例如生成的人物可能会有两个头或者两个身体等等。

以下是个例子:

prompt:oil painting, 1 girl, solo, running, happy, highly detailed stola, Running joyfully with light steps on the grassland, by William Adolphe Bouguereau, vintage, sharp focus,(油画、1个女孩,单独的,奔跑,开心,高度细节的裙子,轻快的步伐在草原开心地奔跑,William Adolphe Bouguereau 画家,复古的,锐焦)

上图的图片尺寸为768x512。可以看出,在宽画幅里绘制人物,既使我在 prompt 里写了 1 girl,并用 solo 强调,但仍然会产生两个人物。

当然,并不是说设置这个尺寸就一定会产生两个人物,而是会增大这个趋势或者说概率。不过,在很多SD微调模型中,这个问题已经得到改善。

另外,在其它设置保持不变的情况下,无论改变图片的宽度或高度参数,都会对最终生成的图像产生显著影响。因此,合理地设置并调整这两个参数,能够帮助你更好地控制生成图像的效果。

以下是个例子:

除了图片尺寸以外,以下两张图的所有参数都是一致的,但是会得到两张完全不一样的图片。

(768 x 512)

(512 x 768)

最后,需要注意的是,生成更高分辨率的图片需要更大的显存。因此,如果你希望提高生成图片的分辨率,但受限于显存容量,你可能需要寻求其他的解决方案。

4、CFG Scale

CFG Scale,全称为 Classifier Free Guidance Scale,是一个可以调整生成图像忠实于提示词程度的重要参数。这个参数的设置将直接影响模型对提示词的忠实程度,从而影响生成图像的效果和质量。

CFG Scale 的值越小,生成的图像与提示词的相关程度越低,模型会展现出更大的创造力;反之,CFG Scale 的值越大,生成的图像将更加忠实于提示词,模型会更严格地按照提示词的内容生成图像。

以下是对 CFG Scale 不同值的一些理解:

1 —— 这个值意味着模型几乎会无视你的提示词

3 —— 这是一个比较有创造力的值,模型会根据你的提示词生成比较有创意的图片。

7 —— 这是默认值,也是创意与忠实提示词之间的一个平衡点。在这个值下,模型既能保持一定的创新性,也能较好地遵循提示词。

15 —— 在这个值下,模型将在很大程度上忠实于提示词,生成的图像将更加接近你的期望。

30 —— 这是一个极端值,模型将严格按照提示词生成图像,几乎没有任何创新性。因此要求你的描述相当完整才行。

其它参数保持相同,使用不同 CFG 参数的效果对比图:

设置建议:通常建议远离1和30这两个极端值。你可以从默认值7开始,然后根据需要进行调整。如果希望生成的图像更有创意,可以适当降低 CFG Scale 值;如果希望生成的图像更接近提示词,可以适当提高 CFG Scale 值。

5、Seed

Seed,即种子,是控制图像生成效果的关键参数之一。它的存在赋予了模型随机性的特点,使得每次生成的图像都不尽相同,增加了生成图像的多样性。

当其他参数保持不变的情况下,如果种子值也相同,那么生成的图像将会完全相同(显卡也需要相同)。这意味着,如果你想复制一张与他人完全一样的图像,你不仅需要知道提示词(Prompt),同时也需要知道对应的种子值(seed)。

种子值设置为-1时,系统将使用随机种子来生成图像,这将使得每次生成的图像都有所不同,增加了生成结果的多样性。然而,如果你想在某张已生成的图像基础上进行微调,你应当固定种子值,并适当调整其他参数,如 Prompt,以便获得更理想的效果。

当你需要生成合适图片的时候将 seed 值设置为-1,而需要微调某张特定图片的时候再固定 seed 值。

以下是个例子:

Prompt:1 girl, :d, blue hair, (brown eyes:1.2), perfect nose, collarbone, detailed vintage dress, shinny glowing skin, upper body, ornate hairbind, jewelry, blue sky, cloud, grassland, sitting, highly detailed, sharp focus, stunningly beautiful, natural light(1个女孩,微笑,蓝色头发,棕色眼睛,完美的鼻子,锁骨,细节的复古裙子,发光的皮肤,上半身,华美的发夹,宝石,蓝天,云,草地,坐着,高度细节,锐焦,美丽的,自然光)

我觉得这张图片很不错,但是我还想让她看着镜头。意味着接下来我需要针对这张图片进行调整那么就需要将这张图片的 seed 值复制到 seed 框内,seed 值可以在如下位置查看:

将这个值手动复制到如下位置,或者点击绿色回收按钮,将种子值自动复制到框内:

然后在 prompt 框内添加 “looking at viewer”(看向观众),点击 generate,你就可以得到一张与原图类似的图片,但是人物会看向镜头。

另外,在 seed 框后边还有一个 extra 选项,点开之后可以看到如下四个参数调整项。

Variation seed 即变异种子,Variation strength 即变异强度。两者需要搭配使用,将变异强度设定为0表示只使用种子值生成图片,将变异强度为1则表示只使用变异种子生成图片,其它介于0到1之间的 变异强度值则可以获得两者不同程度融合的图像

以下是个例子:

将 seed 值设定为1或100,而其他参数保持完全相同,可以得到如下两张图片:

但如果我想要处于两者之间的图片,那么就需要点击 extra,将 Seed 设定为1,将 Variation seed 设定为100,Variation strength 则在0到1之间调整。效果如下所示:

可以注意到,随着 Variation strength 值增大,seed=1 的图片逐渐过渡到 seed=100 的图片。

在之前关于图像大小参数的介绍时,我提到过即使其它参数保持一致,只调整图像尺寸也会对最终结果产生显著影响。Resize seed from width & height 这个参数就是为了解决这个问题而准备的。

将图像的原始尺寸输入 Resize seed from width & height,将目标尺寸输入 width & height 参数框内,即可获得更接近原始尺寸的图片。

比如说我喜欢这张512x512,seed=100 的图片:

如果我直接改变这张图片的尺寸,从512 x 512 → 768 x 512:

可以发现,人物脸部和姿势都变化非常大。

当你使用 Resize seed from width & height,你会得到更接近原始图像的结果。虽然这两者仍然不是完全一致,但要更接近一点:

6、sampler methods

采样方法(Sampler Methods)是 SD webui 中的一个参数选项,它决定了模型在解决扩散方程以生成图像时的策略。

SD webui 提供了多种采样方法供用户选择:

尽管这些方法在理论上以不同的方式解决扩散方程,但在实践中,使用不同的采样器生成的图像差异通常比较小。换句话说,从图像质量的角度来看,选择不同的采样方法对最终结果的影响相对较小。

这并不是说采样方法不重要,而是意味着在选择采样方法时,用户可以更加专注于其他参数的调整,如分辨率、提示词和 CFG 等,以获得更好的图像质量。

以下使用不同采样器的对比图:

从这个结果来看,除了 DPM fastEuler a 两个采样器的结果不尽如人意之外,其它采样器都表现良好。

然而,不同的采样方法在处理相同任务时所需的时间却可能会有所不同。每个采样方法都有其独特的计算方式和算法特点。某些采样器可能更加高效,能够在较短的时间内完成任务,这对于需要快速结果的场景非常有利。其他采样器可能会更加注重结果的准确性和质量,可能需要更多的计算时间才能达到理想的效果。

以下是对不同采样方法所需时间的参考:

这些时间仅供参考,实际的处理时间可能受到多个因素的影响,包括计算机性能、图像大小和选定参数等。

总的来说,在选择适合的采样器时,我们需要综合考虑时间效率结果质量之间的权衡。对于需要迅速获得结果并能够接受一定的精度损失的任务,可以选择较为高效的采样器。而对于对结果准确性要求较高且可以接受更长计算时间的任务,则可以选择注重质量的采样器。

使用建议:如果你对采样方法没有特别的需求或偏好,推荐使用 DPM++ 2M Karras,这种方法在效率和效果上都表现较好。DPM++ SDE Karras  DPM++ SDE 则是质量更佳的采样器,很推荐使用,不过相对耗时。尽量避免使用 Euler a DPM fast

7、Sampler steps

采样步数(Sampler Steps)是另一个影响图像生成效果的重要参数。它决定了使用特定采样方法进行的采样步骤的数量。一般来说,采样步数越多,生成的图片清晰度越高。

然而,这并不是说采样步数越多越好。虽然采样步数的增加可以带来图像清晰度的提升,但同时也会导致图像生成的时间增加。而且,当采样步数达到一定程度后,继续增加步数所带来的清晰度提升将会变得非常微小,甚至几乎无法察觉,而所需的时间却会大幅度增加。因此,我们需要在图像清晰度和生成时间之间寻找一个合适的平衡点

以下是使用 DPM++ 2M Karras 采样方法,随着采样步数增加,生成图片的变化情况:

根据上图可以观察到,在采样步数达到15步之前,随着步数的增加,图片的清晰度变化非常明显。然而,一旦采样步数达到15步以上,随着步数的增加,图片的清晰度变化已经变得难以察觉

基于这个观察结果,在使用 DPM++ 2M Karras 采样方法时,建议将采样步数设置在15到20之间。这个范围内的采样步数可以在保持合理的计算时间的同时,获得较为满意的图像清晰度表现。

至于其他采样方法,合理的采样步数则需要自行尝试和评估。不同的采样方法可能具有不同的收敛速度和清晰度表现。因此建议根据具体情况进行实验,通过逐步增加采样步数并观察图像的清晰度变化,来确定最适合的采样步数。

总的来说,选择适当的采样步数是在使用不同采样方法时的需要考虑的因素。通过将采样步数设置在15到20之间,可以在DPM++ 2M Karras采样方法中实现良好的平衡。对于其他采样方法,建议自行实验和评估,以找到最佳的采样步数,从而得到满意的结果。

使用建议:使用DPM++ 2M Karras,步骤15 - 20步

8、Batch count & Batch size

批次数(Batch Count)与每批次生成的图片数量(Batch Size)是在使用SD生成图片时需要考虑的两个参数。它们决定了你每次运行模型时生成的图片的总数量,总数量等于 Batch Count 与 Batch Size 的乘积。比如,如果设置 Batch Count 为 2,Batch Size 为 4,那么每次运行模型会生成 2 x 4 = 8 张图片。

在实践中,我们往往不会只生成一张图片,而是会一次性生成多张图片,这样可以更好地判断输入的 prompt 是否能得到满意的结果。

然而,Batch Count 和 Batch Size 并不是随意设置的。它们的设定取决于你的显存,尤其是显存的大小。如果你的显存较大,那么可以设置较高的 Batch Size值,因为这样可以一次性处理更多的图片,从而加快运行速度。相反,如果显存较小,那么应设置较高的 Batch Count 值,以防止因一次处理的图片过多导致的内存溢出。

以下是个例子:

生成4张图片,设置batch count = 1,batch size = 4。消耗时间 91.49s,内存占用 3028M

而同样生成4张图片,设置 batch count = 4,batch size = 1。消耗时间 112.77s,内存占用 2656M

因此在电脑性能允许的情况下,生成相同总量的图片应该尽可能提高 batch size 的值,以缩短总的绘图时间。

9、Restore faces

'Restore Faces' 即修复脸部,是一个专门用于修复生成图片中出现的不正常人脸形态的功能

在使用SD生成人物图片时,有时可能会出现形状扭曲或者表情异常的人脸,这会大大降低生成图片的视觉质量。'Restore Faces' 功能则通过对生成的图片进行后处理,专门修复人脸部分,而不会对图像的其他部分造成影响。

以下是个例子:

在SD webui 中,提供了两种人脸修复方法,分别是 CodeFormer 和 GFPGAN。这两种方法在安装 SD webui 的依赖项时就已经被引入。CodeFormer 作为默认的修复方法,能够处理大部分的人脸异常情况。如果在使用 CodeFormer 方法后,人脸的修复效果仍然不理想,你可以尝试切换到 GFPGAN 方法。

切换方法如下:

点击 setting,点击 face restoration,再切换为 GFPGAN 即可。Codeformer weight 可以用来调整面部修复的强度。请注意,codeformer weight 的数值越低效果越强。

开启 'Restore Faces' 功能后,可以显著降低生成图片中出现不正常人脸的概率,从而提升生成图片的整体视觉质量。

虽然 “Restore Faces” 功能在修复生成图片中的人脸形态方面有着显著的效果,但并不意味着我们应该一直保持这个功能开启。事实上,这个功能在运行过程中需要占用额外的显存。因此,建议根据自己的实际需求和硬件条件来合理决定是否开启这个功能。

10、Tiling

Tiling(瓷砖铺设)是一种将瓷砖排列在一起的技术动作,也可以理解为将图像或模式“瓷砖化”。我们都知道,多块瓷砖可以通过拼接方式形成反复出现的图案。这些图案可以是几何形状、花朵、动物或抽象的设计。

Tiling 的主要目的就是生成一幅可以在水平和垂直方向上无限重复拼接的图像

以下是个启用了 Tiling 功能的例子:

Prompt:gems pattern(宝石图案)

可以观察到,启用 tiling 后产生的图片是周期性图片的一部分。

4张相同的图片拼接起来就可以得到下图:

这样的拼接使得图片在水平和垂直方向上呈现出周期性重复的效果。每张图片在拼接过程中与相邻图片的边缘无缝连接,形成一个连续的平铺效果。

需要注意的是,这里的白色线条是为了方便区分和理解才添加进去的,实际操作过程会严丝合缝。

11、Hires. fix.

Hires.fix,即 high-resolution fix(高分辨率修复),是一种能够提高原始图片分辨率的选项。通常情况下,原始图像的分辨率为512x512(当然也有更高分辨率的,如768x768),而1080p显示器的分辨率为1080x1920,远远超过了原始图像的分辨率,因此观感上会显得模糊不清。

Hires.fix 并不仅仅是简单地扩大图片尺寸,而是能够将图片放大为高分辨率图像,并同时填充模糊的细节

那为什么不直接生成分辨率更高的图片呢?这是因为改变图片尺寸会对图片内容产生巨大影响,而且更高分辨率的图像需要更多的显存,并且处理时间也会呈指数级增长

因此,为了实现高分辨率修复,我们必须先生成低分辨率的图像,然后再进行高清放大。这个过程通过利用图像处理算法来填充丢失的细节,以提升图像的清晰度和细腻度。通过这种方式,Hires.fix 能够在保持图像内容完整性的同时,增强图像的质量。

Upscaler 选项框中选择放大器类型。提高 Hires steps 可以增加图像的清晰度。然而,与 sampler steps 一样,我们需要注意不要将 Hires steps 设置得过高,因为每一步 Hires 的计算时间都远大于原始采样步骤的计算时间。一般来说,Hires steps = 15 步已经足够

另外,Denoising strength 参数控制添加到原始图像的噪点数量。随着 Denoising strength 的升高,生成的图像与原图逐渐偏离。但由于某些原因,Denoising strength 小于0.5不能生成清晰的图片。因此使用latent放大器不能获得与原图几乎一致的图片。

以下是开启Hires.fix前后的细节对比图:

(放大前)

(放大后)

       可以发现,图片的像素感消失了,皮肤也变得更加平滑。

接下来,让我们来观察一下 Denoising strength 的效果。请将放大倍率调整为2x,将 upscaler 设置为 latent,并将 upscale steps 设置为15步。如下图:

可以观察到,Denoising strength 的值不应该小于0.5。在0.6至0.9之间,我们可以获得相对清晰的图像,而设定为1.0则会导致图像主题严重变形。因此,合理的 Denoising strength 值应该在0.6至0.9之间

需要注意的是,这个范围是基于 latent 放大器的参考。不同的放大器模型可能具有不同的合理取值范围,因此建议你根据具体的放大器模型进行尝试和调整。

虽然这是个不错的工具,但每个人对工具和方法都有自己的偏好和习惯。对于高分辨率放大,Extra 标签页提供了更多的选项和自定义设置,使我们能够更灵活地控制放大过程。

篇幅所限,这一期的内容先介绍到这里。

· 如果还有其它问题,欢迎在评论区留言~

· 下一期的内容将会给大家继续介绍其它标签页的参数解析。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
Stable Diffusion作图
喂饭级stable_diffusion_webUI使用教程
stable-diffusion 安装和使用
SD WebUI 扩展:prompt-all-in-one
如何用ChatGPT批量编辑图片,改善画质
给小姐姐换黑丝的后续来了
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服