场景7:实物

让 ChatGPT 生成提示词是不是更好?

我有用 ChatGPT 辅助我生成提示词,但没有用 Role 模式,而是让它:

  1. 翻译:我知道我想要的东西,但不知道其英文描述。

  2. 解答:我需要一些风格词,但我不知道输入啥时,就会问 ChatGPT ,比如「文艺复兴时期的著名艺术家有哪些?」

我为何没有用 Role 模式?

的确,让 ChatGPT 以 Role 模式帮我生成内容,比较省时省力,但我个人觉得:

  1. 使用比较麻烦,需要输入很多提示,即使通过 App 保存,在多次输入后,就会超过 token 限制,又要重新输入。

  2. 从 ChatGPT 的原理上看,它只会生成一个「普通」的内容,很难获得超过预期的内容。只是说大多数人甚至连「普通」都达不到,所以才会震惊于它的效果。所以如果你想要生成原创惊艳的图,靠概率是不行的,要靠你的想象力。

不过,这也是我一家之言,如果你觉得这样效率更高,那就用吧~

没啥关系,适合自己的工具才是好工具。

玩具

OK 言归正传,从本章开始,我们会逐步丰富我们的 prompt 框架,让图片有更多的细节。实物生成的第一个是场景是玩具,是个非常有意思的场景。

另外,这个场景如果能跟 3D 打印机结合一下,我觉得会非常赞。不知道有没有有志之士能实现一下。

再解释下 prompt 有哪些更新,从实物这张开始,我讲「背景」调整为「环境」,即主体环境,包括背景、灯光等等:

另外一个是游戏王里的蓝眼白龙,可惜 Midjourney 并不知道啥是 Yu-Gi-Oh,只能按字面意思生成了一个:

以下是生成的图片:

另外,我发现 Midjourney 对美式动漫或电影作品支持会好很多,比如冰与火之歌里的龙妈(只是龙有点诡异),还有圣女贞德:

技巧十一:增加风格——国家

说到手办,大家应该第一反应会想起日本,再介绍一个技巧,在 prompt 里加入 Japanese style 即可,拿圣女贞德作手办,以及之前做的 logo 作为例子:

圣女贞德是不是有种 FF 的感觉?Logo 也比较简洁,猫的外观也有点像动漫里猫的外观,当然除了 Japanese 还有 Chinese(左边4张),甚至 African Style:

技巧十二:增加权重

各位有没有发现,上面那个 Chinese 手办生成的结果好像只有第三张是中国人面孔?原因是 Chinese style 的权重太低,所以仅输出了一个结果。你在实践的过程中,也肯定会遇到,AI 忽略了某些 prompt 词的情况,比如你提到画面中要有一只鸟,但它就是没画出来。

那为何会产生这样的结果?原因 Midjourney 的 prompt 权重是按照顺序逐个降低(详情请见我翻译的 Midjourney 官方 FAQ),在我们上面的 prompt,我们将 Chinese Style 放到了最后,所以生成的结果也是最少的。忽略了某些词,这个原因暂时为止,但应该很可能是权重导致的问题。

增加权重的方法有很多,最简单的方法就是调整顺序,比如将上面的 Chinese Style 放到最前面(然后生成的结果就是眯眯眼 style 了 🤣,我生成了两次,第二次好一些):

product photography, Chinese Style,Joan of Arc, full body, hand painted, plastic, detailed, white background, studio lighting

调整下顺序,效果就大不一样,所以各位不要迷信所谓的 prompt 模板,多试试。

第二种方法是 Slider 方法。

你需要在 prompt 最后加 ,然后加上你需要调整权重的词语,接着再加 ,最后加上权重值。比如还是上面的例子,我想突出 Chinese style 但不想调整顺序,就可以改为:

product photography,Joan of Arc, full body, hand painted, plastic, detailed, white background, studio lighting, Chinese Style :: Chinese Style :: 0.5

然后你会发现,好像权重太高了,生成了跟 prompt 无关的图(下方左图),那我们可以在原来的基础上,再加以下 Joan of Arc 的权重(下方右图):

product photography,Joan of Arc, full body, hand painted, plastic, detailed, white background, studio lighting, Chinese Style :: Joan of Arc:: 0.25 style of Chinese:: 0.5

你可以看到,调整参数后,生成的 4 张图有 2 张具备较强的 Chinese 风格:

不过坦率说来,这个方法,并不特别适合这个案例,调整主体内容,或者顺序, ROI 会更高一些,这个方法更适合 miss 掉某个 prompt 词时使用,比如官方的案例是这样的:

several sad cats watch a crying woman in a home-office environment with laptop

生成的图片里(左四张图),猫咪们都看着你(你可能才是 crying woman 😂),如果用 slider 的功能(右边四张),crying woman 就出现在画面里了:

several sad cats watch a crying woman in a home-office environment with laptop:: several sad cats::0.5 crying woman::0.6 laptop::0.7

另外需要注意,slider 可用的参数有 0.25、0.5、0.6、0.7,也可以用这个方法降低权重,区间是 -0.7、-0.6、-0.5、-0.25:

如果你用了 slider 还是没有出现应该有的画面,那还有一个大招 cowbell,坦率说来,这个并不符合 Midjourney 的官方最佳实践,但的确是个可行的方法,以下面这个 prompt 为例,生成的图片里,woman 看起来并不 shy(左边四张图):

A songbird sits on the shoulder of a shy blonde woman dressed in white.

此时你可以重复重复再重复(我觉得这就是为何这个方法叫 cowbell 的原因):

A songbird sits on the shoulder shoulder shoulder shoulder shoulder shoulder of a shy shy shy shy shy shy shy blonde woman dressed in white.

食物

另一个我比较喜欢的实物是食物,食物讲究的是「色香味俱全」,所以在描述食物类的 prompt 时,可以往这三个方向想想:

  • 色:食物是什么颜色的(可以通过食物的熟度来控制)。

  • 香:照片没有香味,但我们可以把香气画出来。

  • 味:照片也同样没有味道,那我们加一点细节装饰?比如撒上胡椒、盐、辣椒?

然后再来一碗红烧牛肉面:

技巧十三:善用灯光

坦诚地跟大家说,我不是设计师,也不是摄影师(而且我非常不擅长摄影),所以我仅能跟大家分享一下基础内容,因为这个对我来说,太多过程性知识了,不实际操作过,根本不知道有什么。

言归正传,摄影中,常用摄影灯光有以下几种:

  1. 主灯 (Key Light):主灯是最基本的摄影灯光之一,通常放置在被拍摄物体的正前方或正侧方,用于照明主体,决定拍摄物体的主要明暗度。主灯通常是亮度最高的灯光。

  2. 填光灯 (Fill Light):填光灯用于弥补主灯照射的阴影部分,调整阴影的深浅程度,使照片明亮一些。通常填充光应该比主光暗一些,以避免出现过度曝光。

  3. 逆光灯 (Back Light):逆光灯用于照射被拍摄物体的背面,能够区别出主体和背景,并使物体轮廓变得清晰,常用于拍摄骨感、重物感和逆光效果的照片等。

  4. 环境光 (Ambient Light):环境光就是摄影环境自然产生的光线,包括室内照明、自然光、街灯等,它可以补充被拍摄物体的表面,提升照片的自然度和真实感。

  5. 故事性灯光 (Special Light):通常是为了制造出某种情境或者表达某种意义而使用的,例如烛光、亮光等。它们能够产生温暖、浪漫、神秘等场景和气氛,以探索和表达艺术的想象力和创造力。

基于这些灯进行排列组合,你会得到不同使用场景的灯光。灯光的细节种类,可以去我归纳的 Lighting List 里查看,我这里主要分享一些常用和易用的场景灯光:

最后更新于