「中国式求职」开发日志 #6：AI出图就是在抽卡

我永远忘不了那张图。

我要的是”面试官”——一个穿深色西装的中年男性，坐在会议桌对面，表情严肃但不凶。AI给我生成了什么呢？一个长着六根手指的秃头壮汉，左眼比右眼大两倍，西装领带不知道为什么长到了膝盖，背景还莫名其妙出现了一片向日葵花田。

这就是我的AI美术之旅的起点。

火柴人都画不好

先交代一下背景：我完全不会画画。不是谦虚的那种”画得不好”，是真的画不出任何东西。让我画个正方形都能画歪。

但「中国式求职」需要美术——34张卡牌插画、16张角色立绘、42张场景背景、19枚遗物图标、5段CG动画。少一张都不行，游戏打开来就是个半成品。

请画师？一张立绘几百到上千，算下来整套美术预算能买一台新电脑了。

那就AI吧。反正最近AI画图这么火，应该不难吧。

应该不难吧。

抽卡，字面意义上的

用AI出图真的就是抽卡，而且是那种0.6%概率UP的限定池。

我最早试着生成角色立绘，写了个自以为很清楚的提示词：“一个年轻女大学生，黑色长发，穿白色衬衫和深蓝色裙子，日系动漫风格。”

出来50张。我一张张翻过去，全是浓眉大眼高鼻梁的欧美面孔，有的还自带浓烈的迪士尼公主既视感。我要的是日系二次元啊，不是冰雪奇缘。

换了个思路，加上”anime style”。这下好了，风格倒是二次元了，但每张图的人物造型都不一样——第一张是萝莉，第二张变成了御姐，第三张不知道为什么穿上了哥特洛丽塔。同一个角色啊朋友们。

最离谱的一次是生成遗物图标。我想要一个”旧手机”的图标，简简单单一个手机，能有多难？AI先给我画了个翻盖手机（太古老了），又画了个iPad（太大了），然后画了一个……我至今不确定那是什么，看起来像手机和计算器生了个孩子。

我在那张图上花了两个小时。两个小时，就为了一个手机图标。

被提示词教做人

一开始我写提示词很随意，觉得把想要的东西说清楚就行了。然后AI用实际行动告诉我：不行。

游戏事件场景 — 黑客马拉松

转折点是有一次我在生成教室场景。写了”a girl in classroom”，出来的画面像是某个廉价手游的宣传图，模糊，构图奇怪，光线平得像打了层蜡。

我去翻了一堆别人分享的提示词，照着格式重新写：“anime style illustration, a female student sitting by the window in a Japanese high school classroom, warm afternoon sunlight, warm anime color palette, detailed background, soft focus”。

同一个场景，出来的图完全不是一个次元的东西。光从窗户斜着打进来，桌面上有细碎的光斑，背景的黑板和课桌椅都画出了景深。

试完之后慢慢搞懂了，提示词不是在”描述你想要什么”，更像是在跟一个只会看关键词的画师沟通。你说”画个教室”，他随便画画交差。你说”日系动画配色、黄昏光线、从右侧45度角打进来”，他才知道你到底要什么氛围。这个画风是我从小看着长大的——追番篇里写过。

后来慢慢摸出一些门道。“anime style”这种风格词放开头和放结尾差别很大，放后面基本等于没写。还有”golden hour lighting”这种光影描述，加一句整张图质感就上去了，性价比极高。最离谱的是负面提示词——“no extra fingers”、“no deformed face”，你不写它就真给你画六根手指，就好像AI觉得这才是人类的正确形态。

反正没人教，全靠废图喂出来的经验。

在打开AI之前

其实在跟AI搏斗之前，我做了一件事——列了一份美术需求清单。

不是那种”需要一张面试官的图”这么随便的，那太模糊了，给AI它也画不出你想要的。我写的是具体的东西——这个人长什么样、场景里有哪些元素、什么色调、输出多大尺寸，一条条都列了。

立绘那边我还给自己定了几条规矩：全部统一色调，人物占画面60%以上，不同学历路线配色锁死——985冷蓝灰，二本暖橙黄，专科沉稳的绿。AI再怎么抽风，至少大方向不容易偏，整体风格能统一。

说白了跟以前给画师写需求单差不多。就是真人画师会反过来问你”这里你想要什么感觉”、“要不要再调调”，AI不会问。它就看你写了什么，你没写的它自己瞎猜。所以反而得提前把事情想得更细，不能偷懒留模糊空间。

现在回头看，这份清单搞不好比提示词本身还重要。后面好几次出图翻车，回去对着清单一查，基本都是我自己没把需求写明白。

上下文这个坑

还有一个我摔了无数次才搞明白的问题——上下文污染。

AI在同一个对话窗口里，会参考之前生成的图。大部分时候这是好事，风格能保持一致。但如果前面出了一张烂图，那张烂图的特征会像病毒一样传染给后面所有的图。

我有一次连续生成宿舍场景，前几张都很好，突然第四张的床铺变成了一种诡异的紫色。我没在意，继续生成。然后第五张、第六张、第七张，所有床铺全是紫色的。我改提示词，加”white bedsheet”，没用。加”no purple”，没用。那个紫色就跟诅咒一样挥之不去。

最后我只能关掉整个对话，开一个新窗口，把之前满意的参考图和提示词重新喂进去。相当于从头来过。

真的很烦。后来我学乖了，每出十张图就看一眼，感觉颜色或者风格开始跑偏就赶紧开新窗口。重新搭环境确实浪费时间，但总比在一个已经废了的上下文里越改越歪强。

那些一次就对了的图

说了这么多翻车的，也聊聊运气好的时候。

事件系统的场景图是我最满意的一批。宿舍、图书馆、校园小路、面试等候区——这类”日常但有氛围”的场景，日系二次元的画风天然适配。光从窗外洒进来，空气里有细微的颗粒感，颜色干净又温暖。

游戏事件场景 — 舍友的旧笔记

游戏事件场景 — 简历修改

游戏事件场景 — 群面

特别要说的是选人界面的角色背景图。每个学历路线的角色站在不同场景前面——985站在现代化的大学校门口，普通二本站在老旧但温馨的教学楼前，专科站在职业技术学院的实训基地。那几张图我只写了一版提示词，“anime character standing in front of [场景], depth of field, cinematic composition, golden hour”，基本一次就出对了。翻了十来张挑出最好的，改都不用改。

那种感觉像什么呢？就像抽卡歪了一整个晚上，突然十连出了三个金。

145张，然后呢

最后数了一下，成品超过145张。背后大概生成了2000多次，成品率7%左右——跟抽卡出货率差不多。全是一个不会画画的人磨出来的。

但说实话，把所有素材导进游戏看到完整画面的那一刻，心情挺复杂的。

这些图确实是我一张张磨出来的，提示词一个字一个字改，废图翻了两千多张。从”六根手指的面试官”到最终成品，中间骂过很多次。但偶尔出一张特别对的图，又觉得值了。

但它们不是我”画”的。下一张会出什么我根本猜不到，AI犯倔的时候除了换个说法重新来我也没别的办法。就是一种很奇怪的状态——每张图放哪、什么氛围都是我定的，但最后画成什么样，不归我管。

不过算了，一个连火柴人都画不直的人能做出一个看起来还像那么回事的游戏，够了。

反正145张图，出来了。