「中国式求职」开发日志 #6:AI出图就是在抽卡
我永远忘不了那张图。
我要的是”面试官”——一个穿深色西装的中年男性,坐在会议桌对面,表情严肃但不凶。AI给我生成了什么呢?一个长着六根手指的秃头壮汉,左眼比右眼大两倍,西装领带不知道为什么长到了膝盖,背景还莫名其妙出现了一片向日葵花田。
这就是我的AI美术之旅的起点。
火柴人都画不好
先交代一下背景:我完全不会画画。不是谦虚的那种”画得不好”,是真的画不出任何东西。让我画个正方形都能画歪。
但「中国式求职」需要美术——34张卡牌插画、16张角色立绘、42张场景背景、19枚遗物图标、5段CG动画。少一张都不行,游戏打开来就是个半成品。
请画师?一张立绘几百到上千,算下来整套美术预算能买一台新电脑了。
那就AI吧。反正最近AI画图这么火,应该不难吧。
应该不难吧。
抽卡,字面意义上的
用AI出图真的就是抽卡,而且是那种0.6%概率UP的限定池。
我最早试着生成角色立绘,写了个自以为很清楚的提示词:“一个年轻女大学生,黑色长发,穿白色衬衫和深蓝色裙子,日系动漫风格。”
出来50张。我一张张翻过去,全是浓眉大眼高鼻梁的欧美面孔,有的还自带浓烈的迪士尼公主既视感。我要的是日系二次元啊,不是冰雪奇缘。
换了个思路,加上”anime style”。这下好了,风格倒是二次元了,但每张图的人物造型都不一样——第一张是萝莉,第二张变成了御姐,第三张不知道为什么穿上了哥特洛丽塔。同一个角色啊朋友们。
最离谱的一次是生成遗物图标。我想要一个”旧手机”的图标,简简单单一个手机,能有多难?AI先给我画了个翻盖手机(太古老了),又画了个iPad(太大了),然后画了一个……我至今不确定那是什么,看起来像手机和计算器生了个孩子。
我在那张图上花了两个小时。两个小时,就为了一个手机图标。
被提示词教做人
一开始我写提示词很随意,觉得把想要的东西说清楚就行了。然后AI用实际行动告诉我:不行。

转折点是有一次我在生成教室场景。写了”a girl in classroom”,出来的画面像是某个廉价手游的宣传图,模糊,构图奇怪,光线平得像打了层蜡。
我去翻了一堆别人分享的提示词,照着格式重新写:“anime style illustration, a female student sitting by the window in a Japanese high school classroom, warm afternoon sunlight, warm anime color palette, detailed background, soft focus”。
同一个场景,出来的图完全不是一个次元的东西。光从窗户斜着打进来,桌面上有细碎的光斑,背景的黑板和课桌椅都画出了景深。
试完之后慢慢搞懂了,提示词不是在”描述你想要什么”,更像是在跟一个只会看关键词的画师沟通。你说”画个教室”,他随便画画交差。你说”日系动画配色、黄昏光线、从右侧45度角打进来”,他才知道你到底要什么氛围。这个画风是我从小看着长大的——追番篇里写过。
后来慢慢摸出一些门道。“anime style”这种风格词放开头和放结尾差别很大,放后面基本等于没写。还有”golden hour lighting”这种光影描述,加一句整张图质感就上去了,性价比极高。最离谱的是负面提示词——“no extra fingers”、“no deformed face”,你不写它就真给你画六根手指,就好像AI觉得这才是人类的正确形态。
反正没人教,全靠废图喂出来的经验。
在打开AI之前
其实在跟AI搏斗之前,我做了一件事——列了一份美术需求清单。
不是那种”需要一张面试官的图”这么随便的,那太模糊了,给AI它也画不出你想要的。我写的是具体的东西——这个人长什么样、场景里有哪些元素、什么色调、输出多大尺寸,一条条都列了。
立绘那边我还给自己定了几条规矩:全部统一色调,人物占画面60%以上,不同学历路线配色锁死——985冷蓝灰,二本暖橙黄,专科沉稳的绿。AI再怎么抽风,至少大方向不容易偏,整体风格能统一。
说白了跟以前给画师写需求单差不多。就是真人画师会反过来问你”这里你想要什么感觉”、“要不要再调调”,AI不会问。它就看你写了什么,你没写的它自己瞎猜。所以反而得提前把事情想得更细,不能偷懒留模糊空间。
现在回头看,这份清单搞不好比提示词本身还重要。后面好几次出图翻车,回去对着清单一查,基本都是我自己没把需求写明白。
上下文这个坑
还有一个我摔了无数次才搞明白的问题——上下文污染。
AI在同一个对话窗口里,会参考之前生成的图。大部分时候这是好事,风格能保持一致。但如果前面出了一张烂图,那张烂图的特征会像病毒一样传染给后面所有的图。
我有一次连续生成宿舍场景,前几张都很好,突然第四张的床铺变成了一种诡异的紫色。我没在意,继续生成。然后第五张、第六张、第七张,所有床铺全是紫色的。我改提示词,加”white bedsheet”,没用。加”no purple”,没用。那个紫色就跟诅咒一样挥之不去。
最后我只能关掉整个对话,开一个新窗口,把之前满意的参考图和提示词重新喂进去。相当于从头来过。
真的很烦。后来我学乖了,每出十张图就看一眼,感觉颜色或者风格开始跑偏就赶紧开新窗口。重新搭环境确实浪费时间,但总比在一个已经废了的上下文里越改越歪强。
那些一次就对了的图
说了这么多翻车的,也聊聊运气好的时候。
事件系统的场景图是我最满意的一批。宿舍、图书馆、校园小路、面试等候区——这类”日常但有氛围”的场景,日系二次元的画风天然适配。光从窗外洒进来,空气里有细微的颗粒感,颜色干净又温暖。



特别要说的是选人界面的角色背景图。每个学历路线的角色站在不同场景前面——985站在现代化的大学校门口,普通二本站在老旧但温馨的教学楼前,专科站在职业技术学院的实训基地。那几张图我只写了一版提示词,“anime character standing in front of [场景], depth of field, cinematic composition, golden hour”,基本一次就出对了。翻了十来张挑出最好的,改都不用改。
那种感觉像什么呢?就像抽卡歪了一整个晚上,突然十连出了三个金。
145张,然后呢
最后数了一下,成品超过145张。背后大概生成了2000多次,成品率7%左右——跟抽卡出货率差不多。全是一个不会画画的人磨出来的。
但说实话,把所有素材导进游戏看到完整画面的那一刻,心情挺复杂的。
这些图确实是我一张张磨出来的,提示词一个字一个字改,废图翻了两千多张。从”六根手指的面试官”到最终成品,中间骂过很多次。但偶尔出一张特别对的图,又觉得值了。
但它们不是我”画”的。下一张会出什么我根本猜不到,AI犯倔的时候除了换个说法重新来我也没别的办法。就是一种很奇怪的状态——每张图放哪、什么氛围都是我定的,但最后画成什么样,不归我管。
不过算了,一个连火柴人都画不直的人能做出一个看起来还像那么回事的游戏,够了。
反正145张图,出来了。
你可能还想看