论如何驾驭AI不羁的灵魂

06/1134 浏览开发心得
我是 TapTap 独立开发者,用 AI 辅助做了一款叫《今天也元气满满》的职场 SAN 值生存游戏。上篇帖子讲了怎么用 SSOT 管理文档一致性,这篇讲另一个让我抓狂的问题:AI 每次做同一件事,方法都不一样。
AI 的自由发挥是 bug,不是 feature
你有没有遇到过这种情况——
你让 AI 帮你写 10 条游戏事件。第一条格式完美。第二条少了个字段。第三条格式对了但内容违反了你的设计规则。到第十条的时候,你已经不确定之前哪些条是对的了。
或者:你今天让 AI 改一段代码,它用了方法 A。明天同样的事,它用了方法 B。后天又换了方法 C。三种写法混在一个文件里,像三个人合写的作业。
或者:你让 AI 把一段内容写入文件。它说"做完了"。你打开一看——要么格式不对,要么只改了一半,要么根本没改。它不是故意骗你,它是真的以为自己做完了。
这三个问题的根源是同一个:你把"格式保证"交给了 AI 的自觉性。
AI 没有自觉性。你给它同一个指令十次,它十次的做法可能都不一样。有时候对了,有时候歪了,有时候它发明了一种你没想过的"更好的方式"。
写散文或头脑风暴时这是优点。需要精确、一致、可重复的产出时——这是灾难。
核心思路:AI 只能走一条路
我的游戏有 200 多条随机事件。每条事件有固定的结构、19 条格式规则、十几条世界观红线。每个版本要批量生产几十条新事件。
如果让 AI 自由发挥地写,每次都是一场赌博。
我的解法:不给 AI 任何自由发挥的空间。 所有内容必须经过一条固定的管道才能进入项目——AI 填表,自动检查,自动写入,自动验证。四步,每一步都是确定的。AI 只负责第一步——填一张表格。剩下的全部由工具执行,没有商量余地。
打个比方:你不会让一个新来的实习生自己决定怎么提交工作——你给他一个模板,让他填好,然后有人审批、有人归档。AI 也该如此。
不是"请你按这个格式来"。是"你只能按这个格式来,不按就打回去"。
为什么不能"把规则说清楚"就完事?
你可能在想:我跟 AI 说清楚规则不就行了?
试过了。不行。三个原因:
第一,AI 的注意力会漂移。 你列了 19 条规则,前几条它记得住,写到第十条事件开始忘。上下文越长,对早期指令的遵守率越低。
第二,同一个 AI,同样的指令,每次做法可能不同。 你以为你定义了一个稳定的流程——其实你定义了一个手感骰子。今天它这么做,明天它那么做,你无法预测。
第三,AI 说"做完了",你没法信它。 这是最坑的。它说改好了——你怎么知道真的改对了?你得自己打开文件看。一个还行,十个呢?你发现自己在给 AI 当质检员。
把规则说给 AI 听,是"建议"。用工具强制执行,是"法律"。 建议靠自觉,法律靠强制。你要哪个?
四步管道,每一步在做什么
第一步:让 AI 填表,不让它碰代码
我不让 AI 直接改项目文件。我让它填一张结构化的表格。
为什么?因为表格有标准答案——每个格子该填什么、不能超过多少字、必须包含哪些信息——这些全都可以机器验证。"表格填对了没有"这件事,不需要人看,工具就能判。
AI 的工作到这里就结束了。它的角色是"填表的人"。表格对不对,由下一步来判。
第二步:自动检查(19 条规则,零信任)
表格填好后,自动进入检查工具。这个工具做什么呢?举几个例子:
选项文字超长——按钮最多放 25 个字,AI 写了 40 个字,手机上显示不下。
剧透了不该说的信息——某个信息应该让玩家自己发现,AI 直接在文案里写明了。
假设了不存在的前提——内容可能在任何阶段出现,AI 却写了"作为刚来的你",假设玩家是新人。
在随机内容里改了固定设定——随机内容的出现顺序不可控,AI 却在里面让一个角色升职了,后续逻辑全乱。
写死了不该写死的条件——内容可能在上午或下午触发,AI 写了"下午两点"。
这些规则不是"最好遵守"——是**“违反就打回,改好了再来”**。
以前这些全靠我自己肉眼检查。一批 30 条事件,review 一遍要半小时。现在工具 3 秒跑完。我的工作从"逐条审查"变成了"看一眼报告里有没有警告"。
第三步:工具写入(因为 AI 的"手"不可靠)
这个环节的存在,源于一个让我崩溃过三次的 bug:AI 的文件编辑功能会静默失败。
具体来说:某些情况下 AI 说"我已经改好了",但文件实际上没变。它不报错。你信了。然后发现代码还是旧的。
第一次遇到:以为自己眼花了。第二次遇到:以为是 AI 理解有误,换了种说法再来。第三次遇到:再也不让 AI 自己写入文件了。
我写了一个脚本来替代它。这个脚本做完写入后会重新打开文件对比一遍——跟你交作业之前再看一遍答案对不对一个道理。对得上才算成功。
朴素得不能再朴素。但它解决了一个 AI 自身解决不了的问题:写入是确定的。
第四步:交付验证(证明给我看)
最后一环。AI 做完所有改动后,它需要自己列一张清单——“我声称做了这些事”:某条事件存在了吗?某个类型注册了吗?配置文件更新了吗?
然后验证工具去逐条核实。全通过才算真的做完。
这像什么?像你让实习生做完活之后填一张自查表,然后主管再过一遍打钩。“不跑验证就说做好了”——在我这里是禁止的。
真实案例:AI 坑了我多少次?
案例 1:200 条内容里藏着的"信息泄露"
项目早期没有检查工具。AI 写内容的时候经常把本该让玩家自己发现的信息直接写在文案里——等于帮玩家把谜底揭了。
怎么发现的?我自己从头到尾扫了一遍所有内容,手动一条条改。
现在:检查工具在填表阶段就会拦截。AI 每次写出违规的文案,3 秒内被打回重写。这个问题从此消失了。
案例 2:整条事件推倒重写
v1.2 版本,有两条事件被 AI 自由发挥得面目全非——格式和其他事件不一致,选项设计违反规则,世界观细节乱了。我没法修补,只能推倒重来。
有了检查工具后,这种情况基本不发生了。因为问题在"填表"阶段就被拦住——AI 还没动到项目文件就已经知道哪里不对。改一个表格字段比重写整条事件便宜十倍。
案例 3:同一批内容改了四轮
我的提交记录里有一组:某批事件经历了四轮修改才最终合格。
每一轮都是同一个循环:AI 写,我看,有问题,AI 改,我再看,又有新问题……四轮。
后来我把那四轮中反复出现的问题全部编码成了检查规则。现在同样的内容一次通过。 因为规则是机器执行的——AI 不需要"记住"上次犯了什么错。
如果你也想试试
不需要搞复杂的工具链。根据你的痛点,从最小的改变开始。
方法 1:让 AI 填表,别让它自由发挥。 无论你做什么项目——只要需要 AI 批量产出有固定格式的内容——就给它一个模板,让它照着填。你甚至不需要写脚本验证。光是"让 AI 填表"而不是"让 AI 自己决定怎么组织内容",就已经砍掉了一半的格式问题。
方法 2:把你最常发现的问题变成自动检查。 回想你最近一次让 AI 做批量工作——你事后检查时,最常发现什么毛病?文字太长?数字数就行。出现了不该出现的词?关键词匹配。缺了某个必要信息?检查有没有填。把你的"肉眼经验"变成规则。让 AI 帮你写一个检查脚本——它写这种东西很在行。一次设置,以后每次 AI 产出都自动过一遍。
方法 3:AI 说做完了,多问一句"证据呢"。 最简单的做法:AI 说改完了,你让它告诉你"改了哪些文件的哪些部分"。然后你抽查一两个。进阶一点:让 AI 改完后列一个清单——“我做了 1、2、3”——然后你或者脚本去核实。重点就一句话:不信任AI报告。要第三方背调
这套方法给我带来了什么
快了三倍。 以前一批内容:AI 写,我查半小时,找出问题,AI 改,我再查,可能还有第三轮。每批至少两天。现在:AI 填表,工具 3 秒检查,不合格的打回,AI 改,再检查,通过,自动写入,自动验证。一个下午搞定。
质量稳定了。 第 1 条和第 200 条经过完全相同的检查。不存在"AI 写到后面注意力下降"的问题——因为质量不是由 AI 保证的,是由工具保证的。
我的角色变了。 以前我是 AI 的质检员。现在我是设计者。我不再花时间确认"AI 有没有搞砸",而是花时间决定"下一批做什么内容"。这才是我应该干的事。
什么项目适合这么干
说了这么多,这套方法不是万能的。它有明确的适用条件。
适合的项目长这样:内容量大(几十上百条),格式统一(每条结构一样),规则明确(能写成"对/错"的判断),需要反复生产(不是一次性的)。
我的游戏为什么特别适合?因为它是一个"200 多条随机事件 + 19 条格式规则 + 十几条世界观红线"的组合。每条事件结构完全一样——都有描述、选项、结果、数值影响。每条都必须遵守同样的规则。每个版本都要批量追加几十条新的。这就是典型的**“高度结构化的批量生产”**。
反过来,如果你让 AI 帮你写一篇独立的文章、设计一个独特的关卡、做一次头脑风暴——这些事情本身就需要自由发挥,管道反而是束缚。
简单判断:你的产出能不能用一张固定表格来描述? 如果能,就适合上管道。如果不能,让 AI 自由发挥反而是对的。
总结:三条原则
第一,让 AI 填表,别让它自由发挥。 给模板、给结构、给格子。它只需要往里面填内容。格式不是它的责任。
第二,规则写进工具,别写进 prompt。 你跟 AI 说"不要超过 25 字",它偶尔会忘。工具检查"超了,打回",它过不去。一个靠自觉,一个靠强制。
第三,不信 AI 的嘴,信工具的结果。 它说做完了不算。验证通过了才算。
和 AI 合作的最大陷阱,不是它不够聪明——是它太灵活了。它能用一百种方式完成同一件事,但你需要的是每次都用同一种方式。
把一百种可能性收窄成一种确定性——这就是工具管道在做的全部事情。
你不需要 AI 更聪明。你需要 AI 更无聊。像流水线工人一样无聊——每次做一样的事,用一样的方式,得到一样的结果。
创造力留给内容。确定性留给管道。
有问题欢迎评论交流,踩过的坑越多越值得聊#
4
1
2