Meowjesty

《今天也元气满满》制作人

论如何驾驭AI不羁的灵魂

06/1134 浏览开发心得

我是 TapTap 独立开发者，用 AI 辅助做了一款叫《今天也元气满满》的职场 SAN 值生存游戏。上篇帖子讲了怎么用 SSOT 管理文档一致性，这篇讲另一个让我抓狂的问题：AI 每次做同一件事，方法都不一样。

AI 的自由发挥是 bug，不是 feature

你有没有遇到过这种情况——

你让 AI 帮你写 10 条游戏事件。第一条格式完美。第二条少了个字段。第三条格式对了但内容违反了你的设计规则。到第十条的时候，你已经不确定之前哪些条是对的了。

或者：你今天让 AI 改一段代码，它用了方法 A。明天同样的事，它用了方法 B。后天又换了方法 C。三种写法混在一个文件里，像三个人合写的作业。

或者：你让 AI 把一段内容写入文件。它说"做完了"。你打开一看——要么格式不对，要么只改了一半，要么根本没改。它不是故意骗你，它是真的以为自己做完了。

这三个问题的根源是同一个：你把"格式保证"交给了 AI 的自觉性。

AI 没有自觉性。你给它同一个指令十次，它十次的做法可能都不一样。有时候对了，有时候歪了，有时候它发明了一种你没想过的"更好的方式"。

写散文或头脑风暴时这是优点。需要精确、一致、可重复的产出时——这是灾难。

核心思路：AI 只能走一条路

我的游戏有 200 多条随机事件。每条事件有固定的结构、19 条格式规则、十几条世界观红线。每个版本要批量生产几十条新事件。

如果让 AI 自由发挥地写，每次都是一场赌博。

我的解法：不给 AI 任何自由发挥的空间。所有内容必须经过一条固定的管道才能进入项目——AI 填表，自动检查，自动写入，自动验证。四步，每一步都是确定的。AI 只负责第一步——填一张表格。剩下的全部由工具执行，没有商量余地。

打个比方：你不会让一个新来的实习生自己决定怎么提交工作——你给他一个模板，让他填好，然后有人审批、有人归档。AI 也该如此。

不是"请你按这个格式来"。是"你只能按这个格式来，不按就打回去"。

为什么不能"把规则说清楚"就完事？

你可能在想：我跟 AI 说清楚规则不就行了？

试过了。不行。三个原因：

第一，AI 的注意力会漂移。你列了 19 条规则，前几条它记得住，写到第十条事件开始忘。上下文越长，对早期指令的遵守率越低。

第二，同一个 AI，同样的指令，每次做法可能不同。你以为你定义了一个稳定的流程——其实你定义了一个手感骰子。今天它这么做，明天它那么做，你无法预测。

第三，AI 说"做完了"，你没法信它。这是最坑的。它说改好了——你怎么知道真的改对了？你得自己打开文件看。一个还行，十个呢？你发现自己在给 AI 当质检员。

把规则说给 AI 听，是"建议"。用工具强制执行，是"法律"。建议靠自觉，法律靠强制。你要哪个？

四步管道，每一步在做什么

第一步：让 AI 填表，不让它碰代码

我不让 AI 直接改项目文件。我让它填一张结构化的表格。

为什么？因为表格有标准答案——每个格子该填什么、不能超过多少字、必须包含哪些信息——这些全都可以机器验证。"表格填对了没有"这件事，不需要人看，工具就能判。

AI 的工作到这里就结束了。它的角色是"填表的人"。表格对不对，由下一步来判。

第二步：自动检查（19 条规则，零信任）

表格填好后，自动进入检查工具。这个工具做什么呢？举几个例子：

选项文字超长——按钮最多放 25 个字，AI 写了 40 个字，手机上显示不下。

剧透了不该说的信息——某个信息应该让玩家自己发现，AI 直接在文案里写明了。

假设了不存在的前提——内容可能在任何阶段出现，AI 却写了"作为刚来的你"，假设玩家是新人。

在随机内容里改了固定设定——随机内容的出现顺序不可控，AI 却在里面让一个角色升职了，后续逻辑全乱。

写死了不该写死的条件——内容可能在上午或下午触发，AI 写了"下午两点"。

这些规则不是"最好遵守"——是**“违反就打回，改好了再来”**。

以前这些全靠我自己肉眼检查。一批 30 条事件，review 一遍要半小时。现在工具 3 秒跑完。我的工作从"逐条审查"变成了"看一眼报告里有没有警告"。

第三步：工具写入（因为 AI 的"手"不可靠）

这个环节的存在，源于一个让我崩溃过三次的 bug：AI 的文件编辑功能会静默失败。

具体来说：某些情况下 AI 说"我已经改好了"，但文件实际上没变。它不报错。你信了。然后发现代码还是旧的。

第一次遇到：以为自己眼花了。第二次遇到：以为是 AI 理解有误，换了种说法再来。第三次遇到：再也不让 AI 自己写入文件了。

我写了一个脚本来替代它。这个脚本做完写入后会重新打开文件对比一遍——跟你交作业之前再看一遍答案对不对一个道理。对得上才算成功。

朴素得不能再朴素。但它解决了一个 AI 自身解决不了的问题：写入是确定的。

第四步：交付验证（证明给我看）

最后一环。AI 做完所有改动后，它需要自己列一张清单——“我声称做了这些事”：某条事件存在了吗？某个类型注册了吗？配置文件更新了吗？

然后验证工具去逐条核实。全通过才算真的做完。

这像什么？像你让实习生做完活之后填一张自查表，然后主管再过一遍打钩。“不跑验证就说做好了”——在我这里是禁止的。

真实案例：AI 坑了我多少次？

案例 1：200 条内容里藏着的"信息泄露"

项目早期没有检查工具。AI 写内容的时候经常把本该让玩家自己发现的信息直接写在文案里——等于帮玩家把谜底揭了。

怎么发现的？我自己从头到尾扫了一遍所有内容，手动一条条改。

现在：检查工具在填表阶段就会拦截。AI 每次写出违规的文案，3 秒内被打回重写。这个问题从此消失了。

案例 2：整条事件推倒重写

v1.2 版本，有两条事件被 AI 自由发挥得面目全非——格式和其他事件不一致，选项设计违反规则，世界观细节乱了。我没法修补，只能推倒重来。

有了检查工具后，这种情况基本不发生了。因为问题在"填表"阶段就被拦住——AI 还没动到项目文件就已经知道哪里不对。改一个表格字段比重写整条事件便宜十倍。

案例 3：同一批内容改了四轮

我的提交记录里有一组：某批事件经历了四轮修改才最终合格。

每一轮都是同一个循环：AI 写，我看，有问题，AI 改，我再看，又有新问题……四轮。

后来我把那四轮中反复出现的问题全部编码成了检查规则。现在同样的内容一次通过。因为规则是机器执行的——AI 不需要"记住"上次犯了什么错。

如果你也想试试

不需要搞复杂的工具链。根据你的痛点，从最小的改变开始。

方法 1：让 AI 填表，别让它自由发挥。无论你做什么项目——只要需要 AI 批量产出有固定格式的内容——就给它一个模板，让它照着填。你甚至不需要写脚本验证。光是"让 AI 填表"而不是"让 AI 自己决定怎么组织内容"，就已经砍掉了一半的格式问题。

方法 2：把你最常发现的问题变成自动检查。回想你最近一次让 AI 做批量工作——你事后检查时，最常发现什么毛病？文字太长？数字数就行。出现了不该出现的词？关键词匹配。缺了某个必要信息？检查有没有填。把你的"肉眼经验"变成规则。让 AI 帮你写一个检查脚本——它写这种东西很在行。一次设置，以后每次 AI 产出都自动过一遍。

方法 3：AI 说做完了，多问一句"证据呢"。最简单的做法：AI 说改完了，你让它告诉你"改了哪些文件的哪些部分"。然后你抽查一两个。进阶一点：让 AI 改完后列一个清单——“我做了 1、2、3”——然后你或者脚本去核实。重点就一句话：不信任AI报告。要第三方背调。

这套方法给我带来了什么

快了三倍。以前一批内容：AI 写，我查半小时，找出问题，AI 改，我再查，可能还有第三轮。每批至少两天。现在：AI 填表，工具 3 秒检查，不合格的打回，AI 改，再检查，通过，自动写入，自动验证。一个下午搞定。

质量稳定了。第 1 条和第 200 条经过完全相同的检查。不存在"AI 写到后面注意力下降"的问题——因为质量不是由 AI 保证的，是由工具保证的。

我的角色变了。以前我是 AI 的质检员。现在我是设计者。我不再花时间确认"AI 有没有搞砸"，而是花时间决定"下一批做什么内容"。这才是我应该干的事。

什么项目适合这么干

说了这么多，这套方法不是万能的。它有明确的适用条件。

适合的项目长这样：内容量大（几十上百条），格式统一（每条结构一样），规则明确（能写成"对/错"的判断），需要反复生产（不是一次性的）。

我的游戏为什么特别适合？因为它是一个"200 多条随机事件 + 19 条格式规则 + 十几条世界观红线"的组合。每条事件结构完全一样——都有描述、选项、结果、数值影响。每条都必须遵守同样的规则。每个版本都要批量追加几十条新的。这就是典型的**“高度结构化的批量生产”**。

反过来，如果你让 AI 帮你写一篇独立的文章、设计一个独特的关卡、做一次头脑风暴——这些事情本身就需要自由发挥，管道反而是束缚。

简单判断：你的产出能不能用一张固定表格来描述？如果能，就适合上管道。如果不能，让 AI 自由发挥反而是对的。

总结：三条原则