宜糖予我心

TapTap制造创作者

嗒啦啦生成3D模型—提示词技巧、多视图生成、从文字到游戏角色

修改于05/0360 浏览开发心得

以前做 3D 游戏，模型是最大的拦路虎。不会建模，去素材网站找又很难找到风格统一的资源。

现在不用了。TapTap 制造内置了 AI 生成 3D 模型的能力，你只要用文字描述或者给一张图片，它就能帮你生成一个可以直接放进游戏的 3D 模型。

但是——「用得好」和「随便用」差距巨大。同样是生成一个骑士角色，提示词写得好的人拿到的模型精细度、姿势正确性、贴图质量，比随便写两个字的强好几倍。

这篇帖子教你怎么把 AI 生成 3D 模型这个能力用到位。

难度：零基础可上手，有 3D 游戏经验更佳

————————————————

第一章：三种生成模式，先搞清楚用哪个

AI 生成 3D 模型有三种模式，适合不同场景。

【模式一：文字生成模型 text_to_model】

你给一段文字描述，AI 先生成参考图，再生成 3D 模型。

流程是两步走：

第一步，AI 根据你的描述生成正面、左侧、背面、右侧四张参考图，给你确认。

第二步，你确认图片没问题后，AI 根据这四张图生成 3D 模型。

适合：脑子里有想法但没有参考图的情况。

比如「一个穿蓝色铠甲的矮人战士」「一棵长满蘑菇的老橡树」。

【模式二：图片生成模型 image_to_model】

你给一张正面照，AI 自动推算出其他角度的样子，再生成 3D 模型。

流程也是两步走：

第一步，AI 根据你的正面图生成左侧、背面、右侧三张图，给你确认。

第二步，确认后生成 3D 模型。

适合：已经有概念图、角色立绘、或者用 AI 画图工具生成了一张满意的正面图。

注意：给的图必须是正面朝前的！侧面图、45 度角的图都不行，AI 会推算出错误的几何形状。

【模式三：多视图生成模型 multiview_to_model】

你自己提供多个角度的图片（正面必须有，左侧、背面、右侧可选），AI 直接根据这些图生成模型。

适合：对模型要求很高，愿意自己画或用 AI 画图分别生成各个角度的参考图。

视角越多，模型越准确。

【怎么选？一句话总结】

只有想法没有图 → text_to_model

有一张正面图 → image_to_model

有多张不同角度的图 → multiview_to_model

————————————————

第二章：提示词技巧 —— 写得好和写得差，差距巨大

【原则一：说清楚「是什么」】

AI 需要知道你要的东西属于哪个大类。

好的写法：

「一个卡通风格的女骑士角色，身穿银色板甲，手持长剑和盾牌，头戴翼形头盔」

差的写法：

「一个角色」

越具体，结果越接近你的预期。

【原则二：指定风格】

风格决定了模型的整体观感。常用的风格关键词：

写实风格 → realistic, detailed

卡通风格 → cartoon, stylized, toon

低多边形 → low poly, simple geometry

像素风 → voxel, pixel art style

Q版 → chibi, cute, deformed proportions

赛博朋克 → cyberpunk, neon, sci-fi

中世纪 → medieval, fantasy, knight

提示词里加上风格词，效果会好很多。

比如「a low poly medieval sword」比「a sword」好得多。

【原则三：描述材质和颜色】

不说颜色，AI 就随机给你配色。

好的写法：

「深红色皮革铠甲，金色金属装饰，黑色皮靴」

差的写法：

「一套铠甲」

常用材质关键词：金属 metallic、木质 wooden、石质 stone、皮革 leather、布料 cloth、水晶 crystal、发光 glowing

【原则四：控制复杂度】

AI 生成的模型面数有上限（默认 20000 面，最低可设 48 面）。

如果你的游戏需要大量同屏模型（比如 RTS 里几百个单位），应该要求低面数：

跟嗒啦啦说：「生成一个低多边形的士兵，面数控制在 5000 以内」

如果是主角或特写镜头的模型，可以用默认的 20000 面。

面数和质量的对应关系大致是：

48-500 面：极简风格，方块人

500-2000 面：低多边形，手游常见

2000-8000 面：中等精度，大多数独立游戏够用

8000-20000 面：高精度，适合主角或特写

【原则五：人形角色必须说 A-pose】

如果你要生成的是人形角色（两条腿站立的），而且后续要绑定骨骼做动画，生成时必须要求 A-pose。

A-pose 是什么：双臂自然下垂约 45 度，手掌朝内，双腿直立。

这是骨骼绑定的标准姿势。如果角色是举着手或蹲着的，骨骼绑定大概率会失败。

跟嗒啦啦说：「生成一个人形角色，A-pose 站姿，后续要绑定骨骼做动画」

嗒啦啦会自动在生成参数里设 rig=true，并确保姿势正确。

【提示词模板·直接套用】

人形角色：

帮我用 AI 生成一个 3D 角色模型。描述：「卡通风格的男性骑士，身穿蓝色板甲，手持长剑，A-pose 站姿」。需要绑定骨骼，后续要做动画。

怪物/动物：

帮我用 AI 生成一个 3D 怪物模型。描述：「一只卡通风格的绿色史莱姆，圆润的身体，两只大眼睛，半透明果冻质感」。

场景道具：

帮我用 AI 生成一个 3D 道具模型。描述：「中世纪风格的木质宝箱，铁质锁扣和铆钉装饰，低多边形风格」。面数控制在 3000 以内。

建筑/场景：

帮我用 AI 生成一个 3D 建筑模型。描述：「日式风格的二层木塔，红色瓦片屋顶，周围有樱花树」。

————————————————

第三章：多视图生成 —— 模型质量的关键

不管用哪种模式，AI 最终都是根据多张不同角度的图片来「重建」3D 模型的。图片质量直接决定模型质量。

【文字生成模式的视图确认】

当你用 text_to_model 模式时，AI 会先生成四张图给你看：正面、左侧、背面、右侧。

这一步非常重要！不要无脑确认！

检查清单：

1. 四张图的角色造型是否一致？

有时候正面穿的是板甲，背面变成布衣了。如果不一致，不要确认，重新生成。

2. 颜色是否一致？

正面是蓝色，侧面变成红色，这说明 AI 理解出错了。重新生成或换个描述。

3. 姿势是否正确？

如果要绑骨骼，四张图都应该是 A-pose。如果有一张图手臂抬太高或太低，最好重新生成。

4. 有没有多余的东西？

比如地面上多了个影子、背景里多了奇怪的物体。这些会被 AI 当成模型的一部分建进去。

如果只有一两张图有小问题，可以试着确认——但如果问题明显，果断重新生成。重新跑一次比拿到一个歪模型再修要快得多。

【图片生成模式的注意事项】

用 image_to_model 时，你提供的那张图决定了一切。

给图的要求：

1. 必须是正面图（0 度角，角色正脸朝你）

2. 背景越干净越好（纯白或透明最佳）

3. 完整显示整个角色/物体，不要裁切

4. 分辨率至少 512x512

不要给的图：

侧面图、45 度角的图、多个角色挤在一起的图、背景很复杂的图、只有半身的图。

一个小技巧：如果你有一张很满意的角色图但不是正面的，可以先用嗒啦啦的 AI 画图功能，描述「把这个角色画成正面朝前的全身图，白色背景」，得到正面图后再用 image_to_model。

【多视图模式的进阶用法】

multiview_to_model 适合追求最高质量的情况。

你可以用嗒啦啦的 AI 画图功能分别生成四个角度的参考图，然后一起提交。

步骤：

1. 先用 AI 画图生成一张满意的正面图

2. 以正面图为参考，让 AI 画图分别生成左侧、背面、右侧的图

3. 确认四张图风格和细节一致

4. 把四张图一起提交给 multiview_to_model

提示词：

我有四张角色的多视图参考图（正面、左侧、背面、右侧），帮我用多视图模式生成 3D 模型。图片路径分别是 assets/image/front.png、assets/image/left.png、assets/image/back.png、assets/image/right.png。

————————————————

第四章：骨骼绑定 —— 让模型动起来

生成的模型默认是「死的」——一个静态的 3D 物体。想让角色跑起来、打架、跳舞，需要绑定骨骼。

【什么模型能绑骨骼】

只有双足人形角色可以自动绑骨骼。

可以绑的：人类、精灵、兽人、机器人（人形的）、任何两条腿站立的角色

不能绑的：四足动物、蛇、史莱姆、树、建筑、武器、车辆

如果你想给四足动物做动画，目前需要手动处理，AI 自动绑骨骼不支持。

【怎么请求绑骨骼】

生成模型时跟嗒啦啦说「需要绑定骨骼」或「后续要做动画」就行，它会自动设 rig=true。

绑骨骼有几个前提条件：

1. 模型必须是 A-pose（双臂下垂 45 度）

2. 模型必须是双足人形

3. 模型结构要合理（头、躯干、四肢清晰可辨）

如果绑骨骼失败，通常是因为姿势不对或者模型太抽象。重新生成一个姿势标准的模型，比反复重试更有效。

【绑完骨骼之后】

绑完骨骼的模型输出的是 FBX 格式，嗒啦啦会自动帮你导入引擎（转成 MDL 格式）。

导入后你就可以给角色挂动画了。引擎的资源库里有 1700 多个动画片段（走路、跑步、攻击、死亡、休闲动作等），可以直接搜索使用。

提示词：

帮我搜索适合这个角色的待机和跑步动画。

嗒啦啦会从资源库里找到匹配的动画片段并挂到你的角色上。

————————————————

第五章：生成后的优化

【贴图质量】

生成模型时可以选贴图质量：standard（标准）和 detailed（精细）。

如果是主角或近景展示的模型，建议用 detailed。

如果是远景的装饰物或大量同屏的小兵，用 standard 就够了。

提示词加一句：「贴图质量用精细模式」

【面数控制】

面数越高，模型越精细，但也越吃性能。

建议标准：

主角/Boss → 10000-20000 面

普通 NPC → 3000-8000 面

远景装饰 → 500-2000 面

大量同屏单位 → 200-1000 面

跟嗒啦啦说：「面数控制在 5000 以内」就行。

【搭配资源库使用】

不是所有模型都需要 AI 生成。引擎自带 465+ 个预制资源，覆盖奇幻生物、卡通萌宠、怪物、野生动物、人形角色、植被、岩石、建筑、生活道具、武器装备、载具等。

建议流程：

1. 先在资源库里搜一下有没有现成的

2. 有类似的 → 直接用，省时间

3. 没有或风格不匹配 → 用 AI 生成

提示词：「帮我在资源库里搜索一个中世纪风格的盾牌」

如果资源库里没有合适的，嗒啦啦会自动建议用 AI 生成。

————————————————

第六章：常见坑

坑1：生成的模型方向不对

放进场景后角色背对着镜头，或者侧着身子。

解决：在节点上调整旋转角度就行。跟嗒啦啦说「模型放进去方向不对，帮我旋转一下」。

坑2：模型太大或太小

AI 生成的模型尺寸不一定标准。

解决：用 node.scale 缩放。跟嗒啦啦说「这个模型太大了，缩小到原来的一半」或者「让这个角色高度大约 1.8 米」。

坑3：骨骼绑定失败

通常是因为：角色不是 A-pose、不是双足人形、模型太抽象无法识别肢体。

解决：重新生成，描述里强调「A-pose 站姿，双臂自然下垂 45 度，人形角色」。

坑4：多视图不一致导致模型畸形

正面穿铠甲、背面变布衣，AI 就会生成一个前半铠甲后半布衣的怪物。

解决：在确认视图那一步仔细检查，不一致就重新生成。不要凑合确认。

坑5：等待时间太长

3D 模型生成需要时间，通常几分钟。嗒啦啦会自动等待并轮询结果。

如果超时了也不用慌，嗒啦啦会告诉你任务 ID，过一会儿再查结果就行。

不要反复催它重新生成，否则会创建多个重复任务。

坑6：描述太短，结果不可控

「一个人」这种描述，AI 不知道要男的女的、穿什么、什么风格、什么姿势。

解决：至少包含这四个要素——类别（人/动物/道具）、风格（写实/卡通/低模）、颜色材质、用途。

————————————————

提示词速查表

按模型类型给出推荐的提示词结构：

人形角色：

风格 + 性别 + 职业/身份 + 服装描述 + 颜色 + A-pose + 绑骨骼

例：「卡通风格的女法师，紫色长袍，手持法杖，金色卷发，A-pose 站姿，需要绑骨骼」

怪物/生物：

风格 + 生物类型 + 体型描述 + 颜色 + 特征

例：「写实风格的小型火焰精灵，身高约 0.5 米，全身由红橙色火焰构成，头顶有两只小角」

四足动物：

风格 + 动物种类 + 颜色花纹 + 姿态

例：「低多边形风格的柴犬，橙白色毛发，站立姿态，尾巴上翘」

武器/道具：

风格 + 物品类型 + 材质 + 装饰细节

例：「中世纪风格的双手巨剑，银色刃身，黑色皮革剑柄，剑柄末端有红色宝石」

建筑/场景：

风格 + 建筑类型 + 材质 + 环境元素

例：「奇幻风格的矮人铁匠铺，石质墙壁，木质屋顶，门口有铁砧和锤子」

————————————————

总结

AI 生成 3D 模型的核心就三句话：

第一句：描述要具体

类别 + 风格 + 颜色材质 + 细节，写清楚了 AI 才能给出好结果。

第二句：视图要检查

多视图确认那一步不要无脑点确认，四张图不一致就重新生成。

第三句：人形要 A-pose

想做动画的人形角色，必须要求 A-pose 站姿并开启骨骼绑定。

做到这三条，你就能稳定地用 AI 生成出可用的 3D 模型，放进游戏里跑起来。

有问题评论区见！

#TapTap制造 #嗒啦啦