字节游戏下场做AI游戏，能成新风口吗？

修改于昨天 23:581 浏览综合

文/唏嘘

导语

字节游戏，推出一款Steam买断制AI真人RPG

AI 漫剧如今已然成为行业风口，频频占据各大短剧榜单，也直观印证了 AI 影视内容的商业化潜力。

这场新风口的背后，少不了字节的影子。今年2月，字节推出的Seedance 2.0，只需要一段文字、几张图或一小段视频，就能在60秒内生成一段电影级短片。

而实际上，早在AI影视成气候之前，字节游戏江南工作室就已经在酝酿一款AI真人RPG游戏：《不问凡尘》。这是一款借助AI影视能力搭建的修仙题材的真人RPG游戏，去年立项，今年5月公布了首爆PV。

这并不难理解。自2023年以来，AI就成了字节重点发力的方向，昕玠对AI的关注也从那时开始。在《不问凡尘》之前，他尝试过三款AI游戏，都在Demo阶段被推翻。AI 技术更新迭代速度极快，在他看来，研发 AI 游戏更像是一场博弈，不能只着眼当下，更要精准预判行业未来的走向。

而这一次，他认为团队押对了方向。在江南工作室办公室，他拿出手机，向我展示了一段 AI 生成视频：画面里的少女笑容灵动。

这是他感到确定的瞬间。视频由AI生成，素材不过是从网上随手找来的一张人物图，他们只是确定了首帧和尾帧，让AI填充中间的部分。但动起来的那一刻，那个人物有一种真实人物才有的质感，让他忍不住对着屏幕盯了半个小时。

如今，随着AI漫剧等应用场景落地，AI视频有了市场化的可能性。他对《不问凡尘》充满信心。

以下是茶馆和他的对话，经整理后呈现：

诞生于字节游戏的AI影游

茶馆：你之前自己本人是做AI方面的吗？

昕玠：我应该是2023年才开始正式关注AI。我毕业后便加入字节，2023年，当时市面上同类产品尚处于早期阶段。从2023年到2025年，我们在AI游戏领域尝试了很多款产品。

茶馆：之前研发的三款都在Demo阶段被推翻了，这个项目为什么能够持续推进下去？

昕玠：因为逻辑不一样，前三个项目还在找玩法。

第一个做了一个类似“老板模拟器”，是个经营游戏，你要通过自然语言管理你的员工，给员工分配不同的项目，整体来说是想做一个全新的玩法。

但是我发现，因为自然语言需要打字交互，玩家交互的复杂度和收获的快乐，很难成正比。你要非常复杂的操作才能获得极佳的交互反馈，这意味着能享受这种乐趣的人还是比较少的。

我后来邀请了几个同事来玩，对我打击还挺大的。他们说：“你不要让我在游戏里还要上班。”我本来想塑造一个比较爽感的视角，但是在游戏里却整天在处理一些头疼的问题，AI员工问：“老板今天能不能请假”“我看隔壁同事不舒服，能不能不一起工作”。

第二个产品是个故事冒险模拟器。有点类似于“无限流”玩法，玩家带领角色开启不同世界观的冒险，尝试将角色羁绊、冒险记忆转化为专属游戏体验。是个挺有意思的想法，我们还尝试打造过林黛玉穿进霍格沃兹学院，她使用魔法时还会念诗句，是我们意料之外的事。

受限于当时的大模型，产品还是没推进下去。大概是2024年初，彼时大模型对长文本、连续剧情的记忆能力不足，经常出现世界观混淆、剧情逻辑错乱的问题，比如我们当时做了几个副本。

不过，这个事情也慢慢演化出了我们现在的方向。因为这个事情本身利用了AI的创造性。我们也意识到，如果你要做，就要选一个随着AI发展，它能和经典游戏抗衡的方向，纯图文玩法竞争力不足，很难和市面上画面精良主流游戏抗衡，我们把目光投向了还未萌芽的AI视频赛道领域。

那时候我是想做《导演模拟器》的，是一款主打影视公司模拟经营，玩家可以签约演员、改写剧本、挑选阵容，借助 AI 生成影片预告，还能体验影视创作自带的随机性，自由打造原创内容。

也是在这个过程中，我们发现了如今《不问凡尘》里“留影石”玩法雏形。我们发现“首尾帧生视频”，我们在网上随便找了一个图片，固定好它的首帧、尾帧，让AI生成视频。我印象特别深刻，我对着那个Demo看了得有半个小时，当图片上的人连续动起来时，它像有种魔力，让你觉得有很强的代入感和真实感。

在此基础上，我们尝试将交互玩法与AI视频结合，搭建出简易的游戏运行框架，后来就成了《不问凡尘》。

茶馆：该项目隶属于字节跳动哪个部门？内部对这款AI游戏项目的定位是怎样的？

昕玠：我们属于江南工作室。

我觉得内部还是比较给机会的。这些事能在内部迅速运转起来，得益于良好的平台环境和团队的鼎力支持，所以才会有更多的机会和更具战略性投入的选择。

茶馆：我们团队有多少人在做这款游戏？

昕玠：早期一直是10个以内，直到今年初左右，我们发现这个事情确定性比较高，可以把各种类型游戏都用这套范式做一遍，那时候开始加人，现在是20个左右。

茶馆：“确定性”来源于哪里？

昕玠：我觉得来自两大层面。

第一，AI多模态技术跨过“恐怖谷”。2025年9月，我们实现了AI人物连贯动态生成；到2025年底，AI图片、视频的生成质量已经追平市面上大部分PC游戏，人物形象、场景画面的真实感与精细度达到可面向玩家正式交付的标准。

第二，AI内容可控性实现突破。以Banana、Seedance为代表的新一代模型，大幅提升了图文、视频生成的可控性。早期模型仅能依靠大量抽卡试错来产出内容，指令理解能力差；新模型可以精准解读提示词与参考图，我们能够自主把控人物动作、画面风格、场景细节，真正实现创意落地，而非被动接受AI随机产出的内容。技术层面的成熟，让我们确定项目可以稳步推进。

重玩法修仙AI游戏

茶馆：整体来说，《不问凡尘》会讲一个什么故事？

昕玠：你来到一个修仙的世界观，故事以玩家降临这个世界、选择自己不同的修仙之路为故事。

茶馆：游玩过程中，玩家主要就是和各类 NPC 互动、挑战怪物、探索整片大世界吗？

昕玠：没错。我们设计了风格独特的修仙世界观，不过相关细节暂时还不能公开，后续我们会专门发布世界观 PV，完整介绍整个世界的设定。

玩家在游戏中会承接主线赋予的使命，但我们并不强制大家沿着主线一路推进。很多玩家已经厌倦了线性的剧情流程，相比被动跟着故事走，大家更想自由体验修仙的乐趣。为此我们设计了丰富的成长体系：玩家可以选择不同天赋，走丹修、器修等不同路线；也能和角色结缘，在交友互动中习得专属功法。

后续还会上线本命法宝系统，大家可以随心选择正道、邪道，或是做一名自在的散修。即便不推进主线，玩家也能依靠这些玩法修炼成长，最终达成飞升成仙的结局。

目前我们已经开发出炼丹、炼器、宗门试炼、比武大会、拍卖会、世界BOSS等大量玩法，会以完整游戏的形态呈现给玩家。

茶馆：这些都属于偏重度的游戏玩法，已经和大部分主打剧情体验的互动影游不一样了。

昕玠：这也正是我们和互动影游类产品的核心区别。现在不少团队，都是在原有内容基础上尝试增加交互体验；而我们是依托全新的AI生产模式，打造一款内容饱满的正统修仙游戏。

因为我们明确服务的用户，就是Steam平台上的修仙游戏玩家。这类用户不仅想看剧情，还追求丰富的玩法、完整的世界观和多样的互动体验，这也是我们重点打造的方向。长远来看，影视和游戏品类会不断融合：互动影游会逐步补充玩法，传统游戏也会强化剧情分支。只依靠多分支剧情的模式，并不能满足所有用户，各个团队最终都会找准自身定位，持续挖掘不同品类的市场机会。

茶馆：你们最早PV出来后，评论区有说，修仙是一个比较古早的领域。你们是怎么确定修仙是是合适题材的？

昕玠：我们最开始去年就选了修仙。一部分是团队里有比较多修仙的核心粉丝；另一部分，我觉得修仙是个严重被低估的品类。之前大家会觉得修仙是个下沉赛道，但随着我们的调研，我们发现这些用户还是比较集中在一二线城市。

我们观察到去年《凡人修仙传》有一波很强的内容现象。今年还会有《凡人》的大电影、《剑来》的剧，会不断扩展新的用户。

我喜欢把修仙比作“中国原生出来的文化认同题材”，类似中国的二次元。这是一个快速增长的盘子，但目前的游戏供给还不多。而且我认为，在修仙战斗技能、修仙的场景、NPC精细度上，用AI能做出比现有产品更好质量的内容，这是我们比较有把握的判断。

茶馆：很多改编3D动漫如果建模不好，骂声会比较大，AI就更不可控了。

昕玠：我觉得这是两个事情。玩家愿不愿意接受AI做的内容，说到底还是看质量够不够好。如果我们做出的画面、演出质感，能达到甚至超越主流影视剧水准，玩家自然没有拒绝的理由。

我们之前放出 PV 后，有公众号自发组织了用户投票，当时大家的态度基本五五开：一半玩家觉得内容不错愿意体验，另一半则对 AI 制作的形式心存顾虑。今年三四月，我们邀请了二三十位玩家实地试玩，结果和之前差别很大，支持的比例达到了九比一。

也就是说，90% 的玩家在实际体验后，都认可了 AI 制作的内容。只要战斗、场景、NPC 互动等核心体验达标，玩家并不会纠结内容由何种技术制作。这就好比大家看电影，不会因为影片使用的拍摄设备不同就选择不观看，作品本身的品质才是关键。

所以我们的AI花了很多精力在设计和废稿的消耗上：并不是说AI一出来这件事就结束了，我们还是要做大量设计工作。你看到的那些人物，其实都做了一两周的设计。

未来国内用户对 AI 内容的接受度还会持续提升。我们也愿意投入额外成本打磨细节、优化设计，让玩家感受到制作的用心，交出高质量的作品。

茶馆：修仙领域有不少成熟IP，依托IP开发作品或许能收获更广的受众。相比之下，打造原创世界观和故事反而要承担不少风险，你们为何没有选择合作现成IP呢？

昕玠：是，这个问题我从两个方面想。做IP有IP的好处和限制，你要过监修、跟IP对齐每一个设计。我们在这个产品上，希望专注于用AI快速完成0到1的产品验证。

但我觉得精力不能被分散。我后来纹了一个“attention”的纹身——AI算法里有一句很著名的话叫“Attention is all you need”，大模型的突破有一部分就是让模型去关注重要的事情。我觉得这对团队来说同样重要。

跟IP合作、把好故事拍出来、做好长线运营，这些都是游戏行业的基本功。但用AI从0到1做出一个完整的游戏，这不是行业基本功，是你要自己花精力去解的题。其他题你接下来做好就行。我希望先把我自己独特的这道题全力解完，那接下来会有很多选择，我都可以去做我想做的事情。

不做手游，做买断，他们在赌什么？

茶馆：你们搭建项目框架的时候，AI漫剧还没有兴起吧？当时这个赛道是什么情况？

昕玠：是的，我们在去年年底就完成了整体框架搭建，当时主流还是Midjourney 3到4版本，AI相关内容创作还处在早期阶段。后续随着Banana、Seedance等模型陆续上线，我们的研发效率也大幅提升，并且这种技术迭代还会持续下去。

茶馆：今年市面上出现了不少AI互动小说、短视频类互动内容，它们和你们核心差异在哪里呢？

昕玠：在这个方向做了差不多一年时间，我感觉这个事情是必然发生的。过去想要做多分支互动内容，投入成本极高，产出却不确定，大部分团队都难以承受。现在门槛降低，更多人开始尝试互动内容创作。

我们的核心目标是打造一款完整的大型游戏，包含战斗、场景探索、NPC交互、角色养成等全套玩法。所以我们会深耕游戏设计、数值体系、交互反馈等游戏行业的核心能力。

市面上互动短剧、AI漫剧，本质还是源自影视行业，核心竞争力依靠优质剧本和演员演绎。但优质剧本本就稀缺，现阶段AI也还无法复刻真人演员的表现力，想要出彩的效果，需要投入大量精力调试，这也是这类产品目前的局限。当然我也看好影视互动内容的未来，只是现阶段，我们选择立足游戏领域发力。长远来看，两大品类一定会互相融合，诞生更多新颖的内容形态。

茶馆：也就是说，对比传统重度游戏，你们依托AI实现了降本；对比AI互动短剧，你们又在玩法上做出了创新，算是两者结合的路线？

昕玠：可以这么理解，我们的目标受众始终是核心游戏玩家。我一直觉得游戏行业如同建筑行业，不光要有创意设计，更要一步步落地搭建，不少好想法都会受限于成本、制作管线而无法实现。而AI带来的全新生产模式，恰好能打破这类限制，释放创作空间。

我很看好AI视频在画面表现上的潜力，未来它的视觉效果会超越传统游戏。像以前大成本才能打造的顶级3D大作，AI视频天然就具备这样真实的视觉观感。

茶馆：这款游戏偏向重度玩法，但字节的流量分发模式更适配轻量化产品。后续上线后，你们打算如何依托公司生态来推广这款作品？

昕玠：我们这个产品还是一个比较收敛的产品，在Steam上做买断制。我们现阶段的核心目标是快速验证产品模式，因此不会做复杂的流量投放与广告宣传。推广一般是做手游的事情。这个产品应该只做PC单机。PC单机说到底，就是你能把差异化的东西、好的内容给到玩家，他们就会认可。

我们不做手游，跟我之前说的思路是一样的：如果做手游，还要做数值、做长线运营、做广告、做买量测试，这些在当下这个阶段都会分散项目组的精力。我们先把0到1这一款纯粹的游戏做出来，把这件事跑通，接下来想做什么，选择是很多的。

茶馆：会多久做出来？

昕玠：我们会争取今年上线。

茶馆：那有预期的销量目标吗？

昕玠：还是有预期的，没有预期也不合理——你不能只说做嘛。玩家的认可才证明这件事0到1真的跑通了，你做得好。

“做AI游戏像一场赌博”

茶馆：之前似乎少有团队做你们这个方向？为何当时其他团队没有入局，背后存在哪些难点？

昕玠：每个人对行业趋势的预判范围都有限。我们准备产品的时候，当时 AI 绘制的人物形象还无法突破视觉 “恐怖谷”，想要做成完整游戏，必须预判一年后的技术水平，相当于和 AI 发展趋势对赌。预判太过保守，成品会缺乏亮点；预判过于激进，又可能因技术不达标导致项目搁浅。

这款产品能够落地，离不开 Banana、Seedance、Image 2 以及各类 Agent 模型的接连迭代，缺了任何一环都难以实现。这也是一条不断被新技术颠覆的赛道，对团队的持续学习和创新能力要求很高。

茶馆：如果没赌赢的话，还会继续等吗？

昕玠：我觉得看你对这个事情的判断坚不坚决。我对这个事情很坚定在于，它在短、中、长期都有清晰的落地路径和商业化模式。短期来看，当前产品可登陆 PC，后续也能轻松移植为手游；中期可以结合知名 IP，打造体量更大、受众更广的作品，还能重启模拟经营、叙事类等过往构思；长期则可以依托世界模型，实现场景、战斗画面的无缝实时生成。伴随着 AI 技术进步，我们的研发效率和产品品质也会持续提升。

茶馆：那这套模式能够持续拓展延伸的核心底层逻辑是什么？

昕玠：核心逻辑就是把游戏的玩法、内容以及整套生产流程，完全搭建在AI体系之上。我有一个简单的判断方法：假如AI模型的能力提升一倍，你的第一感受是欣喜还是焦虑？如果感到欣喜，就说明赛道选择是正确的。

早些年大家还在研究如何让AI写出千字内容，如今它早已可以轻松完成万字创作，很多基础工作都被AI承接。我们不会去跟风做这类基础功能，而是聚焦在视频、图文这类AI优势领域。模型不断变强，我们的制作效率、内容品质也会同步提升，可落地的产品形态也会越来越丰富。简单来说，我们的产品形态和研发框架，从根源上就是围绕AI来打造的。

茶馆：这套模式看起来门槛不高，很容易被复制，现在普通人也能用AI做游戏。

昕玠：单纯从技术工具层面来看，确实不存在绝对壁垒，毕竟我们并非底层模型研发方。放到整个游戏行业来看，多数竞争壁垒本质都是可量化的资源，无论是引擎技术还是团队管线，别人都有机会补齐。

我们的优势在于走在前面。其他团队并非做不出同类玩法，只是需要花费时间，逐一踩过我们此前遇到的各类问题。AI 领域本就是你追我赶、交替迭代的状态，各家模型和技术轮番更新，这也是行业常态。我们会继续保持前进的节奏，和同行一起在这个领域持续探索。

茶馆：你们PV出来后，可能有更轻量的玩法比你们先出来，这个风险怎么看？

昕玠：我觉得这个市场很大，坦白说，大到容得下很多人来吃东西。走在前面这件事，也没有想得那么简单。我之前跟别人聊的时候也讲过，我的观察是：你不断趟坑走过的内容，就是你的壁垒。

只要我把我想做的事情做好就行，不需要想那么多。你当下想做的事情做出来，这件事还是足够成立的。