字节游戏下场做AI游戏,能成新风口吗?

修改于昨天 23:581 浏览综合
文/唏嘘
导语
字节游戏,推出一款Steam买断制AI真人RPG
AI 漫剧如今已然成为行业风口,频频占据各大短剧榜单,也直观印证了 AI 影视内容的商业化潜力。
这场新风口的背后,少不了字节的影子。今年2月,字节推出的Seedance 2.0,只需要一段文字、几张图或一小段视频,就能在60秒内生成一段电影级短片。
而实际上,早在AI影视成气候之前,字节游戏江南工作室就已经在酝酿一款AI真人RPG游戏:《不问凡尘》。这是一款借助AI影视能力搭建的修仙题材的真人RPG游戏,去年立项,今年5月公布了首爆PV。
这并不难理解。自2023年以来,AI就成了字节重点发力的方向,昕玠对AI的关注也从那时开始。在《不问凡尘》之前,他尝试过三款AI游戏,都在Demo阶段被推翻。AI 技术更新迭代速度极快,在他看来,研发 AI 游戏更像是一场博弈,不能只着眼当下,更要精准预判行业未来的走向。
而这一次,他认为团队押对了方向。在江南工作室办公室,他拿出手机,向我展示了一段 AI 生成视频:画面里的少女笑容灵动。
TapTap
这是他感到确定的瞬间。视频由AI生成,素材不过是从网上随手找来的一张人物图,他们只是确定了首帧和尾帧,让AI填充中间的部分。但动起来的那一刻,那个人物有一种真实人物才有的质感,让他忍不住对着屏幕盯了半个小时。
如今,随着AI漫剧等应用场景落地,AI视频有了市场化的可能性。他对《不问凡尘》充满信心。
以下是茶馆和他的对话,经整理后呈现:
01
诞生于字节游戏的AI影游
茶馆:你之前自己本人是做AI方面的吗?
昕玠:我应该是2023年才开始正式关注AI。我毕业后便加入字节,2023年,当时市面上同类产品尚处于早期阶段。从2023年到2025年,我们在AI游戏领域尝试了很多款产品。
茶馆:之前研发的三款都在Demo阶段被推翻了,这个项目为什么能够持续推进下去?
昕玠:因为逻辑不一样,前三个项目还在找玩法。
第一个做了一个类似“老板模拟器”,是个经营游戏,你要通过自然语言管理你的员工,给员工分配不同的项目,整体来说是想做一个全新的玩法。
但是我发现,因为自然语言需要打字交互,玩家交互的复杂度和收获的快乐,很难成正比。你要非常复杂的操作才能获得极佳的交互反馈,这意味着能享受这种乐趣的人还是比较少的。
我后来邀请了几个同事来玩,对我打击还挺大的。他们说:“你不要让我在游戏里还要上班。”我本来想塑造一个比较爽感的视角,但是在游戏里却整天在处理一些头疼的问题,AI员工问:“老板今天能不能请假”“我看隔壁同事不舒服,能不能不一起工作”。
第二个产品是个故事冒险模拟器。有点类似于“无限流”玩法,玩家带领角色开启不同世界观的冒险,尝试将角色羁绊、冒险记忆转化为专属游戏体验。是个挺有意思的想法,我们还尝试打造过林黛玉穿进霍格沃兹学院,她使用魔法时还会念诗句,是我们意料之外的事。
受限于当时的大模型,产品还是没推进下去。大概是2024年初,彼时大模型对长文本、连续剧情的记忆能力不足,经常出现世界观混淆、剧情逻辑错乱的问题,比如我们当时做了几个副本。
不过,这个事情也慢慢演化出了我们现在的方向。因为这个事情本身利用了AI的创造性。我们也意识到,如果你要做,就要选一个随着AI发展,它能和经典游戏抗衡的方向,纯图文玩法竞争力不足,很难和市面上画面精良主流游戏抗衡,我们把目光投向了还未萌芽的AI视频赛道领域。
那时候我是想做《导演模拟器》的,是一款主打影视公司模拟经营,玩家可以签约演员、改写剧本、挑选阵容,借助 AI 生成影片预告,还能体验影视创作自带的随机性,自由打造原创内容。
也是在这个过程中,我们发现了如今《不问凡尘》里“留影石”玩法雏形。我们发现“首尾帧生视频”,我们在网上随便找了一个图片,固定好它的首帧、尾帧,让AI生成视频。我印象特别深刻,我对着那个Demo看了得有半个小时,当图片上的人连续动起来时,它像有种魔力,让你觉得有很强的代入感和真实感。
TapTap
TapTap
在此基础上,我们尝试将交互玩法与AI视频结合,搭建出简易的游戏运行框架,后来就成了《不问凡尘》。
茶馆:该项目隶属于字节跳动哪个部门?内部对这款AI游戏项目的定位是怎样的?
昕玠:我们属于江南工作室。
我觉得内部还是比较给机会的。这些事能在内部迅速运转起来,得益于良好的平台环境和团队的鼎力支持,所以才会有更多的机会和更具战略性投入的选择。
茶馆:我们团队有多少人在做这款游戏?
昕玠:早期一直是10个以内,直到今年初左右,我们发现这个事情确定性比较高,可以把各种类型游戏都用这套范式做一遍,那时候开始加人,现在是20个左右。
茶馆:“确定性”来源于哪里?
昕玠:我觉得来自两大层面。
第一,AI多模态技术跨过“恐怖谷”。2025年9月,我们实现了AI人物连贯动态生成;到2025年底,AI图片、视频的生成质量已经追平市面上大部分PC游戏,人物形象、场景画面的真实感与精细度达到可面向玩家正式交付的标准。
TapTap
第二,AI内容可控性实现突破。以Banana、Seedance为代表的新一代模型,大幅提升了图文、视频生成的可控性。早期模型仅能依靠大量抽卡试错来产出内容,指令理解能力差;新模型可以精准解读提示词与参考图,我们能够自主把控人物动作、画面风格、场景细节,真正实现创意落地,而非被动接受AI随机产出的内容。技术层面的成熟,让我们确定项目可以稳步推进。
02
重玩法修仙AI游戏
茶馆:整体来说,《不问凡尘》会讲一个什么故事?
昕玠:你来到一个修仙的世界观,故事以玩家降临这个世界、选择自己不同的修仙之路为故事。
茶馆游玩过程中,玩家主要就是和各类 NPC 互动、挑战怪物、探索整片大世界吗?
昕玠:没错。我们设计了风格独特的修仙世界观,不过相关细节暂时还不能公开,后续我们会专门发布世界观 PV,完整介绍整个世界的设定。
玩家在游戏中会承接主线赋予的使命,但我们并不强制大家沿着主线一路推进。很多玩家已经厌倦了线性的剧情流程,相比被动跟着故事走,大家更想自由体验修仙的乐趣。为此我们设计了丰富的成长体系:玩家可以选择不同天赋,走丹修、器修等不同路线;也能和角色结缘,在交友互动中习得专属功法。
TapTap
后续还会上线本命法宝系统,大家可以随心选择正道、邪道,或是做一名自在的散修。即便不推进主线,玩家也能依靠这些玩法修炼成长,最终达成飞升成仙的结局。
目前我们已经开发出炼丹、炼器、宗门试炼、比武大会、拍卖会、世界BOSS等大量玩法,会以完整游戏的形态呈现给玩家。
TapTap
TapTap
TapTap
茶馆:这些都属于偏重度的游戏玩法,已经和大部分主打剧情体验的互动影游不一样了。
昕玠:这也正是我们和互动影游类产品的核心区别。现在不少团队,都是在原有内容基础上尝试增加交互体验;而我们是依托全新的AI生产模式,打造一款内容饱满的正统修仙游戏。
因为我们明确服务的用户,就是Steam平台上的修仙游戏玩家。这类用户不仅想看剧情,还追求丰富的玩法、完整的世界观和多样的互动体验,这也是我们重点打造的方向。长远来看,影视和游戏品类会不断融合:互动影游会逐步补充玩法,传统游戏也会强化剧情分支。只依靠多分支剧情的模式,并不能满足所有用户,各个团队最终都会找准自身定位,持续挖掘不同品类的市场机会。
TapTap
茶馆:你们最早PV出来后,评论区有说,修仙是一个比较古早的领域。你们是怎么确定修仙是是合适题材的?
昕玠:我们最开始去年就选了修仙。一部分是团队里有比较多修仙的核心粉丝;另一部分,我觉得修仙是个严重被低估的品类。之前大家会觉得修仙是个下沉赛道,但随着我们的调研,我们发现这些用户还是比较集中在一二线城市。
我们观察到去年《凡人修仙传》有一波很强的内容现象。今年还会有《凡人》的大电影、《剑来》的剧,会不断扩展新的用户。
我喜欢把修仙比作“中国原生出来的文化认同题材”,类似中国的二次元。这是一个快速增长的盘子,但目前的游戏供给还不多。而且我认为,在修仙战斗技能、修仙的场景、NPC精细度上,用AI能做出比现有产品更好质量的内容,这是我们比较有把握的判断。
茶馆:很多改编3D动漫如果建模不好,骂声会比较大,AI就更不可控了。
昕玠:我觉得这是两个事情。玩家愿不愿意接受AI做的内容,说到底还是看质量够不够好。如果我们做出的画面、演出质感,能达到甚至超越主流影视剧水准,玩家自然没有拒绝的理由。
我们之前放出 PV 后,有公众号自发组织了用户投票,当时大家的态度基本五五开:一半玩家觉得内容不错愿意体验,另一半则对 AI 制作的形式心存顾虑。今年三四月,我们邀请了二三十位玩家实地试玩,结果和之前差别很大,支持的比例达到了九比一。
也就是说,90% 的玩家在实际体验后,都认可了 AI 制作的内容。只要战斗、场景、NPC 互动等核心体验达标,玩家并不会纠结内容由何种技术制作。这就好比大家看电影,不会因为影片使用的拍摄设备不同就选择不观看,作品本身的品质才是关键。
所以我们的AI花了很多精力在设计和废稿的消耗上:并不是说AI一出来这件事就结束了,我们还是要做大量设计工作。你看到的那些人物,其实都做了一两周的设计。
TapTap
未来国内用户对 AI 内容的接受度还会持续提升。我们也愿意投入额外成本打磨细节、优化设计,让玩家感受到制作的用心,交出高质量的作品。
茶馆:修仙领域有不少成熟IP,依托IP开发作品或许能收获更广的受众。相比之下,打造原创世界观和故事反而要承担不少风险,你们为何没有选择合作现成IP呢?
昕玠:是,这个问题我从两个方面想。做IP有IP的好处和限制,你要过监修、跟IP对齐每一个设计。我们在这个产品上,希望专注于用AI快速完成0到1的产品验证。
但我觉得精力不能被分散。我后来纹了一个“attention”的纹身——AI算法里有一句很著名的话叫“Attention is all you need”,大模型的突破有一部分就是让模型去关注重要的事情。我觉得这对团队来说同样重要。
跟IP合作、把好故事拍出来、做好长线运营,这些都是游戏行业的基本功。但用AI从0到1做出一个完整的游戏,这不是行业基本功,是你要自己花精力去解的题。其他题你接下来做好就行。我希望先把我自己独特的这道题全力解完,那接下来会有很多选择,我都可以去做我想做的事情。
03
不做手游,做买断,他们在赌什么?
茶馆:你们搭建项目框架的时候,AI漫剧还没有兴起吧?当时这个赛道是什么情况?
昕玠:是的,我们在去年年底就完成了整体框架搭建,当时主流还是Midjourney 3到4版本,AI相关内容创作还处在早期阶段。后续随着Banana、Seedance等模型陆续上线,我们的研发效率也大幅提升,并且这种技术迭代还会持续下去。
茶馆:今年市面上出现了不少AI互动小说、短视频类互动内容,它们和你们核心差异在哪里呢?
昕玠:在这个方向做了差不多一年时间,我感觉这个事情是必然发生的。过去想要做多分支互动内容,投入成本极高,产出却不确定,大部分团队都难以承受。现在门槛降低,更多人开始尝试互动内容创作。
我们的核心目标是打造一款完整的大型游戏,包含战斗、场景探索、NPC交互、角色养成等全套玩法。所以我们会深耕游戏设计、数值体系、交互反馈等游戏行业的核心能力。
TapTap
市面上互动短剧、AI漫剧,本质还是源自影视行业,核心竞争力依靠优质剧本和演员演绎。但优质剧本本就稀缺,现阶段AI也还无法复刻真人演员的表现力,想要出彩的效果,需要投入大量精力调试,这也是这类产品目前的局限。当然我也看好影视互动内容的未来,只是现阶段,我们选择立足游戏领域发力。长远来看,两大品类一定会互相融合,诞生更多新颖的内容形态。
茶馆:也就是说,对比传统重度游戏,你们依托AI实现了降本;对比AI互动短剧,你们又在玩法上做出了创新,算是两者结合的路线?
昕玠:可以这么理解,我们的目标受众始终是核心游戏玩家。我一直觉得游戏行业如同建筑行业,不光要有创意设计,更要一步步落地搭建,不少好想法都会受限于成本、制作管线而无法实现。而AI带来的全新生产模式,恰好能打破这类限制,释放创作空间。
我很看好AI视频在画面表现上的潜力,未来它的视觉效果会超越传统游戏。像以前大成本才能打造的顶级3D大作,AI视频天然就具备这样真实的视觉观感。
TapTap
TapTap
茶馆:这款游戏偏向重度玩法,但字节的流量分发模式更适配轻量化产品。后续上线后,你们打算如何依托公司生态来推广这款作品?
昕玠:我们这个产品还是一个比较收敛的产品,在Steam上做买断制。我们现阶段的核心目标是快速验证产品模式,因此不会做复杂的流量投放与广告宣传。推广一般是做手游的事情。这个产品应该只做PC单机。PC单机说到底,就是你能把差异化的东西、好的内容给到玩家,他们就会认可。
我们不做手游,跟我之前说的思路是一样的:如果做手游,还要做数值、做长线运营、做广告、做买量测试,这些在当下这个阶段都会分散项目组的精力。我们先把0到1这一款纯粹的游戏做出来,把这件事跑通,接下来想做什么,选择是很多的。
茶馆:会多久做出来?
昕玠:我们会争取今年上线。
茶馆:那有预期的销量目标吗?
昕玠:还是有预期的,没有预期也不合理——你不能只说做嘛。玩家的认可才证明这件事0到1真的跑通了,你做得好。
04
“做AI游戏像一场赌博”
茶馆:之前似乎少有团队做你们这个方向?为何当时其他团队没有入局,背后存在哪些难点?
昕玠:每个人对行业趋势的预判范围都有限。我们准备产品的时候,当时 AI 绘制的人物形象还无法突破视觉 “恐怖谷”,想要做成完整游戏,必须预判一年后的技术水平,相当于和 AI 发展趋势对赌。预判太过保守,成品会缺乏亮点;预判过于激进,又可能因技术不达标导致项目搁浅。
这款产品能够落地,离不开 Banana、Seedance、Image 2 以及各类 Agent 模型的接连迭代,缺了任何一环都难以实现。这也是一条不断被新技术颠覆的赛道,对团队的持续学习和创新能力要求很高。
茶馆:如果没赌赢的话,还会继续等吗?
昕玠:我觉得看你对这个事情的判断坚不坚决。我对这个事情很坚定在于,它在短、中、长期都有清晰的落地路径和商业化模式。短期来看,当前产品可登陆 PC,后续也能轻松移植为手游;中期可以结合知名 IP,打造体量更大、受众更广的作品,还能重启模拟经营、叙事类等过往构思;长期则可以依托世界模型,实现场景、战斗画面的无缝实时生成。伴随着 AI 技术进步,我们的研发效率和产品品质也会持续提升。
TapTap
茶馆:那这套模式能够持续拓展延伸的核心底层逻辑是什么?
昕玠:核心逻辑就是把游戏的玩法、内容以及整套生产流程,完全搭建在AI体系之上。我有一个简单的判断方法:假如AI模型的能力提升一倍,你的第一感受是欣喜还是焦虑?如果感到欣喜,就说明赛道选择是正确的。
早些年大家还在研究如何让AI写出千字内容,如今它早已可以轻松完成万字创作,很多基础工作都被AI承接。我们不会去跟风做这类基础功能,而是聚焦在视频、图文这类AI优势领域。模型不断变强,我们的制作效率、内容品质也会同步提升,可落地的产品形态也会越来越丰富。简单来说,我们的产品形态和研发框架,从根源上就是围绕AI来打造的。
茶馆:这套模式看起来门槛不高,很容易被复制,现在普通人也能用AI做游戏。
昕玠:单纯从技术工具层面来看,确实不存在绝对壁垒,毕竟我们并非底层模型研发方。放到整个游戏行业来看,多数竞争壁垒本质都是可量化的资源,无论是引擎技术还是团队管线,别人都有机会补齐。
我们的优势在于走在前面。其他团队并非做不出同类玩法,只是需要花费时间,逐一踩过我们此前遇到的各类问题。AI 领域本就是你追我赶、交替迭代的状态,各家模型和技术轮番更新,这也是行业常态。我们会继续保持前进的节奏,和同行一起在这个领域持续探索。
茶馆:你们PV出来后,可能有更轻量的玩法比你们先出来,这个风险怎么看?
昕玠:我觉得这个市场很大,坦白说,大到容得下很多人来吃东西。走在前面这件事,也没有想得那么简单。我之前跟别人聊的时候也讲过,我的观察是:你不断趟坑走过的内容,就是你的壁垒。
只要我把我想做的事情做好就行,不需要想那么多。你当下想做的事情做出来,这件事还是足够成立的。
TapTap
茶馆:在AI游戏这个方向,你们怎么看自己的位置?
昕玠:我觉得是走在前面的,这部分的积累和判断力是很重要的。
有个朋友跟我讲,有一种"在压路机前捡钢镚"的感觉——大模型陆续会覆盖各行各业和所有的能力模块。在这个过程中,你要在它覆盖到你和这个体验之前,交付出一些好玩的东西,做出你想表达的东西。
我是相信某一天AI能在所有能力上超越全人类的。但这个过程,不是等待,而是参与。以第一视角去看、去做、去积累,这本身就是一种不一样的体验。