97年创始人再获5000万美元融资,游戏行业对AI严重低估?
昨天 22:17综合

“让每个人都能成为游戏制作人。”
文/修理&托马斯之颅
输入一句简单的prompt,或者上传一张图片,2秒就能生成一个拓扑规整、布线合理的5000面游戏模型。

再多花一分钟,就能自动生成匹配的纹理贴图。全程不用手动做二次拓扑、减面,还能一键完成骨骼绑定和动作适配,生成的模型直接就能接入Unity、UE引擎使用。

当然,实际体验下来,如果只甩一张参考图、不加任何提示词辅助,最终成品还是会有些微瑕疵。但单看这个生成速度,还有拓扑布线的完成度,成品已经完全能打,乍一看已经挑不出什么毛病。

与同类产品的对比
这就是VAST的Smart Mesh(Tripo P1.0),也是目前全球独一份的技术能力。
如果追求极致精度,可以切换到高精度模式,VAST最新发布的Tripo H3.1,在输入对齐、结构精度、贴图质量等核心指标上均有明显提升,能精细还原复杂机械的内部结构与纹路,生成的模型可以直接用于3D打印和工业设计,也可用于游戏和动画的制作环节。

VAST创始人宋亚宸(Simon)还给我们演示了一段Demo:国内某上市游戏公司用Tripo工具,完成了《黑神话:悟空》经典场景的重建,场景里所有的佛像、建筑、植被模型,全由Tripo一键生成,无需额外修改就能直接填入场景使用。虽然单一模型放大之后肯定达不到3A级别的精度,但配合纹理贴图和灯光特效,颇有些以假乱真的观感。

而实现这个效果的,还只是Tripo 3.0版本,并非最新迭代的3.1版本。
我知道看到这里,可能有人会觉得我在夸大其词,但这种技术能力,行业里的大厂和资本已用真金白银投了票。例如腾讯、字节和网易都是他们的客户。

而就在今天(3月5日),VAST正式公布了新一轮融资信息:本轮由阿里、恒旭资本领投,元禾璞华、BV百度风投、东方嘉富等跟投,合计融资金额达5000万美元; 老股东春华创投与北京市人工智能产业投资基金也进行了大额加注。
此前VAST的融资以财务基金、产业基金为主,本轮则吸引了阿里、百度两家BAT巨头入局。在宋亚宸看来,资方阵容的变化,核心是行业终于看到了AI 3D技术的商业化落地能力——它已经真正走进了游戏、3D 打印等产业的核心生产管线。
去年,宋亚宸就曾向我们拆解过AI 3D技术对游戏行业的颠覆性潜力。彼时行业里的大厂,大多还停留在接入Tripo API做二次开发的阶段,对于这项技术究竟能把游戏行业带向怎样的未来,多数人心里都没个准数。
但宋亚宸当时就提醒我们,AI 3D生成技术刚刚面世两年,我们不该低估新事物的进化速度。
事实也的确如此。仅仅不到一年时间,他们的技术就迎来了又一次关键性突破。也正因如此,我们再次与宋亚宸聊了聊。
宋亚宸告诉我们,如今公司的Tripo AI服务已覆盖9万多家企业,全球游戏公司几乎都不同程度地接入了Tripo API,C端产品Tripo Studio也积累了650万开发者和创作者。
他推测在2026年底之前,大家用AI做3D内容,会像现在用AI生图片一样简单,而且会变成理所当然的事。
今年上半年,他们还会上线一款平台型产品,目标是做出一个UGC交互内容平台,让每个人都能成为游戏制作人。
“现在全球游戏市场规模为2600亿美金,我认为它会迎来爆发式增长,至少翻10倍。”
01
“3年前根本没人相信我们”
葡萄君:先聊聊你们最新的技术突破吧。
宋亚宸:我们在AI 3D领域有两个重大进展。
第一个是3.1版本高模生成技术。无论是雕刻作品、图片里的文字,它都能完整展示出来;再复杂的管线、缠绕结构,还是物体内部的凹凸结构,都能还原。完全适配3D打印、工业设计、游戏动画影视制作等场景。
第二个重大进展,是Smart Mesh(Tripo P1.0)。行业里都知道,高模要放进游戏里使用,必须做减面处理,而减面、拓扑结构规整化,一直是游戏生产管线里的核心痛点。
针对这个痛点,我们从零搭建了一版全新的AI 3D大模型。这个技术最核心的突破,是只需2秒钟左右就可以生成一个完整的模型,能做到极其规整的拓扑结构和布线,且几何形体与输入的原图几乎一致,面数支持从500面到2万面。
生成的模型可以直接接入游戏管线,二次编辑也非常容易;同时贴图还原度高,贴上去之后精细度不会受损,还非常便于做AI自动骨骼绑定和动作生成。

葡萄君:好奇这个技术的卡点能有多大?
宋亚宸:原本AI 3D模型的速度和精度很难兼顾,追求精度意味着更长生成时间,追求速度则容易牺牲结构与细节。拓扑结构、几何精度、贴图质量、引擎兼容、可编辑性——每解决一个问题,往往要以另一个问题为代价。Smart Mesh(Tripo P1.0)用了全新的思维方式和算法框架,重新思考3D应该如何被表达、如何被生成。行业内独一家且大幅领先。
葡萄君:真的假的?
宋亚宸:因为在此之前,全世界的同行都在扎堆卷高精度高模生成这条赛道,我们也一直在这个方向深耕。而Smart Mesh这个技术方向,更像是我们在沙漠里找绿洲时,意外撞见的一片全新天地。

说实话,高模生成能做到现在的水平,其实不令我惊讶;但Smart Mesh生成的这次突破,完全是超预期的。
葡萄君:那现在行业最火的世界模型呢?你们有相关的布局吗?
宋亚宸:我们的世界模型还没发布,所以不能说太多。我能讲的是,它的早期会采用融合的多模态数据,包括3D的、视频的,包括专门为世界模型训练设计的原生数据,我希望这是一个能给大家带来惊喜的产品。
葡萄君:你会怎么定义世界模型?
宋亚宸:我一直觉得,国内对世界模型的认知,和海外是有明显偏差的。
早期3D生成主要是用大量2D图片数据转化为3D内容,因为现成的数据和人才都是2D方向的。但从长期主义和第一性原理来看,这件事本来就应该用3D数据来做。
那时我们就搭建了AI和图形学交叉的人才团队,走的是80%图片数据加上20%的3D数据,最终带来的效果就是生成速度更快、成功率更高。随着技术演进,这个比例慢慢变成了20%的图片加80%的3D数据。
发展到今天,我们的3D大模型几乎完全基于3D模型数据训练,和图片已经没有关系了。
行业目前对世界模型的看法,跟当初AI 3D大模型有些像。因为视频数据更易得,视频人才更多,所以国内很多公司从视频切入做世界模型。
但世界的本质是3D,绝对不是视频,视频只是一种压缩格式。如果世界有个源文件,那么文字、图片、视频,都是针对这个世界的压缩格式。用这些压缩格式去训练世界模型,从第一性原理出发就是错误的。
这件事在海外正在逐渐形成共识,比如World Labs、Luma等海外最知名的世界模型公司,核心团队基本都是3D相关出身,或者做娱乐内容出身,3D图形学对他们来说是基座性的、底层的东西。在中国,我们是少数走这条路线的创业公司。
葡萄君:世界模型对AI界来说,会有点像当年开放世界对于游戏界的意义吗?
宋亚宸:做世界模型并不是在鼓吹概念,核心关注点应该在于怎么采集和标注3D数据。
葡萄君:那具体来说,你们的业务路线是什么样的?
宋亚宸:第一块,面向大客户,我们通过API服务现有的游戏行业,目前已经服务了9万多家企业,全球很多游戏公司都在使用Tripo。我们帮他们探索新的玩法,比如AI 3D原生的玩家驱动型Gameplay,还有UGC相关的定制化玩法,这是我们的基础盘。
第二块,是面向650万Tripo Studio用户,他们是PGC开发者。Tripo Studio提供了完整的AI工作流,从最开始的设计图、三视图生成,到几何、贴图、材质、PBR生成,再到动作、骨骼、蒙皮生成,还有模型拆分、补全、编辑、风格化、Magic Brush等全流程功能。
第三块,就是面向PUGC和UGC用户的交互内容平台,这也是我们2026年最重要的事之一。早期平台的主流用户会是PUGC,也就是对3D空间有一定理解、有专业或业余创作能力的用户。后续我们会不断降低门槛,逐步泛化到全量UGC用户。
我们最终的目标,是实现完全的UGC,不管是创作者端的UGC,还是玩法端的UGC。我们希望用户在上面创作的不只是游戏,游戏只是交互内容里的重度品类,就像电影是视频内容里的重度品类一样,未来一定会出现大量轻度的交互内容,都由UGC用户来创作。

葡萄君:技术是你们的核心壁垒吗?还是说对产品的理解本身?
宋亚宸:技术是我们的基础壁垒,让创作者愿意留下来。但更重要的是用户生态。
今年年会上,我们反复讲“种树的人”的故事。有人在荒地里种树,路过的人都质疑“这种地方怎么可能种出森林”。第一年他选错了种子,只种活了几棵歪歪扭扭的树;五年后,却已经长出了成片绿荫;很多年过去,这片荒地最终变成了广袤的森林。
对我们而言,每一位创作者,就是我们种下的树。2023年我们说“未来每个人都能成为创作者”时,根本没人相信,那时我们只有1000个用户。
后来我们发现产品方向走错了,就像故事里选错了种子,于是立刻调整方向,提供完整的3D内容生产工作流,产品一下子就爆发了,用户从不到100万涨到了650万——相当于我们已经种出了650万棵树,也终于有人开始相信这件事了。
现在我们要做的,就是继续勤勤恳恳地耕种这片森林,最核心的事永远是怎么照顾好这些创作者,怎么让他们更好地成长、创作,没有什么事比这个更重要。
02
“让每个人都能成为游戏制作人”
葡萄君:为什么创作者如此重要?
宋亚宸:以前大家用AI 3D工具,主要是为了降本增效,但现在我们的技术打开了全新的空间,实现了之前受限于技术无法大规模铺开的、以玩家驱动的Gameplay和UGC场景,所以创作者的数量会井喷。
葡萄君:这个技术是指最新的Smart Mesh?
宋亚宸:是的。它有三个核心优势:第一,生成的是高精度模型只需要很少的面数,不会用200万面的模型把服务器弄挂;第二,生成速度极快,原来生成一个模型要几分钟甚至更长,现在2秒钟就能完成,真正做到言出法随;第三,能直接做自动骨骼绑定和动作生成,支持实时交互,完全适配玩家驱动的玩法。
比如我们和网易合作的《燕云十六声》,玩家走到河边过不去,就可以直接生成一座桥,这就是典型的玩家驱动的 Gameplay。再比如说还有UGC场景,比如做关卡、皮肤、道具,我们和《蛋仔派对》有合作,用户也可以在《Roblox》里使用我们的工具。
我们最近还办了一场Game Jam,创作者都踊跃报名,获得了全球同类赛事最多的投稿。

葡萄君:你感觉怎么样?
宋亚宸:效果非常好,我们马上要带着这些得奖的、参赛的作品带到GDC现场,分享给更多人。这些作品的完成度都挺高,一方面是AI 3D让搭建场景、角色、道具变得更简单了,哪怕只是一个策划,也能独立完成游戏制作;另一方面,出现了很多以AI 3D为核心的全新玩法,这是更重要的事。
像我们的第一名叫《Mechanical Odyssey》,玩家既可语音指挥机器小猫,也能随时意识潜入任何机器人,无缝切换不同职能破解谜题。

我们后续会密集地做这类活动,公司内部还做了Hackathon(黑客马拉松),马上还要办一场外部的Hackathon。这里面诞生了诸如3D你画我猜、开放世界探索、小家生成摆放、用语言做模型、每日插花 APP等等各种创意作品,我们特别激动,因为这件事能让大家真正玩起来。
葡萄君:感觉量变确实要带来质变了。
宋亚宸:最早期我们想把大语言模型用到游戏里,大家都觉得不好用,怕角色OOC、出戏、人设崩塌,有很多不可控的地方;但现在哪个开放世界游戏里还没加点AI对话?
而3D生成能带来的玩法要多得多,你可以改变地形、改变外观、改变游戏里的几乎所有东西。有了好的策划创意之后,做游戏核心就是两件事,造万物和定规则。
造万物就是美术资产的生产,对应的就是3D生成;定规则就是代码生成,对应的就是Cursor这类工具。当Tripo和Cursor结合在一起,本质上就可以一键式生成世界和游戏,这可能就是当年很多元宇宙编辑器的最终答案。
葡萄君:你判断还需要多久,我们才能做出这样的终极答案?
宋亚宸:现在我们的技术,在UGC场景已经获得大量用户认可买单,PGC场景里做手游、中小型游戏逐渐可用,对普通游戏开发也有很大帮助,只是离3A制作还有距离。我判断今年技术的生成效果,就有机会超过普通人的制作水平。
现在我们的3D生成效果已经逼近专业建模师水平,未来游戏行业会出现大量一人公司。哪怕只是个策划,只要会用AI编码工具,搭配Tripo就能做出游戏Demo,凭Demo去融资、找发行、组建团队。
我甚至认为,未来有些交互体验会告别动辄几十小时的长流程,转向2-5分钟的短内容,把《刺客信条》信仰之跃、《古墓丽影》攀爬这类高光体验集中呈现。
现在很多玩家没精力啃长流程、研究复杂数值体系,未来游戏形态或许会更碎片化,低门槛、短时长、强爽感,就像短视频一样全程都是极致体验。我们把这种形态叫交互内容,它不一定叫游戏,甚至可以没有数值体系。

葡萄君:听起来像你之前说的3D抖音。
宋亚宸:对,就是可交互的抖音。大量3到5分钟的交互内容,有了Tripo加Cursor,制作门槛会变得极低,哪怕是我和你这种不会做游戏的人,终于有机会做出这样的可交互、可消费的内容。
葡萄君:你们是准备做一个平台型产品?
宋亚宸:我们这款产品大概率今年上半年就会上线,核心是让每个人都能成为游戏制作人。传统游戏管线是数百上千人为一个人的创意服务,而我们要实现的,是让每个人都能为自己的创意服务,这必然会带来创意的全面井喷。
现在行业里,腾讯、网易员工每年的立项创意可能有成千上万,但最终能立项的很少,绝大多数创意都因商业化要求、制作成本过高等原因被埋没;商业游戏要兼顾留存、付费,也让很多创意根本无法落地。

但在我们的平台,所有创意都能被容纳,内容时长从两三分钟到30分钟都不受限,制作成本极低、门槛近乎为零。用户可以像发抖音、小红书一样,轻松创作自己的交互内容,实现创意、分享自我,哪怕只是自己体验也能获得十足的乐趣。
葡萄君:但做平台谈何容易。
宋亚宸:我们会先通过PGC内容打样,这些PGC创作者就像平台的KOL,向用户展示平台的内容上限与创作可能性,但平台的核心内容,始终来自普通用户的创作。
做平台最关键的,是要足够开放、不受限。就像TikTok出现前,小咖秀只做对口型单一种类的内容模板,最终只能做成垂类社区,永远做不过全品类的TikTok、快手,核心就是把路走窄了。
我相信依托AI 3D技术,未来平台上一定会出现爆火的内容模板,但我们绝不会只做某一款产品的创意工坊,那完全失去了平台的意义。
葡萄君:这个平台的目标用户是谁?你们现有的650万用户?
宋亚宸:我们这650万用户,更像650万个KOL,他们大多是有一定专业能力的创作者。
03
“未来全球游戏市场至少会翻10倍”
葡萄君:前两天同事还在感叹AI领域日新月异,游戏已经是旧世界了,AI才是新世界。
宋亚宸:游戏行业真的会发生很大的变化,就像现在好莱坞电影行业正在发生的变化一样。但更核心的区别是,电影行业已经衍生出了短视频、短剧这类UGC内容形态,但3D可交互内容的UGC形态还没有出现。
如果可交互内容也能出现对应的UGC生态,这个市场会非常大,甚至有机会诞生下一代的抖音级产品,这是一个巨大的机会。
葡萄君:这一步如果踏出,未来到底会是什么样子?
宋亚宸:我现在都不敢预测了,以前还比较有确定性,现在真的很难说。可能在2026年底之前,大家做3D内容,就像现在用AI生图片一样简单,而且会变成理所当然的事,这才是最可怕的地方。
葡萄君:普通人可能会比较艰难了。
宋亚宸:我反而觉得,这项技术释放了很多人的创意,把大家从螺丝钉的工作里解放出来了。说实话,很多建模师都是知名美院毕业,结果天天在做拧螺丝一样的重复建模工作。
你觉得给人建模有价值,还是把自己的想法和创意完整展现出来有价值?
目前的游戏团队可能是几百人实现一个人的创意,未来可能变成每个创作者都实现自己的创意。工具的本质就是放大人的能力,原本一个人的价值是10,有了AI就能变成100,你既可以在企业里创造更大价值,也可以独立创业,核心只在于谁能率先拥抱AI。文生图、视频生成的发展早已印证了这一点。

葡萄君:关于AI领域的新技术,你现在最关注什么?
宋亚宸:我最关注的就是AI 3D大模型、代码生成、视频生成和世界模型,因为我觉得这些东西是最本质的。如果能直接生成完整的世界,那就是颠覆性的突破,根本不用再考虑这么多复杂的环节了。
我们会把它叫做“可交互的世界级体验”、“有世界沉浸感的交互内容”,但拆解开来,核心就是两件事:可交互,以及世界级的内容和体验,我觉得这一定是未来的方向。
葡萄君:这个方向是不是还没有那么快?
宋亚宸:世界模型的落地可能没那么快。我认为世界模型的落地仍有诸多问题待解,算法层面的一致性、记忆问题,工程层面的多人在线实现,产品层面的可控性与可编辑性保障,以及商业化层面的本地部署难题——若无法实现本地部署,实时传输带来的推理与流量成本难以分摊,最终很可能重蹈云游戏的覆辙。
不过目前市场对世界模型的关注度极高,大量学术界人才、数据与资本持续涌入,海量从业者都在攻坚相关难题,很多问题或许能很快迎刃而解。
葡萄君:那你希望Tripo在其中扮演什么角色?
宋亚宸:从2023年年初开始,我们就一直在说要做UGC交互内容平台,要做3D的接口,我们的产品和创作者生态也是围绕这个目标打造的。
我们会走基模+平台、基模+应用的逻辑。我们本身的研发能力非常强,我们希望拥有从上到下完全自研的基模,在AI 3D这个领域,我们已经沉淀了大量的数据、技术理解、算法人才,积累了大量的工作,未来做世界模型,相信我们也有领先性。
葡萄君:在你看来,未来AI会给游戏行业带来多大的变化?
宋亚宸:现在全球游戏市场规模为2600亿美金,我认为它会迎来爆发式增长,至少翻10倍。因为创作成本大幅下降、玩法更丰富、产品形态更多元,行业必然会像短视频对视频行业那样,迎来全面蓬勃发展。哪怕宏观经济下行也不影响,科技变量本身就是行业最大的增长动力。
葡萄君:你会不会太乐观了?
宋亚宸:文生图刚出现时质疑声不断,但最终率先拥抱它的人抓住了机会,美术外包行业也完成了一轮洗牌,活下来的都是把文生图用得最好的团队;视频生成也是如此,率先入局的影视、短剧公司快速抢占了市场。
你别看有那么多游戏客户用我们的技术和产品,但说实话AI 3D早期并不被大家认可。现在技术已经完全成熟,只是很多人的认知还停留在过去。技术不会因为人的忽视就停止发展,它的普及是必然的,谁先拥抱,谁就能占得先机。
现在行业里很多人对AI的拥抱,还只停留在表面,把它当成了政治任务。比如老板定下AI使用率、降本的OKR,大家只是应付完成,根本没到“不用就会被淘汰”的地步,而这一天很快就会到来。
葡萄君:你把“为世界进文明,为人类造幸福”当作是VAST的Slogan。你们所做的这一切,真的能让人类更幸福吗?
宋亚宸:我一直觉得游戏是个非常了不起的东西。吃饭、按摩、听歌这些能带来快乐的事,都要消耗实体资源或人力,但游戏不一样,它仅凭一个创意,就能给人带来极致的体验与情绪价值。
如果想让人人都获得幸福、拥有专属的极致体验,就需要无数千人千面的内容——每个人在不同时刻的需求都不一样,就像抖音给你我推荐的内容序列截然不同,这背后需要无限的体验供给。
过去,这些供给只能靠专业游戏制作人;但未来,每个人都能成为游戏制作人,用无数的创作提供无限的体验。这就是我想追求的事,我觉得这就是天堂,而游戏就是在打造这样的天堂。

这件事是真正的长坡厚雪。一旦把这件事做成,泛游戏行业会成为人类未来最大的产业,规模甚至会超过农业、工业、服务业,乃至机器人产业的总和。


游戏葡萄招聘商务经理,


