游戏葡萄

官方版主

游戏葡萄

官方版主

对话影眸CEO：一群00后做的3D大模型再融资数亿，Hyper3D在游戏圈悄悄流行

昨天 10:525 浏览综合

头部3D AI生成公司都来自中国的原因。

文/依光流&托马斯之颅

近日，影眸科技（Hyper3D.AI）宣布完成了新一轮数亿元人民币融资，由凯辉基金、上海国投先导领投，老股东持续跟投。

在AI 3D生成领域，影眸科技是一支非常年轻的团队，CEO吴迪、CTO张启煊都是95后，核心算法团队基本都是00后，总人数只有60多人。

但这支小团队，做出了不小的成绩：他们最早为全球定义了3D生成底层框架，核心产品Hyper3D以3D生成大模型Rodin为引擎，主打真实工业流程的高质量、可控、生产级3D资产生成。影眸称，目前他们的ARR（年度经常性收入）已达到数千万美金，约80%的收入来自海外市场；其积累的B端客户营收超过同赛道其他公司的总和，客户覆盖游戏、电商、具身智能、空间计算等多个领域。

今年影眸的动作相当频繁，1月发布Hyper3D Rodin Gen-2 Edit后，他们在海外大火；今年CES，英伟达CEO黄仁勋的Keynote，在3D生成环节也选择了Hyper3D Rodin，影眸科技也是英伟达官方披露工作流中唯一的初创企业。

3月在GDC上，Hyper3D Rodin又被纳入Unity发布的AI Beta当中；同样在3月，OpenAI首届Codex Hackathon的冠军项目StoryWorld也用到了Hyper3D Rodin……

这个月初，影眸科技发布了最新3D大模型Hyper3D Rodin Gen-2.5，它能生成千万面级3D模型，以及最高12K精度的原生3D贴图，还会像大语言模型一样“先思考、再生成”，在海内外，这些能力都是头一次被3D大模型实现。

这个新模型和相关功能，恐怕又将对游戏行业产生深远的改变。借着这个时机，葡萄君和影眸科技CEO吴迪和CTO张启煊聊了聊。

1000万面量级的3D生成AI

话不多说，先看看Hyper3D Rodin Gen-2.5的成色。这一版大模型有两个实用的技术创新点：

一是“自适应”能力。

这个词有点费解，换个简单的说法，你可以根据自身需求调节Rodin Gen-2.5的思考深度（类似大语言模型的逻辑），让它花4~80秒的时间，对应输出从几百面到千万面的不同级别模型。

目前这套模型预设的思考深度有5档：

Extreme-Low模式，最快4秒就能输出一套百万面级的模型，适合面向快速制作简易资产、批量测试实验、UGC场景；Low模式，可以花9秒生成一套结构更干净的模型，适合简约风模型、小型硬表面道具制作；

Extreme-Low模式急速生成的3D模型

Medium模式，可以通过约20秒生成结构与细节均衡的模型，面向通用生产任务的均衡模式；High模式，可以通过约40秒进一步输出结构丰富、表面平滑的高质量模型。

Medium模式生成品质均衡的3D模型

在最极限的Extreme-High模式下，Rodin Gen-2.5可以通过约80秒时间，输出1000万面量级的3D模型，适合追求极致写实的场景，生成能力断代领先。

这个精度下，模型精细度达到雕塑级，能精确呈现皮肤微结构、纹理、毛孔等特征。

Extreme-High模式生成的高精度3D模型

简言之，Rodin Gen-2.5基本可以适配B、C端的绝大多数3D模型使用场景，用户既可以用它快速制作简易资产、批量测试模型效果；也可以用它输出影视级渲染、收藏级3D打印、数字雕刻级别的高精度模型。

行业当前一般可以做到百万面级模型的生成，为什么一定要千万面？

影眸科技联创兼CTO张启煊解释，并非所有产品都有能力往高面数发展。在专业领域，千万面的核心价值，是把用户的创作上限拉高。

此前，影眸团队对3D模型的面数极为克制，“当时觉得面数太高但解析力没上去，没有意义。就像相机像素高但镜头模糊没有意义，过去面数能堆高但细节是糊的。直到这个版本，我们发现解析力已经达到千万面级别，才一口气开放到千万面。”张启煊说。

他将千万面级的生成比作摄影中的RAW格式——占用更大空间，但保留了最完整的信息，从而带来更高的后期自由度。并不是所有行业都需要千万面，但所有行业获得千万面后，能做的事会更多。

能直接用到千万面的，目前主要是 3D 打印——打印精度越高，对面数的要求越高。对大多数行业来说，千万面更像一个高精度模板，再按需求向下派生。

在游戏领域，如果AI只能生成低面模型，美术师也只能简单修一修就用；但给到千万面的母版，则可以在高模上雕刻细节，再把这些细节“烘焙”到轻量化版本上——游戏里跑得动，看起来又精细。影视、高精度工业建模也是同样的路径：先有高精度母版，再派生出每个场景需要的版本。

“更高的面数意味着更高的后期自由度。我们之所以在千万面之上还开放12K贴图，都是为了让用户有更高的创作自由度。”张启煊说。

二是“12K高清”原生3D贴图生成算法。

这就比较容易理解了，游戏研发经常要跟3D贴图、材质纹理打交道。目前Rodin Gen-2.5能做到360°无死角的纹理覆盖，且确保真实还原物体表面质感。

同时它还可以生成基于物理的PBR材质，以及一键预处理光影效果等功能，让3D模型的表面材质，看起来像是从物品本身“长出来的皮肤”。

由于采用了与几何模型一样的Thinking Effort设计，这套贴图模型的生成时间同样可控，用户最快可以将“几何+贴图”整套生成流程压缩到5秒。

和以往更新相同的是，Rodin Gen-2.5依旧强调可用性。

一直以来，Hyper3D Rodin都在朝着高质量、可控、生产级（Production-Ready）的目标迭代，如今已经形成一套业内独家成体系的实用化功能和方案。

首先是3D EDITING功能，Hyper3D把“3D生成”和“3D编辑”首次整合为完整工作流，让用户可以通过自然语言，直接修改编辑3D模型，包括直接对结果进行局部修改，以及导入任意模型并在原模型基础上进行编辑。

其次是分件生成功能，它可以让AI理解模型结构，并将模型自动拆分成不同的部件，甚至拆解之后的部件还可以继续拆解，这提高了3D模型精细化调整、二次编辑，乃至创意设计的效率和便利性。

然后是3D ControlNet功能，它已支持边界框、体素、点云等多个维度的控制能力，让开发者可以真正的按需生成，避开传统AI的随机抽卡问题。

最后是通过DCC插件，对Blender、Unreal、Unity等全品类主流3D创作工具实现原生支持，兼容ComfyUI工作流。此外还支持重做、部分重做等功能。

在大多数3D生成AI都在拿C端故事做文章的时候，Hyper3D强调实用性的做法，已经让他们快速实现商业化。

仅在2024年底，影眸就积累了数百家合作企业，覆盖电商、具身智能、汽车等几大行业，他们跟游戏行业的交集也非常多。

比如去年9月份网易和影眸的合作案例，当时网易旗下产品《蛋仔派对》引入了AI模型创作玩法，借助Hyper3D Rodin大模型让玩家轻松创作3D模型。

随后在去年11月，Hyper3D.AI入选Unity中国官方合作伙伴，后来Unity在今年3月GDC上发布的AI beta功能，调用的3D生成算法就来自Hyper3D Rodin。

今年2月，英伟达公布自家内部工作流，其中3D生成环节用的大模型也是Hyper3D Rodin，同时其他工作流用到的AI基本来自DeepMind、OpenAI这些顶级企业，影眸科技则是唯一入选的初创企业。

张启煊说，面对有意愿合作的游戏公司，他们会建议大家想清楚目的：是为了缩短交付周期，还是希望在相同周期里迭代更多的方案？如果是后者，公司最好是购买账号，接入API，探索新的研发流程；如果只是前者，影眸甚至可以联系合作伙伴，直接帮大家用Rodin生成模型，以节省游戏团队开着飞机换引擎，改变开发流程的成本。

“我们产品的定位不是取代模型师，而是跟模型师合作，成为它们的工具。不要对它有太高的预期，也不要有太低的预期。”

可以说，Hyper3D侧重实用性的路子是走对了，更实用意味着能更快接入工作流程，进一步就能抢到更多B端市场份额。今年影眸的飞速发展也印证了这一点。

从无人问津，到融资数亿

单看现在的成绩，你会觉得影眸很风光。Hyper3D Rodin Gen-2.5发布首月，影眸订阅用户与ARR（年度经常性收入）环比增速均超过400%。

影眸科技CEO吴迪透露，现目前Hyper3D的收入规模达到数千万美金的ARR，其中C端增长速度很快，和B端的占比在6:4左右，整体80%的收入来自海外。

但在两年多以前，影眸科技的现金流一度紧张。

影眸团队是一支非常年轻的60人团队，其中大部分成员是00后，CEO吴迪、CTO张启煊也都是95后。

吴迪在2015年进入上海科技大学，2016年加入计算摄影与图形学课题组，并且主导搭建了学校规模最大的Mars实验室（人工智能与图形学实验室）。

2021年的影眸团队，图源上科大

当时课题组的核心命题，是如何把现实世界的人或物数字化、迁移到虚拟空间。2016年正值AR/VR热潮，课题组因此涉猎了大量3D建模工作，还自研了动态多视角扫描等多套系统。

2020年，吴迪、张启煊与另外两位早期实验室成员张龙文、曾初啸组建了核心班底，正式成立影眸科技——自带“实验室派”的硬科技企业特征。

刚成立影眸时，他们曾研发过一款纯打光的产品，用户用它上传一张照片、一段视频，它就能根据用户需求调节光照参数。产品听起来挺有趣，但实际上线后几乎无人问津。

几经辗转，团队决定放弃2D，全面拥抱3D、聚焦数字人领域。他们的第一个成功产品是“穹顶光场”，这是亚洲唯一的亚微米级面部扫描系统。

穹顶光场系统被央视报道，图源1905网

它不仅能以超高速度和精度进行动态扫描，对人脸面部进行高精度数据采集，还能采集材质数据，包括精准扫描金属度、粗糙度、高光反射、法线等参数，并直接接入PBR渲染管线。

结合影眸团队自研的全栈自动化数据处理流程，他们可以在3-5天内产出包含面部肌肉绑定、PBR 材质、动态材质贴图在内的完备数字人头部资产，比传统相机阵列方案，精度高出约两个数量级，生产周期则从3-5个月缩短到3-5天。如今不少影视作品、3A游戏依旧会跟他们合作，使用这套方案。

早期的“穹顶光场”和配套技术的积累，也是后来影眸在3D生成领域快速起步的根源。

接下来的几年，AR/VR热退去，影眸也在寻找更多的发展路径。

比如他们曾经尝试制作了2D AIGC平台Wand，虽然上线几周就获得了160多万注册用户，流量过亿，但因为没做商业化，团队一共只赚了……6000块钱。后来大家认为2D不是自己的核心优势，也很快放弃了这个方向。

图源Hirokazu Yokohara

随后元宇宙概念兴起，他们在2023年6月发布了一款3D角色生成器ChatAvatar。

通过这套生成器，用户只要上传几张不同角度的照片，就能获得比肩光场扫描品质的3D资产，影眸团队也第一次将diffusion model应用到了3D生成领域。

3D角色生成器ChatAvatar的界面

可惜元宇宙热潮消退得也很快，光盯着数字人、人脸生成赛道，影眸的路会走得很窄，3D市场真正的大头，还是游戏、影视特效等传统图形学行业。

有了这个判断的同时，影眸也迎来最艰难的一次技术路径抉择。

据CTO张启煊回忆，当时3D生成已经热门了起来，Open AI和英伟达都在做，但市面上的3D生成产品，无论学术界还是工业界，主流都是「2D升3D」，也就是先合成多视角图像，再通过NeRF或几何重建，还原成3D模型。

吴迪认为这条路存在明显的瓶颈：它的上限不可能超越传统摄影测量流程。

因为当时市面上的3D软件，都会在采集数据时先把3D降维到2D，很容易出现丢失信息、产生噪声和坑洼等问题。如果用AI生成多视角图，还会出现视角不连续，生成“多头”模型的问题。

3D的维度数据

这时影眸公司账上仅剩两三百万人民币，已经不支持他们继续试错，所以不得不做出决断：

是继续沿用老路快速出产品回血？还是死磕一条结果未知、风险未知的新路径？

最终他们选择从底层创新，尝试更难的“原生3D生成”路径。结果来看，这个决定是对的。很快在2024年，影眸发布了原生3D大模型框架CLAY，并且输出了相关技术论文《CLAY：用于创建高质量3D资产的可控大规模生成模型》。

该论文在当时获得了计算机图形学顶级会议SIGGRAPH最佳论文提名，也让影眸团队和CLAY在学术圈打响名声。

影眸团队在SIGGRAPH大会上展示Rodin模型，图源上科大

有了CLAY大模型框架，影眸很快在2024年6月上线了全球第一个原生3D大模型Hyper3D Rodin Gen-1，肉眼可见地把AI 3D生成效果，拔高到“可用”的标准。

Rodin Gen-1的3D打印头部模型，左上角为输入图，左下角为Rodin Gen-1效果，右侧为当时市面其他产品效果

基于Rodin Gen-1的优异表现，整个行业的主流技术路径开始随之转向。这也解释了为什么现在3D生成领域最头部的公司都来自中国，是因为3D原生框架就来自影眸科技这一国人团队。

2024年底，影眸和数百家企业客户达成了合作，并且获得字节跳动、美团龙珠联合领投的数千万美元融资；2025年9月，影眸发布二代模型Rodin Gen-2，再次获得蓝驰领投，老股东字节跳动、红杉中国种子基金跟投的数千万美元融资。

算上这次数亿元人民币的新一轮融资，影眸在短短两年半以内，从账上现金流紧张，到连续完成三笔大额融资，彻底翻身。

影眸科技CTO张启煊告诉我，成功不是用数据堆出来的：“我们每一次真正的质量飞跃都不是因为数据增加，而是底层架构和表达上的创新带来的。”

很长一段时间内，底层创新都会成为影眸的护城河：“论绝对质量，落后的同行花几个月，或许能追上我们几个月前的质量，但有些东西，比如3D ControlNet、3D Editing，需要花更多时间，或对底层模型更深的理解。”

“难点在于，那些由应用触发、需要在模型侧做改造的能力，他们不知道该怎么改那套通用框架来解锁这个能力。我们是提出这个框架的人，理解最深，从第一天就把这些设计了进去。”

比如这次Rodin Gen-2.5的两个创新技术，几乎都不走传统老路。

开发自适应能力的契机，是近期Hyper3D团队受到图像生成与LLM结合的相关研究启发，开始重新重视类LLM的Test-time Scaling策略。

引入这套策略后，Rodin Gen-2.5在生成3D模型时，不再为所有物体分配等量算力，而会像LLM做推理扩展那样，按对象复杂度自适应分配计算预算。

这相当于把AI的“表征长度”，从一个固定参数，变成了一个可学习、可伸缩的变量。这种“先思考、再生成”的理念，早在影眸的CLAY框架中就被提到过。

12K原生3D贴图的实现差不多，Hyper3D也抛弃了传统3D生成模型的“多视图投影”老方法。

他们采用的高清3D贴图的生成逻辑，是先冻结物体表面光，记录图像实际外观；再利用素体VAE统一2D图像与3D外观，最后通过基于Transformer的生成模型严格还原图像、补全模型。

所以追溯影眸的过往，他们的成功依靠的不是单纯的豪赌，也有早期积累、积极创新的因素使然。

不讲故事的年轻AI公司

在与影眸的交流后，这家公司给我的感觉很特别，很多思考、策略、理念，往往不走寻常路。

首先，影眸团队最大的特征是年轻、AI native。

他们成立6年，做到了赛道头部，但哪怕加上实习生，影眸满打满算也只有60人，而且成员大多是00后。这个规模放在AI头部企业中，只能算中小和初创级别，即便是3D AI生成的同行，也大多有两三百人。

年轻的好处接受新东西更快，思维更活跃，吴迪聊到：“我们属于AI native团队，大多数的开发、研发工作都有AI的加持。平时会先拆解研发方向：UV、材质、拓扑等，任何人有想法都可以提，大家讨论觉得可行就去做。”

活用AI也使得团队管理更扁平，工作更高效：“在AI加持下，很多时候一周就能搞定初步验证性实验，实验OK就加资源往后做，所以大家都会在比较轻松、能主动思考的时候工作……团队大部分是博士，但也有很多前沿方向直接让本科生带。”

“这样的机制，也让公司运营成本大幅低于行业平均水平。”吴迪表示，因为团队内部不会赛马，推理成本优化得好：“我们内部比较一条心，只要认准一条技术路径，大部分资源都会落在上面，毕竟所有底层的原创性研发都是我们自己做的。”

其次，影眸极其重视技术研究。

目前影眸团队技术成员占比达到2/3，自成立以来积累了大量学术成果。张启煊告诉我：“在3D生成领域最顶尖的会议SIGGRAPH里，影眸一共拿了3次最佳论文及提名，其算法团队每2人中就有1人获得或提名过最佳论文。”

这群上科大、清华、剑桥以及多个海外高校的诸多人才之所以能留下来，是因为核心团队最早从2018年开始就在合作，彼此有深厚的信任，而且顶尖人才之间也会互相吸引。

“在这个领域，我们实验室的人才密度是全球第一梯队的。之前的所有算法同事里，目前只离开了三个人，分别去了英伟达、迪士尼（研发部门）和腾讯。”

然后，影眸做商业化更侧重专业领域。

如今AI产品想走红，往往会包装一段C端故事，让产品看起来有庞大的受众基础。

但吴迪认为，未来三年，3D生成AI的方向依旧是专业领域，一方面原因是3D从业者的基数足够大，否则也撑不起Autodesk这种全球专业3D软件巨头。

另一方面原因是大势所趋，张启煊分析：“3D资产以前有1/3用在影视特效上，但视频模型的发展有可能导致这块市场收缩，所以我们更看好实时交互领域（游戏）和实际生产领域（工业生产、3D 打印）。”

全球第二大家具建材零售巨头Lowe's，采用Hyper3d Rodin高效落地超30000个SKU的3D资产目录搭建，建模仅需分钟级完成，单个模型成本控制在1美元以内，Hyper3d与NVIDIA一起，助力Lowe's打造全球1750余家门店的数字孪生，如今每月有超过1亿用户线上逛店看到这些模型

事实上，影眸目前的受众也是Pro C（专业C端）和B端居多，而且营收的一半都来自B端大客户，“B端客户的续费率几乎是100%，”吴迪称：“我们积累的B端客户数量、B端收入，比业内其他公司加起来还多”。

吴迪判断：“随着模型能力一代代提升，模型覆盖的用户群会天然扩大，接下来有更多工业领域的3D用户开始使用模型，所以用户群的天花板，其实是跟着模型能力走的。”

因此在当前市场阶段，“做到足够强的渗透率和占有率”更加重要。

最后，他们对热门的“世界模型”等概念，会更加敬畏。

其实影眸也在做类似的技术探索，比如场景级的3D生成能力。他们的研究成果《CAST：基于单张RGB图像的组件对齐式3D场景重建》已经荣获SIGGRAPH 2025最佳论文。

但早期的低谷，已经让影眸吸取了教训，用吴迪的话来说：“我们在production-ready里主打「听劝」”。

“早期我们很得意穹顶光场的精度和效率，但是第一代光场拍出来的数据材质、坐标系和影视行业不能互通，导致刚做出来时根本没人买单。”

之后影眸对技术的“可用性和实用性”就树立了敬畏：“科研是河的一边，产业界是另一边，你要把中间这条河跨过去，中途就可能呛水。”

面对新概念时，他们的态度也是一样。张启煊觉得：「世界模型」是个很宽泛的概念，“现在大家什么都想往里装，但我们不想这么做。”

但他们也相信，通往世界模型的路，绕不开3D生成能力。他们只要把自己做深、做垂直，就不会错过任何事情。

所以，影眸接下来的发展，也会延续上面这些特质。

在完成这次数亿融资后，未来一两年里，他们会把主要精力集中在两件事上：

一是精进底层模型的生成质量；二是拓展编辑和Agent等能力，让Hyper3D Rodin模型在各个专业领域越来越好用。

吴迪认为，仅在游戏领域，3D建模行业至少有30亿~50亿美金的市场。如果能拓展到工业领域，行业将有300亿~500亿美金的市场。这还没算上3D打印和具身智能未来的发展。哪怕不讲故事，不靠融资，他们也完全可以有健康的财务数据。

他说，自己和很多AI创业者不一样，既没有顶级高校或者大厂的光环，早期也没有获得媒体、资本市场特别正向的反馈。这让他们的路线选择更加脚踏实地。

“决定公司上限的不是讲多好的故事，而是能经历时间考验，经历不同市场环境、经济周期沉淀下来的东西，在市场上真正拼杀之后大浪淘沙剩下来的东西。”吴迪说。