对话影眸CEO:一群00后做的3D大模型再融资数亿,Hyper3D在游戏圈悄悄流行
昨天 10:525 浏览综合

头部3D AI生成公司都来自中国的原因。
文/依光流&托马斯之颅
近日,影眸科技(Hyper3D.AI)宣布完成了新一轮数亿元人民币融资,由凯辉基金、上海国投先导领投,老股东持续跟投。
在AI 3D生成领域,影眸科技是一支非常年轻的团队,CEO吴迪、CTO张启煊都是95后,核心算法团队基本都是00后,总人数只有60多人。
但这支小团队,做出了不小的成绩:他们最早为全球定义了3D生成底层框架,核心产品Hyper3D以3D生成大模型Rodin为引擎,主打真实工业流程的高质量、可控、生产级3D资产生成。影眸称,目前他们的ARR(年度经常性收入)已达到数千万美金, 约80%的收入来自海外市场;其积累的B端客户营收超过同赛道其他公司的总和,客户覆盖游戏、电商、具身智能、空间计算等多个领域。

今年影眸的动作相当频繁,1月发布Hyper3D Rodin Gen-2 Edit后,他们在海外大火;今年CES,英伟达CEO黄仁勋的Keynote,在3D生成环节也选择了Hyper3D Rodin,影眸科技也是英伟达官方披露工作流中唯一的初创企业。
3月在GDC上,Hyper3D Rodin又被纳入Unity发布的AI Beta当中;同样在3月,OpenAI首届Codex Hackathon的冠军项目StoryWorld也用到了Hyper3D Rodin……

这个月初,影眸科技发布了最新3D大模型Hyper3D Rodin Gen-2.5,它能生成千万面级3D模型,以及最高12K精度的原生3D贴图,还会像大语言模型一样“先思考、再生成”,在海内外,这些能力都是头一次被3D大模型实现。
这个新模型和相关功能,恐怕又将对游戏行业产生深远的改变。借着这个时机,葡萄君和影眸科技CEO吴迪和CTO张启煊聊了聊。
01
1000万面量级的3D生成AI
话不多说,先看看Hyper3D Rodin Gen-2.5的成色。这一版大模型有两个实用的技术创新点:
一是“自适应”能力。
这个词有点费解,换个简单的说法,你可以根据自身需求调节Rodin Gen-2.5的思考深度(类似大语言模型的逻辑),让它花4~80秒的时间,对应输出从几百面到千万面的不同级别模型。
目前这套模型预设的思考深度有5档:

Extreme-Low模式,最快4秒就能输出一套百万面级的模型,适合面向快速制作简易资产、批量测试实验、UGC场景;Low模式,可以花9秒生成一套结构更干净的模型,适合简约风模型、小型硬表面道具制作;
Extreme-Low模式急速生成的3D模型
Medium模式,可以通过约20秒生成结构与细节均衡的模型,面向通用生产任务的均衡模式;High模式,可以通过约40秒进一步输出结构丰富、表面平滑的高质量模型。
Medium模式生成品质均衡的3D模型
在最极限的Extreme-High模式下,Rodin Gen-2.5可以通过约80秒时间,输出1000万面量级的3D模型,适合追求极致写实的场景,生成能力断代领先。
这个精度下,模型精细度达到雕塑级,能精确呈现皮肤微结构、纹理、毛孔等特征。
Extreme-High模式生成的高精度3D模型
简言之,Rodin Gen-2.5基本可以适配B、C端的绝大多数3D模型使用场景,用户既可以用它快速制作简易资产、批量测试模型效果;也可以用它输出影视级渲染、收藏级3D打印、数字雕刻级别的高精度模型。
行业当前一般可以做到百万面级模型的生成,为什么一定要千万面?
影眸科技联创兼CTO张启煊解释,并非所有产品都有能力往高面数发展。在专业领域,千万面的核心价值,是把用户的创作上限拉高。
此前,影眸团队对3D模型的面数极为克制,“当时觉得面数太高但解析力没上去,没有意义。就像相机像素高但镜头模糊没有意义,过去面数能堆高但细节是糊的。直到这个版本,我们发现解析力已经达到千万面级别,才一口气开放到千万面。”张启煊说。
他将千万面级的生成比作摄影中的RAW格式——占用更大空间,但保留了最完整的信息,从而带来更高的后期自由度。并不是所有行业都需要千万面,但所有行业获得千万面后,能做的事会更多。
能直接用到千万面的,目前主要是 3D 打印——打印精度越高,对面数的要求越高。对大多数行业来说,千万面更像一个高精度模板,再按需求向下派生。
在游戏领域,如果AI只能生成低面模型,美术师也只能简单修一修就用;但给到千万面的母版,则可以在高模上雕刻细节,再把这些细节“烘焙”到轻量化版本上——游戏里跑得动,看起来又精细。影视、高精度工业建模也是同样的路径:先有高精度母版,再派生出每个场景需要的版本。
“更高的面数意味着更高的后期自由度。我们之所以在千万面之上还开放12K贴图,都是为了让用户有更高的创作自由度。”张启煊说。
二是“12K高清”原生3D贴图生成算法。
这就比较容易理解了,游戏研发经常要跟3D贴图、材质纹理打交道。目前Rodin Gen-2.5能做到360°无死角的纹理覆盖,且确保真实还原物体表面质感。
同时它还可以生成基于物理的PBR材质,以及一键预处理光影效果等功能,让3D模型的表面材质,看起来像是从物品本身“长出来的皮肤”。
由于采用了与几何模型一样的Thinking Effort设计,这套贴图模型的生成时间同样可控,用户最快可以将“几何+贴图”整套生成流程压缩到5秒。
和以往更新相同的是,Rodin Gen-2.5依旧强调可用性。
一直以来,Hyper3D Rodin都在朝着高质量、可控、生产级(Production-Ready)的目标迭代,如今已经形成一套业内独家成体系的实用化功能和方案。
首先是3D EDITING功能,Hyper3D把“3D生成”和“3D编辑”首次整合为完整工作流,让用户可以通过自然语言,直接修改编辑3D模型,包括直接对结果进行局部修改,以及导入任意模型并在原模型基础上进行编辑。
其次是分件生成功能,它可以让AI理解模型结构,并将模型自动拆分成不同的部件,甚至拆解之后的部件还可以继续拆解,这提高了3D模型精细化调整、二次编辑,乃至创意设计的效率和便利性。

然后是3D ControlNet功能,它已支持边界框、体素、点云等多个维度的控制能力,让开发者可以真正的按需生成,避开传统AI的随机抽卡问题。

最后是通过DCC插件,对Blender、Unreal、Unity等全品类主流3D创作工具实现原生支持,兼容ComfyUI工作流。此外还支持重做、部分重做等功能。


在大多数3D生成AI都在拿C端故事做文章的时候,Hyper3D强调实用性的做法,已经让他们快速实现商业化。
仅在2024年底,影眸就积累了数百家合作企业,覆盖电商、具身智能、汽车等几大行业,他们跟游戏行业的交集也非常多。
比如去年9月份网易和影眸的合作案例,当时网易旗下产品《蛋仔派对》引入了AI模型创作玩法,借助Hyper3D Rodin大模型让玩家轻松创作3D模型。

随后在去年11月,Hyper3D.AI入选Unity中国官方合作伙伴,后来Unity在今年3月GDC上发布的AI beta功能,调用的3D生成算法就来自Hyper3D Rodin。

今年2月,英伟达公布自家内部工作流,其中3D生成环节用的大模型也是Hyper3D Rodin,同时其他工作流用到的AI基本来自DeepMind、OpenAI这些顶级企业,影眸科技则是唯一入选的初创企业。
张启煊说,面对有意愿合作的游戏公司,他们会建议大家想清楚目的:是为了缩短交付周期,还是希望在相同周期里迭代更多的方案?如果是后者,公司最好是购买账号,接入API,探索新的研发流程;如果只是前者,影眸甚至可以联系合作伙伴,直接帮大家用Rodin生成模型,以节省游戏团队开着飞机换引擎,改变开发流程的成本。
“我们产品的定位不是取代模型师,而是跟模型师合作,成为它们的工具。不要对它有太高的预期,也不要有太低的预期。”
可以说,Hyper3D侧重实用性的路子是走对了,更实用意味着能更快接入工作流程,进一步就能抢到更多B端市场份额。今年影眸的飞速发展也印证了这一点。
02
从无人问津,到融资数亿
单看现在的成绩,你会觉得影眸很风光。Hyper3D Rodin Gen-2.5发布首月,影眸订阅用户与ARR(年度经常性收入)环比增速均超过400%。
影眸科技CEO吴迪透露,现目前Hyper3D的收入规模达到数千万美金的ARR,其中C端增长速度很快,和B端的占比在6:4左右,整体80%的收入来自海外。
但在两年多以前,影眸科技的现金流一度紧张。
影眸团队是一支非常年轻的60人团队,其中大部分成员是00后,CEO吴迪、CTO张启煊也都是95后。
吴迪在2015年进入上海科技大学,2016年加入计算摄影与图形学课题组,并且主导搭建了学校规模最大的Mars实验室(人工智能与图形学实验室)。

2021年的影眸团队,图源上科大
当时课题组的核心命题,是如何把现实世界的人或物数字化、迁移到虚拟空间。2016年正值AR/VR热潮,课题组因此涉猎了大量3D建模工作,还自研了动态多视角扫描等多套系统。
2020年,吴迪、张启煊与另外两位早期实验室成员张龙文、曾初啸组建了核心班底,正式成立影眸科技——自带“实验室派”的硬科技企业特征。
刚成立影眸时,他们曾研发过一款纯打光的产品,用户用它上传一张照片、一段视频,它就能根据用户需求调节光照参数。产品听起来挺有趣,但实际上线后几乎无人问津。
几经辗转,团队决定放弃2D,全面拥抱3D、聚焦数字人领域。他们的第一个成功产品是“穹顶光场”,这是亚洲唯一的亚微米级面部扫描系统。

穹顶光场系统被央视报道,图源1905网
它不仅能以超高速度和精度进行动态扫描,对人脸面部进行高精度数据采集,还能采集材质数据,包括精准扫描金属度、粗糙度、高光反射、法线等参数,并直接接入PBR渲染管线。
结合影眸团队自研的全栈自动化数据处理流程,他们可以在3-5天内产出包含面部肌肉绑定、PBR 材质、动态材质贴图在内的完备数字人头部资产,比传统相机阵列方案,精度高出约两个数量级,生产周期则从3-5个月缩短到3-5天。如今不少影视作品、3A游戏依旧会跟他们合作,使用这套方案。
早期的“穹顶光场”和配套技术的积累,也是后来影眸在3D生成领域快速起步的根源。
接下来的几年,AR/VR热退去,影眸也在寻找更多的发展路径。
比如他们曾经尝试制作了2D AIGC平台Wand,虽然上线几周就获得了160多万注册用户,流量过亿,但因为没做商业化,团队一共只赚了……6000块钱。后来大家认为2D不是自己的核心优势,也很快放弃了这个方向。

图源Hirokazu Yokohara
随后元宇宙概念兴起,他们在2023年6月发布了一款3D角色生成器ChatAvatar。
通过这套生成器,用户只要上传几张不同角度的照片,就能获得比肩光场扫描品质的3D资产,影眸团队也第一次将diffusion model应用到了3D生成领域。

3D角色生成器ChatAvatar的界面
可惜元宇宙热潮消退得也很快,光盯着数字人、人脸生成赛道,影眸的路会走得很窄,3D市场真正的大头,还是游戏、影视特效等传统图形学行业。
有了这个判断的同时,影眸也迎来最艰难的一次技术路径抉择。
据CTO张启煊回忆,当时3D生成已经热门了起来,Open AI和英伟达都在做,但市面上的3D生成产品,无论学术界还是工业界,主流都是「2D升3D」,也就是先合成多视角图像,再通过NeRF或几何重建,还原成3D模型。
吴迪认为这条路存在明显的瓶颈:它的上限不可能超越传统摄影测量流程。
因为当时市面上的3D软件,都会在采集数据时先把3D降维到2D,很容易出现丢失信息、产生噪声和坑洼等问题。如果用AI生成多视角图,还会出现视角不连续,生成“多头”模型的问题。

3D的维度数据
这时影眸公司账上仅剩两三百万人民币,已经不支持他们继续试错,所以不得不做出决断:
是继续沿用老路快速出产品回血?还是死磕一条结果未知、风险未知的新路径?
最终他们选择从底层创新,尝试更难的“原生3D生成”路径。结果来看,这个决定是对的。很快在2024年,影眸发布了原生3D大模型框架CLAY,并且输出了相关技术论文《CLAY:用于创建高质量3D资产的可控大规模生成模型》。
该论文在当时获得了计算机图形学顶级会议SIGGRAPH最佳论文提名,也让影眸团队和CLAY在学术圈打响名声。

影眸团队在SIGGRAPH大会上展示Rodin模型,图源上科大
有了CLAY大模型框架,影眸很快在2024年6月上线了全球第一个原生3D大模型Hyper3D Rodin Gen-1,肉眼可见地把AI 3D生成效果,拔高到“可用”的标准。

Rodin Gen-1的3D打印头部模型,左上角为输入图,左下角为Rodin Gen-1效果,右侧为当时市面其他产品效果
基于Rodin Gen-1的优异表现,整个行业的主流技术路径开始随之转向。这也解释了为什么现在3D生成领域最头部的公司都来自中国,是因为3D原生框架就来自影眸科技这一国人团队。
2024年底,影眸和数百家企业客户达成了合作,并且获得字节跳动、美团龙珠联合领投的数千万美元融资;2025年9月,影眸发布二代模型Rodin Gen-2,再次获得蓝驰领投,老股东字节跳动、红杉中国种子基金跟投的数千万美元融资。
算上这次数亿元人民币的新一轮融资,影眸在短短两年半以内,从账上现金流紧张,到连续完成三笔大额融资,彻底翻身。
影眸科技CTO张启煊告诉我,成功不是用数据堆出来的:“我们每一次真正的质量飞跃都不是因为数据增加,而是底层架构和表达上的创新带来的。”
很长一段时间内,底层创新都会成为影眸的护城河:“论绝对质量,落后的同行花几个月,或许能追上我们几个月前的质量,但有些东西,比如3D ControlNet、3D Editing,需要花更多时间,或对底层模型更深的理解。”

“难点在于,那些由应用触发、需要在模型侧做改造的能力,他们不知道该怎么改那套通用框架来解锁这个能力。我们是提出这个框架的人,理解最深,从第一天就把这些设计了进去。”
比如这次Rodin Gen-2.5的两个创新技术,几乎都不走传统老路。
开发自适应能力的契机,是近期Hyper3D团队受到图像生成与LLM结合的相关研究启发,开始重新重视类LLM的Test-time Scaling策略。
引入这套策略后,Rodin Gen-2.5在生成3D模型时,不再为所有物体分配等量算力,而会像LLM做推理扩展那样,按对象复杂度自适应分配计算预算。
这相当于把AI的“表征长度”,从一个固定参数,变成了一个可学习、可伸缩的变量。这种“先思考、再生成”的理念,早在影眸的CLAY框架中就被提到过。
12K原生3D贴图的实现差不多,Hyper3D也抛弃了传统3D生成模型的“多视图投影”老方法。
他们采用的高清3D贴图的生成逻辑,是先冻结物体表面光,记录图像实际外观;再利用素体VAE统一2D图像与3D外观,最后通过基于Transformer的生成模型严格还原图像、补全模型。
所以追溯影眸的过往,他们的成功依靠的不是单纯的豪赌,也有早期积累、积极创新的因素使然。
03
不讲故事的年轻AI公司
在与影眸的交流后,这家公司给我的感觉很特别,很多思考、策略、理念,往往不走寻常路。
首先,影眸团队最大的特征是年轻、AI native。
他们成立6年,做到了赛道头部,但哪怕加上实习生,影眸满打满算也只有60人,而且成员大多是00后。这个规模放在AI头部企业中,只能算中小和初创级别,即便是3D AI生成的同行,也大多有两三百人。
年轻的好处接受新东西更快,思维更活跃,吴迪聊到:“我们属于AI native团队,大多数的开发、研发工作都有AI的加持。平时会先拆解研发方向:UV、材质、拓扑等,任何人有想法都可以提,大家讨论觉得可行就去做。”
活用AI也使得团队管理更扁平,工作更高效:“在AI加持下,很多时候一周就能搞定初步验证性实验,实验OK就加资源往后做,所以大家都会在比较轻松、能主动思考的时候工作……团队大部分是博士,但也有很多前沿方向直接让本科生带。”

“这样的机制,也让公司运营成本大幅低于行业平均水平。”吴迪表示,因为团队内部不会赛马,推理成本优化得好:“我们内部比较一条心,只要认准一条技术路径,大部分资源都会落在上面,毕竟所有底层的原创性研发都是我们自己做的。”
其次,影眸极其重视技术研究。
目前影眸团队技术成员占比达到2/3,自成立以来积累了大量学术成果。张启煊告诉我:“在3D生成领域最顶尖的会议SIGGRAPH里,影眸一共拿了3次最佳论文及提名,其算法团队每2人中就有1人获得或提名过最佳论文。”
这群上科大、清华、剑桥以及多个海外高校的诸多人才之所以能留下来,是因为核心团队最早从2018年开始就在合作,彼此有深厚的信任,而且顶尖人才之间也会互相吸引。
“在这个领域,我们实验室的人才密度是全球第一梯队的。之前的所有算法同事里,目前只离开了三个人,分别去了英伟达、迪士尼(研发部门)和腾讯。”
然后,影眸做商业化更侧重专业领域。
如今AI产品想走红,往往会包装一段C端故事,让产品看起来有庞大的受众基础。
但吴迪认为,未来三年,3D生成AI的方向依旧是专业领域,一方面原因是3D从业者的基数足够大,否则也撑不起Autodesk这种全球专业3D软件巨头。
另一方面原因是大势所趋,张启煊分析:“3D资产以前有1/3用在影视特效上,但视频模型的发展有可能导致这块市场收缩,所以我们更看好实时交互领域(游戏)和实际生产领域(工业生产、3D 打印)。”


全球第二大家具建材零售巨头Lowe's,采用Hyper3d Rodin高效落地超30000个SKU的3D资产目录搭建,建模仅需分钟级完成,单个模型成本控制在1美元以内,Hyper3d与NVIDIA一起,助力Lowe's打造全球1750余家门店的数字孪生,如今每月有超过1亿用户线上逛店看到这些模型
事实上,影眸目前的受众也是Pro C(专业C端)和B端居多,而且营收的一半都来自B端大客户,“B端客户的续费率几乎是100%,”吴迪称:“我们积累的B端客户数量、B端收入,比业内其他公司加起来还多”。
吴迪判断:“随着模型能力一代代提升,模型覆盖的用户群会天然扩大,接下来有更多工业领域的3D用户开始使用模型,所以用户群的天花板,其实是跟着模型能力走的。”
因此在当前市场阶段,“做到足够强的渗透率和占有率”更加重要。
最后,他们对热门的“世界模型”等概念,会更加敬畏。
其实影眸也在做类似的技术探索,比如场景级的3D生成能力。他们的研究成果《CAST:基于单张RGB图像的组件对齐式3D场景重建》已经荣获SIGGRAPH 2025最佳论文。
但早期的低谷,已经让影眸吸取了教训,用吴迪的话来说:“我们在production-ready里主打「听劝」”。
“早期我们很得意穹顶光场的精度和效率,但是第一代光场拍出来的数据材质、坐标系和影视行业不能互通,导致刚做出来时根本没人买单。”
之后影眸对技术的“可用性和实用性”就树立了敬畏:“科研是河的一边,产业界是另一边,你要把中间这条河跨过去,中途就可能呛水。”
面对新概念时,他们的态度也是一样。张启煊觉得:「世界模型」是个很宽泛的概念,“现在大家什么都想往里装,但我们不想这么做。”
但他们也相信,通往世界模型的路,绕不开3D生成能力。他们只要把自己做深、做垂直,就不会错过任何事情。
所以,影眸接下来的发展,也会延续上面这些特质。
在完成这次数亿融资后,未来一两年里,他们会把主要精力集中在两件事上:
一是精进底层模型的生成质量;二是拓展编辑和Agent等能力,让Hyper3D Rodin模型在各个专业领域越来越好用。
吴迪认为,仅在游戏领域,3D建模行业至少有30亿~50亿美金的市场。如果能拓展到工业领域,行业将有300亿~500亿美金的市场。这还没算上3D打印和具身智能未来的发展。哪怕不讲故事,不靠融资,他们也完全可以有健康的财务数据。
他说,自己和很多AI创业者不一样,既没有顶级高校或者大厂的光环,早期也没有获得媒体、资本市场特别正向的反馈。这让他们的路线选择更加脚踏实地。
“决定公司上限的不是讲多好的故事,而是能经历时间考验,经历不同市场环境、经济周期沉淀下来的东西,在市场上真正拼杀之后大浪淘沙剩下来的东西。”吴迪说。




