主打角色表演!蔡浩宇AI公司推出视频大模型

04/119 浏览综合
米哈游创始人蔡浩宇在AI领域又有了新动作。他位于新加坡的AI公司Anuttacon于4月10日在arXiv发布论文,公开了新一代视频生成模型LPM 1.0,并同步上线了项目主页。
LPM 1.0拥有170亿参数,基于扩散Transformer架构打造,主打高一致性视频角色表演生成。与传统视频模型不同,它更注重角色的连续表达,能在对话、直播或游戏NPC等场景中实现实时且身份稳定的无限长度视频生成。
该模型支持文本、图像和音频等多模态输入,并可应用于对话式AI智能体、虚拟直播、教育陪伴等多个领域。目前,LPM 1.0仍处于研究阶段,团队暂无计划开放模型权重或对外提供相关服务。
从技术演示来看,LPM 1.0对角色表情和动作的连贯性控制确实不错,至少比目前市面上那些只能生成几秒短视频的模型强不少。不过170亿参数的体量,对算力的要求应该也不低。
蔡浩宇离开米哈游一线后,在AI领域的投入一直没停过。这次发布的模型虽然还处于研究阶段,但方向很明确,就是冲着虚拟角色实时交互去的。未来能不能用在游戏里,还得再等等看。 #今天游戏圈发生了啥 #资讯评论员 #米哈游
TapTap