在GTC2025全球大会上,群核科技宣布开源其自主研发的空间理解模型SpatialLM。该模型仅通过一段视频即可生成物理正确的3D场景布局 。据介绍 ,SpatialLM突破了传统大语言模型对物理世界几何与空间关系的理解局限,让机器具备空间认知与推理能力,将为具身智能等相关领域提供空间理解基础训练框架。该模型接下来还将迭代自然语言和场景交互功能。
你可能想看:
新华社:吃瓜黑料网入口-488.su黑料吃瓜-无问芯穹发布首个端侧全模态理解开源模型|界面新闻 · 快讯
大语言模型之后,空间智能如何打开AI通往物理世界的入口?|界面新闻 · 科技
对话阶跃星辰姜大昕:Sora技术有局限,多模态理解生成一体化才是未来|界面新闻 · 科技
科技早报 | 阿里发布开源全新模型;Manus被质疑“饥饿营销+套壳炒作”|界面新闻 · 科技
极目新闻:吃瓜黑料 在线-今日吃瓜网红黑料-阿里通义千问站上全球开源模型榜首,杭州公司包揽前三|界面新闻 · 科技
火山视频:91黑料吃瓜中心-91吃瓜事件黑料吃瓜-豆包视觉理解模型价格降至0.003元/千Tokens|界面新闻 · 快讯
还没有评论,来说两句吧...