热门资讯

SenseNova-SI – 商汤开源的空间智能大模型

业界来源：AI工具集 2025-11-15 01:56:11

SenseNova-SI是什么

SenseNova-SI 是商汤开源的空间智能大模型，专注于提升空间智能。模型通过大规模、高质量的空间数据训练，显著增强模型在空间测量、关系理解、视角转换等核心维度的能力。在多个权威基准测试中，SenseNova-SI 超越同量级开源模型，领先于 GPT-5 等顶尖闭源模型。模型提供详细的安装和使用指南，助力开发者快速上手，推动具身智能和世界模型的发展，为 AI 理解三维世界奠定基础。

SenseNova-SI的主要功能

空间测量与估算：模型能对物体的尺寸、距离等进行准确的量化估算。
空间关系理解：模型能理解物体之间的相对位置、方向和空间布局。
视角转换：支持处理从不同视角观察同一场景时的信息变化，推断视角变化带来的影响。
空间重构与形变：理解物体的三维结构，在形变或重构后保持空间认知。
空间推理：基于空间信息进行逻辑推理，例如判断物体的移动方向或空间布局的变化。
多模态融合：结合图像、文本等多种模态数据，提升对复杂空间场景的理解能力。

SenseNova-SI的技术原理

尺度效应（Scale Effect）：通过大规模、高质量的空间数据训练，验证“尺度效应”，即数据量的增加能显著提升模型的空间认知能力，是 SenseNova-SI 性能飞跃的核心原因。
系统性训练方法：商汤提出空间能力分类体系，基于此扩充数据规模，采用系统化的训练方法，使模型在多个空间智能维度上实现一致性提升。
多模态融合架构：基于 InternVL 等基础架构，SenseNova-SI 能有效融合图像和文本信息，提升对复杂场景的理解能力。