💡 站外导读:随着AI多模态能力成为产业智能化核心引擎,高推理成本与低跨模态精度始终制约着其在自动驾驶、机器人等具身场景的规模化落地。商汤科技此次推出的日日新V6.5,直击这一行业痛点,通过独创的图文交错思维链与轻量化架构,在大幅提升推理精度的同时,将成本压缩至前代的30%,为多模态AI从实验室走向千行百业提供了极具性价比的解决方案。
日日新 V6.5是什么
日日新 V6.5是商汤科技推出的日日新新型多模态推理大模型。模型独创图文交错思维链,图像用本体形式参与推理,显著提升跨模态推理精度,超越Gemini 2.5 Pro。相比日日新6.0,推理能力提升6.99%,推理成本仅为30%,性价比提升5倍。模型依托轻量Vision Encoder+和纵深LLM架构,具备高效推理能力,能广泛应用在自动驾驶、机器人等具身智能场景。

日日新 V6.5的主要功能
-
多模态推理:支持处理图像和文本的混合输入,进行复杂的推理任务,例如理解图像内容并结合文本信息生成准确的描述或回答相关问题。
-
高效推理能力:在多个数据集上表现优异,推理精度显著提升,推理成本大幅降低,性价比提升5倍。
日日新 V6.5的技术原理
- 图文交错思维链:图像用本体形式参与推理过程,图文混合的思考模式使得模型能够更准确地理解和处理多模态信息。
- 轻量Vision Encoder+:基于优化视觉编码器,提高图像处理效率,同时减少计算资源消耗。
- 纵深LLM架构:结合深度语言模型(LLM)的强大语言理解和生成能力,实现高效的跨模态推理。
- 多模态协同训练:同时处理图像和文本数据,模型能学习到更丰富的语义信息,提升推理精度。
日日新 V6.5的项目地址
- 项目官网:https://platform.sensenova.cn/
日日新 V6.5的应用场景
- 自动驾驶:实时分析道路环境,精准识别交通标志、行人和车辆,为自动驾驶系统提供高效、安全的决策支持,提升自动驾驶车辆的智能化水平。
- 机器人:在工业、服务和物流机器人领域,助力机器人实现精准的物体抓取、灵活的导航避障和自然的人机交互,显著提升机器人的工作效率和适应性。
- 智能家居:实时监控家庭环境,提供智能安全警报和个性化的家居管理服务,为用户打造更加便捷、智能的家居生活体验。
- 智能教育:为学生提供个性化的学习辅导,通过图像识别和自然语言处理技术,快速解答数学题、批改作业,同时生成多媒体教材,提升教学效果和学习体验。
- 医疗健康:在医疗领域,辅助医生进行医疗影像分析,快速准确地识别病变,同时为患者提供智能导诊服务,优化就医流程,提升医疗服务的智能化水平。
📝 站长洞察 (Editor’s Insight)
商汤此次发布的日日新V6.5,绝非一次简单的模型迭代,而是精准卡位“具身智能”爆发前夜的关键技术落子。其核心价值在于破解了多模态领域的“不可能三角”——高性能、低成本与强场景泛化。通过让图像以“本体”形式深度参与推理链,模型实现了对物理世界更本质的理解,这使其在需要实时决策的自动驾驶与机器人场景中优势凸显。更值得关注的是其“性价比提升5倍”的务实宣言,这直击企业级应用的核心诉求:不仅要智能,更要经济可用。在GPT-4o、Gemini等巨头聚焦通用能力的当下,商汤选择深耕垂直场景的效率与成本优化,这条“硬核产业化”路径,或将为国内大模型发展提供一个超越单纯参数竞赛的新范式,标志着行业竞争正从“技术秀肌肉”转向“落地拼刺刀”。
