Ad image
Ad image

最近更新

CombatVLA:淘天集团推出3D游戏专用VLA模型,推理速度提升50倍,超越人类玩家

💡 站外导读:在AIGC浪潮席卷各行各业的今天,如何让AI更高效、更精准地理解和执行复杂动态任务,成为前沿攻关的核心。尤其是在3D游戏、机器人控制等需要实时决策与精细操作的领域,传统模型往往面临推理速度慢、泛化能力弱的瓶颈。淘天集团未来生活…

上海AI Lab重磅开源Intern-S1-mini:8B+0.3B轻量多模态科学推理模型,2.5万亿科学标记赋能

💡 站外导读:随着AI向科学发现的深度融合,单一模态模型难以应对化学结构、蛋白质序列等复杂科学任务。行业亟需轻量化、专业…

Fun-ASR:钉钉×通义实验室发布行业级语音识别大模型,多场景准确率飙升20%!

💡 站外导读:随着企业数字化进程加速,传统语音识别工具在专业术语、复杂环境及个性化需求上捉襟见肘,导致会议纪要出错、沟通…

xAI正式开源Grok 2.5:埃隆·马斯克的AI巨兽,500GB参数,超越GPT-4?深度解析与下载指南

💡 站外导读:在人工智能军备竞赛白热化的当下,开源模型正成为改变游戏规则的关键力量。埃隆·马斯克的xAI公司突然开源了G…

华南理工与微信AI联手发布ComoRAG:模拟人脑推理的下一代RAG框架,长文本理解能力飙升

💡 站外导读:当前,主流AI模型在处理长篇叙事文本时,常陷入“只见树木,不见森林”的困境。传统RAG方法虽能检索碎片信息…

ToonComposer:腾讯联手顶尖高校发布AI动画神器,草图秒变专业动画!

💡 站外导读:在内容为王的时代,动画产业面临产能瓶颈:传统流程中繁琐的中间帧绘制与上色消耗大量人力与时间,限制了创意的快速迭代与商业化落地。AI生成式技术的崛起正试图破解这一困局。ToonComposer的出现,标志着生成式AI正深度渗透至动画制作的核心环节,旨在通过自动化处理重复性劳动,将创作者从技术性工作中解放,使其能专注于故事与艺术表达,从而降低创作门槛、加速产业内容生产。 ToonComp…

谷歌D4RT:4D重建模型速度提升300倍,动态场景AI追踪与预测的革命

💡 站外导读:传统计算机视觉模型在处理动态场景时,常面临重建精度低、计算耗时长、无法有效预测运动轨迹等核心痛点,限制了其…

斯坦福&英伟达发布TTT-Discover:测试时强化学习实现低成本AI科学发现

💡 站外导读:当前AI模型在科学发现等复杂任务中往往依赖海量数据与天价算力训练,且模型在部署后性能固定,无法从具体问题中…

清华×斯坦福重磅开源:Ctrl-World具身世界模型登顶全球第一,0.986一致性重构机器人开发范式

💡 站外导读:机器人研发长期面临“仿真到现实”的鸿沟——虚拟环境中训练的策略部署到真实物理世界后,常因物理规律模拟不精确…

GPT‑5.3 Instant – OpenAI 推出的轻量级对话模型

GPT‑5.3 Instant是什么 GPT‑5.3 Instant 是 OpenAI 推出的轻量级对话模型,专为优化日…

GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型

GPT‑5.4是什么 GPT-5.4是OpenAI推出的旗舰AI模型,定位为”专为专业工作设计的最强前沿模型”。模型首次…

Ming‑Flash‑Omni 2.0 – 蚂蚁开源的全模态大模型

Ming-flash-omni-2.0是什么 Ming-flash-omni-2.0是蚂蚁集团开源的全模态大模型,采用1…