Ad image
Ad image

最近更新

美团LongCat发布UNO-Bench:首个验证全模态大模型‘组合定律’的评测基准,引领AI评估新范式

💡 站外导读:随着多模态AI向全模态融合演进,现有评测体系面临数据质量参差、模态信息冗余、评估区分度不足等核心痛点,难以科学衡量模型在复杂真实场景下的协同推理能力。行业亟需一个能够精准解构并量化单模态与全模态能力关系的统一基准,以推动技术从…

蚂蚁开源Ming-Flash-Omni 2.0:100B参数MoE全模态大模型,统一图文音理解与生成,定义开源AI新标准

💡 站外导读:当前多模态AI模型常面临理解与生成能力割裂、跨模态融合不深、计算成本高昂等行业痛点。随着AIGC技术进入深…

OpenAI发布GPT-5.3-Codex-Spark:1000+ tokens/秒,实时编程交互革命

💡 站外导读:在AI编程助手追求‘自主完成’长任务的趋势下,开发者面临反馈延迟、交互割裂的痛点。当AI需要‘思考’数分钟…

OpenAI发布GPT-5.3 Instant:免费轻量模型,告别啰嗦说教,联网搜索、专业咨询体验大升级

💡 站外导读:在AI聊天助手日益普及的当下,用户对模型“说教味重、回答冗长”的抱怨从未停止。行业正从“能力军备竞赛”转向…

GPT-5.4震撼发布:OpenAI最强模型如何用‘操作电脑’重新定义AI工作模式?

💡 站外导读:当AI还停留在‘回答问题’的层面,GPT-5.4已率先迈入‘完成任务’的新纪元。这款OpenAI最新旗舰模…

Maya1开源发布:30亿参数语音合成模型,支持20+情绪实时生成,重塑AI声音未来

💡 站外导读:当前AI语音合成技术正从“听得清”向“听得懂、有情感”跨越。传统TTS系统常被诟病声音机械、缺乏表现力,难以满足游戏、有声内容、智能交互等场景对人性化声音的渴求。Maya Research团队开源的Maya1模型直击这一核心痛点,以自然语言描述驱动声音设计,结合强大情绪表达与实时生成能力,标志着语音合成技术迈入情感化、个性化新阶段。 Maya1是什么 Maya1 是 Maya Res…

GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型

GPT‑5.4是什么 GPT-5.4是OpenAI推出的旗舰AI模型,定位为”专为专业工作设计的最强前沿模型”。模型首次…

Ming‑Flash‑Omni 2.0 – 蚂蚁开源的全模态大模型

Ming-flash-omni-2.0是什么 Ming-flash-omni-2.0是蚂蚁集团开源的全模态大模型,采用1…

GPT‑5.3 Instant – OpenAI 推出的轻量级对话模型

GPT‑5.3 Instant是什么 GPT‑5.3 Instant 是 OpenAI 推出的轻量级对话模型,专为优化日…

理想汽车发布MindVLA-o1:原生多模态VLA架构,定义自动驾驶与具身智能新范式

💡 站外导读:当行业仍在争论端到端纯视觉与多传感器融合路线孰优孰劣时,理想汽车已悄然开辟新赛道。其最新发布的MindVL…

GPT‑5.3‑Codex‑Spark – OpenAI推出的轻量级编程模型

GPT‑5.3‑Codex‑Spark是什么 GPT-5.3-Codex-Spark是OpenAI首个专为实时编程设计的…

GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型

GPT‑5.4是什么 GPT-5.4是OpenAI推出的旗舰AI模型,定位为”专为专业工作设计的最强前沿模型”。模型首次…