Ad image
Ad image

最近更新

苹果开源SHARP模型:1秒内将单张2D照片转为逼真3D场景,速度提升1000倍!

💡 站外导读:在AI快速渗透各行业的今天,从单张2D图像快速生成高质量3D场景的需求日益迫切,无论是VR/AR内容创作、影视特效,还是自动驾驶的环境感知,都面临传统3D建模速度慢、成本高的瓶颈。苹果开源的SHARP模型直击这一痛点,它能在不…

谷歌开源FunctionGemma:2.7亿参数AI模型如何重塑手机语音助手与智能家居交互?

💡 站外导读:当前AI应用常停留在对话层面,用户需要的是能直接执行任务的智能体。谷歌开源FunctionGemma,旨在…

谷歌重磅开源T5Gemma 2:128K超长上下文多模态模型,重新定义端侧AI部署

💡 站外导读:当前AI领域面临两大核心挑战:大模型如何在资源受限的端侧设备(如手机)上高效运行,以及如何统一处理日益复杂…

阿里开源Qwen-Image-Layered:AI图像编辑新范式,一键将图片拆分为独立透明图层

💡 站外导读:在AIGC浪潮席卷全球的当下,AI图像编辑却长期面临一个根本性痛点:缺乏真正的“非破坏性编辑”能力。传统A…

英伟达发布NitroGen:斯坦福联合打造开源通用游戏AI模型,泛化能力飙升52%

💡 站外导读:随着AI技术在游戏领域的渗透,通用游戏智能体的需求日益凸显。传统AI模型往往局限于单一游戏,需从零训练,效…

Kairos 3.0: 大晓机器人开源商业级世界模型,用物理AI加速具身智能落地

💡 站外导读:在机器人自主交互的竞赛中,高质量的虚拟训练环境是突破真实世界数据稀缺与安全瓶颈的关键。大晓机器人推出的Kairos 3.0,正是瞄准这一核心痛点。作为行业首个开源且可商用的世界模型,它旨在通过长时序视频生成和物理规律建模,为机器人创造“数字孪生”般的训练场。这不仅意味着更高效、安全的开发流程,更预示着具身智能从实验室走向产业应用的加速期已到来。 Kairos 3.0是什么 Kairo…

GPT‑5.3 Instant – OpenAI 推出的轻量级对话模型

GPT‑5.3 Instant是什么 GPT‑5.3 Instant 是 OpenAI 推出的轻量级对话模型,专为优化日…

理想汽车发布MindVLA-o1:原生多模态VLA架构,定义自动驾驶与具身智能新范式

💡 站外导读:当行业仍在争论端到端纯视觉与多传感器融合路线孰优孰劣时,理想汽车已悄然开辟新赛道。其最新发布的MindVL…

GPT‑5.3‑Codex‑Spark – OpenAI推出的轻量级编程模型

GPT‑5.3‑Codex‑Spark是什么 GPT-5.3-Codex-Spark是OpenAI首个专为实时编程设计的…

GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型

GPT‑5.4是什么 GPT-5.4是OpenAI推出的旗舰AI模型,定位为”专为专业工作设计的最强前沿模型”。模型首次…

LangGraph – 基于图结构构建与部署多代理动态工作流的开源框架

LangGraph是什么 LangGraph是为构建状态化、多智能体(Multi-Agent) 系统而设计的,特别是与大…

Ming‑Flash‑Omni 2.0 – 蚂蚁开源的全模态大模型

Ming-flash-omni-2.0是什么 Ming-flash-omni-2.0是蚂蚁集团开源的全模态大模型,采用1…