Ad image
Ad image

最近更新

突破扩散模型极限!蚂蚁集团开源100B参数LLaDA 2.0,推理速度2倍超越自回归模型

💡 站外导读:当自回归大模型席卷全球时,扩散模型这一在图像领域大放异彩的技术路线,却在语言生成上遭遇了扩展性瓶颈。参数规模难以突破、训练成本高昂、推理效率受限,成为制约其发展的三大痛点。蚂蚁集团此次开源的LLaDA 2.0,不仅将参数量级首…

商汤LightX2V开源:实时视频生成推理框架,4步出视频、8GB显存跑14B模型

💡 站外导读:AI视频生成正从实验室走向产业落地,但推理速度慢、硬件门槛高、部署复杂仍是行业核心痛点。商汤最新开源的Li…

英伟达Nemotron 3开源模型系列发布:MoE架构助力4倍吞吐量,重塑多智能体AI开发范式

💡 站外导读:在AI大模型竞争白热化的今天,企业面临推理成本高昂、多智能体协作复杂、长文本处理能力不足等核心痛点。英伟达…

阿里通义万相2.6发布:多模态AI视频生成新标杆,角色扮演+音画同步赋能专业创作

💡 站外导读:在AIGC浪潮席卷全球的当下,视频创作正面临前所未有的效率瓶颈与专业门槛。传统影视制作周期长、成本高,而普…

字节Seedance 1.5 Pro重磅发布:原生音画同步多模态视频生成模型深度解析

💡 站外导读:在AIGC浪潮席卷全球之际,视频内容创作正面临效率与成本的双重瓶颈。传统制作流程耗时耗力,难以满足社交媒体…

快手可灵×港科大重磅开源:UnityVideo统一框架破解多模态视频生成难题,零样本泛化能力领跑行业

💡 站外导读:当前,AI视频生成模型虽已能产出惊艳画面,但普遍存在一个核心痛点:模型对物理世界的理解深度不足,难以精准控制视频内容的运动、空间关系与物理真实性。从影视特效到虚拟现实,行业迫切需要能同时处理多种视觉信号、实现精细可控生成的下一代框架。快手可灵团队与顶尖学术机构联手开源的UnityVideo,正是瞄准了这一关键瓶颈,旨在通过统一架构彻底打通文本、图像与多种辅助模态之间的信息壁垒。 Un…

Ming‑Flash‑Omni 2.0 – 蚂蚁开源的全模态大模型

Ming-flash-omni-2.0是什么 Ming-flash-omni-2.0是蚂蚁集团开源的全模态大模型,采用1…

GPT‑5.3 Instant – OpenAI 推出的轻量级对话模型

GPT‑5.3 Instant是什么 GPT‑5.3 Instant 是 OpenAI 推出的轻量级对话模型,专为优化日…

理想汽车发布MindVLA-o1:原生多模态VLA架构,定义自动驾驶与具身智能新范式

💡 站外导读:当行业仍在争论端到端纯视觉与多传感器融合路线孰优孰劣时,理想汽车已悄然开辟新赛道。其最新发布的MindVL…

GPT‑5.3‑Codex‑Spark – OpenAI推出的轻量级编程模型

GPT‑5.3‑Codex‑Spark是什么 GPT-5.3-Codex-Spark是OpenAI首个专为实时编程设计的…

GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型

GPT‑5.4是什么 GPT-5.4是OpenAI推出的旗舰AI模型,定位为”专为专业工作设计的最强前沿模型”。模型首次…

LangGraph – 基于图结构构建与部署多代理动态工作流的开源框架

LangGraph是什么 LangGraph是为构建状态化、多智能体(Multi-Agent) 系统而设计的,特别是与大…