Ad image
Ad image

最近更新

小米开源Lego-Edit:基于MLLM的下一代图像编辑框架,三阶段强化学习实现SOTA性能

💡 站外导读:随着AIGC与多模态技术的深度融合,图像编辑领域正从传统的工具依赖型转向指令驱动型。用户不再满足于预设功能的简单调整,而是期望通过自然语言指令完成复杂、精准的创意操作。这一趋势对模型的泛化能力、工具调用灵活性与零样本适应能力提…

IBM发布258M参数轻量级视觉语言模型:高效文档转换,支持多语言与复杂版式

💡 站外导读:在数字化浪潮下,企业每日处理海量文档,传统OCR或简单格式转换工具常丢失表格、公式等复杂结构,导致信息失真…

美团5600亿参数推理模型LongCat-Flash-Thinking:开源MoE架构引领AI Agent新范式

💡 站外导读:当AI从简单的模式识别迈向复杂推理与自主决策,单一庞大的稠密模型正面临计算成本与泛化能力的双重瓶颈。如何让…

网易清华联手!LatticeWorld:AI文本一键生成UE5级3D世界,效率飙升90倍

💡 站外导读:在游戏开发、影视制作等领域,高质量3D场景的创作一直面临耗时耗力、成本高昂的痛点。传统手工建模与渲染流程难…

DeepSeek-V3.1-Terminus 发布:深度优化中英文混杂与Agent能力,打造更稳定可靠的AI语言模型

💡 站外导读:在 AI 应用日益深入的当下,语言模型的输出质量与稳定性成为关键痛点。DeepSeek 团队针对其 V3.…

浙大华为联手发布DeepSeek-R1-Safe:基于昇腾的安全大模型,开源权重防御越狱攻击

💡 站外导读:随着大模型应用爆发,安全与合规问题日益凸显。越狱攻击、有害内容生成和数据泄露风险,成为企业落地AI的头号障碍。浙大网络空间安全学院与华为此次合作,直击行业痛点,推出安全大模型DeepSeek-R1-Safe,旨在从训练源头嵌入安全基因,为高敏感场景提供可信赖的AI底座。 DeepSeek-R1-Safe是什么 DeepSeek-R1-Safe 是浙江大学网络空间安全学院和华为合作推出…

斯坦福&英伟达发布TTT-Discover:测试时强化学习实现低成本AI科学发现

💡 站外导读:当前AI模型在科学发现等复杂任务中往往依赖海量数据与天价算力训练,且模型在部署后性能固定,无法从具体问题中…

清华×斯坦福重磅开源:Ctrl-World具身世界模型登顶全球第一,0.986一致性重构机器人开发范式

💡 站外导读:机器人研发长期面临“仿真到现实”的鸿沟——虚拟环境中训练的策略部署到真实物理世界后,常因物理规律模拟不精确…

GPT‑5.3 Instant – OpenAI 推出的轻量级对话模型

GPT‑5.3 Instant是什么 GPT‑5.3 Instant 是 OpenAI 推出的轻量级对话模型,专为优化日…

GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型

GPT‑5.4是什么 GPT-5.4是OpenAI推出的旗舰AI模型,定位为”专为专业工作设计的最强前沿模型”。模型首次…

Ming‑Flash‑Omni 2.0 – 蚂蚁开源的全模态大模型

Ming-flash-omni-2.0是什么 Ming-flash-omni-2.0是蚂蚁集团开源的全模态大模型,采用1…

GPT‑5.3 Instant – OpenAI 推出的轻量级对话模型

GPT‑5.3 Instant是什么 GPT‑5.3 Instant 是 OpenAI 推出的轻量级对话模型,专为优化日…