Ad image
Ad image

最近更新

快手KAT-V1开源:自动思考模型40B/200B,性能逼近DeepSeek-R1,代码生成与复杂推理革新

💡 站外导读:在AI模型参数不断膨胀的背景下,如何让模型更“聪明”地思考,避免在简单问题上浪费算力,成为行业核心痛点。快手最新开源的KAT-V1自动思考模型,正是为解决这一难题而生。它通过创新的混合训练范式和强化学习算法,赋予模型根据任务难…

字节跳动开源Coze Loop:一站式AI Agent开发调试平台,全面优化Prompt工程与模型监控

💡 站外导读:随着大模型应用的深入,AI Agent开发面临调试复杂、效果评估主观、性能监控缺失等痛点。行业亟需一套标准…

上海AI Lab开源Intern-S1:2350亿参数科学多模态大模型,解析分子式、蛋白质与地震波,多项基准超越顶尖闭源模型

💡 站外导读:当前大模型竞争已从通用能力卷向垂直专业领域,尤其是科研场景中对化学分子式、蛋白质结构、地震波等复杂科学模态…

腾讯开源混元3D世界模型1.0:文本图片一键生成可交互沉浸式3D场景,引领AIGC新范式

💡 站外导读:在AIGC浪潮席卷内容创作的今天,生成可控、可交互的3D资产仍是行业核心痛点。传统3D建模流程复杂、成本高…

商汤「日日新V6.5」多模态推理大模型发布:推理成本暴降70%,性能超Gemini 2.5 Pro

💡 站外导读:随着AI多模态能力成为产业智能化核心引擎,高推理成本与低跨模态精度始终制约着其在自动驾驶、机器人等具身场景…

阿里Qwen3开源推理模型震撼发布:2350亿参数刷新AIME数学与LiveCode编程双料纪录

💡 站外导读:当前,大模型正从“通用对话”迈向“深度推理”的关键阶段,企业与开发者对模型的逻辑、数学、代码等复杂任务处理能力需求激增。然而,开源模型在专业推理领域的性能瓶颈和超长上下文处理能力不足,仍是行业痛点。阿里此次发布的Qwen3-235B-A22B-Thinking-2507,正是瞄准这一核心挑战,以“最强开源推理模型”的姿态,试图在性能标杆与开源生态之间建立新平衡。 Qwen3-235B…

突破传统Token架构!字节跳动DLCM动态大概念模型:推理效率提升34%、准确率+2.69%的下一代LLM新范式

💡 站外导读:大模型推理成本居高不下,已成为制约AI规模化落地的核心瓶颈。传统Transformer架构以token为基…

谷歌D4RT:4D重建模型速度提升300倍,动态场景AI追踪与预测的革命

💡 站外导读:传统计算机视觉模型在处理动态场景时,常面临重建精度低、计算耗时长、无法有效预测运动轨迹等核心痛点,限制了其…

斯坦福&英伟达发布TTT-Discover:测试时强化学习实现低成本AI科学发现

💡 站外导读:当前AI模型在科学发现等复杂任务中往往依赖海量数据与天价算力训练,且模型在部署后性能固定,无法从具体问题中…

清华×斯坦福重磅开源:Ctrl-World具身世界模型登顶全球第一,0.986一致性重构机器人开发范式

💡 站外导读:机器人研发长期面临“仿真到现实”的鸿沟——虚拟环境中训练的策略部署到真实物理世界后,常因物理规律模拟不精确…

GPT‑5.3 Instant – OpenAI 推出的轻量级对话模型

GPT‑5.3 Instant是什么 GPT‑5.3 Instant 是 OpenAI 推出的轻量级对话模型,专为优化日…

GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型

GPT‑5.4是什么 GPT-5.4是OpenAI推出的旗舰AI模型,定位为”专为专业工作设计的最强前沿模型”。模型首次…