Ad image
Ad image

最近更新

谷歌D4RT:4D重建模型速度提升300倍,动态场景AI追踪与预测的革命

💡 站外导读:传统计算机视觉模型在处理动态场景时,常面临重建精度低、计算耗时长、无法有效预测运动轨迹等核心痛点,限制了其在自动驾驶、机器人等实时交互领域的应用。随着AI向四维时空理解迈进,业界亟需能高效处理动态视觉数据的统一架构。谷歌Dee…

阿里Qwen3-Max-Thinking发布:万亿参数推理模型如何叫板GPT-5.2?

💡 站外导读:大模型军备竞赛已进入万亿参数时代,但单纯的规模扩张已遇瓶颈,推理能力成为决胜关键。如何让AI不仅“知道得多…

Kimi K2.5开源发布:月之暗面推出视觉文本融合全能AI模型,支持百Agent集群协作

💡 站外导读:随着AI技术飞速发展,企业对高效处理复杂任务、多模态理解及自动化办公的需求日益迫切。传统单一文本模型已难以…

蚂蚁灵波重磅开源LingBot-Depth:攻克透明物体深度感知难题,具身智能落地新突破

💡 站外导读:在具身智能快速发展的今天,机器人在真实环境中感知复杂物体的能力仍面临重大挑战,尤其是面对玻璃、镜面等透明或…

Vidu Q2参考生Pro发布:万物可参考,小白一键生成专业级特效视频的AI创作引擎

💡 站外导读:在AIGC浪潮席卷内容创作的当下,视频制作的高门槛与高成本仍是普遍痛点。专业特效、复杂动捕、精细抠像等环节…

NVIDIA开源TensorRT-LLM:GPU大模型推理提速10倍,附保姆级部署教程

💡 站外导读:随着AIGC浪潮席卷全球,企业面临的核心痛点已从模型训练转向大规模、低成本的实时推理。如何让动辄数百亿参数的大模型在实际业务中快速、稳定地响应,成为制约AI应用落地的关键瓶颈。NVIDIA开源的TensorRT-LLM正是为此而生,它旨在彻底释放GPU算力潜能,为生成式AI的规模化部署铺平道路。 TensorRT LLM是什么 TensorRT LLM 是 NVIDIA 推出的优化大…

LangGraph – 基于图结构构建与部署多代理动态工作流的开源框架

LangGraph是什么 LangGraph是为构建状态化、多智能体(Multi-Agent) 系统而设计的,特别是与大…

Ming‑Flash‑Omni 2.0 – 蚂蚁开源的全模态大模型

Ming-flash-omni-2.0是什么 Ming-flash-omni-2.0是蚂蚁集团开源的全模态大模型,采用1…

R2R – AI 检索增强生成应用开发平台,支持多模态内容处理、混合搜索、知识图谱构建

R2R是什么 R2R是先进的AI检索系统,专注于Retrieval-Augmented Generation(增强型检索…

GPT‑5.3‑Codex‑Spark – OpenAI推出的轻量级编程模型

GPT‑5.3‑Codex‑Spark是什么 GPT-5.3-Codex-Spark是OpenAI首个专为实时编程设计的…

Eliza – 开源多功能AI Agent框架,快速搭建智能、高效的AI系统

Eliza是什么 Eliza 是ai16z开源的多代理模拟框架,旨在创建、部署和管理自主 AI 代理。 以 TypeSc…

smoltalk-chinese – OpenCSG 开源专为中文大型语言模型设计的合成数据集

smoltalk-chinese是什么 smoltalk-chinese 是OpenCSG开源的专为中文大型语言模型(L…