GPT‑5.3‑Codex‑Spark – OpenAI推出的轻量级编程模型
GPT‑5.3‑Codex‑Spark是什么 GPT-5.3-Codex-Spark是OpenAI首个专为实时编程设计的轻量级模型,主打极致速度。模型运行在Cerebra…
EMO2 – 阿里研究院推出的音频驱动头像视频生成技术
EMO2是什么 EMO2 (End-Effector Guided Audio-Driven Avatar Video Generation)是阿里巴巴智能计算研究院开发…
Mini-InternVL – 上海AI Lab联合清华等机构推出的轻量级多模态大模型
Mini-InternVL是什么 Mini-InternVL是“迷你版”书生·万象大模型,是上海AI实验室与清华大学、南京大学等机构联合推出的轻量级多模态大型语言模型系列…
HoloDrive – 商汤联合上海AI Lab等机构推出的2D-3D多模态街道场景生成框架
HoloDrive是什么 HoloDrive 是商汤和上海人工智能实验室等机构提出的用于自动驾驶的整体2D-3D多模态街道场景生成框架。框架联合生成相机图像和激光雷达点云…
Xianyu AutoAgent – AI闲鱼客服机器人,支持多专家协同决策
Xianyu AutoAgent是什么 Xianyu AutoAgent 是为闲鱼平台设计的智能客服机器人系统。支持实现7×24小时自动化值守,多专家协同决策、智能议价及…
Cognita – 面向生产环境的开源、模块化 RAG 框架
Cognita是什么 Cognita是开源的模块化RAG(Retrieval Augmented Generation)框架,能帮助开发者构建模块化、易于扩展和部署的生产…
TradingAgents – 加利福尼亚联合麻省理工推出的多智能体LLM金融交易框架
TradingAgents是什么 TradingAgents是加利福尼亚大学洛杉矶分校和麻省理工学院推出的多代理LLM金融交易框架,能模拟现实世界的交易公司环境。Trad…
GPT‑5.3 Instant – OpenAI 推出的轻量级对话模型
GPT‑5.3 Instant是什么 GPT‑5.3 Instant 是 OpenAI 推出的轻量级对话模型,专为优化日常聊天体验设计。模型显著改善”爱说教、太啰嗦”的机…
Ming‑Flash‑Omni 2.0 – 蚂蚁开源的全模态大模型
Ming-flash-omni-2.0是什么 Ming-flash-omni-2.0是蚂蚁集团开源的全模态大模型,采用100B总参数/6B激活参数的MoE架构。作为业界S…
VideoReward – 港中文、清华、快手等联合推出的视频生成偏好数据集及奖励模型
VideoReward是什么 VideoReward 是香港中文大学、清华大学、快手科技等联合创建的视频生成偏好数据集及奖励模型。包含182,000条标注数据,涵盖视觉质…
PaSa – 字节跳动推出的学术论文检索智能体
PaSa是什么 PaSa是字节跳动研究团队(ByteDance Research)推出的基于强化学习的学术论文检索智能体。能模仿人类研究者的行为,自动调用搜索引擎、浏览相…
Weebo – AI语音聊天机器人,实时响应用户语音指令和问题
Weebo是什么 Weebo是实时语音聊天机器人,基于Whisper Small、Llama 3.2和Kokoro-82M技术驱动。能通过语音识别和生成技术,与用户进行自…
Perception-as-Control – 阿里通义实验室推出的图像动画框架
Perception-as-Control是什么 Perception-as-Control是阿里巴巴通义实验室推出的图像动画框架,能根据用户意图实现细粒度的运动控制。P…
Matrix-Game – 昆仑万维开源的工业界首个空间智能大模型
Matrix-Game是什么 Matrix-Game是昆仑万维开源的工业界首个10B+空间智能大模型,是Matrix-Zero世界模型中的可交互视频生成大模型。模型基于两…
LAM – 微软推出的大型行动模型,能自主操作Windows程序
LAM是什么 LAM是微软推出的名为“Large Action Model”(简称 LAM)的新人工智能模型。与传统语言模型不同,LAM能够自主操作Windows程序,实…
CreatiLayout – 复旦和字节联合推出创新的布局到图像生成技术
CreatiLayout是什么 CreatiLayout 是复旦大学和字节跳动联合提出的创新的布局到图像生成(Layout-to-Image, L2I)技术。通过构建大规…
