阿里云百炼 CLI – 阿里云开源的 AI Agent 命令行工具
阿里云百炼 CLI是什么 阿里云百炼CLI是阿里云开源的AI Agent命令行工具,专为智能体场景设计。开发者一行命令,可让Agent自动调用阿里云百炼平台150+多模态…
ControlFoley – 小米开源的可控视频音效生成模型
ControlFoley是什么 ControlFoley是小米开源的可控视频音效生成模型,能解决V2A领域可控性难题。模型统一支持文本引导、文本控制与参考音频控制三类视频…
Qwen3.7-Plus – 阿里通义推出的智能体多模态大模型
Qwen3.7-Plus是什么 Qwen3.7-Plus 是通义千问推出的新一代多模态大模型,将视觉与语言统一为一体化智能体基座。模型能感知真实世界场景、读取屏幕并操作 …
Bernini – 字节跳动开源的统一视频生成与编辑框架
Bernini是什么 Bernini 是字节跳动开源的统一视频生成与编辑框架,采用MLLM 语义规划 + DiT 视觉渲染的两阶段解耦架构。多模态大模型理解指令并规划语义…
Mellum2 – JetBrains 开源的混合专家模型
Mellum2是什么 Mellum2 是 JetBrains 开源的面向软件工程系统的新机器学习模型。模型每 token 仅激活 2.5B 参数,专为软件工程 AI 工作…
MAI-Code-1-Flash – 微软推出的轻量级代码生成模型
MAI-Code-1-Flash是什么 MAI-Code-1-Flash 是微软专为开发者工作流推出的轻量级代码生成模型,深度集成 GitHub Copilot。模型采用…
ECC – 开源的跨平台 AI Agent 性能优化系统
ECC是什么 ECC(Everything Claude Code)是跨平台 AI Agent 性能优化系统。系统为 Claude Code、Codex、Cursor 等…
Gamma-World – 英伟达推出的多智能体世界模型
Gamma-World是什么 Gamma-World 是 NVIDIA 推出的多智能体世界模型,能解决多个智能体在同一个模拟世界中平等交互、全局一致的问题。模型创新性地采…
PaddleOCR-VL-1.6 – 百度推出的文档解析视觉语言模型
PaddleOCR-VL-1.6是什么 PaddleOCR-VL-1.6 是百度飞桨团队推出的文档解析视觉语言模型(VLM),是 PaddleOCR-VL 系列的最新升级…
OpenClacky – 李亚飞团队开源的低成本 AI Agent
OpenClacky是什么 OpenClacky 是李亚飞团队开源的 AI Agent,支持一键安装与跨平台运行。工具通过精简工具集、智能上下文压缩和模型路由大幅降低使用…
Hermes Desktop – Nous Research 推出的 Hermes 桌面端
Hermes Desktop是什么 Hermes Desktop 是 Nous Research 推出的官方 Hermes 桌面客户端,支持 macOS、Windows …
MAI-Thinking-1 – 微软推出的首款自研高级推理模型
MAI-Thinking-1是什么 MAI-Thinking-1 是微软推出的首款自研高级推理模型。模型采用 35B 活跃参数 / 约 1T 总参数的稀疏 MoE 架构,…
Ideogram 4 – Ideogram 开源的文本到图像生成模型
Ideogram 4是什么 Ideogram 4 是 Ideogram 推出的首个开源文本到图像生成模型,拥有 93 亿参数,从头训练非基于现有模型微调。模型专为高质量图…
Gemma 4 12B – 谷歌开源的多模态大模型
Gemma 4 12B是什么 Gemma 4 12B是谷歌开源的多模态大模型,采用业界首个无编码器统一架构,视觉和音频数据直接输入LLM主干,彻底砍掉独立编码器。模型12…
Science Skills – 谷歌 DeepMind 开源的科研技能工具包
Science Skills是什么 Science Skills 是谷歌 DeepMind 推出的开源科研技能集合,专为加速 AI Agent 驱动的科学研究工作流设计。…
Odysseus – 开源的本地自托管 AI 工作空间
Odysseus是什么 Odysseus 是开源自托管的 AI 工作空间,提供类似 ChatGPT / Claude 的聊天界面,工具完全本地化运行,数据不出本机、隐私零…
