Wall-OSS-0.5 – 自变量机器人开源的国产具身智能模型
Wall-OSS-0.5是什么 Wall-OSS-0.5是自变量机器人开源的国产具身智能模型,属于视觉-语言-动作(VLA)大模型,具备无需任务微调即可在真实机器人上部署…
MiniMax M3 – MiniMax 推出的新一代 AI 模型
MiniMax M3是什么 MiniMax M3是 MiniMax 推出的全新AI模型,具备领先的编程、Agent与长文本处理能力。模型采用创新的MSA稀疏注意力架构,支…
Dubbing v2 – ElevenLabs 推出的 AI 配音模型
Dubbing v2是什么 Dubbing v2 是 ElevenLabs 推出的 AI 配音模型,支持 29 种语言自动翻译配音,保留原始说话人音色与情感。模型提供双工…
Qwen-Image-Bench – 通义千问推出的文生图模型评测基准
Qwen-Image-Bench是什么 Qwen-Image-Bench 是通义千问团队推出的文生图模型评测数据集,规模为 1k 条测试样本,覆盖中英双语提示,支持多维度…
Hermes Desktop – Hermes Agent 的桌面应用,开箱即用
Hermes Desktop是什么 Hermes Desktop 是开发者 sir1st 推出的 Hermes Agent 社区版桌面应用。将 Python 运行时、he…
Qwen-VLA – 阿里通义推出的通用视觉-语言-动作模型
Qwen-VLA是什么 Qwen-VLA 是通义实验室推出的通用视觉-语言-动作模型,以 Qwen3.5-4B 为视觉语言主干,搭配 1.15B 参数的 DiT 动作解码…
Cosmos 3 – 英伟达开源的全模态物理 AI 基础大模型
Cosmos 3是什么 Cosmos 3是英伟达推出的全球首款全开源全模态物理 AI 基础大模型,采用混合 Transformer 架构融合视觉推理、世界生成与动作预测能…
Dynamic Workflows – Claude Code 推出的动态工作流
Dynamic Workflows是什么 Dynamic Workflows 是 Claude Code 推出的动态工作流,目前处于研究预览阶段,支持 Claude 动态…
Webwright – 微软开源的终端原生网页智能体框架
Webwright是什么 Webwright 是微软研究院开源的终端原生网页智能体框架,仅需约 1000 行代码可让 AI 模型在终端中编写 Playwright 代码、…
阿里云百炼 CLI – 阿里云开源的 AI Agent 命令行工具
阿里云百炼 CLI是什么 阿里云百炼CLI是阿里云开源的AI Agent命令行工具,专为智能体场景设计。开发者一行命令,可让Agent自动调用阿里云百炼平台150+多模态…
ControlFoley – 小米开源的可控视频音效生成模型
ControlFoley是什么 ControlFoley是小米开源的可控视频音效生成模型,能解决V2A领域可控性难题。模型统一支持文本引导、文本控制与参考音频控制三类视频…
Qwen3.7-Plus – 阿里通义推出的智能体多模态大模型
Qwen3.7-Plus是什么 Qwen3.7-Plus 是通义千问推出的新一代多模态大模型,将视觉与语言统一为一体化智能体基座。模型能感知真实世界场景、读取屏幕并操作 …
Bernini – 字节跳动开源的统一视频生成与编辑框架
Bernini是什么 Bernini 是字节跳动开源的统一视频生成与编辑框架,采用MLLM 语义规划 + DiT 视觉渲染的两阶段解耦架构。多模态大模型理解指令并规划语义…
Mellum2 – JetBrains 开源的混合专家模型
Mellum2是什么 Mellum2 是 JetBrains 开源的面向软件工程系统的新机器学习模型。模型每 token 仅激活 2.5B 参数,专为软件工程 AI 工作…
MAI-Code-1-Flash – 微软推出的轻量级代码生成模型
MAI-Code-1-Flash是什么 MAI-Code-1-Flash 是微软专为开发者工作流推出的轻量级代码生成模型,深度集成 GitHub Copilot。模型采用…
ECC – 开源的跨平台 AI Agent 性能优化系统
ECC是什么 ECC(Everything Claude Code)是跨平台 AI Agent 性能优化系统。系统为 Claude Code、Codex、Cursor 等…
