VoiceCanvas – 开源AI语音合成平台,支持多语言、多音色、声音克隆服务
VoiceCanvas是什么 VoiceCanvas 是开源的多语言语音合成平台。基于 AI 技术提供高质量的文字转语音服务,支持超过 50 种语言,集成 OpenAI …
PaddleSpeech – 百度飞桨团队开源的语音处理工具
PaddleSpeech是什么 PaddleSpeech 是百度飞桨团队开源的语音处理工具,提供全面的语音处理功能,包括语音识别、语音合成、声纹识别、语音翻译等。Padd…
UNO – 字节跳动推出的创新AI图像生成框架
UNO是什么 UNO是字节跳动推出创新的AI图像生成框架,突破传统模型在多主体生成中的局限。通过“少到多”的泛化方法,能高质量地生成单主体和多主体图像,解决了多主体场景下…
福棠·百川 – 百川智能联合北京儿童等推出的儿科大模型
福棠·百川是什么 福棠·百川是是国家儿童医学中心、首都医科大学附属北京儿童医院联合百川智能、小儿方健康共同发布的全球首个儿科大模型。覆盖了儿童常见病及疑难病症的立体化知识…
Xiaomi MiMo – 小米开源的首个推理大模型
Xiaomi MiMo是什么 Xiaomi MiMo 是小米开源的首个推理(Reasoning)大模型,支持提升模型在复杂推理任务中的表现。模型基于联动预训练和后训练,挖…
SWE-1 – Windsurf推出的首个软件工程 AI 模型系列
SWE-1是什么 SWE-1是Windsurf团队推出的首个软件工程 AI 模型系列,专为整个软件开发流程优化,涵盖代码生成、测试、调试、资料查找等开发环节,提升开发效率…
AbletonMCP – AI音乐制作工具,基于MCP支持音轨创建与修改
AbletonMCP是什么 AbletonMCP 是开源项目,基于模型上下文协议(MCP) 将 Ableton Live 与 Claude AI 连接,实现 AI 辅助音…
GPT‑5.3 Instant – OpenAI 推出的轻量级对话模型
GPT‑5.3 Instant是什么 GPT‑5.3 Instant 是 OpenAI 推出的轻量级对话模型,专为优化日常聊天体验设计。模型显著改善”爱说教、太啰嗦”的机…
Yuxi-Know – 基于大模型 RAG 知识库的 AI 知识图谱问答平台
Yuxi-Know是什么 Yuxi-Know(语析)是基于大模型RAG知识库与知识图谱技术构建的智能问答平台。Yuxi-Know支持多种知识库文件格式(如PDF、TXT、…
赤兔Chitu – 清华联合清程极智开源的大模型推理引擎
Chitu是什么 Chitu(赤兔)是清华大学高性能计算研究所与清程极智联合开源的高性能大模型推理引擎,专为解决大模型在推理阶段的高成本和低效率问题设计,具有强大的硬件适…
DeerFlow – 字节跳动开源的深度研究框架
DeerFlow 是什么 DeerFlow 是字节跳动开源的深度研究框架,能帮助用户高效完成复杂的研究任务。DeerFlow结合语言模型与多种工具,如网络搜索、爬虫和 P…
ChatAnyone – 阿里通义推出的实时风格化肖像视频生成框架
ChatAnyone是什么 ChatAnyone是阿里巴巴通义实验室推出的实时风格化肖像视频生成框架。通过音频输入,生成具有丰富表情和上半身动作的肖像视频。采用高效分层运…
Skywork-OR1 – 昆仑万维开源的高性能系列推理模型
Skywork-OR1是什么 Skywork-OR1(Open Reasoner 1)是昆仑万维推出的开源高性能推理模型系列,模型突破大模型在逻辑推理和复杂任务求解方面的…
Agent TARS – 字节跳动开源的多模态 AI Agent 项目
Agent TARS是什么 Agent TARS 是字节跳动开源的多模态 AI Agent 项目。基于视觉解释网页内容,与浏览器、命令行和文件系统无缝集成,实现复杂任务的…
F-Lite – Freepik联合FAL开源的文生图模型
F-Lite是什么 F-Lite是Freepik团队联合FAL开源的10B参数的文生图模型。基于Freepik内部80M有版权的数据集训练,支持商业用途。F-Lite将T…
AutoBE – AI驱动的后端服务器代码生成工具
AutoBE是什么 AutoBE 是 AI 驱动的后端服务器代码生成工具,通过用户描述需求自动生成高质量的后端代码。基于 TypeScript、NestJS、Prisma…
