RepText – Liblib AI联合Shakker Labs推出的多语言视觉文本渲染框架
RepText是什么 RepText 是Shakker Labs 和 Liblib AI推出的多语言视觉文本渲染框架,基于复制字形而非理解文本内容实现高质量的文本渲染。框…
Pixel3DMM – 慕尼黑联合伦敦大学等推出的3D人脸重建框架
Pixel3DMM是什么 Pixel3DMM是慕尼黑工业大学、伦敦大学学院和Synthesia联合推出的单图像3D人脸重建框架。框架基于DINO基础模型,引入专门的预测头…
OlympicArena – 上海交大联合 AI Lab 等推出的多学科认知推理基准测试框架
OlympicArena是什么 OlympicArena是上海交通大学、上海AI Lab、苏州大学和上海交通大学生成式人工智能实验室(GAIR Lab)联合推出的多学科认…
WriteHERE – 开源的AI长文写作框架,单次生成超长文本
WriteHERE是什么 WriteHERE是Jürgen Schmidhuber领衔的团队开源的AI长文写作框架。WriteHERE基于异质递归规划(Heterogen…
MT-TransformerEngine – 摩尔线程开源的高效训练与推理优化框架
MT-TransformerEngine是什么 MT-TransformerEngine 是摩尔线程开源的高效训练与推理优化框架,专为 Transformer 模型设计。…
VoiceCanvas – 开源AI语音合成平台,支持多语言、多音色、声音克隆服务
VoiceCanvas是什么 VoiceCanvas 是开源的多语言语音合成平台。基于 AI 技术提供高质量的文字转语音服务,支持超过 50 种语言,集成 OpenAI …
PaddleSpeech – 百度飞桨团队开源的语音处理工具
PaddleSpeech是什么 PaddleSpeech 是百度飞桨团队开源的语音处理工具,提供全面的语音处理功能,包括语音识别、语音合成、声纹识别、语音翻译等。Padd…
UNO – 字节跳动推出的创新AI图像生成框架
UNO是什么 UNO是字节跳动推出创新的AI图像生成框架,突破传统模型在多主体生成中的局限。通过“少到多”的泛化方法,能高质量地生成单主体和多主体图像,解决了多主体场景下…
福棠·百川 – 百川智能联合北京儿童等推出的儿科大模型
福棠·百川是什么 福棠·百川是是国家儿童医学中心、首都医科大学附属北京儿童医院联合百川智能、小儿方健康共同发布的全球首个儿科大模型。覆盖了儿童常见病及疑难病症的立体化知识…
Xiaomi MiMo – 小米开源的首个推理大模型
Xiaomi MiMo是什么 Xiaomi MiMo 是小米开源的首个推理(Reasoning)大模型,支持提升模型在复杂推理任务中的表现。模型基于联动预训练和后训练,挖…
SWE-1 – Windsurf推出的首个软件工程 AI 模型系列
SWE-1是什么 SWE-1是Windsurf团队推出的首个软件工程 AI 模型系列,专为整个软件开发流程优化,涵盖代码生成、测试、调试、资料查找等开发环节,提升开发效率…
AbletonMCP – AI音乐制作工具,基于MCP支持音轨创建与修改
AbletonMCP是什么 AbletonMCP 是开源项目,基于模型上下文协议(MCP) 将 Ableton Live 与 Claude AI 连接,实现 AI 辅助音…
GPT‑5.3 Instant – OpenAI 推出的轻量级对话模型
GPT‑5.3 Instant是什么 GPT‑5.3 Instant 是 OpenAI 推出的轻量级对话模型,专为优化日常聊天体验设计。模型显著改善”爱说教、太啰嗦”的机…
Yuxi-Know – 基于大模型 RAG 知识库的 AI 知识图谱问答平台
Yuxi-Know是什么 Yuxi-Know(语析)是基于大模型RAG知识库与知识图谱技术构建的智能问答平台。Yuxi-Know支持多种知识库文件格式(如PDF、TXT、…
赤兔Chitu – 清华联合清程极智开源的大模型推理引擎
Chitu是什么 Chitu(赤兔)是清华大学高性能计算研究所与清程极智联合开源的高性能大模型推理引擎,专为解决大模型在推理阶段的高成本和低效率问题设计,具有强大的硬件适…
DeerFlow – 字节跳动开源的深度研究框架
DeerFlow 是什么 DeerFlow 是字节跳动开源的深度研究框架,能帮助用户高效完成复杂的研究任务。DeerFlow结合语言模型与多种工具,如网络搜索、爬虫和 P…
