Omnitool – 开源 AI 桌面,支持多种主流AI平台和服务
Omnitool是什么 Omnitool是开源的AI桌面环境,为用户提供统一的交互界面,能快速接入和使用多种AI模型。Omnitool支持本地运行,能在Mac、Windo…
HumanRig – 阿里高德推出的3D人形角色自动绑定任务数据集
HumanRig是什么 HumanRig 是阿里巴巴团队开发的 3D 人形角色自动绑定研究项目。解决现有绑定技术因缺乏高质量数据集而发展受限的问题,通过提供大规模、高质量…
Moonlight-16B-A3B – 月之暗面开源的 MoE 模型
Moonlight-16B-A3B是什么 Moonlight-16B-A3B 是 Moonshot AI 推出的新型 Mixture-of-Expert (MoE) 模型…
DeepSeek百宝箱 – DeepSeek API在多种软件中的集成应用
DeepSeek百宝箱是什么 DeepSeek百宝箱是 DeepSeek官方 维护的 GitHub 项目,展示如何将 DeepSeek API 集成到各种流行软件中。项目…
Klavis AI – 开源MCP集成平台,快速接入生产级MCP服务器
Klavis AI是什么 Klavis AI 是开源的 MCP(Multimodal Communication Protocol,多模态通信协议)集成平台,帮助 AI …
Bolt3D – 牛津大学联合谷歌推出的 3D 场景生成技术
Bolt3D是什么 Bolt3D 是谷歌研究院、牛津大学 VGG 团队和谷歌 DeepMind 联合推出的新型 3D 场景生成技术,是潜在扩散模型,能在单个 GPU 上,…
月之暗面再度融资 20 亿美元,估值飙升至 300 亿
在人工智能领域的竞争愈发激烈之际,知名初创公司 “月之暗面”(Moonshot AI)正在积极寻求新一轮融资,目标金额高达 20 亿美元。这一融资计划若成功实施,将使其估…
Versatile-OCR-Program – 开源多模态OCR工具,精准提取复杂结构化数据
Versatile-OCR-Program是什么 Versatile-OCR-Program是开源多模态OCR工具,支持从复杂的教育材料中提取结构化数据,生成适合机器学习…
DiffBrush – 北邮联合清华等机构推出的图像生成与编辑框架
DiffBrush是什么 DiffBrush是北京邮电大学、清华大学、中国电信人工智能研究所和西北工业大学推出的,无需训练的图像生成与编辑框架,支持用户基于手绘草图直观地…
Motion Anything – 腾讯联合京东等高校推出的多模态运动生成框架
Motion Anything是什么 Motion Anything 是澳大利亚国立大学、悉尼大学、腾讯、麦吉尔大学、京东等机构推出的多模态运动生成框架,根据文本、音乐或…
OLMo 2 32B – Ai2 推出的最新开源语言模型
OLMo 2 32B是什么 OLMo 2 32B 是 Allen Institute for AI(Ai2)推出的最新开源语言模型,是 OLMo 2 系列的重要成果。拥有…
UniToken – 复旦联合美团等机构推出的统一视觉编码框架
UniToken是什么 UniToken 是新型的自回归生成模型,专为多模态理解与生成任务设计。通过结合离散和连续的视觉表示,构建了一种统一的视觉编码框架,能同时捕捉图像…
豆包·语音播客模型 – 火山引擎推出的语音播客模型
豆包·语音播客模型是什么 豆包·语音播客模型是字节跳动旗下火山引擎推出的语音播客模型。模型基于流式模型构建,可将文本秒级转化为双人对话式播客,具有低成本、高时效、强互动特…
OThink-MR1 – OPPO联合港科大推出的多模态语言模型优化框架
OThink-MR1是什么 OThink-MR1是OPPO研究院和香港科技大学(广州)联合推出的多模态语言模型优化框架。基于动态调整Kullback-Leibler(KL…
Baichuan-Audio – 百川智能开源的端到端语音交互模型
Baichuan-Audio是什么 Baichuan-Audio是百川智能推出的端到端音频大语言模型,支持无缝集成音频理解和生成功能,实现支持高质量、可控的实时中英双语对…
Qihoo-T2X – 360 AI 研究院和中山大学开源的高效多模态生成模型
QIHOO-T2X是什么 Qihoo-T2X 是360 AI 研究院和中山大学推出的基于代理标记化扩散 Transformer(PT-DiT)的高效多模态生成模型,Qih…
