NodeRAG – 开源基于异构图的智能检索与生成系统
NodeRAG是什么 NodeRAG 是基于异构图的检索增强生成(Retrieval-Augmented Generation,RAG)系统。通过构建包含多种节点类型的异…
News Agents – 开源的终端新闻聚合与摘要系统
News Agents是什么 News Agents基于终端的新闻聚合与摘要系统。基于Amazon Q CLI作为 Agent 框架,用Model Context Pro…
DreamActor-M1 – 字节跳动推出的 AI 图像动画框架
DreamActor-M1是什么 DreamActor-M1是字节跳动推出的先进AI图像动画框架,能将静态人物照片转化为生动的动画视频。采用混合引导机制,结合隐式面部表示…
Mahilo – AI多智能体框架,支持创建与人类互动的多智能体系统
Mahilo是什么 Mahilo 是灵活的多智能体框架,支持创建与人类互动的多智能体系统。Mahilo支持实时语音和文本通信,智能体之间能自主共享上下文和信息,保持人类对…
Aether – 上海 AI Lab 开源的生成式世界模型
Aether是什么 Aether 是上海AI Lab开源的生成式世界模型,完全基于合成数据训练。Aether 首次将三维时空建模与生成式建模深度融合,具备 4D 动态重建…
Evolving Agents – 开源的AI Agent管理与进化框架
Evolving Agents是什么 Evolving Agents 是用在创建、管理和进化 AI 代理的生产级框架。Evolving Agents支持智能代理之间的通信…
QLIP – 英伟达推出的视觉标记化方法
QLIP是什么 QLIP(Quantized Language-Image Pretraining)是英伟达等推出的视觉标记化方法,结合高质量的图像重建和零样本图像理解能…
TxGemma – 谷歌推出的通用医学治疗大模型
TxGemma是什么 TxGemma 是谷歌推出的用于药物发现的通用人工智能模型,通过 AI 技术加速药物研发进程。基于 Google 的 Gemma 框架开发,能理解常…
ScholarCopilot – 滑铁卢与卡内基梅隆大学联合推出的AI学术写作助手
ScholarCopilot是什么 ScholarCopilot 是加拿大滑铁卢大学与卡内基梅隆大学的研究团队开发的专为学术写作设计的人工智能工具,基于 Qwen-2.5…
Chat2SVG – 文本描述实现高质量矢量图形的生成框架
Chat2SVG是什么 Chat2SVG 是创新的文本到矢量图形(SVG)生成框架,通过结合大型语言模型(LLMs)和图像扩散模型,实现高质量 SVG 图形的自动化创作。…
Step-Video-TI2V – 阶跃星辰开源的图生视频模型
Step-Video-TI2V是什么 Step-Video-TI2V 是阶跃星辰(StepFun)推出的开源图生视频(Image-to-Video)生成模型,拥有 300…
Ev-DeblurVSR – 中科大等机构推出的视频画面增强模型
Ev-DeblurVSR是什么 Ev-DeblurVSR是中国科学技术大学、合肥综合性国家科学中心人工智能研究所和新加坡国立大学联合推出的视频画面增强模型,能从低分辨率且…
LBM – AI图像转换框架,实现可控阴影生成
LBM是什么 LBM(Latent Bridge Matching)是Jasper Research团队推出的新型图像到图像转换框架,基于在潜在空间中构建桥匹配实现快速高…
Mini DALL·E 3 – 北京理工联合上海 AI Lab等高校推出的交互式文生图框架
Mini DALL·E 3是什么 Mini DALL·E 3 是北京理工大学、上海AI Lab、清华大学和香港中文大学联合推出的交互式文本到图像(iT2I)框架。基于自然…
WorldCraft – 港科大推出的3D虚拟世界创建和定制系统
WorldCraft是什么 WorldCraft是香港科技大学推出的基于大型语言模型(LLM)代理的3D世界创建和定制系统,用在创建和定制逼真的3D虚拟世界。基于自然语言…
Infinite Mobility – 上海 AI Lab 推出的可交互物体生成模型
Infinite Mobility是什么 Infinite Mobility 是上海AI Lab推出的可交互物体生成模型,基于程序化生成技术,高效生成高质量的可交互物体数…
