AI-Infra-Guard – 腾讯开源的 AI 基础设施安全评估工具
AI-Infra-Guard是什么 AI-Infra-Guard是腾讯开源的高效、轻量级易于使用的 AI 基础设施安全评估工具,能发现和检测 AI 系统中的潜在安全风险。…
SimpleAR – 复旦大学联合字节 Seed 团队推出的图像生成模型
SimpleAR是什么 SimpleAR 是复旦大学视觉与学习实验室和字节 Seed 团队联合推出的纯自回归图像生成模型。采用简洁的自回归架构,通过优化训练和推理过程,实…
LazyLLM – 商汤大装置开源的多智能体应用开发平台
LazyLLM是什么 LazyLLM 是开源的低代码平台,帮助开发者快速、低成本地构建多智能体大语言模型应用。通过极简的开发流程,支持一键式部署和跨平台操作,降低了 AI…
MIDI – AI 3D场景生成技术,能将单张图像转化为360度3D场景
MIDI是什么 MIDI(Multi-Instance Diffusion for Single Image to 3D Scene Generation)是先进的3D场…
Insert Anything – 浙大联合哈佛大学和南洋理工推出的图像插入框架
Insert Anything是什么 Insert Anything是浙江大学、哈佛大学和南洋理工大学的研究人员联合推出的基于上下文编辑的图像插入框架。框架基于将参考图像…
QVQ-Max – 阿里通义推出的视觉推理模型
QVQ-Max是什么 QVQ-Max 是阿里通义推出的视觉推理模型,是QVQ-72B-Preview的正式升级版。QVQ-Max能“看懂”图片和视频内容,结合信息进行分析…
Fourier N1 – 傅利叶推出的首款开源人形机器人
Fourier N1是什么 Fourier N1 是通用机器人公司傅利叶发布的首款开源人形机器人。身高1.3米,体重38公斤,拥有23个自由度,采用铝合金与工程塑料复合结…
PodAgent – 港中文、微软、小红书联合推出的播客生成框架
PodAgent是什么 PodAgent 是香港中文大学、微软和小红书联合推出的播客生成框架。基于模拟真实的脱口秀场景,用多智能体协作系统(包括主持人、嘉宾和编剧)自动生…
YT Navigator – AI YouTube 内容搜索工具,自然语言查询定位关键信息
YT Navigator是什么 YT Navigator 是 AI 驱动的 YouTube 内容搜索工具,帮助用户高效地搜索和浏览 YouTube 频道内容。YT Nav…
NodeRAG – 开源基于异构图的智能检索与生成系统
NodeRAG是什么 NodeRAG 是基于异构图的检索增强生成(Retrieval-Augmented Generation,RAG)系统。通过构建包含多种节点类型的异…
News Agents – 开源的终端新闻聚合与摘要系统
News Agents是什么 News Agents基于终端的新闻聚合与摘要系统。基于Amazon Q CLI作为 Agent 框架,用Model Context Pro…
DreamActor-M1 – 字节跳动推出的 AI 图像动画框架
DreamActor-M1是什么 DreamActor-M1是字节跳动推出的先进AI图像动画框架,能将静态人物照片转化为生动的动画视频。采用混合引导机制,结合隐式面部表示…
Mahilo – AI多智能体框架,支持创建与人类互动的多智能体系统
Mahilo是什么 Mahilo 是灵活的多智能体框架,支持创建与人类互动的多智能体系统。Mahilo支持实时语音和文本通信,智能体之间能自主共享上下文和信息,保持人类对…
Aether – 上海 AI Lab 开源的生成式世界模型
Aether是什么 Aether 是上海AI Lab开源的生成式世界模型,完全基于合成数据训练。Aether 首次将三维时空建模与生成式建模深度融合,具备 4D 动态重建…
Evolving Agents – 开源的AI Agent管理与进化框架
Evolving Agents是什么 Evolving Agents 是用在创建、管理和进化 AI 代理的生产级框架。Evolving Agents支持智能代理之间的通信…
QLIP – 英伟达推出的视觉标记化方法
QLIP是什么 QLIP(Quantized Language-Image Pretraining)是英伟达等推出的视觉标记化方法,结合高质量的图像重建和零样本图像理解能…
