Praison AI – 开源AI多智能体框架,低代码创建和管理AI代理
Praison AI是什么 Praison AI 是生产级的多智能体框架,基于低代码解决方案创建和管理AI代理,用自动化和解决从简单到复杂的任务。Praison AI 支…
GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型
GPT‑5.4是什么 GPT-5.4是OpenAI推出的旗舰AI模型,定位为”专为专业工作设计的最强前沿模型”。模型首次将推理、编程、原生计算机操作、深度网页搜索和百万T…
Hibiki – Kyutai Labs 推出的实时语音翻译模型
Hibiki是什么 Hibiki是Kyutai Labs开源的用在同时语音翻译的解码器模型,能实时将一种语言的语音翻译成另一种语言的语音或文本。Hibiki基于多流语言模…
node-DeepResearch – Deep Research开源复现版 AI Agent,支持多步推理和复杂查询
node-DeepResearch是什么 node-DeepResearch 是开源的 AI 智能体项目,基于持续搜索和阅读网页,用 Gemini 语言模型和 Jina …
CogVideoX-2 – 智谱 AI 推出的文本到视频生成模型
CogVideoX-2是什么 CogVideoX-2是智谱 AI 推出的文本到视频生成模型,基于先进的 3D 变分自编码器(VAE),将视频数据压缩到原本的 2%,减少资…
Seaweed APT – 字节跳动推出的单步图像和视频生成项目
Seaweed APT是什么 Seaweed APT是字节跳动推出的对抗性后训练(Adversarial Post-Training)模型,能实现图像和视频的一站式生成。…
SVFR – 腾讯优图联合厦门大学推出的通用视频人脸修复统一框架
SVFR是什么 SVFR(Stable Video Face Restoration)是腾讯优图实验室和厦门大学联合推出的用于广义视频人脸修复的统一框架,整合了视频人脸修…
ViLAMP – 蚂蚁联合人民大学推出的视觉语言模型
ViLAMP是什么 ViLAMP(VIdeo-LAnguage Model with Mixed Precision)是蚂蚁集团和中国人民大学联合推出的视觉语言模型,专门…
ImBD – 复旦联合华南理工等机构推出的通用 AI 内容检测器
ImBD是什么 ImBD(Imitate Before Detect)是复旦大学、华南理工大学、武汉大学、Fenzi AI等推出的用在检测机器修订文本的方法。首先模仿大型…
KAG – 蚂蚁集团推出的专业领域知识服务框架
KAG是什么 KAG(Knowledge Augmented Generation)是蚂蚁集团推出的专业领域知识服务框架,基于知识增强提升大型语言模型(LLMs)在特定领…
Goedel-Prover – 自动化数学问题的形式证明生成开源推理模型
Goedel-Prover是什么 Goedel-Prover(哥德尔证明器)是普林斯顿大学、清华大学、清华大学等机构推出的开源大型语言模型(LLM),用在自动化数学问题的…
Ming‑Flash‑Omni 2.0 – 蚂蚁开源的全模态大模型
Ming-flash-omni-2.0是什么 Ming-flash-omni-2.0是蚂蚁集团开源的全模态大模型,采用100B总参数/6B激活参数的MoE架构。作为业界S…
HMA – MIT联合Meta等推出的机器人动作视频动态建模方法
HMA是什么 HMA(Heterogeneous Masked Autoregression)是麻省理工学院、Meta和伊利诺伊大学香槟分校开源的,用在建模机器人动作视频…
OmniHuman – 字节跳动推出的单张照片生成全身动态视频生成框架
OmniHuman是什么 OmniHuman是字节跳动推出的端到端多模态条件化人类视频生成框架,能基于单张人类图像和运动信号(如音频、视频或两者的组合)生成逼真的人类视频…
CogView-4 – 智谱AI推出的文本到图像生成模型
CogView4是什么 CogView4 是智谱推出的开源文生图模型,具有60亿参数,支持原生中文输入和中文文字生成。模型在 DPG-Bench 基准测试中综合评分排名第…
OmAgent – Om AI联合浙大开源的多模态语言代理框架
OmAgent是什么 OmAgent是Om AI和浙江大学滨江研究院联合开源的多模态语言代理框架,能简化设备端智能代理的开发。OmAgent支持可重用的代理组件,助力开发…
