SVFR – 腾讯优图联合厦门大学推出的通用视频人脸修复统一框架
SVFR是什么 SVFR(Stable Video Face Restoration)是腾讯优图实验室和厦门大学联合推出的用于广义视频人脸修复的统一框架,整合了视频人脸修…
ViLAMP – 蚂蚁联合人民大学推出的视觉语言模型
ViLAMP是什么 ViLAMP(VIdeo-LAnguage Model with Mixed Precision)是蚂蚁集团和中国人民大学联合推出的视觉语言模型,专门…
ImBD – 复旦联合华南理工等机构推出的通用 AI 内容检测器
ImBD是什么 ImBD(Imitate Before Detect)是复旦大学、华南理工大学、武汉大学、Fenzi AI等推出的用在检测机器修订文本的方法。首先模仿大型…
KAG – 蚂蚁集团推出的专业领域知识服务框架
KAG是什么 KAG(Knowledge Augmented Generation)是蚂蚁集团推出的专业领域知识服务框架,基于知识增强提升大型语言模型(LLMs)在特定领…
Goedel-Prover – 自动化数学问题的形式证明生成开源推理模型
Goedel-Prover是什么 Goedel-Prover(哥德尔证明器)是普林斯顿大学、清华大学、清华大学等机构推出的开源大型语言模型(LLM),用在自动化数学问题的…
Ming‑Flash‑Omni 2.0 – 蚂蚁开源的全模态大模型
Ming-flash-omni-2.0是什么 Ming-flash-omni-2.0是蚂蚁集团开源的全模态大模型,采用100B总参数/6B激活参数的MoE架构。作为业界S…
HMA – MIT联合Meta等推出的机器人动作视频动态建模方法
HMA是什么 HMA(Heterogeneous Masked Autoregression)是麻省理工学院、Meta和伊利诺伊大学香槟分校开源的,用在建模机器人动作视频…
OmniHuman – 字节跳动推出的单张照片生成全身动态视频生成框架
OmniHuman是什么 OmniHuman是字节跳动推出的端到端多模态条件化人类视频生成框架,能基于单张人类图像和运动信号(如音频、视频或两者的组合)生成逼真的人类视频…
CogView-4 – 智谱AI推出的文本到图像生成模型
CogView4是什么 CogView4 是智谱推出的开源文生图模型,具有60亿参数,支持原生中文输入和中文文字生成。模型在 DPG-Bench 基准测试中综合评分排名第…
OmAgent – Om AI联合浙大开源的多模态语言代理框架
OmAgent是什么 OmAgent是Om AI和浙江大学滨江研究院联合开源的多模态语言代理框架,能简化设备端智能代理的开发。OmAgent支持可重用的代理组件,助力开发…
TimesFM 2.0 – 谷歌研究团队开源的时间序列预测模型
TimesFM 2.0是什么 TimesFM 2.0是谷歌研究团队推出的开源时间序列预测模型。具备强大的预测能力,可处理长达2048个时间点的单变量时间序列,支持任意预测…
Seed1.5-VL – 字节跳动Seed推出的视觉语言多模态大模型
Seed1.5-VL是什么 Seed1.5-VL 是字节跳动 Seed 团队最新发布的视觉-语言多模态大模型,具备强大的通用多模态理解和推理能力,推理成本显著降低。模型由…
GPT‑5.3 Instant – OpenAI 推出的轻量级对话模型
GPT‑5.3 Instant是什么 GPT‑5.3 Instant 是 OpenAI 推出的轻量级对话模型,专为优化日常聊天体验设计。模型显著改善”爱说教、太啰嗦”的机…
SocraticLM – 中科大和科大讯飞共同推出的苏格拉底教学大模型
SocraticLM是什么 SocraticLM 是通过苏格拉底式的教学法来教授数学的创新人工智能模型,模型由中科大和科大讯飞共同开发,采用了“Thought-Provo…
Gemini Coder – AI 应用生成工具,文本描述实时生成代码和预览
Gemini Coder是什么 Gemini Coder 是基于 Google 的 Gemini API、Next.js 和 Tailwind CSS 的工具,用在快速生…
CineMaster – 快手推出的文本到视频生成框架,具备3D感知能力
CineMaster是什么 CineMaster是快手推出的具备3D感知能力的文本到视频生成框架。类似于视频版的ControlNet,支持用户通过多种控制信号精确操控视频…
