GPDiT – 清华北大联合阶跃星辰等推出的视频生成模型
GPDiT是什么 GPDiT(Generative Pre-trained Autoregressive Diffusion Transformer)是北京大学、清华大学…
Neo-1 – VantAI 推出的首个原子生成式AI模型
Neo-1是什么 Neo-1 是 VantAI 推出的全球首个将从头分子生成与原子级结构预测统一的AI模型。能预测生物分子结构,生成全新的分子,在设计分子胶等新型治疗药物…
腾讯混元Turbo S – 腾讯推出的新一代快思考模型
腾讯混元Turbo S是什么 腾讯混元Turbo S是腾讯推出的新一代快思考模型。模型采用创新的Hybrid-Mamba-Transformer融合架构,有效降低了传统T…
SkyReels-V1 – 昆仑万维开源首个面向AI短剧创作的视频生成模型
SkyReels-V1是什么 SkyReels-V1是昆仑万维开源的首个面向AI短剧创作的视频生成模型。基于在千万级高质量影视数据上进行微调,实现影视级的人物微表情和肢体…
万相首尾帧模型 – 阿里通义开源的首尾帧生视频模型
万相首尾帧模型是什么 万相首尾帧模型(Wan2.1-FLF2V-14B)是开源的14B参数规模的首尾帧生视频模型。模型根据用户提供的首帧和尾帧图像,自动生成流畅的高清视频…
Evo 2 – Acr研究所联合英伟达、斯坦福等推出的生物学AI模型
Evo 2是什么 Evo 2 是美国弧形研究所、英伟达、斯坦福大学等机构合作推出的DNA语言模型,用于基因组建模和设计,覆盖生命的所有领域。Evo 2 基于 Stripe…
VideoPainter – 港中文联合腾讯等机构推出的视频修复和编辑框架
VideoPainter是什么 VideoPainter 是香港中文大学、腾讯ARC Lab、东京大学、澳门大学等机构推出的视频修复和编辑框架,专门用在处理任意长度的视频…
Granite 4.0 Tiny Preview – IBM推出的语言模型
Granite 4.0 Tiny Preview是什么 Granite 4.0 Tiny Preview 是 IBM 推出的 Granite 4.0 语言模型家族中最小的…
Video-T1 – 清华联合腾讯推出的视频生成技术
Video-T1是什么 Video-T1 是清华大学和腾讯的研究人员共同推出的视频生成技术,基于测试时扩展(Test-Time Scaling,TTS)提升视频生成的质量…
Animate Anyone 2 – 阿里通义推出的高保真角色图像动画生成技术
Animate Anyone 2是什么 Animate Anyone 2 是阿里巴巴集团通义实验室推出的高保真角色图像动画生成技术,通过结合环境信息生成更具真实感的角色动…
LocAgent – 斯坦福联合耶鲁大学等机构推出的代码问题定位智能体
LocAgent是什么 LocAgent是斯坦福大学、耶鲁大学和南加州大学等机构联合推出的,专注于代码定位任务的框架,帮助开发者快速准确地找到代码库中需要修改的部分。Lo…
NotaGen – 中央音乐学院联合北航、清华等推出的音乐生成模型
NotaGen是什么 NotaGen 是中央音乐学院、北京航空航天大学、清华大学等机构推出的音乐生成模型,基于模仿大型语言模型(LLM)的训练范式生成高质量的古典乐谱。N…
BEHAVIOR Robot Suite – 李飞飞团队开源的机器人家庭任务自动化框架
BEHAVIOR Robot Suite是什么 BEHAVIOR Robot Suite(BRS)是斯坦福大学李飞飞团队推出的用在学习全身操作完成日常家务任务的框架。基于…
Multi-Speaker – AudioShake 推出的多说话人声分离模型
Multi-Speaker是什么 Multi-Speaker是AudioShake推出的全球首个高分辨率多说话人分离模型。支持将音频中的多个说话人精准分离到不同轨道,解决…
WebSSL – Meta联合纽约大学等机构推出的视觉自监督学习系列模型
WebSSL是什么 WebSSL(Web-scale Self-Supervised Learning)是Meta、纽约大学等机构推出的视觉自监督学习(SSL)系列模型,…
Magentic-UI – 微软开源的人机协作AI Agent研究原型
Magentic-UI是什么 Magentic-UI 是微软推出的开源研究原型,用在探索人类参与的 AI Agent系统。Magentic-UI 是以人为中心的AI Ag…
