站外新闻 – 第 113 页 – Prompt 语宙

站外新闻

5090 .

SNOOPI – AI文本到图像生成框架，提升单步扩散模型的效率和性能

SNOOPI是什么 SNOOPI是创新的文本到图像生成框架，基于增强单步扩散模型的指导提升模型性能和控制力。SNOOPI包括PG-SB（适当指导 – SwiftBrush…

MEMO – 音频驱动的生成肖像说话视频框架，保持身份一致性和表现力

MEMO是什么 MEMO（Memory-Guided EMOtionaware diffusion）是Skywork AI、南洋理工大学和新加坡国立大学推出的音频驱动肖像…

NVILA – 英伟达推出的视觉语言大模型

NVILA是什么 NVILA是NVIDIA推出的系列视觉语言模型，能平衡效率和准确性。模型用“先扩展后压缩”策略，有效处理高分辨率图像和长视频。NVILA在训练和微调阶段…

O1-CODER – 北交大推出的O1代码版开源项目，专注于编码任务

O1-CODER是什么 O1-CODER是北京交通大学研究团队推出的开源项目，旨在复制OpenAI的O1模型，专注于编码任务。O1-CODER结合强化学习（RL）和蒙特卡…

SOLAMI – 南洋理工推出的VR端3D角色扮演AI系统

SOLAMI是什么 SOLAMI是创新的VR端3D角色扮演AI系统，是南洋理工大学研究团队推出的。支持用户用语音和肢体语言与虚拟角色进行沉浸式互动，基于社交视觉-语言-行…

Florence-VL – 微软和马里兰大学共同开源的多模态大语言模型

Florence-VL是什么 Florence-VL是创新的多模态大型语言模型（MLLMs），是马里兰大学和微软研究院共同推出的。Florence-VL用生成式视觉基础模…

OOTDiffusion – 开源AI虚拟试衣工具，智能适配性别和体型自动调整衣物

OOTDiffusion是什么 OOTDiffusion是开源的AI虚拟试衣工具，能智能适配不同性别和体型，自动调整衣物尺寸和形状，生成自然贴合的试穿效果。OOTDiff…

Willow 量子芯片 – 谷歌推出的最强量子芯片，成功解决30年纠错难题

Willow 量子芯片是什么 Willow 量子芯片是谷歌最新推出的具有105个物理量子比特，在量子纠错和计算效率上取得了显著突破。Willow成功解决了量子计算领域近3…

GenMAC – 港大、清华联合微软推出文本到视频生成的多代理协作框架

GenMAC是什么 GenMAC是香港大学、清华大学和微软研究院推出的多代理协作的迭代框架，用在解决文本到视频生成中的复杂场景生成问题。基于将任务分解为设计、生成和重新设…

Amurex – 开源AI会议助手，提供实时建议、智能摘要、快速回顾关键信息

Amurex是什么 Amurex是AI会议助手，基于实时建议、智能摘要、关键要点提取、迟到加入回顾和完整会议记录等功能，帮助用户提升会议效率。作为开源工具，Amurex强…

易健EasyHealth – 北大健康推出的 AI 健康科普应用

易健EasyHealth是什么易健EasyHealth是北京大学健康传播专业师生推出的微信小程序，基于大语言模型技术打造的健康科普智能问答系统。程序提供AI智能问答、情…

See3D – 智源研究院开源的无标注视频学习3D生成模型

See3D是什么 See3D（See Video, Get 3D）是北京智源人工智能研究院推出的3D生成模型，能基于大规模无标注的互联网视频进行学习，实现从视频中生成3D…

VISION XL – AI视频修复处理工具，修复缺失、支持四倍超分辨率

VISION XL是什么 VISION XL是高效的视频修复和超分辨率工具，基于潜在扩散模型技术，专注于解决高清视频的逆问题。工具能修复视频缺失部分、去除模糊，提升视频清…

SPDL – Meta AI 推出的开源高性能AI模型数据加载解决方案

SPDL是什么 SPDL（Scalable and Performant Data Loading）是 Meta AI 推出的开源数据加载工具，能提高 AI 模型训练效率…

CausVid – Adobe 联合 MIT 推出的自回归实时视频生成技术

CausVid是什么 CausVid是Adobe和MIT共同推出的自回归实时视频生成技术，能实现视频的即时播放。基于蒸馏预训练的双向扩散模型构建出自回归生成模型，减少视频…

ClotheDreamer – 上海大学联合腾讯等高校推出的3D服装生成技术

ClotheDreamer是什么 ClotheDreamer是上海大学、上海交通大学、复旦大学和腾讯优图实验室共同推出的3D服装生成技术，能根据文本描述生成高保真、可穿戴…