站外新闻 – 第 109 页 – Prompt 语宙

站外新闻

5094 .

DramaClaw – 工业级 AI 视频制作工具，提供一站式流水线

DramaClaw是什么 DramaClaw 是工业级 AIGC 视频制作工具，主要面向 AI 短剧、漫剧、小说推文、解说剧等多类型视频创作场景。工具基于自研灵山 AI …

SeFi-Image – 开源的文本到图像模型，基于语义优先扩散

SeFi-Image是什么 SeFi-Image 是基于语义优先扩散的文本到图像模型，提供 1B、2B、5B 三种规格。模型将高层语义结构与纹理细节分离，让语义流提前去噪…

SAM 2.1 – Meta 开源的视觉分割模型

SAM 2.1是什么 SAM 2.1（全称Segment Anything Model 2.1）是Meta（Facebook的母公司）推出的先进视觉分割模型，用于图像和视…

Qwen2vl-Flux – 开源的多模态图像生成模型，支持多种生成模式

Qwen2vl-Flux是什么 Qwen2VL-Flux是多模态图像生成模型，结合Qwen2VL的视觉语言理解和FLUX框架，基于文本提示和图像参考生成高质量的图像。模型…

ShowUI – 新加坡国立联合微软推出用于 GUI 自动化的视觉-语言-操作模型

ShowUI是什么 ShowUI是新加坡国立大学Show Lab和微软共同推出的视觉-语言-行动模型，能提升图形用户界面（GUI）助手的工作效率。模型基于UI引导的视觉令…

NVLM – 英伟达推出的多模态大型语言模型

NVLM是什么 NVLM是NVIDIA推出的前沿多模态大型语言模型（LLMs），在视觉-语言任务上达到与顶尖专有模型（如GPT-4o）和开放访问模型（如Llama 3-V…

Promptriever – 信息检索模型，支持自然语言提示响应用户搜索需求

Promptriever是什么 Promptriever 是约翰斯·霍普金斯大学和Samaya AI联合推出的新型检索模型，能像语言模型一样接受自然语言提示，用直观的方式…

LongLLaVA – 香港中文大学推出的多模态上下文混合架构大语言模型

LongLLaVA是什么 LongLLaVA是的多模态大型语言模型（MLLM），是香港中文大学（深圳）的研究人员推出。基于混合架构，结合Mamba和Transformer…

Devika – 开源的AI编程工具，理解和执行复杂的人类指令

Devika 是什么 Devika是开源的AI编程工具，能理解并拆分复杂指令，基于集成AI搜索和网页浏览能力搜集信息，编写代码实现目标。Devika支持多种AI模型，具备…

iDP3 – 斯坦福大学联合多所高校推出的改进型3D视觉运动策略

iDP3是什么 iDP3（Improved 3D Diffusion Policy）是斯坦福大学联合多所高校推出的改进型3D视觉运动策略(如三维扩散策略)，提升人形机器人…

Proactive Agent – 清华联合面壁智能开源的新一代主动Agent交互范式

Proactive Agent是什么 Proactive Agent是清华大学联合面壁智能等团队推出的新一代主动Agent交互范式，具备主动性，能预测用户需求并在没有直…

EMOVA – 华为诺亚方舟联合多所高校共同推出的多模态全能处理模型

EMOVA是什么 EMOVA（EMotionally Omni-present Voice Assistant）是多模态全能模型，是香港科技大学、香港大学和华为诺亚方舟实…

OminiControl – AI图像生成框架，实现图像主题控制和空间精确控制

OminiControl是什么 OminiControl是高度通用且参数高效的图像生成框架，为扩散变换器模型如FLUX.1设计，实现对图像生成过程的精细控制。OminiC…

Talker-Reasoner – 谷歌DeepMind推出的双思维AI代理架构

Talker-Reasoner是什么 Talker-Reasoner是谷歌DeepMind推出的双思维AI代理架构，借鉴人类的认知理论，将代理分为两个模块：Talker和…

Diffusion Self-Distillation – 斯坦福大学推出的零样本定制图像生成技术

Diffusion Self-Distillation是什么 Diffusion Self-Distillation（扩散自蒸馏，简称DSD）是斯坦福大学吴佳俊团队推出的…

Open Materials 2024 – Meta 开源的大型开放数据集和配套预训练模型

Open Materials 2024是什么 Open Materials 2024 (OMat24) 是Meta推出的包含超过1.1亿个结构的密度泛函理论(DFT)计算…