站外新闻 – 第 132 页 – Prompt 语宙

站外新闻

4997 .

StyleStudio – 文本驱动的风格迁移模型，能将参考图像的风格与文本提示内容融合

StyleStudio是什么 StyleStudio是西湖大学AI实验室、复旦大学、南洋理工大学和香港科技大学（广州）联合推出的，文本驱动的风格迁移模型，能将参考图像的风…

MetaHuman-Stream – 实时交互流式AI数字人技术

MetaHuman-Stream是什么 MetaHuman-Stream 是一项前沿的实时交互流式AI数字人技术，集成了 ERNerf、MuseTalk、Wav2lip …

Bolt․new – AI全栈 Web 编程工具，自动写代码、运行、部署

Bolt․new是什么 Bolt․new 是一个AI全栈 Web 编程工具，自动编写代码、运行、编辑和部署应用程序。Bolt․new依托于 WebContainers 技…

M2UGen – 腾讯联合国立大学推出多模态音乐理解和生成框架

M2UGen是什么 M2UGen是先进的多模态音乐理解和生成框架，由腾讯PCG ARC实验室与新加坡国立大学联合推出。结合了大型语言模型（LLM）的能力，能处理包括文本、…

Parler-TTS – Hugging Face开源的文本转语音模型

Parler-TTS是什么 Parler-TTS是由Hugging Face推出的一款开源的文本到语音（TTS）模型，能够通过输入提示描述模仿特定说话者的风格（性别、音调…

CogView-3-Plus – 智谱AI最新推出的AI文生图模型，媲美 MJ-V6 和 FLUX

CogView-3-Plus是什么 CogView-3-Plus是智谱AI最新推出的AI文生图模型，采用Transformer架构替代传统UNet，优化了扩散模型的噪声规…

百度智能云一见 – 百度推出的AI视觉大模型平台

百度智能云一见是什么百度智能云一见是百度智能云推出的视觉大模型平台，旨在基于领先的视觉大模型技术和丰富的场景化算法方案，实现专业级视觉AI应用的平民化。平台打通从模型生…

MLE-Agent – 工程师的AI智能助手，自动创建基线模型

MLE-Agent是什么 MLE-Agent 是一款专为机器学习工程师和研究人员设计的智能助手，通过自动化基线创建、集成最新研究资源、智能调试、文件系统和工具集成，以及交…

Chameleon – Meta推出的图文混合多模态开源模型

Chameleon是什么 Chameleon 是 Meta（Facebook 的母公司）的人工智能研究团队 FAIR（Facebook AI Research）发布的一个…

MMMLU – OpenAI推出的多语言大规模多任务语言理解数据集

MMMLU是什么 MMMLU（多语言大规模多任务语言理解）是OpenAI推出的一个开源数据集，为评估和提升人工智能模型在不同语言、认知和文化背景下的性能而设计。MMMLU…

RWKV-7 – RWKV系列的最新大模型架构版本，有强大的上下文学习能力

RWKV-7是什么 RWKV-7是RWKV系列的最新大模型架构版本，超越了传统的attention和linear attention范式，具有更灵活的状态演化能力，能在相…

Half_illustration – 基于Flux.1 的LoRA模型，让照片秒变艺术大片

Half_illustration是什么 Half_illustration是一个基于Flux.1模型的LoRA图像创意模型，融合了摄影写实与插画艺术的元素，创造出独特的…

ChatMLX – 高性能MacOS聊天应用，基于MLX框架实现与数据实时交互

ChatMLX是什么 ChatMLX是一个基于大型语言模型（LLM）的高性能MacOS聊天应用，基于MLX框架实现与数据的交互。应用通过自然语言处理技术，让用户与数据进行…

Nemotron-Mini-4B-Instruct – 英伟达推出的开源小型语言模型

Nemotron-Mini-4B-Instruct是什么 Nemotron-Mini-4B-Instruct是英伟达推出的一款开源小型语言模型，专为角色扮演、检索增强生成…

VASA-1 – 微软推出的静态照片对口型视频生成框架

VASA-1是什么 VASA-1是由微软亚洲研究院提出的一个将静态照片转换为对口型动态视频的生成框架，能够根据单张静态人脸照片和一段语音音频，实时生成逼真的3D说话面部动…

GLM-4V-Plus – 智谱AI最新推出的多模态AI模型，专注图像和视频理解

GLM-4V-Plus是什么 GLM-4V-Plus是智谱AI最新推出的多模态AI模型，专注于图像和视频理解。GLM-4V-Plus不仅能够精确分析静态图像，还具备动态视…