站外新闻 – 第 84 页 – Prompt 语宙

站外新闻

5195 .

FLUX.1 – Stable Diffusion创始团队推出的开源AI图像生成模型

# 克隆FLUX.1 GitHub仓库 git clone https://github.com/black-forest-labs/flux # 进入仓库目录 cd f…

Stable Fast 3D – Stability AI推出的AI新模型，0.5秒将图片转为3D

Stable Fast 3D是什么 Stable Fast 3D（SF3D）是Stability AI推出的一种创新3D网格重建技术，能在0.5秒内从单张图片生成高质量的…

Tora – 阿里推出的AI视频生成框架

Tora是什么 Tora是阿里推出的AI视频生成框架，基于轨迹导向的扩散变换器（DiT）技术，将文本、视觉和轨迹条件融合，生成高质量且符合物理世界动态的视频内容。Tora…

Whisper-Medusa – aiOla推出的开源AI语音识别模型

Whisper-Medusa是什么 Whisper-Medusa是aiOla推出的开源AI语音识别模型，结合了OpenAI的Whisper技术与aiOla的创新，Whis…

FoleyCrafter – 上海人工智能实验室推出的AI视频配音框架

FoleyCrafter是什么 FoleyCrafter是上海人工智能实验室和香港中文大学（深圳）共同推出的AI视频配音框架，FoleyCrafter能自动听出视频中的动…

MinerU – OpenDataLab推出的开源智能数据提取工具

MinerU是什么 MinerU是上海人工智能实验室OpenDataLab团队推出的开源智能数据提取工具，专注于复杂PDF文档的高效解析与提取。MinerU能将包含图片、…

CogVideoX – 智谱AI推出的开源AI视频生成模型

CogVideoX是什么 CogVideoX是智谱AI最新推出的开源AI视频生成模型，与智谱AI的商业产品“ 清影 ”同源。CogVideoX支持英文…

PhotoMaker V2 – 腾讯推出的AI图像生成框架

PhotoMaker V2是什么 PhotoMaker V2是腾讯推出的AI图像生成框架，能在极短的时间内生成逼真的人物照片。与初代相比，V2版本在角色的一致性和可控性上…

SEED-Story – 腾讯推出的多模态故事生成模型

SEED-Story是什么 SEED-Story是腾讯联合香港科技大学、香港中文大学推出的多模态故事生成模型。基于多模态大语言模型（MLLM），能预测文本和视觉token…

FlashFace – 阿里联合香港大学推出的高保真AI写真工具

FlashFace是什么 FlashFace是阿里联合香港大学推出的高保真AI写真工具。能基于用户提供的面部图像和文本提示，快速生成个性化的高保真人像写真图。FlashF…

EasyAnimate – 阿里推出的AI视频生成工具

EasyAnimate是什么 EasyAnimate是阿里推出的AI视频生成工具，支持文生视频和图生视频两种方式，用户可以上传图片作为视频的起始和结束画面，实现更灵活的视…

EmoTalk3D – 华为、复旦联合推出的3D数字人框架

EmoTalk3D是什么 EmoTalk3D是华为诺亚方舟实验室、南京大学和复旦大学共同推出的3D数字人框架。技术的核心在于能合成具有丰富情感表达的3D会说话头像。Emo…

SAM 2 – Meta推出的AI对象分割模型

SAM 2是什么 SAM 2（Segment Anything Model 2）是Meta推出的AI对象分割模型，专注于实时图像和视频对象分割。具备零样本泛化能力，能准确…

Wordware – 零代码构建AI Agent和应用的开发平台

Wordware是什么 Wordware 是一个集成开发环境（IDE），可以让任何人通过日常语言构建复杂的 AI Agent 和应用。用户无需编程知识，就能利用预构建的工…

Qwen2-Math – 阿里推出的数学专用开源AI模型

Qwen2-Math是什么 Qwen2-Math是阿里通义千问推出的基于Qwen2语言模型构建的数学解题专用开源AI模型，专为解决复杂数学问题设计。经过数学专用语料库的预…

Aide – 免费开源的AI 编程插件

Aide是什么 Aide 是免费开源的AI 编程插件，具备代码注释、语言转换、智能粘贴、批量处理、变量命名和自定义命令等功能，帮助开发者快速理解、编写和重构代码。Aide…