站外新闻 – 第 112 页 – Prompt 语宙

站外新闻

5090 .

ConsisID – 北大联合鹏城实验室等机构推出的文本到视频生成模型

ConsisID是什么 ConsisID是北京大学和鹏城实验室等机构推出的文本到视频（Text-to-Video, IPT2V）生成模型，基于频率分解技术保持视频中人物身…

Perplexideez – 开源本地AI搜索助手，智能搜索信息来源追溯

Perplexideez是什么 Perplexideez是本地AI助手，支持用户在网络和自托管应用中快速搜索信息。Perplexideez项目以Postgres数据库为基…

Micro LLAMA – 教学版 LLAMA 3模型实现，用于学习大模型的核心原理

Micro LLAMA是什么 Micro LLAMA是精简的教学版LLAMA 3模型实现，能帮助学习者理解大型语言模型架构。整个项目仅约180行代码，便于理解和学习。Mi…

GenCast – 谷歌DeepMind推出的AI气象预测模型

GenCast是什么 GenCast是DeepMind推出的革命性AI气象预测模型，基于扩散模型技术，提供长达15天的全球天气预报。GenCast在97.2%的预测任务中…

FullStack Bench – 字节豆包联合M-A-P社区开源的全新代码评估基准

FullStack Bench是什么 FullStack Bench是字节跳动豆包大模型团队与M-A-P社区联合推出的全新代码评估基准，专注于全栈编程和多语言编程能力评估…

Motion Prompting – 谷歌联合密歇根和布朗大学推出的运动轨迹控制视频生成模型

Motion Prompting是什么 Motion Prompting是 Google DeepMind、密歇根大学和布朗大学联合推出的视频生成技术，基于运动轨迹（mo…

Fish Speech 1.5 – Fish Audio 推出的语音合成模型，支持13种语言

Fish Speech 1.5是什么 Fish Speech 1.5 是Fish Audio 推出的文本到语音（TTS）模型，基于深度学习技术如Transformer、V…

ClearerVoice-Studio – 阿里通义实验室开源的语音处理框架

ClearerVoice-Studio是什么 ClearerVoice-Studio 是阿里巴巴达摩院通义实验室开源的语音处理框架，集成语音增强、分离和音视频说话人提取等…

PaliGemma 2 – 谷歌DeepMind推出的全新视觉语言模型

PaliGemma 2是什么 PaliGemma 2是Google DeepMind基于Gemma 2语言模型家族推出的新一代视觉语言模型（VLM），作为PaliGemm…

Optimus-1 – 哈工大联合鹏城实验室推出的智能体框架

Optimus-1是什么 Optimus-1是哈尔滨工业大学（深圳）和鹏城实验室推出的智能体框架，能解决在开放世界环境中完成长期任务的挑战。框架结合结构化知识和多模态经验…

Fox-1 – TensorOpera 开源的小语言模型系列

Fox-1是什么 Fox-1是TensorOpera推出的一系列小型语言模型（SLMs），包括Fox-1-1.6B和Fox-1-1.6B-Instruct-v0.1。Fo…

Llama 3.3 – Meta AI推出的纯文本语言模型

Llama 3.3是什么 Llama 3.3是Meta AI推出的70B 参数模型，大型多语言预训练语言模型，性能与40B参数的Llama 3.1相当。模型专为多语言对话…

Aurora – xAI为Grok AI助手推出的新图像生成模型

Aurora是什么 Aurora是xAI为AI助手Grok新增的图像生成模型。Aurora擅长创建逼真的图像，擅长人物肖像。Aurora能生成包括公共和版权人物在内的图像…

One Shot, One Talk – 中科大联合香港理工推出的动态图像生成技术

One Shot, One Talk是什么 One Shot, One Talk是先进的图像生成技术，能从单张图片中生成具有个性化细节的全身动态说话头像，支持逼真的动画效…

GLM-4V-Flash – 智谱 AI 推出的首个免费多模态模型API

GLM-4V-Flash是什么 GLM-4V-Flash 是智谱AI推出的首个免费多模态模型API，GLM-4V-Flash 模型拥有图像描述生成、图像分类、视觉推理、视…

clone-voice – 开源的声音克隆工具，支持16种语言

clone-voice是什么 Clone-voice是开源的声音克隆工具，基于深度学习技术分析和模拟人类声音，实现声音的高质量克隆。工具支持包括中文、英文、日语、韩语等在…