站外新闻 – 第 124 页 – Prompt 语宙

站外新闻

5047 .

Bark – Suno AI 推出的开源文本到音频模型

Bark是什么 Bark是Suno AI 推出的开源文本到音频模型，能生成逼真的多语言语音和多种音频类型，包括音乐、背景噪音等，同时支持非语言交流如笑声和哭泣。Bark提…

Yi-Coder – 零一万物开源的AI编程助手模型，提供1.5B和9B两种参数

Yi-Coder是什么 Yi-Coder是零一万物推出的开源AI编程助手系列模型，专为提升代码生成、理解、调试和补全等任务的效率而设计。Yi-Coder系列模型包含1.5…

Hallo – 复旦百度等开源的AI对口型肖像视频生成框架

Hallo是什么 Hallo是由复旦大学、百度公司、苏黎世联邦理工学院和南京大学的研究人员共同提出的一个AI对口型肖像图像动画技术，可基于语音音频输入来驱动生成逼真且动态…

Make-A-Character：阿里开源的AI 3D数字人生成框架

Make-A-Character是什么？ Make-A-Character（简称Mach）是一个由阿里巴巴集团智能计算研究院开发的一个人工智能3D数字人生成框架，旨在通过…

豆包视觉理解模型 – 豆包推出视觉理解模型，具备识别和推理能力

豆包视觉理解模型是什么豆包视觉理解模型是豆包推出的先进AI大模型，具备视觉识别和理解推理能力。豆包视觉理解模型具备强大的视觉定位能力，支持多目标、小目标及通用目标的框定…

FancyVideo – 360推出的AI文生视频模型

FancyVideo是什么 FancyVideo是360联合中山大学推出的AI文生视频模型。基于创新的跨帧文本引导模块（Cross-frame Textual Guida…

XVERSE-MoE-A36B – 元象开源的国内最大MoE模型，推理性能提升100%

XVERSE-MoE-A36B是什么 XVERSE-MoE-A36B是由元象推出的中国最大的MoE（Mixture of Experts，混合专家模型）开源大模型。模型具…

Mora – 微软等推出的可生成12秒视频的多AI智能体框架

Mora是什么 Mora是由来自微软和理海大学的研究人员推出的一个多智能体（AI Agents）框架，专门用于通用视频生成任务，目标是模拟并扩展OpenAI的Sora视频…

eSearch – 开源的AI桌面应用，截屏、OCR、搜索、翻译、录屏

eSearch是什么 eSearch是一款开源的跨平台AI桌面应用，集成了截屏、OCR识别、搜索翻译、贴图、以图搜图和屏幕录制等功能。eSearch基于Electron框…

Grok 4.5 – SpaceXAI推出的新一代旗舰大语言模型

Grok 4.5是什么 Grok 4.5是SpaceXAI（原xAI）推出的新一代旗舰大语言模型，基于1.5万亿参数V9基础架构。模型在补充训练阶段深度整合Cursor编…

VideoGameBunny – 专为视频游戏设计的开源多模态大模型

VideoGameBunny是什么 VideoGameBunny（VGB）是一个专为视频游戏设计的开源大型多模态模型，由加拿大阿尔伯塔大学研究团队开发。它能理解和生成多种…

Unique3D – 清华大学团队开源的图像到3D生成模型

Unique3D是什么 Unique3D是清华大学团队开源的一个单张图像到3D模型转换的框架，通过结合多视图扩散模型和法线扩散模型，以及一种高效的多级上采样策略，能够从单…

MotionCtrl – 腾讯等推出的视频生成模型的运动控制器

MotionCtrl是什么 MotionCtrl是由来自腾讯、香港大学、上海AI实验室、清华大学、广东工业大学等机构的研究人员推出的一个为视频生成模型设计的统一且灵活的运…

亚马逊被爆开发AI智能体“Moonraker”:Alexa将支持多步复杂任务串联

据科技媒体爆料，亚马逊正在秘密推进一项代号为“Moonraker”的先进人工智能智能体（AI Agent）项目，旨在赋予智能语音助手 Alexa 串联执行复杂任务的能力。…

全息流体渐变通用占位特色图

AI”按量计费”吓退企业高管：近三分之一承认不懂经济账，算力账单成了黑箱

据外媒The Register报道，"四大"会计师事务所毕马威的一项最新调查显示，不少企业高管正被AI新的按量计费模式"吓"到。过去企业可以通过固定价格合同让AI公司补贴…

豆包3D生成模型 – 豆包推出3D生成模型，自然语言交互实时生成3D场景图

豆包3D生成模型是什么豆包3D生成模型是豆包推出的3D生成模型，属于豆包大模型家族。模型基于3D-DiT 架构，能生成高质量 3D 模块。与火山引擎数字孪生平台 veO…