Zonos – ZyphraAI 开源的多语言 TTS 模型
Zonos是什么 Zonos是Zyphra推出的高保真文本到语音(TTS)模型。Zonos包含两个模型:16亿参数的Transformer模型和SSM混合模型,均在Apa…
GPT‑5.3 Instant – OpenAI 推出的轻量级对话模型
GPT‑5.3 Instant是什么 GPT‑5.3 Instant 是 OpenAI 推出的轻量级对话模型,专为优化日常聊天体验设计。模型显著改善”爱说教、太啰嗦”的机…
BlockDance – 复旦联合字节推出的扩散模型加速方法
BlockDance是什么 BlockDance 是复旦大学联合字节跳动智能创作团队推出的用在加速扩散模型的新方法。BlockDance 基于识别重用相邻时间步中结构相似…
Lumina-Image 2.0 – 上海 AI Lab 开源的统一图像生成模型
Lumina-Image 2.0是什么 Lumina-Image 2.0 是开源的高效统一图像生成模型,参数量为26亿,基于扩散模型和Transformer架构。在图像生…
SeniorTalk – 智源联合南开开源的超高龄老年人中文对话语音数据集
SeniorTalk是什么 SeniorTalk 是智源研究院联合南开大学计算机学院人类语言技术实验室(HLT Lab)推出的全球首个中文超高龄老年人对话语音数据集。数据…
CogView4 – 智谱开源的AI文生图模型,支持生成汉字
CogView4是什么 CogView4 是智谱推出的开源文生图模型,具有60亿参数,支持原生中文输入和中文文字生成。模型在 DPG-Bench 基准测试中综合评分排名第…
OpenAI o3-mini – OpenAI 推出的全新推理模型
OpenAI o3-mini是什么 OpenAI o3-mini是OpenAI正式发布的全新推理模型。是OpenAI推理系列中最新、成本效益最高的模型,专为科学、数学和编…
书生·浦像 – 上海AI Lab 联合港中文和浙大推出的超高动态成像算法
书生·浦像是什么 书生·浦像是上海人工智能实验室联合香港中文大学、浙江大学等机构研发的超高动态成像算法,核心为浦像HDR(UltraFusion HDR)。算法结合了AI…
I2V3D – 香港城市大学联合微软推出的图像到视频生成框架
I2V3D是什么 I2V3D是香港城市大学和微软 GenAI创新的图像到视频生成框架,支持将静态图像转换为动态视频,基于3D几何引导实现精确的动画控制。I2V3D结合传统…
Luma Ray2 – Luma AI 推出的最新视频生成模型
Luma Ray2是什么 Luma Ray2 是 Luma AI 推出的最新视频生成模型,Ray2 基于 Luma 新的多模态架构训练后展现出先进功能,该架构的计算能力是…
Ming‑Flash‑Omni 2.0 – 蚂蚁开源的全模态大模型
Ming-flash-omni-2.0是什么 Ming-flash-omni-2.0是蚂蚁集团开源的全模态大模型,采用100B总参数/6B激活参数的MoE架构。作为业界S…
DreamFit – 字节联合清华和中山大学推出的虚拟试衣框架
DreamFit是什么 DreamFit是字节跳动团队联合清华大学深圳国际研究生院、中山大学深圳校区推出的虚拟试衣框架,专门用在轻量级服装为中心的人类图像生成。框架能显著…
cpmGO – 面壁智能推出的首个纯端侧汽车智能助手
cpmGO是什么 cpmGO (小钢炮超级助手)是面壁智能推出的全球首个纯端侧智能助手,专为汽车智能座舱设计。cpmGO 基于面壁小钢炮MiniCPM 端侧模型开发,具备…
OctoTools – 斯坦福推出解决复杂推理任务的开源智能体框架
OctoTools是什么 OctoTools 是斯坦福大学推出的开源智能体框架,基于可扩展的工具解决复杂的推理任务。OctoTools用标准化的工具卡片(tool car…
万相2.1 – 通义万相最新推出的视频生成模型
万相2.1是什么 万相2.1是阿里推出的通义万相升级版本。基于自研的高效VAE和DiT架构,增强时空上下文建模能力,支持无限长1080P视频的高效编解码,首次实现中文文字…
FoloUp – 开源AI语音面试平台,自动生成定制化面试问题
FoloUp是什么 FoloUp 是开源的AI语音面试平台,能帮助企业高效地进行招聘面试。FoloUp能根据职位描述自动生成定制化的面试问题,基于AI技术与候选人进行自然…
