万相2.1 – 通义万相最新推出的视频生成模型
万相2.1是什么 万相2.1是阿里推出的通义万相升级版本。基于自研的高效VAE和DiT架构,增强时空上下文建模能力,支持无限长1080P视频的高效编解码,首次实现中文文字…
FoloUp – 开源AI语音面试平台,自动生成定制化面试问题
FoloUp是什么 FoloUp 是开源的AI语音面试平台,能帮助企业高效地进行招聘面试。FoloUp能根据职位描述自动生成定制化的面试问题,基于AI技术与候选人进行自然…
GLM-Z1-32B – 智谱开源的新一代推理模型
GLM-Z1-32B是什么 GLM-Z1-32B是智谱公司开源的新一代推理模型,具体参数版本为GLM-Z1-32B-0414 。GLM-Z1-32B基于 GLM-4-32…
OSUM – 西北工业大学开源的语音理解模型
OSUM是什么 OSUM(Open Speech Understanding Model)是西北工业大学计算机学院音频、语音与语言处理研究组推出的开源语音理解模型。OSU…
URO-Bench – AI基准测试工具,专为端到端语音对话模型设计
URO-Bench是什么 URO-Bench 是面向端到端语音对话模型(SDMs)的全面基准测试工具。涵盖了多语言、多轮对话、副语言信息等多维度任务,全面评估语音对话模型…
InspireMusic – 阿里通义实验室开源的音乐生成技术
InspireMusic是什么 InspireMusic 是阿里巴巴通义实验室开源的音乐生成技术,通过人工智能为用户生成高质量的音乐作品。基于多模态大模型技术,支持通过简…
GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型
GPT‑5.4是什么 GPT-5.4是OpenAI推出的旗舰AI模型,定位为”专为专业工作设计的最强前沿模型”。模型首次将推理、编程、原生计算机操作、深度网页搜索和百万T…
Reve Image – Reve 推出的全新 AI 图像生成模型
Reve Image是什么 Reve Image 是 Reve 推出的全新 AI 图像生成模型。专注于提升美学表现、精确的提示遵循能力以及出色的排版设计,能生成高质量的视…
GPT‑5.3 Instant – OpenAI 推出的轻量级对话模型
GPT‑5.3 Instant是什么 GPT‑5.3 Instant 是 OpenAI 推出的轻量级对话模型,专为优化日常聊天体验设计。模型显著改善”爱说教、太啰嗦”的机…
BEN2 – 自动从图像和视频中移除背景深度学习模型
BEN2是什么 BEN2(Background Erase Network 2)是Prama LLC开发的深度学习模型,专门用于从图像和视频中快速移除背景并提取前景。基于…
HiDream-I1 – 智象未来开源的AI图像生成模型
HiDream-I1是什么 HiDream-I1是 HiDream.ai 团队推出的开源AI图像生成模型,拥有17亿参数,采用MIT许可证。模型在图像生成质量、提示词遵循…
PRefLexOR – MIT 团队推出的新型自学习AI框架
PRefLexOR是什么 PRefLexOR(Preference-based Recursive Language Modeling for Exploratory O…
EICopilot – 百度推出基于AI智能体的企业信息搜索与探索工具
EICopilot是什么 EICopilot是百度研究院推出的基于AI智能体的企业信息搜索与探索工具。通过大型语言模型(LLM)驱动的智能体,帮助企业用户在大规模知识图谱…
DeepSeek R1-Zero – DeepSeek推出的开源推理模型,基于纯强化学习训练
DeepSeek R1-Zero是什么 DeepSeek R1-Zero 是 DeepSeek 团队开发的完全依赖纯强化学习(RL)训练的推理模型,未使用任何监督微调(S…
OpenBioMed – 清华AIR联合水木分子推出的开源Agent平台
OpenBioMed是什么 OpenBioMed 是清华大学智能产业研究院(AIR)和水木分子共同推出的开源平台,专注于 AI 驱动的生物医学研究。是多模态表征学习工具包…
RAIN – 视频流制作实时动画生成和真人表情移植解决方案
RAIN是什么 RAIN(Real-time Animation Of Infinite Video Stream)是创新的实时动画解决方案,基于消费级硬件,如单个RTX…
