Granite 4.0 Tiny Preview – IBM推出的语言模型
Granite 4.0 Tiny Preview是什么 Granite 4.0 Tiny Preview 是 IBM 推出的 Granite 4.0 语言模型家族中最小的…
Video-T1 – 清华联合腾讯推出的视频生成技术
Video-T1是什么 Video-T1 是清华大学和腾讯的研究人员共同推出的视频生成技术,基于测试时扩展(Test-Time Scaling,TTS)提升视频生成的质量…
Animate Anyone 2 – 阿里通义推出的高保真角色图像动画生成技术
Animate Anyone 2是什么 Animate Anyone 2 是阿里巴巴集团通义实验室推出的高保真角色图像动画生成技术,通过结合环境信息生成更具真实感的角色动…
LocAgent – 斯坦福联合耶鲁大学等机构推出的代码问题定位智能体
LocAgent是什么 LocAgent是斯坦福大学、耶鲁大学和南加州大学等机构联合推出的,专注于代码定位任务的框架,帮助开发者快速准确地找到代码库中需要修改的部分。Lo…
NotaGen – 中央音乐学院联合北航、清华等推出的音乐生成模型
NotaGen是什么 NotaGen 是中央音乐学院、北京航空航天大学、清华大学等机构推出的音乐生成模型,基于模仿大型语言模型(LLM)的训练范式生成高质量的古典乐谱。N…
BEHAVIOR Robot Suite – 李飞飞团队开源的机器人家庭任务自动化框架
BEHAVIOR Robot Suite是什么 BEHAVIOR Robot Suite(BRS)是斯坦福大学李飞飞团队推出的用在学习全身操作完成日常家务任务的框架。基于…
Multi-Speaker – AudioShake 推出的多说话人声分离模型
Multi-Speaker是什么 Multi-Speaker是AudioShake推出的全球首个高分辨率多说话人分离模型。支持将音频中的多个说话人精准分离到不同轨道,解决…
WebSSL – Meta联合纽约大学等机构推出的视觉自监督学习系列模型
WebSSL是什么 WebSSL(Web-scale Self-Supervised Learning)是Meta、纽约大学等机构推出的视觉自监督学习(SSL)系列模型,…
Magentic-UI – 微软开源的人机协作AI Agent研究原型
Magentic-UI是什么 Magentic-UI 是微软推出的开源研究原型,用在探索人类参与的 AI Agent系统。Magentic-UI 是以人为中心的AI Ag…
Amazon Nova Act – 亚马逊推出的通用 AI 智能体,自主执行网页任务
Amazon Nova Act是什么 Amazon Nova Act是亚马逊 AGI Labs推出的通用AI代理,用于在网页浏览器中执行任务。Amazon Nova Ac…
GPT-4.5 – OpenAI 推出的最强聊天模型
GPT-4.5是什么 GPT-4.5 是 OpenAI 推出的最新大型聊天模型,是目前规模最大、性能最强的聊天模型。基于扩展无监督学习,提升模式识别、知识广度和创意生成能…
LangFlow – AI应用构建工具,拖拽组件创建复杂工作流
LangFlow是什么 LangFlow 是低代码、可视化的 AI 应用构建工具,用于快速搭建和实验 LangChain 流水线。通过拖拽式界面,用户能轻松创建复杂的 A…
InstantCharacter – 腾讯混元开源的定制化图像生成插件
InstantCharacter是什么 InstantCharacter 是腾讯混元开源的定制化图像生成插件。基于扩散 Transformer(DiT)框架,引入可扩展的…
云原生应用管理再进化:Rainbond v6.9.0 正式发布,开启大模型私有化部署新纪元
近日,云原生应用管理平台Rainbond正式发布了 v6.9.0版本,通过重构架构与功能升级,将 AI 大模型私有化部署的能力直接赋予了企业用户,实现了从模型选型、一键部…
Indic Parler-TTS – 开源多语言TTS模型,专注于合成印度语和英语
Indic Parler-TTS是什么 Indic Parler-TTS 是 Hugging Face 和 AI4Bharat 团队合作推出的多语言文本到语音(TTS)模…
TrajectoryCrafter – 腾讯和港中文推出的单目视频自由运镜技术
TrajectoryCrafter是什么 TrajectoryCrafter 是腾讯PCG ARC Lab和香港中文大学推出的,用在单目视频的相机轨迹重定向方法,支持在后…
