gpt-4o-transcribe – OpenAI 推出的语音转文本模型
gpt-4o-transcribe是什么 gpt-4o-transcribe是 OpenAI 推出的高性能语音转文本模型。基于最新的语音模型架构,用海量多样化音频数据训练…
风宇 – 中国气象局联合华为和南昌大学推出的空间天气大模型
风宇是什么 风宇是中国气象局联合南昌大学和华为共同推出的全球首个全链式空间天气大模型。模型基于创新的链式训练结构,结合卫星观测数据与数值模式数据,实现太阳风、磁层和电离层…
Sketch2Anim – 爱丁堡大学等机构推出的2D草图转3D动画框架
Sketch2Anim是什么 Sketch2Anim 是爱丁堡大学联合Snap Research、东北大学推出的自动化框架,能将2D草图故事板直接转换为高质量的3D动画。…
DeepSeek-GRM – DeepSeek 联合清华推出的通用奖励模型
DeepSeek-GRM是什么 DeepSeek-GRM是DeepSeek和清华大学研究者共同提出的通用奖励模型(Generalist Reward Modeling)。…
MAGI-1 – Sand AI 开源的首个自回归视频生成模型
MAGI-1是什么 MAGI-1 是 Sand AI 开源的全球首个自回归视频生成大模型,采用自回归架构,通过逐块预测视频序列生成流畅自然的视频,支持无限扩展和一镜到底的…
Botgroup.chat – 开源的AI机器人群聊项目,支持多个AI模型群聊对话
Botgroup.chat是什么 Botgroup.chat 是基于 React 和 Cloudflare Pages 的多人 AI 聊天应用。支持多个 AI 角色同时参…
HunyuanCustom – 腾讯混元开源的多模态定制视频生成框架
HunyuanCustom是什么 HunyuanCustom是腾讯混元团队推出的多模态驱动的定制化视频生成框架。HunyuanCustom支持图像、音频、视频和文本等多种…
DistilQwen2.5-R1 – 阿里推出的小型系列深度推理模型
DistilQwen2.5-R1是什么 DistilQwen2.5-R1 是阿里巴巴推出的基于知识蒸馏技术的小型化系列深度推理模型,包含3B、7B、14B和32B四个参数…
FlexIP – 腾讯推出的个性化图像生成编辑框架
FlexIP是什么 FlexIP 是腾讯提出的面向图像合成的灵活主体属性编辑框架,平衡图像生成中的身份保持和个性化编辑。框架采用双适配器架构,将身份保持与个性化编辑解耦,…
SpatialVLA – 上海 AI Lab 联合上科大等推出的空间具身通用操作模型
SpatialVLA是什么 SpatialVLA 是上海 AI Lab、中国电信人工智能研究院和上海科技大学等机构共同推出的新型空间具身通用操作模型,基于百万真实数据预训…
GPT-4o mini TTS – OpenAI 推出的文本转语音模型
GPT-4o mini TTS是什么 GPT-4o mini TTS 是 OpenAI 推出的轻量级文本转语音模型,支持将文本内容转换为自然流畅语音的同时,开发者能用指令…
RepText – Liblib AI联合Shakker Labs推出的多语言视觉文本渲染框架
RepText是什么 RepText 是Shakker Labs 和 Liblib AI推出的多语言视觉文本渲染框架,基于复制字形而非理解文本内容实现高质量的文本渲染。框…
Pixel3DMM – 慕尼黑联合伦敦大学等推出的3D人脸重建框架
Pixel3DMM是什么 Pixel3DMM是慕尼黑工业大学、伦敦大学学院和Synthesia联合推出的单图像3D人脸重建框架。框架基于DINO基础模型,引入专门的预测头…
OlympicArena – 上海交大联合 AI Lab 等推出的多学科认知推理基准测试框架
OlympicArena是什么 OlympicArena是上海交通大学、上海AI Lab、苏州大学和上海交通大学生成式人工智能实验室(GAIR Lab)联合推出的多学科认…
WriteHERE – 开源的AI长文写作框架,单次生成超长文本
WriteHERE是什么 WriteHERE是Jürgen Schmidhuber领衔的团队开源的AI长文写作框架。WriteHERE基于异质递归规划(Heterogen…
MT-TransformerEngine – 摩尔线程开源的高效训练与推理优化框架
MT-TransformerEngine是什么 MT-TransformerEngine 是摩尔线程开源的高效训练与推理优化框架,专为 Transformer 模型设计。…
