讯飞星火X1 – 科大讯飞推出的首个全国产深度推理大模型
讯飞星火X1是什么 讯飞星火X1是科大讯飞于2025年1月15日发布的国内首个基于全国产算力平台训练的具备深度思考和推理能力的大模型。在解题过程中更接近人类的“慢思考”方…
Index-AniSora – B站开源的动漫视频生成模型
Index-AniSora是什么 Index-AniSora 是哔哩哔哩开源的先进动漫视频生成模型,模型支持一键生成多种动漫风格的视频,涵盖番剧片段、国创动画、VTube…
FacePoke – 开源的实时面部编辑工具,拖拽操作面部表情
FacePoke是什么 FacePoke是基于AI技术的开源实时面部编辑工具。用户基于简单的鼠标拖拽操作,对人物照片中的头部朝向(如抬头、低头、左右摇头)和面部表情(如眼…
StockMixer – 上海交大推出的股票价格预测架构
StockMixer是什么 StockMixer是上海交通大学推出的用在股票价格预测的多层感知器(MLP)架构,具备简单和强大的预测能力。架构基于指标混合、时间混合和股票…
EnerVerse – 智元机器人推出的首个机器人4D世界模型
EnerVerse是什么 EnerVerse 是智元机器人团队开发的首个机器人4D世界模型,通过生成未来具身空间来指导机器人完成复杂任务。模型采用自回归扩散模型,结合稀疏…
Collaborative Gym – 支持人与AI代理实时交互协作的评估框架
Collaborative Gym是什么 Collaborative Gym(Co-Gym)是专注于人机协作(Human-Agent Collaboration)的框架,…
TongGeometry – 北京通院联合北大AI研究院推出的几何模型
TongGeometry是什么 TongGeometry 是北京通用AI研究院和北京大学AI研究所联合推出的基于树搜索的几何模型,专门用在提出和解决奥林匹克级别的几何问题…
OpenManus – MetaGPT 团队推出的 Manus 开源复刻版
OpenManus是什么 OpenManus 是MetaGPT 团队推出的开源复刻版 Manus,提供无需邀请码的 AI Agent 。OpenManus基于模…
VisoMaster – AI换脸和编辑软件,支持图片和视频高质量换脸
VisoMaster是什么 VisoMaster 是基于 AI 技术的换脸和编辑软件,功能强大操作简便。支持图片、视频以及直播换脸,能生成自然逼真的换脸效果,应用于娱乐、…
GPT‑5.3‑Codex‑Spark – OpenAI推出的轻量级编程模型
GPT‑5.3‑Codex‑Spark是什么 GPT-5.3-Codex-Spark是OpenAI首个专为实时编程设计的轻量级模型,主打极致速度。模型运行在Cerebra…
EMAGE – 清华联合东大等机构推出的音频生成全身共语手势框架
EMAGE是什么 EMAGE(Expressive Masked Audio-conditioned GEsture modeling)是清华大学、东京大学、庆应义塾大学…
ARTalk – 东京大学等机构推出的3D头部动画生成框架
ARTalk是什么 ARTalk是东京大学和日本理化学研究所推出的新型语音驱动3D头部动画生成框架,基于自回归模型实现实时、高同步性的唇部动作和自然的面部表情及头部姿势生…
Qwen2.5-Max – 阿里通义千问推出的MoE模型
Qwen2.5-Max是什么 Qwen2.5-Max是阿里云推出的超大规模MoE(Mixture of Experts)模型,使用超过20万亿tokens的预训练数据。模…
LineArt – 吉林大学等机构推出的设计绘图外观迁移框架
LineArt是什么 LineArt是吉林大学、瑞典皇家理工学院、东京工业大学等机构推出的,无需训练的高质量设计绘图外观迁移框架,能将复杂外观特征转移到详细的设计图纸上,…
Open-LLM-VTuber – AI数字人语音交互项目,支持实时语音对话和视觉感知
Open-LLM-VTuber是什么 Open-LLM-VTuber 是开源的跨平台语音交互 AI 伴侣项目。支持实时语音对话、视觉感知,配备生动的 Live2D 动态形…
星火语音同传大模型 – 科大讯飞推出的端到端语音同传大模型
星火语音同传大模型是什么 星火语音同传大模型是科大讯飞于2025年1月15日发布的国内首个具备端到端语音同传能力的大模型。模型在内容完整度、信息准确度以及语言质量上均处于…
