rStar-Math – 微软推出的小模型复杂推理与自进化SLMs的创新技术
rStar-Math是什么 rStar-Math是微软亚洲研究院推出的创新研究项目,基于蒙特卡洛树搜索(MCTS)驱动的深度思考,使小型语言模型(SLMs)在数学推理方面…
GPT‑5.3 Instant – OpenAI 推出的轻量级对话模型
GPT‑5.3 Instant是什么 GPT‑5.3 Instant 是 OpenAI 推出的轻量级对话模型,专为优化日常聊天体验设计。模型显著改善”爱说教、太啰嗦”的机…
n8n – 开源工作流自动化平台,支持400多个应用程序、拖放创建复杂工作流
n8n是什么 n8n 是开源的低代码AI工作流自动化工具,基于 Node.js 构建,通过可视化界面让用户能轻松地通过拖拽节点构建自动化流程,每个节点代表一个操作或触发器…
PersonaMagic – 高保真人脸定制技术,根据肖像无缝生成新角色
PersonaMagic是什么 PersonaMagic 是创新的高保真人脸定制技术,通过阶段调节的文本条件策略实现个性化图像生成。基于简单多层感知机(MLP)网络学习一…
Ming‑Flash‑Omni 2.0 – 蚂蚁开源的全模态大模型
Ming-flash-omni-2.0是什么 Ming-flash-omni-2.0是蚂蚁集团开源的全模态大模型,采用100B总参数/6B激活参数的MoE架构。作为业界S…
SPAR3D – Stability AI等机构推出的单试图重建 3D 网络模型
SPAR3D是什么 SPAR3D是Stability AI和伊利诺伊大学香槟分校推出的,先进的单图生成3D模型方法,能从单张图像中高效重建出高质量的3D对象。SPAR3D…
GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型
GPT‑5.4是什么 GPT-5.4是OpenAI推出的旗舰AI模型,定位为”专为专业工作设计的最强前沿模型”。模型首次将推理、编程、原生计算机操作、深度网页搜索和百万T…
SoulChat2.0 – 华南理工大学推出的心理咨询师数字孪生大语言模型
SoulChat2.0是什么 SoulChat2.0是华南理工大学未来技术学院-广东省数字孪生人重点实验室基于SoulChat1.0模型推出的心理咨询师数字孪生大语言模型…
InstructMove – 东京大学联合 Adobe 推出基于指令的图像编辑模型
InstructMove是什么 InstructMove是东京大学和Adobe公司联合推出的基于指令的图像编辑模型,通过观察视频中的帧对变化学习如何根据指令进行图像操作。…
GPT‑5.3‑Codex‑Spark – OpenAI推出的轻量级编程模型
GPT‑5.3‑Codex‑Spark是什么 GPT-5.3-Codex-Spark是OpenAI首个专为实时编程设计的轻量级模型,主打极致速度。模型运行在Cerebra…
Search-o1 – 人大联合清华推出自主知识检索增强的推理框架
Search-o1是什么 Search-o1是中国人民大学和清华大学推出的创新框架,能提升大型推理模型(LRMs)在面对复杂问题时的推理能力。基于整合代理检索增强生成(R…
Ming‑Flash‑Omni 2.0 – 蚂蚁开源的全模态大模型
Ming-flash-omni-2.0是什么 Ming-flash-omni-2.0是蚂蚁集团开源的全模态大模型,采用100B总参数/6B激活参数的MoE架构。作为业界S…
SAC-KG – 通用知识图谱构建框架,能构建超百万节点的领域知识图谱
SAC-KG是什么 SAC-KG是基于大型语言模型(LLMs)自动构建领域知识图谱的通用框架。由生成器、验证器和剪枝器三个主要组件构成,能自动从原始领域语料库中生成特定领…
LatentSync – 字节联合北交大开源的端到端唇形同步框架
LatentSync是什么 LatentSync是字节跳动、北京交通大学联合推出的端到端唇形同步框架,基于音频条件的潜在扩散模型,无需任何中间的3D表示或2D特征点。La…
WebWalker – 阿里推出用于评估LLMs在网页浏览任务中性能的基准工具
WebWalker是什么 WebWalker是阿里巴巴自然语言处理团队开发的用于评估和提升大型语言模型(LLMs)在网页浏览任务中性能的工具。通过模拟网页导航任务,帮助模…
ConceptMaster – 高保真多概念视频定制生成的创新 AI 框架
ConceptMaster是什么 ConceptMaster是用于多概念视频定制的创新框架,能在无需测试时调优的情况下,在扩散Transformer模型上生成高质量且概念…
