GeneralDyG – 南洋理工推出的通用动态图异常检测方法
GeneralDyG是什么 GeneralDyG 是南洋理工大学研究团队提出的通用动态图异常检测方法,解决动态图数据在社交网络、电商和网络安全等领域的异常检测问题。通过时…
GPT‑5.3‑Codex‑Spark – OpenAI推出的轻量级编程模型
GPT‑5.3‑Codex‑Spark是什么 GPT-5.3-Codex-Spark是OpenAI首个专为实时编程设计的轻量级模型,主打极致速度。模型运行在Cerebra…
MMedAgent – 专为医疗领域设计的多模态AI智能体,管理多种医疗任务
MMedAgent是什么 MMedAgent是专为医疗领域设计的多模态AI智能体,通过整合各种开源医疗模型来管理多种医疗任务。系统包括一个指令调整的多模态大型语言模型(M…
OpenHands – AI编程工具,多智能体协作实现代码编写、命令运行等
OpenHands是什么 OpenHands是AI编程工具,支持多智能体协作提高开发效率,减少开发者的编码工作量。OpenHands基于编写代码、与命令行交互和浏览网页等…
GPT‑5.3 Instant – OpenAI 推出的轻量级对话模型
GPT‑5.3 Instant是什么 GPT‑5.3 Instant 是 OpenAI 推出的轻量级对话模型,专为优化日常聊天体验设计。模型显著改善”爱说教、太啰嗦”的机…
Hallo3 – 复旦联合百度开源的高动态与真实感肖像动画生成框架
Hallo3是什么 Hallo3是复旦大学和百度公司联合推出的,基于扩散变换器网络(Diffusion Transformer Networks)的肖像图像动画技术,能生…
清华联手智谱推出IndexCache:稀疏注意力加速技术,长上下文推理提速近2倍,零性能损失
💡 站外导读:随着大模型上下文窗口迈向百万Token时代,超长文本的处理效率成为AI落地的核心瓶颈。传统稀疏注意力(DSA)中的索引器,在200K上下文下竟占据高达81%…
VITRON – Skywork AI 联合新加坡国立、南洋理工推出的像素级视觉大型语言模型
VITRON是什么 VITRON是Skywork AI、新加坡国立大学和南洋理工大学联合推出的像素级视觉大型语言模型(LLM),能全面理解和处理静态图像与动态视频,对图像…
VideoAnydoor – 港大联合阿里达摩院等机构推出的零样本视频对象插入框架
VideoAnydoor是什么 VideoAnydoor是香港大学、阿里巴巴集团达摩院、湖畔实验室、华中科技大学联合推出的零样本的视频对象插入框架,能将特定对象以高保真度…
GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型
GPT‑5.4是什么 GPT-5.4是OpenAI推出的旗舰AI模型,定位为”专为专业工作设计的最强前沿模型”。模型首次将推理、编程、原生计算机操作、深度网页搜索和百万T…
rStar-Math – 微软推出的小模型复杂推理与自进化SLMs的创新技术
rStar-Math是什么 rStar-Math是微软亚洲研究院推出的创新研究项目,基于蒙特卡洛树搜索(MCTS)驱动的深度思考,使小型语言模型(SLMs)在数学推理方面…
GPT‑5.3 Instant – OpenAI 推出的轻量级对话模型
GPT‑5.3 Instant是什么 GPT‑5.3 Instant 是 OpenAI 推出的轻量级对话模型,专为优化日常聊天体验设计。模型显著改善”爱说教、太啰嗦”的机…
n8n – 开源工作流自动化平台,支持400多个应用程序、拖放创建复杂工作流
n8n是什么 n8n 是开源的低代码AI工作流自动化工具,基于 Node.js 构建,通过可视化界面让用户能轻松地通过拖拽节点构建自动化流程,每个节点代表一个操作或触发器…
PersonaMagic – 高保真人脸定制技术,根据肖像无缝生成新角色
PersonaMagic是什么 PersonaMagic 是创新的高保真人脸定制技术,通过阶段调节的文本条件策略实现个性化图像生成。基于简单多层感知机(MLP)网络学习一…
Ming‑Flash‑Omni 2.0 – 蚂蚁开源的全模态大模型
Ming-flash-omni-2.0是什么 Ming-flash-omni-2.0是蚂蚁集团开源的全模态大模型,采用100B总参数/6B激活参数的MoE架构。作为业界S…
