GPT‑5.3‑Codex‑Spark – OpenAI推出的轻量级编程模型
GPT‑5.3‑Codex‑Spark是什么 GPT-5.3-Codex-Spark是OpenAI首个专为实时编程设计的轻量级模型,主打极致速度。模型运行在Cerebra…
TryOffAnyone – 将模特穿着服装的图像还原成平铺商品图的 AI 工具
TryOffAnyone是什么 TryOffAnyone是能将穿着服装的人物照片转换成平铺的服装展示图的AI工具。基于先进的Latent Diffusion Models…
PsycoLLM – 合肥工业大学推出的中文心理大语言模型
PsycoLLM是什么 PsycoLLM是合肥工业大学计算机科学与信息工程学院推出的中文心理大型语言模型,基于高质量的心理数据集训练,提升对心理健康问题的理解和评估能力。…
VideoChat-Flash – 上海 AI Lab 等机构推出针对长视频建模的多模态大模型
VideoChat-Flash是什么 VideoChat-Flash 是上海人工智能实验室和南京大学等机构联合开发的针对长视频建模的多模态大语言模型(MLLM),模型通过…
日日新融合大模型 – 商汤科技推出的原生融合模态大模型
日日新融合大模型是什么 “日日新”融合大模型(SenseNova)是商汤科技于2025年1月10日正式推出的多模态大模型。模型实现了原生融合模态,深度推理能力与多模态信息…
FastVLM – 苹果推出的高效视觉语言模型
FastVLM是什么 FastVLM是苹果推出的高效的视觉语言模型(VLM),能提升高分辨率图像处理的效率和性能。模型引入FastViTHD新型混合视觉编码器,有效减少视…
LongDocURL – 中科院联合淘天集团推出的多模态长文档理解基准数据集
LongDocURL是什么 LongDocURL是中国科学院自动化研究所和阿里巴巴淘宝天猫集团联合发布的多模态长文档理解基准数据集。专注于评估模型在处理长文档、复杂元素和…
Casevo – 中国传媒大学推出的开源社会传播模拟系统
Casevo是什么 Casevo(Cognitive Agents and Social Evolution Simulator)是中国传媒大学数据科学与智能媒体传播学院…
GPT‑5.3 Instant – OpenAI 推出的轻量级对话模型
GPT‑5.3 Instant是什么 GPT‑5.3 Instant 是 OpenAI 推出的轻量级对话模型,专为优化日常聊天体验设计。模型显著改善”爱说教、太啰嗦”的机…
EmoLLM – 专注于心理健康支持的大语言模型
EmoLLM是什么 EmoLLM 是专注于心理健康支持的大型语言模型,通过多模态情感理解为用户提供情绪辅导和心理支持。结合了文本、图像、视频等多种数据形式,基于先进的多视…
Agent Laboratory – AMD 联合约翰·霍普金斯大学推出的自主科研 Agent
Agent Laboratory是什么 Agent Laboratory是AMD和约翰·霍普金斯大学推出,基于大型语言模型(LLM)的自主研究框架,能加速科学发现、降低成…
Audio-SDS – NVIDIA推出的扩展文本条件音频扩散模型
Audio-SDS是什么 Audio-SDS是NVIDIA AI研究团队推出的创新技术,将Score Distillation Sampling(SDS)技术扩展至文本条…
DeepSeek Artifacts – Hugging Face推出的AI编程工具,基于DeepSeek V3
DeepSeek Artifacts是什么 DeepSeek Artifacts是Hugging Face推出的免费AI编程工具,能生成React和Tailwind CS…
NMT – 阿里联合 UC Berkeley 推出的多任务学习框架
NMT是什么 NMT(No More Tuning)是UC Berkeley和阿里巴巴集团联合推出的多任务学习框架,能解决多任务学习中不同任务优先级优化的问题。NMT将多…
GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型
GPT‑5.4是什么 GPT-5.4是OpenAI推出的旗舰AI模型,定位为”专为专业工作设计的最强前沿模型”。模型首次将推理、编程、原生计算机操作、深度网页搜索和百万T…
Step-Video V2 – 阶跃星辰推出的升级版视频生成模型
Step-Video V2是什么 Step-Video V2 是上海阶跃星辰智能科技发布的升级版视频生成模型。该版本在多个核心技术领域进行了优化和创新,采用了更高压缩比的…
