GPT‑5.3‑Codex‑Spark – OpenAI推出的轻量级编程模型
GPT‑5.3‑Codex‑Spark是什么 GPT-5.3-Codex-Spark是OpenAI首个专为实时编程设计的轻量级模型,主打极致速度。模型运行在Cerebra…
DeepRant 鲸喷 – 专为游戏玩家设计的多语言快捷翻译开源工具
DeepRant 鲸喷是什么 DeepRant 鲸喷是专为游戏玩家设计的多语言快捷翻译工具。DeepRant能帮助玩家在国际服务器中快速进行文字交流,消除语言障碍。玩家在…
DeepRAG – 中科院、中科大和腾讯微信AI部联合推出的新型检索增强生成框架
DeepRAG是什么 DeepRAG 是中科院、中科大和腾讯微信AI部联合推出的新型检索增强生成(RAG)框架,提升大型语言模型(LLMs)在推理和检索任务中的性能。通过…
llmware – 专为企业级应用设计的开源统一框架
llmware是什么 llmware是为企业级应用设计的统一框架,适用于构建基于小型、专门化模型的RAG(Retrieval-Augmented Generation)流…
T2A-01-HD – 海螺AI海外版推出新的语音模型
T2A-01-HD是什么 T2A-01-HD是海螺AI海外版推出新的语音模型。支持声音克隆,仅需10秒音频即可精准克隆声音,保留情感底色。模型具备智能情感系统,能捕捉语音…
NeuralSVG – 文本驱动矢量图形生成技术,转化为有层次结构的矢量图形
NeuralSVG是什么 NeuralSVG是创新的文本驱动矢量图形生成技术。通过一个小型的多层感知器网络,将文本提示转化为具有层次结构的矢量图形。该网络以形状索引为输入…
Co-Sight – 中兴通讯开源的超级智能体项目
Co-Sight是什么 Co-Sight是中兴通讯开源的超级智能体项目,为协同视觉分析平台及智能自动化底座。采用多智能体架构,构建“数字团队”协同体系,通过DAG任务引擎…
GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型
GPT‑5.4是什么 GPT-5.4是OpenAI推出的旗舰AI模型,定位为”专为专业工作设计的最强前沿模型”。模型首次将推理、编程、原生计算机操作、深度网页搜索和百万T…
VMix – 字节联合中科大推出增强模型生成美学质量的适配器
VMix是什么 VMix是创新的即插即用美学适配器,提升文本到图像扩散模型生成图像的美学质量。通过解耦输入文本提示中的内容描述和美学描述,将细粒度的美学标签(如色彩、光线…
AIOpsLab – 微软等机构共同开源的面向 AIOps 代理的综合 AI 框架
AIOpsLab是什么 AIOpsLab是微软公司、加州大学伯克利分校、伊利诺伊大学香槟分校、微软研究院等机构推出的,用在构建、评估和改进云服务运营管理AIOps代理的原…
GAS – 卡内基梅隆联合上海 AI Lab 等推出的单图生成3D人体框架
GAS是什么 GAS(Generative Avatar Synthesis from a Single Image)是卡内基梅隆大学、上海人工智能实验室和斯坦福大学的研…
RSIDiff – 基于合成数据提升图像生成质量的递归自训练框架
RSIDiff是什么 RSIDiff 是用于提升文本到图像扩散模型性能的递归自训练(RSI)框架。通过迭代优化模型,基于模型自身生成的数据进行训练,解决传统自训练中常见的…
StochSync – AI图像生成技术,为360°全景图和3D网格纹理生成高质量图像
StochSync是什么 StochSync(Stochastic Diffusion Synchronization)是创新的图像生成技术,专门用于在复杂空间(如360…
MnnLlmApp – 阿里巴巴开源的离线大模型 Android 手机应用AI助手
MnnLlmApp是什么 MnnLlmApp 是阿里巴巴基于 MNN-LLM 框架开源的 Android 手机应用,支持各类大语言模型(LLM)在手机上离线运行。具备多模…
GPT‑5.3 Instant – OpenAI 推出的轻量级对话模型
GPT‑5.3 Instant是什么 GPT‑5.3 Instant 是 OpenAI 推出的轻量级对话模型,专为优化日常聊天体验设计。模型显著改善”爱说教、太啰嗦”的机…
FilmAgent – 哈工大联合清华推出的AI电影自动化制作工具
FilmAgent是什么 FilmAgent是哈尔滨工业大学(深圳)的研究团队开发的基于多智能体协作框架的虚拟电影制作工具,通过自动化流程实现虚拟3D空间中的端到端电影制…
