OOMOL – 基于 VSCode 的 AI 工作流集成开发环境
OOMOL是什么 OOMOL (悟墨)是基于 VSCode 打造的现代化集成开发环境(IDE),专为工作流自动化而设计。通过拖拽式图形化界面,让用户能直观地搭建复杂的工作…
COMET – 字节开源的通信优化系统
COMET是什么 COMET是字节跳动推出的针对Mixture-of-Experts(MoE)模型的优化系统,能解决分布式训练中通信开销过大的问题。基于细粒度的计算-通信…
NoteLLM – 小红书推出的笔记推荐多模态大模型框架
NoteLLM是什么 NoteLLM 是小红书推出的针对笔记推荐的多模态大型语言模型框架。NoteLLM 基于生成笔记的压缩嵌入和自动生成标签类别,用大型语言模型(LLM…
Mureka V6 – 昆仑万维推出的AI音乐创作基座模型
Mureka V6是什么 Mureka V6是昆仑万维推出的AI音乐创作平台的基座模型,支持纯音乐生成以及10种语言的AI音乐创作。引入自研的ICL(in-context…
Pippo – Meta 推出的单图生成多视角高清人像视频模型
Pippo是什么 Pippo是Meta Reality Labs推出的图像到视频生成模型,能从单张照片生成1K分辨率的多视角高清人像视频。模型基于多视角扩散变换器,预训练…
DCEdit – 北交大联合美图推出的双层控制图像编辑方法
DCEdit是什么 DCEdit 是新型的双层控制图像编辑方法,是北京交通大学和美图2MT实验室联合推出的。DCEdit基于精确语义定位策略(PSL),用视觉和文本自注意…
ChatGPT 升级记忆系统 全面推向用户
OpenAI 宣布,其 ChatGPT 的记忆系统进行了升级,旨在提供更为智能和个性化的对话体验。此次更新是在其 “梦境” 功能的基础上进行的,这项功能可以帮助 Chat…
NextGenAI – OpenAI 推出的教育联盟,联合15家顶尖大学和机构
NextGenAI是什么 NextGenAI是OpenAI推出的全球性联盟,基于AI技术推动教育和研究的进步。NextGenAI联合包括哈佛大学、麻省理工学院、牛津大学等…
Agentic Object Detection – 吴恩达团队推出的Agent目标检测技术
Agentic Object Detection是什么 Agentic Object Detection 是吴恩达团队开发的新型目标检测技术,通过智能代理(Agent)系…
国产大模型掀起新一轮上市潮,阶跃星辰冲刺香港近年来最大AI IPO
中国人工智能初创企业阶跃星辰(StepFun)最快将于本周一正式向港交所递交首次公开募股(IPO)申请,其主要投资方给出的最高估值达120亿美元(约合815.21亿元人民…
PP-DocBee – 百度飞桨推出的文档图像理解多模态大模型
PP-DocBee是什么 PP-DocBee是百度飞桨(PaddlePaddle)团队推出的专注于文档图像理解的多模态大模型。基于ViT+MLP+LLM架构,具备强大的中…
UniFluid – 谷歌联合麻省理工推出的多模态图像生成与理解框架
UniFluid是什么 UniFluid 是谷歌 DeepMind 和麻省理工学院联合推出的,统一的自回归框架,用在联合视觉生成和理解任务。基于连续视觉标记处理多模态图像…
Step1X-Edit – 阶跃星辰开源的通用图像编辑框架
Step1X-Edit是什么 Step1X-Edit 是阶跃星辰团队推出的通用图像编辑框架,能缩小开源图像编辑模型与闭源模型(如 GPT-4o 和 Gemini2 Fla…
GPDiT – 清华北大联合阶跃星辰等推出的视频生成模型
GPDiT是什么 GPDiT(Generative Pre-trained Autoregressive Diffusion Transformer)是北京大学、清华大学…
Neo-1 – VantAI 推出的首个原子生成式AI模型
Neo-1是什么 Neo-1 是 VantAI 推出的全球首个将从头分子生成与原子级结构预测统一的AI模型。能预测生物分子结构,生成全新的分子,在设计分子胶等新型治疗药物…
腾讯混元Turbo S – 腾讯推出的新一代快思考模型
腾讯混元Turbo S是什么 腾讯混元Turbo S是腾讯推出的新一代快思考模型。模型采用创新的Hybrid-Mamba-Transformer融合架构,有效降低了传统T…
