站外新闻 – 第 107 页 – Prompt 语宙

站外新闻

5094 .

OpenAI 招聘家庭产品经理，ChatGPT 加速渗透中老年与家庭用户

生成式人工智能进入主流视野三年多后，OpenAI 正在将产品重心从个人生产力工具向家庭场景延伸。近期，OpenAI 在旧金山公开招聘一位专职产品经理，负责为家庭、护理人员…

Claude Code再进化！内置浏览器让AI自主“刷网页”

知名AI企业Anthropic近日为旗下开发者工具Claude Code迎来重大升级，正式加入了一款内置的集成浏览器窗口。这项新功能赋予了Claude在应用内部直接打开、…

苹果正式起诉OpenAI指控其窃取商业机密，涉及前高管及核心AI硬件项目

苹果公司于2026年7月10日正式向美国加州北区地方法院提起诉讼，指控OpenAI涉嫌窃取商业秘密并违反合同，这一重磅法律行动标志着两大科技巨头在人工智能领域的竞争全面白…

Frames – Runway 推出的AI图像生成模型

Frames是什么 Frames是Runway推出的最新AI图像生成模型，在风格控制和视觉保真度方面取得巨大进步。Frames能维持风格一致性，支持广泛的创意探索，为项目…

SlideChat – 上海AI Lab联合多所高校和机构推出的视觉语言助手

SlideChat是什么 SlideChat是上海AI实验室、厦门大学、华东师范大学等机构推出的，首个能理解千兆像素级别全切片图像的视觉语言助手。SlideChat能生成…

Fugatto – 英伟达推出的多功能AI音频生成模型

Fugatto是什么 Fugatto是英伟达（NVIDIA）推出的音频合成和转换模型，全称为”Foundational Generative Audio Transfor…

LongRAG – 智谱联合清华和中科院推出的双视角鲁棒检索框架

LongRAG是什么 LongRAG是清华大学、中国科学院和智谱的研究团队推出的，面向长文本问答（LCQA）的双视角鲁棒检索增强生成（RAG）框架。基于混合检索器、LLM…

Illustrious – 开源文本到图像生成模型，专注于生成高质量动漫风格图像

Illustrious是什么 Illustrious是开源的文本到图像动漫图像生成模型，是Onoma AI Research推出的。基于优化批量大小、dropout控制、…

aisuite – 吴恩达发布开源Python库，一个接口调用多个大模型

import aisuite as ai client = ai.Client() models = ["openai:gpt-4o", "anthropic:claud…

XGrammar – 陈天奇团队推出的LLM结构化生成引擎

XGrammar是什么 XGrammar是由陈天奇团队推出的开源软件库，能为大型语言模型（LLM）提供高效、灵活且可移植的结构化数据生成能力。基于上下文无关语法（CFG）…

Edify 3D – NVIDIA 推出的3D生成模型

Edify 3D是什么 Edify 3D 是 NVIDIA 推出的先进3D资产生成方案，能从文本提示或参考图像快速合成高质量的3D模型。Edify 3D能在两分钟内生成具…

SongCreator – AI音乐模型，能理解、生成和编辑歌曲

SongCreator是什么 SongCreator是清华大学深圳国际研究生院、香港中文大学等机构推出的AI音乐生成模型，能从歌词出发生成包含声乐和伴奏的完整歌曲。基于双…

Teacher2Task – 谷歌推出的多教师学习框架

Teacher2Task什么 Teacher2Task是谷歌团队推出的多教师学习框架，引入教师特定的输入标记和重新构思训练过程，消除对手动聚合启发式方法的需求。框架不依赖…

DynaSaur – Adobe 推出的大语言模型代理框架

DynaSaur是什么 DynaSaur是Adobe Research推出的大型语言模型（LLM）代理框架，突破传统LLM代理系统受限于预定义动作集合的限制。框架支持代理…

Takin AudioLLM – 喜马拉雅推出的系列零样本语音生成模型

Takin AudioLLM是什么 Takin AudioLLM是喜马拉雅Everest团队推出的一系列高质量零样本语音生成模型，包括Takin TTS、Takin VC…

AutoTrain – Hugging Face 开源的无代码模型训练平台

AutoTrain是什么 AutoTrain（AutoTrain Advanced）是Hugging Face推出的开源无代码平台，能简化最先进模型的训练过程。支持用户无…