FramePack – 斯坦福开源的AI视频生成模型
FramePack是什么 FramePack 是斯坦福大学开源的AI视频生成模型。基于压缩输入帧的上下文长度,解决视频生成中的“遗忘”和“漂移”问题,让模型能高效处理大量…
BioMedGPT-R1 – 清华联合水木分子推出的多模态生物医药大模型
BioMedGPT-R1是什么 BioMedGPT-R1 是清华大学AI产业研究院(AIR)与北京水木分子生物科技有限公司联合推出的升级版多模态生物医药开源大模型。Bio…
START – 阿里联合中科大推出的自学推理模型
START是什么 START(Self-Taught Reasoner with Tools)是阿里巴巴集团和中国科学技术大学推出的新型工具增强型推理模型,结合外部工具(…
Amazon Nova Premier – 亚马逊推出的多模态AI模型
Amazon Nova Premier是什么 Amazon Nova Premier 是亚马逊推出功能最强大的多模态 AI 模型,能处理文本、图像和视频输入(不包括音频)…
Qwen2.5-Omni – 阿里开源的端到端多模态模型
Qwen2.5-Omni是什么 Qwen2.5-Omni 是阿里开源的 Qwen 系列旗舰级多模态模型,拥有7B参数,Qwen2.5-Omni具备强大的多模态感知能力,能…
RWKV-7-2.9B – RWKV 基金开源的 RNN 大语言模型
RWKV-7-2.9B是什么 RWKV-7-2.9B模型(RWKV-7-World-2.9B-V3) 是RWKV 基金推出的先进 RNN 大语言模型。基于 RWKV Wo…
DevDocs – 开源的技术文档爬取和处理工具
DevDocs是什么 DevDocs 是专为程序员和开发者设计的开源技术文档爬取和处理工具,基于智能爬虫技术,快速爬取、整理技术文档,将理解文档的时间从数周缩短至几小时。…
TrendPublish – AI内容发布工具,支持智能总结和自动发布
TrendPublish是什么 TrendPublish 是基于 AI 的趋势发现和内容发布系统。基于多源数据采集,从 Twitter/X、网站等渠道获取信息,用 Dee…
Gemma 3 – 谷歌最新推出的开源多模态 AI 模型
Gemma 3是什么 Gemma 3 是谷歌最新推出的开源人工智能模型,专为开发者设计,支持多种设备上的人工智能应用开发。支持超过 35 种语言,具备分析文本、图像及短视…
Stable Virtual Camera – Stability AI 等机构推出的 AI 模型,2D图像转3D视频
Stable Virtual Camera是什么 Stable Virtual Camera 是 Stability AI 推出的 AI 模型,能将 2D 图像转换为具有…
Lyria 2 – DeepMind 推出的 AI 音乐生成模型
Lyria 2是什么 Lyria 2 是谷歌 DeepMind 推出的第三代 AI 音乐生成模型,作为 Vertex AI 平台的核心组件,具备高保真音频生成能力,能输出…
ChatUI – 阿里推出的开源智能对话式 UI 组件库
ChatUI是什么 ChatUI 是阿里团队推出的开源智能对话式 UI 组件库,能帮助开发者快速构建高质量的聊天应用,提供响应式设计、国际化、主题定制等功能。ChatUI…
Text to Bark – ElevenLabs 推出的 AI“狗语”文本转语音模型
Text to Bark是什么 Text to Bark 是 ElevenLabs 推出的全球首个AI“狗语”文本转语音模型。用户输入文字选择犬种,模型能生成高度逼真的狗…
Smallpond – DeepSeek开源的轻量级数据处理框架
Smallpond是什么 Smallpond是DeepSeek推出的基于 DuckDB 和 3FS 构建的轻量级数据处理框架,专为高性能和大规模数据处理设计。Smallp…
GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型
GPT‑5.4是什么 GPT-5.4是OpenAI推出的旗舰AI模型,定位为”专为专业工作设计的最强前沿模型”。模型首次将推理、编程、原生计算机操作、深度网页搜索和百万T…
CopilotKit – 开源 AI Agent 开放框架,全栈 Agent UI 基础设施
CopilotKit是什么 CopilotKit 是开源的AI原生应用前端操作系统。工具支持三种 Generative UI 模式,包含受控、声明式 A2UI、开放式,让…
