BiliNote – 开源 AI 视频笔记工具,自动提取视频内容生成Markdown格式
BiliNote是什么 BiliNote 是开源的 AI 视频笔记助手,支持基于哔哩哔哩、YouTube 等视频链接,自动提取视频内容生成结构清晰、重点明确的 Markd…
DianJin-R1 – 阿里云通义点金联合苏大推出的金融推理大模型
DianJin-R1是什么 DianJin-R1是阿里云通义点金团队与苏州大学联合推出的金融领域推理增强大模型,专为金融任务设计,融合了先进的技术和全面的数据支持。模型通…
Pemo – AI文档管理工具,支持一键翻译智能总结文献摘要
Pemo是什么 Pemo是AI驱动的文档管理工具。工具支持PDF、Epub、Word等多种格式文档的导入与管理,具备一键翻译、智能总结、思维导图生成等功能,帮助用户快速理…
SkyReels-A2 – 昆仑万维推出的可控视频生成框架
SkyReels-A2是什么 SkyReels-A2是昆仑万维推出的可控视频生成框架,支持根据文本提示将任意视觉元素(如人物、物体、背景)组合成合成视频,严格保持与每个元…
GPT‑5.3‑Codex‑Spark – OpenAI推出的轻量级编程模型
GPT‑5.3‑Codex‑Spark是什么 GPT-5.3-Codex-Spark是OpenAI首个专为实时编程设计的轻量级模型,主打极致速度。模型运行在Cerebra…
Eagle 2.5 – 英伟达推出的视觉语言模型
Eagle 2.5是什么 Eagle 2.5是英伟达推出的视觉语言模型,专注于长上下文多模态学习的 AI 模型,参数规模仅为 8B。参数量较小,但在处理高分辨率图像和长视…
Mogao – 字节跳动Seed团队推出的多模态理解与生成统一架构
Mogao是什么 Mogao是字节跳动Seed团队推出的交错多模态生成全基础模型。在架构上采用了双视觉编码器,结合变分自编码器(VAE)和视觉变换器(ViT),能更好地进…
可灵2.0 – 快手推出的新一代AI视频生成模型
可灵2.0是什么 可灵2.0是快手推出的新一代 AI 视频生成模型,现已上线可灵AI视频平台。平台更新包含可灵2.0(大师版)和可图2.0两大基础模型。可图2.0大幅提升…
X-Fusion – 加州大学联合Adobe等机构推出的多模态融合框架
X-Fusion是什么 X-Fusion 是加州大学洛杉矶分校、威斯康星大学麦迪逊分校和 Adobe Research 联合提出的多模态融合框架,将预训练的大型语言模型(…
Context7 – 为大模型和AI编辑器提供最新文档和代码示例的平台
Context7是什么 Context7 是 Upstash 推出的AI编程辅助工具,为大型语言模型(LLMs)和 AI 代码编辑器提供最新、版本特定的文档和代码示例。通…
ChildMandarin – 智源联合南开开源的低幼儿童中文语音数据集
ChildMandarin是什么 ChildMandarin 是智源研究院联合南开大学计算机学院人类语言技术实验室(HLT Lab)共同推出的,针对3-5岁儿童的普通话语…
Skywork-R1V 2.0 – 昆仑万维开源的新版多模态推理模型
Skywork-R1V 2.0是什么 Skywork-R1V 2.0 是昆仑万维最新开源的多模态推理模型,专为复杂推理任务设计,具备强大的视觉与文本推理能力。模型基于混合…
Scenethesis – 英伟达推出的交互式3D场景生成框架
Scenethesis是什么 Scenethesis 是 NVIDIA 推出的创新框架,用在从文本生成交互式 3D 场景。框架结合大型语言模型(LLM)和视觉感知技术,基…
MedReason – 美国加州联合南洋理工等机构推出的医学推理框架
MedReason是什么 MedReason是美国加州大学圣克鲁斯分校、加拿大不列颠哥伦比亚大学、新加坡南洋理工大学等机构推出的医学推理框架,基于知识图谱提升大型语言模型…
Phi-4-reasoning – 微软推出的Phi-4推理模型系列
Phi-4-reasoning是什么 Phi-4-reasoning 是微软推出的 140 亿参数的推理模型,专为复杂推理任务设计。通过监督微调(SFT)训练而成,使用了…
BLIP3-o – Salesforce Research等机构推出的多模态模型
BLIP3-o是什么 BLIP3-o是Salesforce Research等机构推出的创新多模态模型,融合自回归模型的推理和指令遵循能力及扩散模型的强大生成能力。模型基…
