Ad image
Ad image

最近更新

X-Fusion – 加州大学联合Adobe等机构推出的多模态融合框架

X-Fusion是什么 X-Fusion 是加州大学洛杉矶分校、威斯康星大学麦迪逊分校和 Adobe Research 联合提出的多模态融合框架,将预训练的大型语言模型(LLMs)扩展到多模态任务中,保留其语言能力。框架采用双塔架构,冻结语…

预计阅读时间: 14

Phi-4-reasoning – 微软推出的Phi-4推理模型系列

Phi-4-reasoning是什么 Phi-4-reasoning 是微软推出的 140 亿参数的推理模型,专为复杂推…

BLIP3-o – Salesforce Research等机构推出的多模态模型

BLIP3-o是什么 BLIP3-o是Salesforce Research等机构推出的创新多模态模型,融合自回归模型的…

Flex.2-preview – Ostris 推出的文本到图像扩散模型

Flex.2-preview是什么 Flex.2-preview 是Ostris开源的 80 亿参数文本到图像扩散模型,…

Seed-Coder – 字节跳动开源的代码模型系列

Seed-Coder是什么 Seed-Coder是字节跳动开源的8B规模代码模型系列,提升代码生成与理解能力。包含Bas…

MedReason – 美国加州联合南洋理工等机构推出的医学推理框架

MedReason是什么 MedReason是美国加州大学圣克鲁斯分校、加拿大不列颠哥伦比亚大学、新加坡南洋理工大学等机构推出的医学推理框架,基于知识图谱提升大型语言模型(LLMs)在医学领域的推理能力。其中最佳模型MedReason-8B达到最先进的性能。MedReason将临床问答对转换为逻辑推理链(“思考路径”),确保每一步推理都有可靠的医学知识支撑。MedReason数据集包含32,682…

预计阅读时间: 15

HoloTime – 北大联合鹏城实验室推出的全景4D场景生成框架

HoloTime是什么 HoloTime 是北京大学深圳研究生院和鹏城实验室推出的全景 4D 场景生成框架,基于视频扩散…

Command A+ – Cohere Labs 开源的多模态大模型

Command A+是什么 Command A+ 是 Cohere Labs 推出的开源多模态大模型,采用混合专家架构,…

Cooragent – 清华 LeapLab 开源的 AI Agent 协作框架

Cooragent是什么 Cooragent是由清华大学LeapLab团队推出的开源AI Agent协作框架。用户基于简…

BILIVE – 开源AI录播工具,一站式自动直播录制与处理

BILIVE是什么 BILIVE 是基于 AI 技术的开源工具,专为 B 站直播录制与处理设计。工具支持自动录制直播、渲…

T2I-R1 – 港中文联合上海AI Lab推出文生图模型

T2I-R1是什么 T2I-R1 是香港中文大学和上海AI Lab联合推出的新型文本生成图像模型。基于引入双层推理机制,…

FreeLLMAPI – 开源 AI 模型聚合平台,统一OpenAI兼容格式

FreeLLMAPI是什么 FreeLLMAPI 是开源的 OpenAI 兼容代理服务,可将约 14 家 AI 服务商的…