Second Me – 心识宇宙开源的 AI 身份模型
Second Me是什么 Second Me 是心识宇宙(Mindverse)推出的开源AI身份模型,支持创建完全私有且深度个性化的AI代理,代表用户的“真实自我”。Se…
Phi-4-Mini – 微软推出专注于文本任务的小型语言模型
Phi-4-Mini是什么 Phi-4-Mini 是微软 Phi-4 系列中最新推出的专注于文本任务的小型语言模型,参数量为 38 亿。基于密集的解码器-only Tra…
Matrix3D – 南大联合Apple、港科大推出的统一摄影测量模型
Matrix3D是什么 Matrix3D 是南京大学、苹果公司和香港科技大学合作推出的新型的统一摄影测量模型,能在一个模型中完成多个摄影测量子任务,包括姿态估计、深度预测…
Neural4D 2o – DreamTech 推出支持多模态交互的 3D 模型
Neural4D 2o是什么 Neural4D 2o 是 DreamTech 推出的全球首个支持多模态交互的 3D 大模型。模型基于文本、图像、3D 和运动数据的联合训练…
Migician – 北交大联合清华、华中科大推出的多模态视觉定位模型
Migician是什么 Migician是北京交通大学、华中科技大学和清华大学的研究团队联合推出的多模态大语言模型(MLLM),专门用在自由形式的多图像定位(Multi-…
Heygem – 硅基智能推出的开源数字人模型
Heygem是什么 Heygem 是硅基智能推出的开源数字人模型,专为 Windows 系统设计。基于先进的AI技术,仅需 1 秒视频或 1 张照片,能在 30 秒内完成…
potpie.ai – AI代码库Agent构建平台,自动化代码分析、测试和开发任务
potpie.ai是什么 potpie.ai 是开源平台,基于AI技术为代码库创建定制化的工程代理(Agents)。potpie.ai基于构建代码库的知识图谱,深度理解代…
kimi-thinking-preview – 月之暗面推出的多模态思考模型
kimi-thinking-preview是什么 kimi-thinking-preview 是月之暗面推出的多模态思考模型,具备深度推理能力,擅长解决复杂问题,如代码、…
pdf-craft – 开源 PDF 转 Markdown 工具
pdf-craft是什么 pdf-craft 是用在将 PDF 文件转换为其他格式(如 Markdown、EPUB)的工具,专注于处理扫描书籍的 PDF 文件。pdf-c…
UltraMem – 字节豆包大模型团队推出的全新超稀疏模型架构
UltraMem是什么 UltraMem 是字节跳动豆包大模型团队提出的全新超稀疏模型架构,解决传统 MoE 架构在推理时的高额访存问题。架构通过优化内存访问和计算效率,…
EasyControl – Tiamat AI 联合上海科大等开源的图像生成控制框架
EasyControl是什么 EasyControl 是 Tiamat AI 开源的基于扩散变换器(Diffusion Transformer,DiT)架构的高效灵活控制…
GaussianCity – 南洋理工大学 S-Lab 团队推出的 3D 城市生成框架
GaussianCity是什么 GaussianCity 是南洋理工大学 S-Lab 团队推出的高效无边界3D城市生成框架,基于3D高斯绘制(3D-GS)技术。引入紧凑的…
X-Prompt – 用于多模态视频目标分割的通用框架
X-Prompt是什么 X-Prompt是用于多模态视频目标分割的通用框架,解决传统方法在极端光照、快速运动和背景干扰等复杂场景下的局限性。通过预训练一个基于 RGB 数…
豆包大模型1.5 – 字节跳动推出的最新版大模型
豆包大模型1.5是什么 豆包大模型1.5 是字节跳动推出的最新版本大模型。采用大规模稀疏MoE架构,等效于7倍激活参数的Dense模型性能,综合得分在知识、代码、推理、中…
GaussianAnything – 南洋理工 S-Lab 和上海 AI Lab 等推出的 3D 生成框架
GaussianAnything是什么 GaussianAnything 是南洋理工大学 S-Lab 联合上海 AI Lab 等机构推出的 3D 生成框架。Gaussia…
Cube 3D – Roblox 推出的 AI 3D 生成模型
Cube 3D是什么 Cube 3D 是 Roblox 推出的AI 3D生成大模型,基于 AI 技术高效生成 3D 模型和环境。Cube 3D支持直接从文本描述生成完整的…
