Cobra – 清华、港中文和腾讯开源的漫画线稿上色框架
Cobra是什么 Cobra(Efficient Line Art COlorization with BRoAder References)是清华大学、香港中文大学和腾…
PilotDeck – 清华联合面壁智能开源的 Agent 操作系统
PilotDeck是什么 PilotDeck 是清华大学THUNLP实验室、面壁智能、OpenBMB与AI9stars联合开源的智能体操作系统。PilotDeck以Wor…
PixelHacker – 华中科技联合VIVO推出的图像修复模型
PixelHacker是什么 PixelHacker 是华中科技大学和 VIVO AI Lab联合推出的图像修复(Image Inpainting)模型。基于引入潜在类别…
KeySync – 帝国理工联合弗罗茨瓦夫大学推出的口型同步框架
KeySync是什么 KeySync 是帝国理工学院和弗罗茨瓦夫大学推出的用在高分辨率口型同步框架,支持将输入音频与视频中的口型动作对齐。KeySync 基于两阶段框架实…
Polar – 英伟达开源的智能体强化学习训练框架
Polar是什么 Polar 是英伟达推出的开源智能体强化学习(Agentic RL)训练框架,核心创新在于无需修改现有智能体框架内部代码,可将其接入 GRPO 等 RL…
ZenCtrl – Fotographer AI 推出的商品图生成AI工具
ZenCtrl是什么 ZenCtrl 是 Fotographer AI 推出的 AI 图像生成工具,支持从单张图像生成高质量、多视角和多样化场景的图像,无需额外训练数据。…
MAI Transcribe-1.5 – 微软 MAI 推出的语音转文本模型
MAI Transcribe-1.5是什么 MAI-Transcribe-1.5 是 微软 AI 团队自研的语音转文本模型,支持 43 种语言,具备上下文感知的关键词偏置…
Seed1.5-Embedding – 字节跳动 Seed 团队推出的向量模型
Seed1.5-Embedding是什么 Seed1.5-Embedding 是字节跳动 Seed 团队最新发布的向量模型,基于 Seed1.5 (Doubao-1.5-…
ShotAdapter – Adobe联合UIUC推出的多镜头视频生成框架
ShotAdapter是什么 ShotAdapter是Adobe联合UIUC推出的用在文本到多镜头视频生成的框架,基于微调预训练的文本到视频模型,引入过渡标记和局部注意力…
Devstral – Mistral AI联合All Hands AI开源的编程专用AI模型
Devstral是什么 Devstral是Mistral AI和All Hands AI推出的专为软件工程任务设计的编程专用模型。Devstral在解决真实世界软件问题上…
MMaDA – 字节联合普林斯顿大学等推出的多模态扩散模型
MMaDA是什么 MMaDA(Multimodal Large Diffusion Language Models)是普林斯顿大学、清华大学、北京大学和字节跳动推出的多模…
Software Copyright Materials Skill – 开源软著资料生成Skill
Software Copyright Materials Skill是什么 Software Copyright Materials Skill是开源的软著Skill,通…
Dulus – 开源的 CLI AI Agent,可驱动多模型工具调用
Dulus是什么 Dulus 是约 12K 行 Python 的开源 CLI AI Agent,支持 Claude、GPT、Gemini、DeepSeek、Kimi、Qw…
Reasonix – 专为 DeepSeek 推出的开源终端编程 Agent
Reasonix是什么 Reasonix 是专为 DeepSeek 推出的开源终端编程 Agent,围绕字节稳定的 prefix-cache 机制设计 append-on…
