ZenCtrl – Fotographer AI 推出的商品图生成AI工具
ZenCtrl是什么 ZenCtrl 是 Fotographer AI 推出的 AI 图像生成工具,支持从单张图像生成高质量、多视角和多样化场景的图像,无需额外训练数据。…
MAI Transcribe-1.5 – 微软 MAI 推出的语音转文本模型
MAI Transcribe-1.5是什么 MAI-Transcribe-1.5 是 微软 AI 团队自研的语音转文本模型,支持 43 种语言,具备上下文感知的关键词偏置…
Seed1.5-Embedding – 字节跳动 Seed 团队推出的向量模型
Seed1.5-Embedding是什么 Seed1.5-Embedding 是字节跳动 Seed 团队最新发布的向量模型,基于 Seed1.5 (Doubao-1.5-…
ShotAdapter – Adobe联合UIUC推出的多镜头视频生成框架
ShotAdapter是什么 ShotAdapter是Adobe联合UIUC推出的用在文本到多镜头视频生成的框架,基于微调预训练的文本到视频模型,引入过渡标记和局部注意力…
Devstral – Mistral AI联合All Hands AI开源的编程专用AI模型
Devstral是什么 Devstral是Mistral AI和All Hands AI推出的专为软件工程任务设计的编程专用模型。Devstral在解决真实世界软件问题上…
MMaDA – 字节联合普林斯顿大学等推出的多模态扩散模型
MMaDA是什么 MMaDA(Multimodal Large Diffusion Language Models)是普林斯顿大学、清华大学、北京大学和字节跳动推出的多模…
Software Copyright Materials Skill – 开源软著资料生成Skill
Software Copyright Materials Skill是什么 Software Copyright Materials Skill是开源的软著Skill,通…
Dulus – 开源的 CLI AI Agent,可驱动多模型工具调用
Dulus是什么 Dulus 是约 12K 行 Python 的开源 CLI AI Agent,支持 Claude、GPT、Gemini、DeepSeek、Kimi、Qw…
Reasonix – 专为 DeepSeek 推出的开源终端编程 Agent
Reasonix是什么 Reasonix 是专为 DeepSeek 推出的开源终端编程 Agent,围绕字节稳定的 prefix-cache 机制设计 append-on…
Mega-ASR – NTU、NUS、上海AI Lab开源的语音识别模型
Mega-ASR是什么 Mega-ASR 是南洋理工大学(NTU)、新加坡国立大学(NUS)与上海人工智能实验室联合开源的全场景鲁棒语音识别基座模型,模型以 Qwen3-…
CodeGraph – 开源代码知识图谱工具,加速代码理解和分析
CodeGraph是什么 CodeGraph 是面向 AI 编码代理的预索引代码知识图谱工具,通过 MCP 协议与 Claude Code、Cursor、Codex CL…
MiniCPM5-1B – 面壁智能联合清华开源的端侧文本基座模型
MiniCPM5-1B是什么 MiniCPM5-1B 是面壁智能联合清华大学、OpenBMB 开源社区推出的 1B 参数端侧文本基座大模型,在 AA-Index 榜单上以…
Horizon – 开源 AI 信息聚合系统,构建专属新闻雷达
Horizon是什么 Horizon 是开源的 AI 驱动信息聚合系统,帮助用户构建专属的 AI 新闻雷达。工具支持从 RSS、Hacker News、GitHub、Re…
BitCPM-CANN – 面壁智能联合清华开源的端侧大模型
BitCPM-CANN是什么 BitCPM-CANN是面壁智能联合清华大学与OpenBMB开源社区联合推出的,中国首个完全基于华为昇腾国产算力平台完成端到端训练的1.58…
