Agent TARS – 字节跳动开源的多模态 AI Agent 项目
Agent TARS是什么 Agent TARS 是字节跳动开源的多模态 AI Agent 项目。基于视觉解释网页内容,与浏览器、命令行和文件系统无缝集成,实现复杂任务的…
F-Lite – Freepik联合FAL开源的文生图模型
F-Lite是什么 F-Lite是Freepik团队联合FAL开源的10B参数的文生图模型。基于Freepik内部80M有版权的数据集训练,支持商业用途。F-Lite将T…
AutoBE – AI驱动的后端服务器代码生成工具
AutoBE是什么 AutoBE 是 AI 驱动的后端服务器代码生成工具,通过用户描述需求自动生成高质量的后端代码。基于 TypeScript、NestJS、Prisma…
BabelDOC – 开源 AI PDF 翻译工具,专为科学论文翻译设计
BabelDOC是什么 BabelDOC 是沉浸式翻译开源的智能 PDF 翻译工具,专为科学论文翻译设计。能在原文旁生成翻译文本,形成双语对照,无需切换窗口,方便阅读。能…
GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型
GPT‑5.4是什么 GPT-5.4是OpenAI推出的旗舰AI模型,定位为”专为专业工作设计的最强前沿模型”。模型首次将推理、编程、原生计算机操作、深度网页搜索和百万T…
SurveyGO卷姬 – 清华联合面壁智能开源的AI论文写作工具
SurveyGO是什么 SurveyGO(卷姬) 是清华联合面壁智能团队开源的AI论文写作工具。支持根据用户输入的论文主题和描述,快速生成结构清晰、内容丰富的综述文章,帮…
WebThinker – 人民大学联合智源研究院等机构推出的深度研究智能体
WebThinker是什么 WebThinker是中国人民大学、北京智源人工智能研究院和华为泊松实验室等机构提出的深度研究智能体。WebThinker赋能大型推理模型(L…
Math24o – SuperCLUE 开源的高中奥林匹克数学竞赛推理测评基准
Math24o是什么 Math24o 是中文大模型测评基准 SuperCLUE 开源的高中奥林匹克数学竞赛级别的数学推理测评基准。主要用于评估大型语言模型在数学推理方面的…
Seed-Thinking-v1.5 – 字节跳动推出的最新思考模型
Seed-Thinking-v1.5是什么 Seed-Thinking-v1.5 是字节跳动推出的推理智能模型,采用混合专家(MoE)架构,总参数量为 200B,每次激活…
gpt-4o-mini-transcribe – OpenAI 推出的语音转文本模型
gpt-4o-mini-transcribe是什么 gpt-4o-mini-transcribe 是 OpenAI 推出的语音转文本模型,gpt-4o-transcrib…
ACI.dev – 为AI智能体设计的开源MCP基础设施平台
ACI.dev是什么 ACI.dev 是开源的基础设施平台,专为 AI 智能体设计,提供强大的工具调用支持。集成了 600 多种预构建工具,涵盖 Gmail、Slack、…
DICE-Talk – 复旦联合腾讯优图推出的情感化动态肖像生成框架
DICE-Talk是什么 DICE-Talk是复旦大学联合腾讯优图实验室推出的新颖情感化动态肖像生成框架,支持生成具有生动情感表达且保持身份一致性的动态肖像视频。DICE…
Llama 4 – Meta 开源的多模态系列AI模型,重夺开源王座
Llama 4是什么 Llama 4 是 Meta 开源的多模态系列AI模型。首次采用混合专家(MoE)架构,在训练和推理时计算效率更高。Llama 4 目前有 Scou…
Suna – Kortix推出的全球首款通用型 AI Agent 开源项目
Suna是什么 Suna 是Kortix推出的全球首款通用型 AI Agent 开源项目,支持高效解决现实场景中的各类任务。基于自然流畅的对话交互,Suna 支持智能辅助…
Multiverse – Enigma Labs推出的全球首款AI生成多人游戏模型
Multiverse是什么 Multiverse是以色列团队Enigma Labs推出的全球首个AI生成多人游戏模型。是多人赛车游戏,玩家可以超车、漂移、加速,每一次行动…
RoboBrain – 智源研究院开源的具身大脑模型
RoboBrain是什么 RoboBrain是智源研究院推出的开源具身大脑模型,推动单机智能迈向群体智能。由三个模块组成:用于任务规划的基座模型、用于可操作区域感知的A-…
