SocioVerse – 复旦大学联合小红书等机构开源的社会模拟世界模型
SocioVerse是什么 SocioVerse(众生) 是复旦大学、上海创智学院、罗切斯特大学和小红书联合推出的社会模拟世界模型。基于大语言模型(LLM)驱动的智能体和…
FunGPT – 开源AI情感调节项目,基于InternLM2.5系列模型
FunGPT是什么 FunGPT 是基于 InternLM2.5 系列大模型开发的开源项目,专为情感调节设计。具备两大核心功能:甜言蜜语模式和犀利怼语模式。甜言蜜语模式能…
EmotiVoice – 网易有道开源的AI语音合成系统
EmotiVoice是什么 EmotiVoice是网易有道开源的多语言、多声音和提示控制的文本到语音(TTS)系统。EmotiVoice支持英语和中文,提供超过2000种…
Agent Development Kit – 谷歌开源的 AI Agent 开发与部署框架
Agent Development Kit是什么 Agent Development Kit(ADK)是谷歌开源的首个AI智能体开发工具包,是一个代码优先的Python工…
VoltAgent – 开源的AI Agent构建和编排框架
VoltAgent是什么 VoltAgent 是开源的 TypeScript 框架,用在构建和编排 AI Agent。VoltAgent 提供构建 AI 应用的基础结构和…
Toolkami – 开源 AI Agent 框架,七种核心工具支持运行
Toolkami是什么 Toolkami 是极简的 AI Agent 框架,用七种工具支持运行, 包括读(Read)、写(Write Diff)、浏览(Browse)、命…
Awesome MCP Servers – 开源的MCP资源聚合平台,覆盖多个垂直领域
Awesome MCP Servers是什么 Awesome MCP Servers 是开源项目,汇集各种基于 Model Context Protocol (MCP) …
GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型
GPT‑5.4是什么 GPT-5.4是OpenAI推出的旗舰AI模型,定位为”专为专业工作设计的最强前沿模型”。模型首次将推理、编程、原生计算机操作、深度网页搜索和百万T…
Pad.ws – 在线AI开发工具,白板功能与代码编辑器深度结合
Pad.ws是什么 Pad.ws 是创新的在线开发环境,结合了白板功能与完整的 IDE 工具。基于浏览器运行,无需安装额外软件,用户可以随时随地通过任何设备访问。将交互式…
SuperEdit – 字节跳动等机构推出的图像编辑方法
SuperEdit是什么 SuperEdit是字节跳动智能创作团队和佛罗里达中央大学计算机视觉研究中心联合推出的指令引导图像编辑方法,基于优化监督信号提高图像编辑的精度和…
MiniMax MCP Server – MiniMax 推出基于 MCP 的多模态生成服务器
MiniMax MCP Server是什么 MiniMax MCP Server 是 MiniMax 稀宇科技推出的基于模型上下文协议(MCP)的多模态生成服务器。通过简…
Aero-1-Audio – LMMs-Lab 推出的轻量级音频模型
Aero-1-Audio是什么 Aero-1-Audio 是 LMMs-Lab 开发的轻量级音频模型,基于 Qwen-2.5-1.5B 构建,仅包含 1.5 亿参数。专为…
MedGemma – 谷歌开源的AI医疗领域模型
MedGemma是什么 MedGemma是谷歌推出的开源AI模型,专门用在医疗图像与文本分析。模型基于Gemma 3架构,包含4B参数的多模态模型和27B参数的纯文本模型…
ACTalker – 港科大联合腾讯、清华推出的端到端视频扩散框架
ACTalker是什么 ACTalker 是用于生成逼真说话人头部视频的端到端视频扩散框架。支持单信号或多信号控制,如音频、表情等。核心架构包括并行 Mamba 结构,通…
Ming‑Flash‑Omni 2.0 – 蚂蚁开源的全模态大模型
Ming-flash-omni-2.0是什么 Ming-flash-omni-2.0是蚂蚁集团开源的全模态大模型,采用100B总参数/6B激活参数的MoE架构。作为业界S…
GPT-image-1 – OpenAI 推出的最新图像生成模型
GPT-image-1是什么 GPT-image-1是OpenAI推出的原生多模态图像生成模型,基于API向开发者开放使用。模型根据文本提示和图像生成高质量、专业级的图像…
