RAG Logger – 专为检索增强生成应用设计的开源日志工具
RAG Logger是什么 RAG Logger是开源的日志记录工具,专为检索增强生成(RAG)应用设计。作为LangSmith的轻量级替代品,专注于满足RAG应用的日志…
VideoRAG – 用于长视频理解的检索增强生成技术
VideoRAG是什么 VideoRAG是用于长视频理解的检索增强生成(Retrieval-Augmented Generation)技术。通过提取视频中的视觉对齐辅助文…
通古大模型 – 华南理工大学推出的古籍大语言模型
通古大模型是什么 通古大模型是华南理工大学深度学习与视觉计算实验室(SCUT-DLVCLab)推出的专注于古籍文言文处理的人工智能语言模型。基于百川2-7B-Base进行…
DynamicCity – 上海 AI Lab 推出的4D动态场景生成框架
DynamicCity是什么 DynamicCity 是上海AI Lab推出的大规模动态场景生成的4D生成框架。DynamicCity 专注于生成具有语义信息的动态 Li…
Aya Vision – Cohere 推出多模态、多语言的视觉模型
Aya Vision是什么 Aya Vision 是 Cohere 推出的多模态、多语言的视觉模型,提升全球范围内的多语言和多模态通信能力。支持 23 种语言,能执行图像…
Airweave – 将任何应用程序转为 Agent 知识库的开源工具
Airweave是什么 Airweave 是开源工具,能将任何应用程序的数据(包括API、数据库、网站等)同步到图数据库和向量数据库中,让数据能基于智能代理或搜索机制进行…
s1 – 斯坦福和华盛顿大学推出低成本、高性能的AI推理模型
s1是什么 s1是斯坦福大学和华盛顿大学的研究团队开发的低成本、高性能的AI推理模型。模型通过“蒸馏”技术从谷歌的Gemini 2.0 Flash Thinking Ex…
WhisperChain – AI实时语音转文字工具,自动对文本进行清理和优化
WhisperChain是什么 WhisperChain 是开源的语音识别工具,基于语音输入提升工作效率。WhisperChain用 Whisper.cpp 实现实时语音…
Qwen2.5-1M – 阿里通义千问开源的语言模型,支持100万Tokens上下文
Qwen2.5-1M是什么 Qwen2.5-1M是阿里通义千问团队推出的开源模型,支持100万Tokens的上下文长度。模型包括Qwen2.5-7B-Instruct-1…
Wear-Any-Way – 阿里拍立淘团队推出自由定制的虚拟试穿框架
Wear-Any-Way是什么 Wear-Any-Way是阿里巴巴拍立淘团队推出的创新的虚拟试穿框架。通过稀疏对应对齐机制,实现了高保真度且可定制的虚拟试穿效果。用户可以…
Riona-AI-Agent – AI社交工具,可在社交媒体平台自动化交互点赞评论
Riona-AI-Agent是什么 Riona-AI-Agent是Node.js 和 TypeScript 构建的 AI 驱动的自动化工具,能与 Instagram、Tw…
Ming‑Flash‑Omni 2.0 – 蚂蚁开源的全模态大模型
Ming-flash-omni-2.0是什么 Ming-flash-omni-2.0是蚂蚁集团开源的全模态大模型,采用100B总参数/6B激活参数的MoE架构。作为业界S…
QwQ-Max – 阿里推出的深度推理模型,基于 Qwen2.5-Max
QwQ-Max是什么 QwQ-Max是阿里巴巴基于Qwen2.5-Max推出的深度推理模型,是 Qwen 系列的一部分。QwQ-Max-Preview作为预览版本推出,Q…
GLM-Zero – 智谱AI推出的深度推理模型
GLM-Zero是什么 GLM-Zero是智谱AI基于扩展强化学习技术的推理模型,专注于提升模型的深度推理能力。擅长处理数理逻辑、代码编写和复杂问题解决,在AIME 20…
SPRIGHT – 专注于空间关系的大型视觉语言数据集
SPRIGHT是什么 SPRIGHT(SPatially RIGHT)是亚利桑那州立大学 、Intel 实验室 、Hugging Face 、华盛顿大学等机构联合推出的,…
ENEL – 上海 AI Lab 推出的无编码器3D大型多模态模型
ENEL是什么 ENEL(Exploring the Potential of Encoder-free Architectures in 3D LMMs)是创新的无编码…
