站外新闻 – 第 150 页 – Prompt 语宙

站外新闻

4997 .

LowCodeEngine – 阿里开源的低代码开发框架

LowCodeEngine是什么 LowCodeEngine是阿里巴巴开源的低代码开发框架，基于提供拖拽、配置等简单操作，让开发者快速构建复杂的系统页面。框架以强大的定制…

Qwen-Agent – 阿里通义开源的 Agent 应用开发框架

Qwen-Agent是什么 Qwen-Agent是基于通义千问模型（Qwen）的开源Agent开发框架，支持开发者用Qwen模型的指令遵循、工具使用、规划和记忆能力构建智…

Mind GPT-3o – 理想汽车推出的多模态端到端大模型

Mind GPT-3o是什么 Mind GPT-3o是理想汽车推出的多模态端到端大模型，融合语音、视觉和语言理解技术，实现高效实时交互。Mind GPT-3o具备记忆、规…

琅琊 – 中国科学院海洋研究所自主研发的海洋大模型1.0版本

琅琊是什么琅琊是中国科学院海洋研究所自主研发的新一代海洋人工智能大模型1.0版本，专注于海洋状态变量预报。模型结合了先进的人工智能算法和专业的海洋科学知识，能实现对全球…

DynamicControl – 腾讯优图联合南洋理工等机构推出的动态条件控制图像生成新框架

DynamicControl是什么 DynamicControl是腾讯优图联合南洋理工、浙大等研究机构推出的集成多模态大语言模型（MLLM）推理能力的文本生成图像（T2I…

VideoPhy – UCLA 联合谷歌推出评估视频生成模型物理常识能力的基准测试

VideoPhy是什么 VideoPhy是UCLA和谷歌研究研究院联合推出的，首个评估视频生成模型物理常识能力的基准测试，能衡量模型生成的视频是否遵循现实世界的物理规则。…

Large Motion Model – 商汤科技联合南洋理工推出的统一多模态运动生成模型

Large Motion Model是什么 Large Motion Model（LMM）是统一的多模态运动生成模型，是新加坡南洋理工大学S-Lab和商汤科技研究团队共同…

StereoCrafter – 腾讯开源将任意2D视频转为立体3D视频的框架

StereoCrafter是什么 StereoCrafter是腾讯AI Lab和ARC Lab共同推出的创新框架，能将单目视频（2D视频）转换为立体3D视频，满足日益增长…

AgiBot World – 智元机器人开源的百万真机数据集

AgiBot World是什么 AgiBot World是智元机器人开源的百万真机数据集，旨在推动具身智能的发展。数据集包含八十余种日常技能，覆盖家居、餐饮、工业等五大核…

GraphAgent – 港大联合港科大开源的智能图形语言助手

GraphAgent是什么 GraphAgent是香港大学和香港科技大学（广州）联合推出的智能图形语言助手，能处理现实世界中结构化（如图连接）和非结构化（如文本、视觉信息…

DeepSeek Engineer – 开源AI编程助手，处理用户对话生成结构化JSON

DeepSeek Engineer是什么 DeepSeek Engineer 是集成DeepSeek API 的AI编程助手，基于命令行界面让用户能读取本地文件、创建新文…

Psi R0 – 灵初智能推出的端到端具身模型

Psi R0是什么 Psi R0是灵初智能发布的首个基于强化学习的端到端具身模型。支持双灵巧手协同进行复杂操作，能够将多个技能串联混训，生成具有推理能力的智能体，完成并闭…

WBench – 美团推出的交互式视频世界模型多轮评测基准

WBench是什么 WBench 是美团 LongCat 团队推出的，首个面向交互式视频世界模型的系统性多轮评测基准，包含 289 个测试案例和 1058 个交互轮次，覆…

MemGUI-Agent – 浙大联合快手推出的长程手机GUI智能体

MemGUI-Agent是什么 MemGUI-Agent 是浙大与快手联合推出的长程手机GUI智能体，专为跨App、多步骤、长链条的移动端自动化任务设计。传统ReAct风…

InternAgentS – 上海 AI Lab 开源的国产科研智能体工作台

InternAgentS是什么 InternAgentS 是上海AI实验室开源的国产科研智能体工作台，面向 AI for Science 场景，将论文阅读、实验分析、代码…

LingBot-Depth 2.0 – 蚂蚁灵波科技推出的深度补全模型

LingBot-Depth 2.0是什么 LingBot-Depth 2.0 是蚂蚁灵波科技发布的面向真实场景的深度补全模型，同步开源视觉基座模型 LingBot-Vis…