Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: Magentic-UI – 微软开源的人机协作AI Agent研究原型
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > Magentic-UI – 微软开源的人机协作AI Agent研究原型
AIGC 资讯

Magentic-UI – 微软开源的人机协作AI Agent研究原型

站外新闻
最近更新: 2026年6月7日 下午8:03
SHARE

Magentic-UI是什么

Magentic-UI 是微软推出的开源研究原型,用在探索人类参与的 AI Agent系统。Magentic-UI 是以人为中心的AI Agent,能与用户协作完成复杂的 Web 任务,如浏览网页、执行代码和处理文件。Magentic-UI 的核心特点是协作规划(co-planning)、协作执行(co-tasking)、安全机制(action guards)及从经验中学习(plan learning)。Magentic-UI 基于让用户在任务规划和执行过程中实时参与,提供透明且可控的交互体验。Magentic-UI 基于人类反馈提升任务完成效率,降低人工成本,为研究人类与 AI Agent的协作提供实验平台。

阅读目录
  • Magentic-UI是什么
  • Magentic-UI的主要功能
  • Magentic-UI的技术原理
  • Magentic-UI的项目地址
  • Magentic-UI的应用场景

Magentic-UI

Magentic-UI的主要功能

  • 协作规划:在执行任务前生成分步计划,用户能修改、批准,确保任务按预期进行。
  • 协作执行:实时展示即将执行的操作,用户随时接管控制权,确保任务执行符合需求。
  • 安全机制:在执行关键或不可逆操作前征求用户批准,支持用户自定义审批策略,保障操作安全。
  • 学习复用:任务完成后保存执行计划,用户能在未来任务中复用或修改,提升效率。

Magentic-UI的技术原理

  • 系统架构:Magentic-UI 基于 AutoGen 的 Magentic-One 系统,用多个专业代理(agents)组成,协同工作完成任务。Orchestrator(协调者)由大型语言模型(LLM)驱动,负责与用户进行协作规划,决定何时征求用户反馈,将子任务分配给其他Agent完成。WebSurfer(网页浏览者)配备浏览器控制能力的 LLM Agent,能执行点击、输入、滚动等操作,完成 Orchestrator 分配的网页浏览任务。Coder(代码执行者)配备 Docker 代码执行容器的 LLM Agent,将结果反馈给 Orchestrator。FileSurfer(文件处理者)配备 Docker 容器和文件转换工具的 LLM 代理,能定位文件、转换为 Markdown 格式,回答有关文件的问题。
  • 交互流程:用户输入文本消息和附加图像与 Magentic-UI 交互。Orchestrator 根据用户输入创建自然语言的分步计划,用户基于计划编辑界面进行修改。Orchestrator 根据计划的每一步决定由哪个Agent或用户完成,发送请求等待响应。所有步骤完成,Orchestrator 生成最终答案呈现给用户。如果在执行过程中发现计划不足,Orchestrator 在获得用户许可后重新规划执行新计划。
  • 安全与控制:用户设置 Magentic-UI 可访问的网站列表,访问列表外的网站需要用户明确批准。用户在 Magentic-UI 执行任务的任何阶段中断它,停止任何待执行的代码或网页浏览操作。Magentic-UI 控制的浏览器和代码执行器都在 Docker 容器中运行,避免对主机环境产生影响,防止登录凭证泄露等安全风险。用户配置行动审批策略,决定 Magentic-UI 在执行某些操作时是否需要用户批准。

Magentic-UI的项目地址

  • 项目官网:https://www.microsoft.com/en-us/research/blog/magentic-ui
  • GitHub仓库:https://github.com/microsoft/magentic-ui

Magentic-UI的应用场景

  • 复杂任务自动化:帮助用户完成多步骤的 Web 任务,如比较产品价格、填写在线表单或预订旅行。
  • 代码编写与执行辅助:生成代码片段、安全运行代码,例如数据分析或脚本编写。
  • 文件处理与信息检索:转换文件格式、搜索文件内容回答相关问题。
  • 研究与开发:为研究人员提供实验平台,探索人机协作方式。
  • 教育与培训:作为教学工具,帮助学习任务规划和 AI 协作。
NavFoM:全球首个环视导航大模型!零样本跨本体适配,机器人/无人机/汽车通用
VARGPT – 北大推出的多模态理解生成统一模型
MiniMax MCP Server – MiniMax 推出基于 MCP 的多模态生成服务器
京东零售开源 OxyGent:多智能体协作框架,解锁AI应用构建新范式
OThink-MR1 – OPPO联合港科大推出的多模态语言模型优化框架
分享
Email 复制链接 打印
Share
上一篇 Amazon Nova Act – 亚马逊推出的通用 AI 智能体,自主执行网页任务
下一篇 WebSSL – Meta联合纽约大学等机构推出的视觉自监督学习系列模型
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

Self Forcing: Adobe与德克萨斯大学联合推出实时视频生成模型,单GPU实现17FPS,告别传统AI视频生成延迟
AI 工具 AIGC 资讯
腾讯AI Lab重磅开源SongGeneration:AI音乐生成大模型,多轨合成、风格克隆,媲美商业模型
AI 工具 AIGC 资讯
快手OneRec:颠覆传统推荐!端到端生成式AI系统引爆观看时长与GMV
AI 工具 AIGC 资讯
Kimi-Researcher:月之暗面端到端强化学习Agent,深度研究基准测试超Claude 4 Opus
AI 工具 AIGC 资讯

相关推荐

AI 工具AIGC 资讯

腾讯ARC重磅发布AudioStory:一句话生成叙事音频,AI配音、有声书、游戏音效全搞定

站外新闻
AIGC AudioStory 腾讯ARC 视频配音 音频生成模型
AI 工具AIGC 资讯

蚂蚁百灵开源万亿参数模型Ling-2.6-1T:智效比登顶,AIME26/SWE-bench双料SOTA,专为Agent与Coding打造

站外新闻
AI Agent InclusionAI Ling-2.6-1T SWE-Bench 百灵大模型
AI 工具AIGC 资讯

GPT-5.3-Codex-Spark发布:OpenAI首个实时编程模型,Cerebras芯片驱动1000+ tokens/秒超低延迟编码体验

站外新闻
Cerebras WSE-3 GPT-5.3-Codex-Spark openai 实时编程模型 轻量级AI模型
AIGC 资讯

星火医疗大模型X1 – 讯飞医疗推出的深度推理大模型

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程助手 AI编程工具 AI编程模型 AI视频生成 AI音乐生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax MoE架构 MoE模型 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 清华大学 知识管理 科大讯飞 端侧AI 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.