Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 明略科技Mano大模型重磅发布:GUI智能操作新标杆,登顶Mind2Web与OSWorld双榜单
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > 明略科技Mano大模型重磅发布:GUI智能操作新标杆,登顶Mind2Web与OSWorld双榜单
AI 工具AIGC 资讯

明略科技Mano大模型重磅发布:GUI智能操作新标杆,登顶Mind2Web与OSWorld双榜单

站外新闻
最近更新: 2026年6月7日 下午8:15
GUI智能体 Mano 明略科技 自动化操作
SHARE

💡 站外导读:在AI驱动自动化的浪潮中,如何让机器像人一样精准操作复杂GUI界面,是通往通用人工智能(AGI)的关键一步。传统脚本自动化脆弱、维护成本高,面对动态网页和多样桌面软件束手无策。明略科技最新发布的Mano大模型,正是瞄准这一核心痛点,它通过多模态感知与强化学习的深度融合,不仅在权威基准测试中刷新纪录,更致力于将自动化从“流程编排”升级为“智能执行”,开启GUI交互的新范式。

Mano是什么

Mano 是明略科技推出的专有大模型,专注于图形用户界面(GUI)智能操作。模型基于多模态基础模型,通过在线强化学习和训练数据自动采集等创新技术,在 Mind2Web 和 OSWorld 两大基准测试中取得 SOTA 成绩。Mano 能精准识别和操作网页及桌面环境中的 GUI 元素,完成复杂任务,如填写表单、登录账号等,为自动化操作提供高效解决方案,推动 GUI 智能体领域的发展。

阅读目录
  • Mano是什么
  • Mano的主要功能
  • Mano的技术原理
  • Mano的项目地址
  • Mano的应用场景
      • 📝 站长洞察 (Editor’s Insight)

Mano

Mano的主要功能

  • 自动化网页操作:模型能自动完成网页中的各种操作,如填写表单、点击按钮、输入文本、提交表单等,能应用在自动化数据采集、网页自动化测试等场景。
  • 桌面应用操作:支持对桌面软件的操作,包括打开软件、进行菜单操作、输入文本、点击按钮等。
  • 跨平台操作:兼容多种操作系统和浏览器,实现在不同平台上的自动化操作,满足多样化的自动化需求。
  • 数据采集与分析:支持自动从网页或桌面应用中采集数据,进行初步分析,为后续的数据处理和决策提供支持。
  • 错误检测与恢复:具备错误检测机制,能及时发现操作过程中的错误,尝试自动恢复,提高操作的可靠性和稳定性。

Mano的技术原理

  • 多模态基础模型:基于多模态基础模型,能理解和处理视觉信息(如网页截图)和文本信息(如用户指令、网页文本),实现对 GUI 环境的感知和理解。
  • 在线强化学习:通过在线强化学习,Mano 能在与真实环境的交互中不断学习和优化操作策略,提高在动态环境中的适应性和决策能力。
  • 训练数据自动采集:设计训练数据自动采集模块,自动生成和采集高质量的交互数据,用在模型的训练和优化,降低人工标注成本。
  • 监督微调(SFT):在训练的第一阶段,用监督学习对模型进行微调,能更好地理解和执行特定的 GUI 操作任务。
  • 离线强化学习:在第二阶段,通过离线强化学习进一步优化模型的决策能力,能更好地完成多步操作任务。
  • 在线强化学习:在第三阶段,模型在模拟环境中与真实环境进行交互,通过在线强化学习进一步提升模型适应性和灵活性。
  • 验证模块:Mano 配备验证模块,用在验证每一步操作的正确性,及时发现、纠正错误,提高操作的准确性和可靠性。

Mano的项目地址

  • 技术论文:https://www.mininglamp.com/wp-content/uploads/2025/09/%E6%98%8E%E7%95%A5%E7%A7%91%E6%8A%80-Mano-Technical-Report.pdf

Mano的应用场景

  • 自动化数据采集:Mano 能自动从网页或桌面应用中采集数据,为数据分析和研究提供高效支持,节省人工采集时间。
  • 网页自动化测试:模型自动完成网页的各种操作,如填写表单、点击按钮等,用在测试网页功能是否正常,提高测试效率和准确性。
  • 企业自动化办公:支持对桌面软件的操作,实现企业内部办公流程的自动化,如自动填写报表、发送邮件等,提升工作效率。
  • 软件自动化测试:模型用在对桌面软件进行自动化测试,包括打开软件、进行菜单操作等,帮助开发者快速发现软件问题。
  • 智能客服辅助:模型能自动处理一些常见的客户咨询问题,如查询订单状态、解答常见疑问等,减轻客服人员的工作负担。

📝 站长洞察 (Editor’s Insight)

Mano的发布,标志着GUI智能体从“能用”向“好用”的关键跃迁。其技术路径极具前瞻性:三阶段训练法(SFT→离线RL→在线RL)完美解决了从静态数据到动态环境的泛化难题,而验证模块则直指商业落地最核心的可靠性需求。在RPA(机器人流程自动化)市场增长见顶的背景下,Mano代表了AI原生自动化范式的崛起——它不替代特定工具,而是成为操作所有数字界面的通用“数字员工”。结合国内大模型“卷应用”的大趋势,明略科技选择从企业级、高价值的GUI操作场景切入,避开通用对话的红海,展现了极强的差异化战略。未来,此类模型将成为AI Agent的核心“手眼”,其生态位价值可能远超模型本身。

BestBlogs:开源AI内容聚合平台,400+ RSS源智能筛选编程/设计/商业科技资讯
阿里通义开源Mobile-Agent-v3.5:跨平台GUI Agent框架,从演示级迈向工程级
Fourier N1 – 傅利叶推出的首款开源人形机器人
Arrow 1.0:Quiver AI发布全球首款SVG原生AI模型,矢量图形生成进入新纪元
字节跳动开源Lance 3B:仅30亿参数,一个模型同时搞定AI看图、写图、剪视频
TAGGED:GUI智能体Mano明略科技自动化操作
分享
Email 复制链接 打印
Share
上一篇 浙大开源SciToolAgent:知识图谱驱动,集成500+科学工具,AI自动化科研全流程
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

浙大开源SciToolAgent:知识图谱驱动,集成500+科学工具,AI自动化科研全流程
AI 工具
京东开源xLLM:国产芯片AI推理框架,服务-引擎分离架构实现端云一体高效部署
AI 工具 AIGC 资讯
Meta ARE: Meta发布AI Agent动态环境评估平台 Gaia2基准测试引领行业新标准
AI 工具 AIGC 资讯
小红书开源FireRedChat:全双工语音交互系统,实现可控打断与私有化部署
AI 工具 AIGC 资讯

相关推荐

AIGC 资讯

披着便利外衣的陷阱!国安部鸣枪警告:警惕“AI中转站”四大致命风险

站外新闻
AI 工具AIGC 资讯

谷歌Gemini Deep Research Agent深度解析:基于Gemini 3 Pro的自动化研究革命

站外新闻
AI研究报告 Gemini Deep Research 多步骤强化学习 谷歌
AIGC 资讯

MAI-Image-2.5 – 微软推出的旗舰级文生图模型

站外新闻
AIGC 资讯

X-Fusion – 加州大学联合Adobe等机构推出的多模态融合框架

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI图像生成 AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程工具 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.4 GPT-5.5 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 NVIDIA openai OpenClaw prompt SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 大模型 大模型推理 大语言模型 字节跳动 家居 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 文本转语音 早报 智谱AI 月之暗面 本地AI 清华大学 生成式AI 科大讯飞 端侧AI 端侧部署 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 赛博朋克 边缘计算 通义千问 长上下文 阶跃星辰 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.