Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: AndroidGen – 智谱推出增强大语言模型 Agent 能力的框架
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > AndroidGen – 智谱推出增强大语言模型 Agent 能力的框架
AIGC 资讯

AndroidGen – 智谱推出增强大语言模型 Agent 能力的框架

站外新闻
最近更新: 2026年6月8日 下午6:27
SHARE

AndroidGen是什么

AndroidGen 是智谱技术团队推出增强基于大语言模型(LLM)的 Agent 能力的框架,特别是在数据稀缺的情况下。框架通过收集人类任务轨迹基于这些轨迹训练语言模型,开发出无需人工标注轨迹的 Agent,显著提升 LLM 执行复杂任务的能力。

阅读目录
  • AndroidGen是什么
  • AndroidGen的主要功能
  • AndroidGen的技术原理
  • AndroidGen的性能效果
  • AndroidGen的应用场景

AndroidGen

AndroidGen的主要功能

  • 无需人工标注的数据收集与训练:AndroidGen 能在无需人工标注轨迹的情况下,通过收集人类任务轨迹并基于这些轨迹训练语言模型,开发出高效的 Agent。
  • 增强 Agent 的任务执行能力:通过四个核心模块(ExpSearch、ReflectPlan、AutoCheck 和 StepCritic),AndroidGen 显著提升了 LLM 执行复杂任务的能力。
    • xpSearch(经验搜索):通过检索已完成的类似轨迹,使 LLM 进行上下文学习,从而提升 Agent 的能力,帮助其实现从简单任务到复杂任务的泛化。
    • ReflectPlan(反思计划):对当前环境进行自我反思并更新计划状态,增强 Agent 的长期推理能力。
    • AutoCheck(自动检查):主动验证每个 Agent 操作的有效性,降低因操作失误导致任务失败的风险。
    • StepCritic(步骤评估):将任务分解为多个子目标,并提供逐步轨迹评估,为模型优化提供细粒度标签。
  • 高效的数据收集管道:AndroidGen 构建了一个高效的数据收集管道,能生成大量高质量的 Android 浏览轨迹。

AndroidGen的技术原理

  • 模型训练:采用 LoRA 技术,针对自动构建的数据集对 GLM-4-9B 和 Llama-3-70B 进行微调,得到 Android Agent 模型。无需人工标注轨迹,通过将轨迹中的每一步作为独立样本进行训练,充分利用了数据集中的信息。
  • 混合规划和执行步骤:将规划和执行步骤混合起来进行微调,使 LLM 能够同时具备规划和执行的能力。
  • 数据收集流程:
    • 任务制定:基于 GPT-4o 根据 AndroidWorld 中的指令生成约 300 条任务指令。
    • Agent 采样:基于 AndroidWorld 和 GPT-4o 对每个任务的轨迹进行采样。
    • 轨迹记录:记录每一步的环境和操作信息,构建可复现的 Android 导航轨迹。
    • 轨迹评估:使用 StepCritic 对记录的轨迹进行评估,确保每个子目标都已完成。
    • 轨迹增强:扩充高质量数据集,最终构建了一个包含 1000 多个轨迹的数据集。

AndroidGen的性能效果

  • AndroidWorld 基准测试:
    • AndroidGen 显著提升了相同基础模型 Agent 的能力,与 M3A 和 SeeAct 相比,性能提升更为显著。
    • AndroidGen + GPT-4o 的平均得分达到了 46.8,远超其他组合。
    • 模型参数更小且开源的 GLM-4-9B + AndroidGen 的平均得分,超过了模型参数更大且闭源的 GPT-4o + M3A。
  • AitW(Android in the Wild) 和八款全球流行的移动应用程序(如 Google Maps、YouTube 等)的评测中,AndroidGen 也表现出色,在真实设备环境中对自然语言指令的理解和交互能力。

AndroidGen的应用场景

  • 自动化任务处理:通过自然语言指令,Agent 可以自动完成如发送邮件、设置提醒、查询信息等任务。
  • 跨应用操作:Agent 能在不同应用之间进行交互,完成如从一个应用复制数据到另一个应用等操作。
  • 智能导航:在 Android 设备上,Agent 可以根据用户指令进行导航,例如打开特定的应用、查找文件等。
  • 智能交互:通过自然语言理解,Agent 能与用户进行交互,提供更智能的用户体验。
禁用12小时后全面恢复!Notion 澄清 Anthropic 模型下线传闻:仅为技术性故障
OpenAI 紧急修复 ChatGPT 与 API 高延迟故障:服务已恢复,部分功能仍待优化
上海发布AI微短剧“沪8条”:最高千万资助,全流程AI化重塑出海版图
Amazon Nova Act – 亚马逊推出的通用 AI 智能体,自主执行网页任务
腾讯云发布音视频 AI 品牌 WAND:内置六大自研模型与60+项AI能力
分享
Email 复制链接 打印
Share
上一篇 ACE++ – 阿里通义推出的升级版图像生成与编辑模型
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

ACE++ – 阿里通义推出的升级版图像生成与编辑模型
AIGC 资讯
Llama Nemotron – 英伟达推出的系列推理模型
AIGC 资讯
Image-01 – MiniMax 推出的文本到图像生成模型
AIGC 资讯
SyncAnimation – 南科大等推出的实时音频驱动生成头部运动框架
AIGC 资讯

相关推荐

AIGC 资讯

ReasonGraph – 开源可视化与分析LLMs推理过程的AI工具

站外新闻
AI 工具AIGC 资讯

Stable Audio 3 开源发布:0.62秒生成20秒音频,音频创作门槛再降低

站外新闻
AIGC Stability AI Stable Audio 3 潜扩散模型 音频生成
AIGC 资讯

The AI Scientist-v2 – 通用端到端 AI 系统,自动探索科学假设生成论文

站外新闻
全息流体渐变通用占位特色图
AIGC 资讯

杭州全息智能技术研究院揭牌六大AI联合实验室,打造产学研融合新引擎

站外新闻
产学研融合 人工智能 具身智能 杭州全息智能技术研究院 联合实验室
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AGI AI AI Agent AIGC AI商业化 AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI生成内容 AI监管 AI绘画 AI编程 AI编程工具 AI编程智能体 AI芯片 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenRouter Pika prompt SpaceX stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源大模型 开源工具 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.