💡 站外导读:随着 AI 技术渗透到日常工作流,浏览器自动化成为提升效率的关键痛点。然而,现有智能体在复杂网页任务中成功率有限,且常伴随隐私风险。微软研究院针对此背景推出 Fara1.5 系列模型,旨在通过“观察-思考-行动”循环,以高成功率解决浏览器场景下的智能化难题,这标志着 AI 从辅助工具向自主执行的重要跃迁。
在人工智能领域,微软研究院 AI Frontiers 实验室近日发布了全新的 Fara1.5系列智能体模型。这一系列专为浏览器场景设计,旨在提升计算机使用的智能化水平。Fara1.5系列涵盖了三个不同参数规模的版本,分别是4B、9B 和27B。
这款智能体模型能与 MagneticLite 沙盒浏览器界面协同工作。它可以直接获取浏览器的屏幕画面,并通过模仿鼠标点击和键盘输入,自动执行各类网页操作。Fara1.5 的运行机制遵循一个“观察-思考-行动”的循环过程,在每个环节,它都会综合历史对话记录和最近的三张浏览器截图,从而生成思考过程和下一步指令。

在性能方面,Fara1.5-27B 在 Online-Mind2Web 基准测试中取得了72% 的任务成功率,显著高于 OpenAI 的 Operator(58.3%)和 Gemini2.5Computer Use(57.3%)等竞品。而即使是 Fara1.5-9B 版本,其成功率也达到了63.4%。这种高效的表现让 Fara1.5系列在众多智能体中脱颖而出。
Fara1.5 的训练过程使用了大约200万个样本进行微调。这些数据来源丰富多样:其中60%是网页操作轨迹,12.8%来自合成环境,12.5%与用户交互相关,8.8%用于事实锚定,还有4.9%源于视觉问答任务。如此全面的训练数据极大地增强了模型的泛化能力与智能表现。
为了确保用户的安全与隐私,Fara1.5在以下三种情况下会主动停止操作并询问用户:缺少个人信息、任务描述不清晰以及即将执行未经批准的不可逆操作。此外,所有操作记录都将存储在 MagneticLite 沙盒中,确保智能体与用户设备之间的安全边界。
随着技术的持续发展,微软的 Fara1.5 系列产品为用户提供了更为智能、便捷的浏览新体验,充分展现了人工智能在日常电脑使用场景中的广阔应用前景。
划重点:
🌟 Fara1.5系列模型任务成功率高达72%,超越 OpenAI 等竞品。
🖥️ 该模型借助沙盒浏览器界面来完成网页任务,整个操作过程非常直观,用户上手轻松。
🔒 强调用户安全,主动询问模糊任务与个人信息保护,确保隐私安全。
📝 站长洞察 (Editor’s Insight)
微软此次发布 Fara1.5 系列,不仅是技术参数的刷新,更揭示了 AI 智能体发展的核心趋势:从封闭测试走向开放场景落地。其 72% 的成功率背后,是训练数据多样性(如合成环境、用户交互)与安全机制(如主动询问边界)的结合,这为行业树立了兼顾性能与可信度的新标杆。未来,随着多模态大模型与计算机使用场景的深度结合,类似智能体将重塑企业流程自动化,甚至催生新的交互范式,但数据隐私和可解释性仍是持续挑战。
