在人工智能领域,微软研究院 AI Frontiers 实验室近日发布了全新的 Fara1.5系列智能体模型。这一系列专为浏览器场景设计,旨在提升计算机使用的智能化水平。Fara1.5系列涵盖了三个不同参数规模的版本,分别是4B、9B 和27B。

这款智能体模型能与 MagneticLite 沙盒浏览器界面协同工作。它可以直接获取浏览器的屏幕画面,并通过模仿鼠标点击和键盘输入,自动执行各类网页操作。Fara1.5 的运行机制遵循一个“观察-思考-行动”的循环过程,在每个环节,它都会综合历史对话记录和最近的三张浏览器截图,从而生成思考过程和下一步指令。

image.png

在性能方面,Fara1.5-27B 在 Online-Mind2Web 基准测试中取得了72% 的任务成功率,显著高于 OpenAI 的 Operator(58.3%)和 Gemini2.5Computer Use(57.3%)等竞品。而即使是 Fara1.5-9B 版本,其成功率也达到了63.4%。这种高效的表现让 Fara1.5系列在众多智能体中脱颖而出。

Fara1.5 的训练过程使用了大约200万个样本进行微调。这些数据来源丰富多样:其中60%是网页操作轨迹,12.8%来自合成环境,12.5%与用户交互相关,8.8%用于事实锚定,还有4.9%源于视觉问答任务。如此全面的训练数据极大地增强了模型的泛化能力与智能表现。

为了确保用户的安全与隐私,Fara1.5在以下三种情况下会主动停止操作并询问用户:缺少个人信息、任务描述不清晰以及即将执行未经批准的不可逆操作。此外,所有操作记录都将存储在 MagneticLite 沙盒中,确保智能体与用户设备之间的安全边界。

随着技术的持续发展,微软的 Fara1.5 系列产品为用户提供了更为智能、便捷的浏览新体验,充分展现了人工智能在日常电脑使用场景中的广阔应用前景。

划重点:

🌟 Fara1.5系列模型任务成功率高达72%,超越 OpenAI 等竞品。

🖥️ 该模型借助沙盒浏览器界面来完成网页任务,整个操作过程非常直观,用户上手轻松。

🔒 强调用户安全,主动询问模糊任务与个人信息保护,确保隐私安全。