这是计算机科学史上注定被载入史册的时刻。英国数学家、计算机科学之父艾伦·图灵在1950年提出的伟大设想,在诞生76年后终于迎来了确凿的实证数据。

在最新一期的《美国国家科学院院刊》(PNAS)上,加州大学圣地亚哥分校(UCSD)的研究团队发表了一项令人瞩目的突破性发现。认知科学家卡梅伦·琼斯与本·伯根教授联合撰写的论文指出:在严格遵循经典三方图灵测试的设定下,当前最先进的大语言模型已成功证明其具备通过该测试的能力。更引人深思的是,在某些特定情境下,人工智能被误判为真人的概率,竟然比人类本身还要高。

image.png

核心硬核数据:

  • 封神登顶: 赋予特定人格提示后,GPT-4.5在73% 的情况下被判定为人类,胜率显著超越了与其同台竞技的真人志愿者。

  • 表现不相上下:开源模型的顶尖代表LLaMa-3.1-405B取得了56%的胜率,从统计学角度来看,其表现与真实人类已无显著差异,处于同等水平。

  • 提示词定乾坤: 失去精心设计的“人格提示词”后,GPT-4.5胜率暴跌至36%,LLaMa-3.1降至38%。AI 的伪装能力目前仍依赖人类的高级指令。

  • 基线表现失利:诞生于1960年代的规则型机器人ELIZA(23%)以及未经过针对性提示优化的GPT-4o(21%),在面对长对话时迅速暴露了破绽。

“说谎的游戏”:智商不再是标准,情商与缺陷才是伪装的核心

在这场由近500名评判员(包含 UCSD 本科生及网络招募志愿者)参与的双盲随机对照实验中,评判员需要通过5到15分钟的即时文本对话,在一真一假两个对象中揪出谁才是机器。

然而,最终的结果却超出了所有人的预期。过去,我们普遍认为AI要赢得图灵测试,必须依靠其“无所不知的强大算力”。但这项研究揭示了一个残酷的真相:大模型之所以能够成功“欺骗”人类,关键在于它们学会了“像人一样偶尔犯错和出现疏漏”。

image.png

[无提示状态:知识面过广、绝对理性] ──► 人类裁判:这绝对是AI!

正如通讯作者卡梅伦·琼斯所言,只要给定恰当的提示,先进的大语言模型就能精准模拟出人类的聊天语气、直接性、幽默感以及易错性(犯错和说错话的倾向)。它们赢下比赛,靠的不是展示数学和逻辑层面的高智商,而是展现出了几近完美的社会行为特征。

图灵测试的重新定义:从“衡量智能”到“衡量像人”

该研究的合著者本·伯根教授强调,这次实验迫使整个科学界不得不重新思考图灵测试的核心意义。图灵测试诞生之初,旨在检验机器能否在智能层面与人类相匹敌。但时至今日,AI在众多领域的响应速度和回答精度早已远超人类,仅仅比较“智力高低”已显得意义不大。

现在的图灵测试,与其说是在测试‘智能’,不如说是在测试‘像人’的程度。而这场游戏本质上就是一场关于说谎的比赛。AI 已经证明了自己是一个极其完美的说谎者。

一旦大语言模型能够在长达15分钟的开放式对话中成功伪装身份而不露出丝毫马脚,这就意味着,网络世界中长期以来依赖的信任基石将面临彻底崩塌的风险。

繁荣背后的阴影:“反洗钱”式的网络身份清算即将来临

当欺骗变得如此廉价和高效,现实世界的社会风险正成倍放大。伯根教授对此表达了深切的担忧。这种能够完美伪装成人类的 AI 技术,极易被不法分子、政治团体或激进的商业公司恶意利用。

在社交媒体或客户服务等线上场景中,用户很可能在完全不知情的情况下,被一个伪装成人类的聊天机器人所说服,进而泄露自己的社保号码等敏感个人信息、改变既定的政治投票倾向,或者因一时冲动而购买某项产品。

针对这一历史性的科学实证,研究团队也正式向社会发出警示:未来在线上与陌生人互动时,人们必须大幅降低“自己能100%分辨真人与机器人”的迷之自信。为了应对日益倒退的网络信任生态,更严苛的数字身份验证与 AI 生成内容防伪机制,必须以更快的速度提上日程。