近百年前创作的经典散文《荷塘月色》近日被某 AI 检测工具判定为“AI 生成率超 60%”,该荒诞结果迅速引发网民热议。针对这一现象,相关领域的技术专家明确指出,这表明大众对“AI 率”这一概念存在着根本性的误解。

业内人士对此解释道,报告中显示的60%概率,指的是整篇文本由人工智能独立创作的可能性,而不是说文章中有六成内容是机器生成的。这些经典文学作品之所以会被标记为高度疑似AI生成,根本原因在于它们早已被广泛用作训练大语言模型的基础数据。

经典名篇屡成算法牺牲品

由于 AI 检测的原理是比对文本用词与模型预测的一致性,而大模型对《荷塘月色》等经典文本的表达极其熟悉,才会导致一致性过高并引发误判。不仅朱自清的作品中招,刘慈欣的《流浪地球》片段也曾被检出超 50% 的 AI 率,而《滕王阁序》甚至被标注过 100% 的 AI 率。

由于各个检测平台所采用的算法逻辑各不相同,不同工具得出的结果往往差异显著,同一篇内容的检测数据偏差有时甚至能达到30%。此外,检测结果的可靠性与被测文本的篇幅密切相关,一般需要达到约500字左右,所给出的结论才具有一定的参考意义。

保持独特文风对抗概率误判

随着 AI 检测工具的普及,目前市面上甚至已经催生出了“提供 AI 生成再提供降 AI 率服务”的灰色产业链。这种通过替换高频词来规避检测的手段,在本质上只是技术之间进行的一场持续攻防战。

专家指出,AI检测工具所输出的结果本质上是一种概率性判断,绝不可将其视为衡量文章原创程度的唯一依据。对于那些时常需要证明自己作品原创性的创作者和学生群体而言,锤炼并保持鲜明独特的个人写作手法,是抵御算法误判最有效的策略。