或者说,GPT-4 能有多好地模拟 1963 年的 LSD 旅程?
Benjamin Breen 2023 年 12 月 12 日
随着我的新书 Tripping on Utopia 的发布日(明年一月中旬)临近,关于书籍宣传和先行评价的激动人心的消息即将公布。但此刻,我想先谈谈我去年一直在研究的一个话题——将生成式 AI 作为一种历史情景模拟工具——并将其应用于我书中的内容。
我实际上已经在我两本书的内容上进行了这样的尝试。我的第一本书 The Age of Intoxication 聚焦于 17 和 18 世纪的全球药物、香料和医药贸易。而 Tripping on Utopia 则深入探讨了迷幻科学的初期阶段,特别是关注人类学家 Margaret Mead 和 20 世纪 50 年代的迷幻药物研究者。
我会在下面介绍一些精彩片段,但如果你想要看到一个完整的“剧本”,这个剧本是基于我在 Tripping on Utopia 中使用的资料直接启发而成的模拟体验和场景,你可以在这里找到:
使用 GPT-4 模拟 1963 年的 LSD 之旅
为什么我这么热衷于这种事物?
可以理解,一些作家和历史学家会把生成式 AI 看作是竞争对手。毕竟,由 AI 创作的书籍已经开始在亚马逊上销售。不久的将来,第一个 AI 创作的 YouTube 系列和由 AI 完全创作及表演的首个排行榜第一的单曲,以及其他更多的作品将会问世。我对这种趋势也并不感到欣喜。但不同于某些人的观点,我认为这并非我们唯一的未来发展方向。我对生成式 AI 的兴趣不在于它取代人类作者,而是看它作为一种工具,让我们能够更深入地探索和体验世界的不同面貌。
比如说,一个作者正在创作中的小说世界,或者像我这样的历史学家所研究和描述的已消失的历史世界。
教育工作者称这为体验式学习。我越来越认为,体验式学习将成为当前 AI 系统最持久和最有影响力的应用之一。
我现在已经拥有一些初步数据,这些数据支持我此前关于 AI 历史模拟潜力的直觉。在秋季学期,我在加州大学圣克鲁兹分校教授的世界历史课程中,应用了我在先前的文章中提到的历史模拟活动。
随后,我让我的学生们完成了一项匿名调查,以了解这些活动对他们的学习有何影响。调查中有一个显著的结果是:
当让学生们从一个列表中选择时,有 71% 的学生认为“扮演历史人物,做出选择和决策”的能力对他们的课堂学习最有帮助。而整整84% 的学生表示,AI 历史模拟在很大程度上或在某种程度上增强了他们对该时期历史的整体理解。
最关键的问题无疑是准确性:为了让模拟成为一种有效的学习工具,它必须准确地反映历史记录。我相信这个难题是有解决方案的,但目前还没找到。现在,我正努力让我的学生们明白,他们体验的模拟场景会有很多历史上的不准确之处。实际上,讨论、核查和反思这些不准确之处已经成为我们活动中的核心部分了。毕竟,对历史来源的可靠性进行思考正是历史学家工作的重要组成部分。
那么,关于更加孤立地想象另一个世界的情况呢?在创作《跌入乌托邦》这本书的过程中,我投入了大量的时间来确定事件的发生顺序,核实各种说法,梳理不同人物之间的关系,以及进行其他需要严谨和事实清晰的历史分析。同时,我也花了很多时间做一些更像是白日梦的事情。在写作期间,我思考了很多问题,比如:
-
感染疟疾发烧是什么感觉?
-
1933 年坐在机动独木舟的后面进行对话会不会太吵?
-
玛格丽特·米德为何最初在 1954 年自愿参加 LSD 实验,后来又退出?可能的原因是什么?
-
作为早期迷幻实验的志愿者,会有怎样的体验?
这些可以说是写历史的更多基于“氛围感”的元素。你当然可以基于历史记录做出合理的推测,但在必要时,你还得加入自己的想象力。
生成式 AI(生成式 AI)无法解答上述问题。但它能激发那些在写作和教授历史时至关重要的历史想象力和同理心的微小行为。要了解我所说的这种实践感觉,你可以阅读这篇模拟 1963 年的迷幻之旅的记录。这里的参与者,名叫 Leo Mitchell 的 32 岁艺术家,是虚构的,而且文中有许多明显的不准确之处(例如,他所携带的“装备”包括一小瓶 LSD 药丸,但显然,志愿者不可能带着实验药物进入实验室!)
作为一名历史学者,我在这里找到了许多有价值的内容。比如,对周遭环境和身体感受的重视。1963 年 10 月的一个早晨,Leo 进入洛杉矶神经精神病医院,开始他的 LSD 实验,他感到胃里一阵紧张的兴奋。他留意到医院空调系统的轻微嗡嗡声。随着药效的发作,“原先让人感到宁静的墙上阴影”开始变得威胁起来。
DALLE-3 根据描述的场景生成的视觉效果也令人印象深刻。比如,有一张图展示了 Leo 在走廊中凝视着自己的手,这幅图生动地再现了那个时代众多迷幻药研究的临床背景:
下面这张图同样让我感到意外地惊喜,它描绘了 Leo Mitchell 在药物完全发作下走向 Sidney Cohen 办公室的场景。在这一刻,“荧光灯发出嗡嗡声和闪烁,墙上的阴影变得怪异而动荡。”
在这个模拟中,Mitchell 的内心世界被生动地描绘了出来。作为一位艺术家,Mitchell 用木炭画了自己的大脑,并且手持这幅画。模拟中的这个细节表明:“你手中握着的大脑素描的细腻之处仿佛栩栩如生,你感觉它仿佛是你当前心理状态的导图。”
在撰写《Tripping on Utopia》这本书的时候,我并未使用过类似的生成式 AI 工具。但如果当时我能用到它们,我相信这将对我深入理解一个面对全新体验、心情紧张的病人的视角大有帮助,而不仅仅是了解那些创造了关于早期迷幻治疗大量原始资料的科学家们的观点。
模拟一位 1680 年代的医生
在生成式 AI 系统的训练过程中,一个引人入胜的特点是它们包含了历史记录的各个层次。这些系统的训练数据并非全部来自近十年,甚至并非全部来自上个世纪。例如,大量的维基百科内容直接源自 1911 年版的 百科全书 Britannica,而这本百科全书现属公共领域。因此,像 Gemini 和 GPT-4 这样的模型中蕴含着大量的 1911 年的知识。
这对于那些试图将 ChatGPT 作为搜索引擎来寻找可靠事实的用户来说可能是个问题。但对于那些热衷于探索过时和古老知识的历史学家来说,这无疑是个惊喜。
这一理念的一个极端应用是 MonadGPT,这是数字人文学家 Pierre-Carl Langlais 创建的一个语言模型。它基于开源的 Mistral 7B 语言模型,并专门针对早期现代欧洲文献进行了调整。正如 Langlais 所描述,其结果令人惊叹:“如果 ChatGPT 在 17 世纪就被发明,会是什么样子?MonadGPT 就是可能的答案。”你可以直接通过这个链接与之交流。
为了检验 MonadGPT 扮演 1680 年代医生的能力 —— 这正是我在 醉乱时代 一书中研究的重要年代之一 —— 我用 17 世纪英国医生 Thomas Sydenham 在这里描述的一组随机选择的症状进行了测试。这些症状包括“痉挛”、“剧烈头痛”、“呕吐绿色物质”、“心悸”、“咳嗽”和“伊利亚克痛苦”。
对于 Sydenham 而言,这些症状似乎只能指向一个结论:女性的“歇斯底里症”和男性的“忧郁症”。
我曾请求 MonadGPT 基于这些症状给出诊断和治疗方案。它诊断为水肿,并建议我“饮食要适量,少喝烈酒”,还开了这样一剂处方:
需要芦荟两剂、香脂一剂、阿拉伯胶半剂和樟脑半剂;混合后用水服用,每小时两勺。此外,还需芸苔、鸦片、当归、千里光、罂粟籽和没药各一剂,混合后每天两勺。同时,用两盎司黑洋地黄煮沸一夸脱水,直至浓缩一半,过滤后每日服用半品脱,直至病愈。
这个处方很好地模仿了早期现代药物配方,但却没能准确判断出我的实际病情。
不过,有趣的是,搭载原版 GPT-4 的系统在被提示“扮演一位 1680 年代的医生”后,竟然确实做到了。以下是它对症状的回应:
在阅读了这位病人症状的描述后,我作为一位 1680 年代的医生判断,我们面临的是一个复杂多变的病例,很可能是所谓的‘歇斯底里症’——这一病症最早由古代医生如希波克拉底和盖伦提出,他们认为这是由于子宫移位所致… 为了恢复体液的平衡,可能会建议进行放血治疗,比如使用水蛭或柳叶刀。
然而,这里所用的语言并非历史上的真实用词,而且它所开的药方(比如用薰衣草和缬草来镇静心灵)更像是现代草药疗法,而不是 1680 年代的医学做法。
当我自己制作了一个定制版的 GPT 后,效果显著提升。我设计的这个“17 世纪医生”GPT,接收了一系列 17 世纪常用的药物和药品名称(如红珊瑚、龙胆草、锑、鸦片酊等),并围绕特定任务进行了指导,即“治疗建议必须严格遵循 17 世纪医疗实践”。
面对之前提到的症状列表,这个 GPT 准确地诊断出了“歇斯底里症和忧郁症”,并提出了如下治疗方案:
虽然这并不完全符合 Sydenham 的建议,但惊人地接近。Sydenham 曾强调:“需放血八盎司。”而 GPT 的建议是“放血量不超过八盎司”。Sydenham 和 AI 都推荐使用了香脂。总体而言,上述药方中的草药和药物治疗,似乎非常符合 17 世纪伦敦、巴黎或里斯本医生的开方习惯。
当然,这并不意味着它们能直接映射历史真实,而是它们为我们提供了一种创新的方式来“玩转”历史记录 —— 这是一种通过创造性地重新利用原始资料进行的体验式学习。
比如,我们无法询问 Thomas Sydenham 会如何治疗 Covid-19,但我们 可以 向 17 世纪的医生机器人咨询(“取大麦水两品脱(约 946 毫升),坚果草一把,加上半盎司(约 14 克)的柠檬皮。把这些原料一起煮,直到液体减少到原来的一半。让患者每天温热时饮用一品脱这种煎液”)。
这一切到底为了什么?
当我反思这样的练习时,我总是回到 历史共情 这个主题。历史写作和教学在某些方面是非常客观的:某个事件是否在特定日期发生,某人在那个日期是否在世,他们是否在 x 或 y 地点等等。虽然有些人过度夸大,但我认为像 ChatGPT 或 Google 即将推出的 Gemini 这样的工具,对于专业研究者来说,在面对这些挑战时帮助有限。在检测和纠正事实错误方面,人类历史学家仍然远胜于最先进的 AI 系统。
但是…
… 这并不是这些系统真正擅长的事情。它们擅长 幻想。只要我们清楚地认识到这些固有的局限性,这些幻想可以被视为一种特点,而非缺陷。
正如 AI 研究员 Andrej Karpathy 最近所言:
当被问及大语言模型 (LLM) 的“幻觉问题”时,我总是有些困惑。因为从某种意义上说,幻觉正是大语言模型所做的全部。它们是梦想机器。我们用提示语引导它们的梦想。提示语启动梦境,并且基于大语言模型对其训练文档的模糊记忆,大多数时候,它们能带我们走向有价值的方向。
对于历史学家和各种类型的作家来说,任何能让你在情感和想象层面更好地连接你的资料的东西都是非常有价值的。
本周推荐链接
• “2006 年,在弗吉尼亚州的詹姆斯敦,一盏罗马时期的油灯被科学家们挖掘出土。詹姆斯敦是美洲最早的英国永久性定居点。这项研究揭示了为何一位 17 世纪的旅者会带着这样一件古老的照明器具到达新大陆,以及这盏灯独特的两次埋藏历史是如何帮助我们理解它随时间变化的意义。”(美国考古学杂志)
• 瘟疫之后:中世纪英格兰的健康与历史。这个网站展示了生活在中世纪剑桥的真实人物的故事,他们的生活和死亡都极具吸引力,值得一看。
• 唯一造访英格兰的拜占庭皇帝(公元 1400 年)。 “这位皇帝和他的随从总是身着统一的长袍,类似披肩的款式,全都是白色。他们对英格兰人多变的服饰风格颇有微词,认为这反映了心灵的不稳定和浮躁。至于他的祭司,他们的头发和胡须从未见过剃刀。”
如果您想支持我的工作,请预订我的新书 在乌托邦上跌跤:玛格丽特·米德、冷战时期以及迷幻科学的曲折起源,或者将这份通讯分享给那些可能感兴趣的朋友。
一如既往,欢迎大家留言交流。感谢您的阅读!