随着大语言模型(LLMs)的进展,最近人们越来越多地讨论通用人工智能(AGI),包括它的发展趋势和可能的面貌。这些讨论既有乐观的期待,也有对未来充满担忧的声音。但遗憾的是,这些讨论往往过于抽象,导致大家在讨论中各说各话,难以达成共识。因此,我一直在寻找具体的例子和历史先例来更实际地探讨这个话题。当被问及我对 AGI 的看法时,我通常会举自动驾驶为例。在这篇文章中,我想解释这样做的原因。
首先,让我们来看看 AGI 的一个常见定义:
AGI:一种能在大部分具有经济价值的工作中超越人类能力的自主系统。
这个定义涉及两个关键要求:
- 首先,它是一个完全自主的系统,即它可以独立运行,几乎不需要或完全不需要人类的监督。
- 其次,它能在大多数具有经济价值的工作中独立运作。
为了具体化这一点,我经常参考美国劳工统计局的职业索引。具备这两种属性的系统,我们可以称之为 AGI。
我在这篇文章中想指出的是,我们在自动化驾驶领域的最新进展是一个很好的早期案例,用以研究社会对日益增长的自动化技术的反应,同时也可以预览通用人工智能将会带来的影响和感受。之所以选择自动驾驶,是因为它在社会中非常显著且易于接触(想象一下,街上的车辆无人驾驶!),在经济上占据重要地位,目前涉及大量的人力(比如 Uber 和 Lyft 的司机),而且自动化驾驶是一个挑战性很大的问题。我们在自动化驾驶方面的进展超越了经济的许多其他领域,这一点已经引起了社会的广泛关注和反响。当然,还有其他行业也经历了显著的自动化,但我对它们不太了解,或者它们没有达到上述几个关键点。
探讨部分自动化
在人工智能的众多挑战中,自动驾驶技术的发展并非一蹴而就,而是逐步实现的结果。这个过程中出现了许多起辅助作用的“工具型 AI”。在汽车自主性领域,现在许多车辆都配备了“二级”驾驶辅助功能——这种 AI 能与人类司机协同工作,共同完成从起点到终点的行驶任务。虽然这种系统并不是完全自动驾驶,但它能处理大量驾驶中的基础操作细节。例如,在某些情况下,它甚至可以自动完成停车等操作。在这一过程中,人类司机主要承担监督角色,但原则上可以随时接管驾驶,或下达高层指令(比如请求变道)。在某些方面(如车道跟踪和快速决策),这种 AI 的表现甚至超过了人类,但在一些罕见的场景中可能仍有不足。
这与我们在其他行业看到的许多工具型 AI 的发展情况类似,特别是在大语言模型(LLMs)近期带来的技术突破后。例如,作为程序员,当我使用 GitHub Copilot 来自动填写代码块,或利用 GPT-4 编写更复杂的函数时,我实际上是将一些基础细节交给了自动化系统处理,但同样,我也可以随时介入调整。换句话说,Copilot 和 GPT-4 就像是二级编程自动化。
在整个行业中,存在许多类似的二级自动化应用,不仅限于基于 LLMs 的系统——从 TurboTax 到亚马逊仓库中的机器人,再到翻译、写作、艺术、法律和营销等领域的众多工具型 AI。
全自动化
随着这些系统可靠性的提高,它们渐渐实现了完全自动化,就像今天的 Waymo 一样。在旧金山,现在你可以通过一个应用叫一辆 Waymo 车,而不是 Uber。一辆无人驾驶的汽车会来接你,带你前往目的地。这一切都非常神奇。你无需懂得驾驶技术,也不需要保持注意力集中,可以在车内放松休息,甚至打个小盹,而系统则会负责将你从 A 点安全运送到 B 点。像我和许多其他人一样,我现在更倾向于使用 Waymo 而非 Uber 进行城市间的出行。Waymo 提供更加稳定、可预测的驾驶体验,驾驶平稳,你可以在车内听音乐、和朋友聊天,无需分心考虑司机可能对谈话内容的想法。
全自动化的混合经济
尽管自动驾驶技术已经问世,但依然有很多人倾向于同时使用 Uber。这是为什么呢?
首先,许多人根本不知道他们可以叫 Waymo。即便知道,他们中的许多人对自动系统还不够信任,更喜欢人类司机驾驶。即使对技术有信心,一些人也可能更喜欢人类司机,比如他们享受与司机的交谈和互动,以及结识新朋友。不仅仅是个人喜好,从现在应用程序里不断增加的等待时间可以看出,Waymo 的供应还远远不能满足需求。车辆数量不足可能部分是因为 Waymo 在谨慎处理和监控风险及公众舆论。我猜想,Waymo 可能还受到监管机构对街道上运行车辆数量的限制。另一个限制因素是,Waymo 不可能立刻完全取代 Uber,他们需要逐步建立基础设施,生产汽车,扩大运营规模。
我认为,其他行业的自动化也会经历类似过程 – 有些人或公司会立即采用,但许多人可能 1) 不了解这些技术,2) 知道后可能不信任,3) 即使信任,也更倾向于与人类合作。
此外,需求大于供应,通用人工智能 (AGI) 也会因为开发者的自我约束、法规限制以及资源短缺(比如需要建设更多 GPU 数据中心)而受到限制。
全球化的全自动化
如我之前提到的,由于资源限制,这项技术的全球推广仍然非常昂贵、劳动密集,并且发展缓慢。目前,Waymo 只能在旧金山和凤凰城运行,但其方法本质上是通用且可扩展的,因此公司可能很快会向洛杉矶、奥斯汀等地扩展。此外,该产品可能还会受到其他环境因素的影响,比如在大雪天气下的驾驶。在极少数情况下,它甚至可能需要人类操作员的紧急援助。能力的拓展并非没有代价。例如,Waymo 进入一个新城市,需要投入资源来建立当地的业务,绘制街道地图,调整其感知系统和规划/控制器,以适应当地的特殊情况和规定。
从工作的角度看,许多职位可能只在特定的环境或条件下实现完全自动化,而拓展这些能力到更广泛的领域,需要付出努力和时间。在这两种情况下,尽管方法本质上是通用和可扩展的,但其发展只能逐渐进行。
社会对此的反应
我发现自动驾驶技术进入社会的一个引人入胜的方面是,就在几年前,大家还在纷纷讨论和怀疑它的可行性,甚至有很多恐慌和不确定的声音。但现在,自动驾驶不再是一个遥不可及的研究原型,而是真实存在的产品了——你可以用钱买到完全自动化的交通服务。在目前的运行范围内,自动驾驶行业已实现了完全自主。
然而,令人惊讶的是,这个变化似乎并没有引起太多人的关注。即便是技术圈内的人,很多都没有意识到这个变化。当 Waymo 的自动驾驶车辆在旧金山街头行驶时,你会发现许多人对此感到好奇。他们先是惊讶地盯着看,然后很快就继续他们的生活。可能当自动驾驶技术在其他行业得到应用时,世界并不会发生翻天覆地的变化。大多数人甚至可能刚开始都没意识到这个变革。即使意识到了,他们可能只是好奇地看一眼,然后无动于衷,态度从否认到接受各不相同。有些人可能会因此感到不满,做出一些反抗行为,就像有人曾经在 Waymo 车辆上放置交通锥以示抗议一样。当然,这方面的影响还远未完全显现出来,但当它发生时,我相信它将会成为一种广泛的趋势。
经济影响
谈到工作,Waymo 显然取代了司机的工作。但同时,它也创造了许多此前看不见的新职位——比如帮助收集神经网络训练数据的人工标注员、远程协助遇到问题的车辆的技术支持人员、负责建造和维护车队、地图等的工作人员。为了制造这些高度仪器化、高科技的汽车,一个涵盖各种传感器和相关基础设施的全新产业也随之诞生。
与此类似,工作本身也在发生变化:一些工作会消失,许多新的工作机会也会出现。这更像是对工作的一次重组或改造,而不仅仅是简单的消除,尽管消除部分可能更为显著。长远来看,总体的工作数量可能会减少,但这个过程比人们初看时想象的要缓慢得多。
竞争态势
我想探讨的最后一个话题是行业的竞争态势。几年前,自动驾驶领域涌现出众多公司。但今天,随着人们逐渐意识到这一领域的挑战性(按照我对当前人工智能及整体计算技术的看法,这个挑战刚好处于可实现的边缘),相关企业已经大幅度整合。在这之中,Waymo 已经率先展示了功能完备的自动驾驶技术。然而,仍有诸如 Cruise、Zoox,以及我的个人最爱 Tesla 等公司紧随其后。
考虑到我在这个领域的背景和经历,我认为自动驾驶产业的终极目标是实现全球范围内的完全自动化。在这一目标的追求上,Waymo 选择了先实现自动化再进行全球扩展的策略,而 Tesla 则是先在全球推广,再逐步提升自动化水平。作为这两家公司产品的用户,我对他们所取得的成就感到满意,同时也对整个技术领域保持高度期待。但这两家公司面临的挑战不同:一家主要是软件方面的工作,另一家则是硬件方面的工作。
对于哪家公司能更快取得进展,我有自己的判断。正如自动驾驶行业在 ~2015 年那样经历了快速增长和扩张,但最终只有少数几家公司在激烈竞争中存活下来,其他经济领域也可能会经历类似的变化。在这一过程中,将会大量使用工具型 AI(例如:目前的二级自动驾驶辅助系统 ADAS 特性),甚至出现一些开放平台(例如:Comma)。
通用人工智能(AGI)
所以,这些大体上是我对通用人工智能(AGI)的展望。想象一下,在我们的经济体系中,类似的事情以不同的速度发生,伴随着复杂且难以预测的相互作用和连带影响。虽然这个模型可能不尽完美,但我认为它是一个有用的参考。
在一种思维模式的范畴内,AGI 的发展趋势并不像是一种失控的、能够递归自我完善的超级智能,它不会逃入网络空间制造灾难,也不会像某些科幻场景那样将银河系转变为一片灰色的废墟。相反,它更像是目前正在快速发展的自动驾驶技术,这是经济中一个重要的、正在改变社会的自动化分支。
AGI 的发展是逐步的,社会既是观察者也是参与者。其扩展在多方面受到限制,包括对教育有素的人力资源、信息、材料和能源的监管和资源的限制。世界不会因此崩溃,而是在适应、变化和重新构建中前行。
以自动驾驶为例,交通的自动化将使道路更安全,城市空气将变得更清新,交通更为畅通,而路边的停车场和停车车辆将逐渐消失,让出更多空间给行人。我个人非常期待看到 AGI 在各个领域带来的类似变革。