黄仁勋领导的 Nvidia 如何推动 AI 革命 [译]

Nvidia 的 CEO 黄仁勋把全部筹码都放在了一种全新的芯片上。如今，Nvidia 已经跻身世界最大公司之列，那么他的下一步计划会是什么呢？

作者 Stephen Witt

2023 年 11 月 27 日

“在 AI 领域的角逐中，Nvidia 就像独家武器供应商，”一位华尔街分析师如是说。插图作者：Javier Jaén

让人震惊的人工智能聊天机器人 ChatGPT 就是在 Nvidia 的超级计算机上进行训练的，这一发现引发了股市历史上罕见的单日巨大涨幅。2023 年 5 月 25 日，纳斯达克一开盘，Nvidia 的市值就飙升了约 2000 亿美元。就在几个月前，Nvidia 的 CEO 黄仁勋向投资者宣布，Nvidia 已向美国前 100 大公司中的 50 家出售了类似的超级计算机。当日交易结束时，Nvidia 成为全球第六大价值公司，市值超过沃尔玛和埃克森美孚的总和。可以将黄仁勋的商业地位与 19 世纪 40 年代末在旧金山销售淘金设备的 Samuel Brannan 相媲美。“在 AI 领域的这场较量中，Nvidia 是唯一的军火商，”另一位华尔街分析师表示。

黄仁勋是个耐心经营自己事业的垄断者。1993 年，在加州圣何塞的 Denny’s 餐厅，他和另外两人共同起草了 Nvidia 的创始文件，并自那时起一直负责公司运营。现年六十岁的他，风趣而又自嘲，有着一张泰迪熊似的面孔和稀疏的灰发。Nvidia 的核心产品是其图形处理单元 (graphics-processing unit)，一块集成了强大微芯片的电路板。起初，Nvidia 把这些 G.P.U. 卖给电子游戏玩家，但自 2006 年起，黄仁勋也开始向超级计算领域推广这些产品。到了 2013 年，依托于计算机科学领域内的前沿研究，黄仁勋下了一注大赌注，决定让 Nvidia 转向人工智能领域。长期以来，人工智能领域屡屡让投资者失望，当时 Nvidia 的首席深度学习研究员 Bryan Catanzaro 对此持怀疑态度。“我不想让他重蹈人工智能行业过去的覆辙，”Catanzaro 曾对我说。“但事实证明，十多年后，他做对了。”

未来，人工智能有望实现按需生成电影、为孩子们辅导学习、教会汽车自动驾驶等壮举。所有这些进步都将在 Nvidia 的 G.P.U. 上成为现实，而黄仁勋在公司中的股份如今价值超过 400 亿美元。

今年九月，我在 Nvidia 成立之初的那家 Denny’s 餐厅和黄仁勋一起吃早餐。当时，Denny’s 的 CEO 正在给他颁发一个纪念牌匾，还有电视台的摄制组在场。黄仁勋一直以一种带点幽默的冷面幽默与人交谈。他在与我们的女服务员聊天时，点了包括 Super Bird 三明治和炸鸡牛排在内的七样食物。“你知道吗，我曾经在这里洗碗，”他对她说，“但我很努力地工作，真的非常努力，最终我成为了一名服务员。”

黄仁勋以实用为主，不爱空想，甚至连一本科幻小说都没读过。他以微芯片目前的能力为出发点，用第一性原理推测出它们将来的发展方向，并且坚定地对此下注。“我尽我所能，避免公司倒闭，”他在早餐时这样说。“我尽我所能，避免失败。”黄仁勋认为，自 IBM 在 20 世纪 60 年代初期推出以来，数字计算的基本架构几乎没变，但现在正面临重新构思的时刻。“深度学习不是一个算法，”他近期表示，“它是一种方法，一种全新的软件开发方式。”早餐前的晚上，我看了一个视频：一个运行着这种新型软件的机器人，似乎认出了自己的手，然后对一堆彩色积木进行分类。这个视频让我不寒而栗；人类似乎即将被淘汰。黄仁勋一边用手指卷着煎饼和香肠，一边对我的忧虑表示不以为然。“我知道它是怎么工作的，所以我并不担心，”他说。“这和微波炉的原理没什么两样。”我追问黄仁勋，一个自主机器人肯定和微波炉不同，会有它独特的风险。他回答说，他从不担心技术本身，“它所做的只是处理数据，”他说，“还有很多其他事情值得我们担忧。”

今年五月，数百名行业领袖签署了一份声明，认为失控的人工智能风险可媲美核战争。黄仁勋没有参与签署。有经济学家提出，工业革命导致全球马匹数量减少，而人工智能可能对人类产生类似影响。“马的职业选择有限，”黄仁勋说，“比如，马不会打字。”当他吃完早餐时，我表达了自己的担忧：不久的将来，我可能将我们谈话的笔记输入到一个智能引擎中，然后它就能输出结构更好、更优秀的文章。黄仁勋没有否认这种可能性，但他向我保证，我还有几年时间在面临这种挑战之前。“它会先影响小说家，”他说。然后他给了女服务员一千美元的小费，并起身去接受他的奖项。

1963 年，黄仁勋在台湾出生，但 9 岁那年，他和他的哥哥被送到美国，成为无人陪伴的未成年人。他们首先到达华盛顿州的塔科马，与一位叔叔同住，随后被送到肯塔基州的奥尼达浸信会学院。黄仁勋的叔叔原以为那是一所声名显赫的寄宿学校，事实上却是一所宗教改革学院。黄仁勋的室友是个 17 岁的少年。他们第一个晚上，这个年长的孩子向黄仁勋展示了他在争斗中被刺伤的痕迹。“学校里每个人都抽烟，我似乎是唯一一个没有随身携带折叠刀的学生，”黄仁勋回忆道。他的室友不识字，黄仁勋教他阅读，作为回报，室友教会了他卧推。“最终，我每晚睡前都会做一百个俯卧撑。”

黄仁勋虽然住在学院，但年龄太小，不能上那里的课，所以他去了附近的公立学校。在那里，他结识了 Ben Bays，一个和他五个兄弟姐妹住在一间没自来水的老房子里的孩子。“学校的孩子大多是烟草农的子女，或者是住在山谷口的贫穷孩子，”Bays 讲述道。黄仁勋在学年已经开始后才到校，Bays 记得校长介绍了一个个子瘦小、长发、口音浓重的亚洲移民孩子。“他成了众矢之的，”Bays 说。

“但我用了所有武器！” —— 这幅漫画由 Ali Solomon 创作。

黄仁勋的童年遭遇了无情的欺凌。他回忆道：“那时候，人们用‘Chinks’来称呼中国人。”在他的口吻中，我几乎感受不到任何情绪。“我们每天都被这样叫。”为了上学，黄仁勋必须穿过一座摇晃的吊桥，桥下是湍急的河流。“这些桥非常高，”他的朋友贝斯回忆，“都是破旧的木板，许多都已经不见了。”有时，黄仁勋走桥时，当地的孩子们会尝试摇晃桥绳，让他掉下去。“但他似乎从不受影响，”贝斯说，“他总能从容应对。”学年结束时，黄仁勋已经能带领那些曾经欺凌他的孩子们一起探险进入树林。贝斯记得黄仁勋在桥上小心地踩过那些缺失的木板，“看起来，他甚至还挺享受的。”黄仁勋认为，他在奥尼达的经历锻炼了他的韧性。“那时候，没有心理顾问可以倾诉，”他说，“你只能自己变得坚强，继续前进。”

2019 年，他向学校捐赠了一栋建筑，并怀着深情回忆那座已不复存在的吊桥，但他并未提及那些曾试图将他从桥上推下的欺凌者。几年后，黄仁勋的父母成功移居美国，定居在俄勒冈州，黄仁勋和他的兄弟与父母团聚。在高中，黄仁勋表现出众，成为了全美乒乓球排名靠前的运动员。他参加了数学、计算机和科学俱乐部，提前两年完成学业，十六岁就高中毕业。“我那时没有女朋友，”他轻描淡写地说。黄仁勋后来进入俄勒冈州立大学，主修电气工程。他的实验室搭档是 Lori Mills，一位热心且略显书呆子气的本科生，拥有一头卷曲的棕色头发。“在电气工程专业里，大约有 250 个学生，只有三个是女生，”黄仁勋回忆，“男生们都在争夺 Mills 的注意。”他感觉自己处于不利地位。“我是班里最小的，看起来像个十二岁的孩子。”

每个周末，黄仁勋都会电话邀请 Mills 一起做作业。他说：“我试图展示自己解决作业的强大能力给她留下印象，当然，并不是依靠外表。”Mills 最终答应了。经过六个月的合作，黄仁勋终于鼓起勇气邀请她约会，她也欣然接受。

大学毕业后，黄仁勋和 Mills 在硅谷找到了作为微芯片设计师的工作。黄仁勋透露：“她的收入甚至比我高。”两人结婚不久后，Mills 选择离开工作岗位，致力于抚养孩子。与此同时，黄仁勋开始负责自己的部门，并在晚上攻读斯坦福大学的研究生课程。1993 年，他与两位经验丰富的微芯片设计师 Chris Malachowsky 和 Curtis Priem 共同创立了 Nvidia。尽管当时只有三十岁的黄仁勋年龄比 Malachowsky 和 Priem 小，但他们都认为他已经做好准备成为 CEO。Malachowsky 评价说：“他学习能力非常强。”

Malachowsky 和 Priem 计划设计一款让竞争对手“嫉妒不已”的图形芯片。最初，他们打算将公司命名为 NVision，但发现这个名字已被一家卫生纸制造商占用。黄仁勋提出了 Nvidia 这个名字，灵感来自拉丁语“invidia”（意为“嫉妒”）。他选择在 Denny’s 餐厅筹划公司事务，因为那里比家里安静，咖啡便宜，同时他还回忆起自己八十年代在俄勒冈的 Denny’s 餐厅工作的经历。“在逆境中我思考得更清晰，”黄仁勋表示。“我的心跳反而会减慢。任何在餐厅高峰时段工作过的人都能理解我的感受。”

黄仁勋对视频游戏情有独钟，他认为市场需要更先进的图形芯片。艺术家们开始使用称为“原语”的形状，通过组装三维多边形来节省绘图时间和精力，但这需要新型芯片。Nvidia 的竞争对手使用三角形作为原语，但黄仁勋和他的合伙人选择了四边形。这一决策几乎导致公司崩溃，因为 Nvidia 首款产品刚一发布，微软就宣布其图形软件只支持三角形。

面临资金危机，黄仁勋决定采用传统的三角策略，力求在竞争对手之前抢占市场。1996 年，他裁掉 Nvidia 一百多名员工中的一半以上，将公司剩余的资金全部投入到一批未经测试的微芯片上，他对这些芯片能否正常工作并不确定。“这是一场五五开的赌局，”黄仁勋向我解释，“反正我们即将破产。”

当名为 riva 128 的产品上市时，Nvidia 仅有足够支付一个月工资的资金。然而，这次冒险最终取得了成功，Nvidia 在四个月内卖出了一百万个 riva。黄仁勋鼓励员工以绝望的心态继续推出产品，多年来，他在员工会议上的开场白总是：“我们的公司距离倒闭还有 30 天。”这句话成为了公司非正式的座右铭。

位于 Santa Clara 的 Nvidia 总部中心有两座巨大的三角形建筑，角落被修剪过。这种形状在建筑内部得到了小规模的复制，从沙发和地毯到小便池的挡水板。员工将这两座建筑称为“太空船”，它们宽敞明亮，却又带有一丝神秘感，大多时间里空无一人。在 covid 之后，只有大约三分之一的员工每天上班。根据我在午餐时间对食堂的观察，员工构成相当多元，大约有三分之一是南亚人，三分之一是东亚人，三分之一是白人。绝大多数员工是男性。

即便在股价飙升之前，员工调查就已经将 Nvidia 评为美国最佳工作场所之一。每座建筑顶部都设有酒吧，定期举行欢乐时光，员工被鼓励将办公室当作一个灵活的空间，在这里吃饭、编程和社交。然而，建筑内部保持着一尘不染——Nvidia 通过摄像头和 AI 全天监控员工。如果员工在会议桌上用餐，AI 将在一小时内派遣清洁工来打扫。在 Denny’s，黄仁勋向我预示了一个机器人如家电一样融入日常生活的未来。“在未来，所有能动的东西都将自主运行，”他说。

在 Nvidia，我发现唯一不那么开心的似乎是质控技术人员。他们在北校区酒吧下方没有窗户的实验室里，这些面色苍白的年轻人戴着耳塞，穿着 T 恤，不断地把 Nvidia 的微芯片推向极限。周围充斥着难以忍受的噪音——那是不断运转的高音风扇试图冷却过热的硅电路所发出的刺耳声音。正是这些芯片，推动了人工智能革命的到来。

在传统计算机架构中，中央处理单元（CPU）承担了大多数工作。程序员编写程序，将数学问题交给 CPU，而 CPU 则一次解决一个问题。几十年来，CPU 的主要生产商是 Intel，而 Intel 曾多次试图把 Nvidia 淘汰出市场。黄仁勋描述他们像猫鼠游戏般的关系时说：“我尽量避开 Intel。每次他们靠近我们，我都会带着芯片跑路。”

Nvidia 采纳了另一种方式。1999 年，该公司刚上市不久就推出了 GeForce 显卡，公司营销负责人 Dan Vivoli 称之为图形处理单元（GPU）。“我们创造了这个类别，就是为了在这个领域领先”，Vivoli 说。不同于通用的 CPU，GPU 将复杂的数学任务分解成许多小计算，然后一次性并行处理。CPU 就像一辆送货卡车，一次只能送一个包裹；GPU 则更像是分散在城市各处的一群摩托车。

GeForce 系列大获成功。这一受欢迎程度得益于 Quake 视频游戏系列，这些游戏利用并行计算呈现出玩家可以用榴弹发射器击败的怪物。（我还记得，Quake II 在我大学一年级时发布，我在这个游戏上耗费了好几年。）Quake 系列还有一个多人对战模式，叫做“死亡竞赛”，PC 游戏爱好者为了占据上风，每次 GeForce 升级，他们都会购买新的显卡。2000 年，斯坦福大学计算机图形学研究生 Ian Buck 把三十二张 GeForce 卡组合在一起，用八台投影仪来玩 Quake。“那是第一个 8K 分辨率的游戏装置，它覆盖了整面墙”，Buck 回忆道。“真是太壮观了。”

“别这样。他们故意用面包棒让你吃饱，这样等你进治疗师办公室时就会感到不适。” —— 漫画作者：Drew Dernavich

Buck 曾怀疑，GeForce 显卡除了用来在游戏中向朋友投掷手榴弹外，是否还有其他用途。这些显卡配备了一个基础的编程工具——着色器（shader）。在 darpa（美国国防部高级研究计划署）的资助下，Buck 改造了着色器，以访问底层的并行计算电路，从而将 GeForce 转变为一种低成本的超级计算机。不久后，他开始为 Nvidia 的创始人黄仁勋工作。

Buck 是一个充满热情且头发稀疏的人，他的身上散发着聪明才智。作为一名热衷于计算机科学的人，他在过去的二十年里不断挑战 Nvidia 芯片的极限。他说：“人类的思考是线性的。比如，你告诉别人怎样从这里到星巴克，你会一步步指导他们。但你不会告诉他们如何从任何地方到达任意一家星巴克。并行思考对我们来说很难。”

自 2004 年以来，Buck 一直负责开发 Nvidia 的超级计算软件包，名为 cuda。黄仁勋的愿景是让 cuda 能运行在每一块 GeForce 显卡上。“我们在普及超级计算，”黄仁勋表示。

在 Buck 开发软件的同时，Nvidia 的硬件团队也在微芯片上预留出空间，用于超级计算。这些芯片包含了数十亿电子晶体管，通过复杂的电路迅速完成计算。Nvidia 的首席芯片工程师 Arjun Prabhu 把设计微芯片比作城市规划，不同区域负责不同的任务。就像玩俄罗斯方块时处理下落的方块，Prabhu 有时甚至会在梦中看到晶体管。“我经常在周五晚上梦见最棒的点子，就好像真的在梦中看到它们一样，”Prabhu 说。

当 cuda 在 2006 年底面世时，华尔街的反应并不热烈。黄仁勋正将超级计算推向普通大众，但似乎大众对此并不感兴趣。“他们为这种新型芯片架构投入了巨资，”硅谷知名播客“Acquired”的联合主持人 Ben Gilbert 说。“他们投入了数十亿美元，目标却是学术和科学计算的一个小众市场，这和他们的投资规模相比简直是小巫见大巫。”黄仁勋认为，单纯 cuda 的存在就能扩展超级计算的市场。这种看法并不被普遍接受，到 2008 年底，英伟达的股价暴跌了 70%。

黄仁勋在演讲中提到，访问国立台湾大学物理学教授赵庭伟的办公室，给了他在这段艰难时期的信心。赵教授为了模拟宇宙大爆炸后的物质演化，自己在办公室旁的实验室里搭建了一台超级计算机。黄仁勋发现实验室里到处是 GeForce 盒子，而且计算机还用摆动的台式风扇冷却。“Jensen 是一个有远见的人，”赵教授告诉我，“他让我的终身研究成为可能。”

赵教授是理想客户的典范，但像他这样的客户并不多。cuda 的下载量在 2009 年达到顶峰，之后连续三年下降。英伟达的董事会担心，公司股价的低迷可能会吸引企业掠夺者。“我们尽一切努力保护公司，以防激进股东入侵并企图拆分公司，”长期董事会成员 Jim Gaither 说。前 NFL 市场营销主管 Dawn Hudson 于 2013 年加入董事会。“当时的公司明显处于停滞状态，”她评价道。

在市场推广 cuda 的过程中，Nvidia 试图吸引包括股票交易员、石油勘探者和分子生物学家等多种客户。公司甚至与通用磨坊达成协议，为烹饪冷冻比萨的热物理过程建模。但对于人工智能领域，Nvidia 却几乎没有花费太多精力，因为看似没有太大的市场。

在 2010 年代初期，人工智能（A.I.）这个领域几乎被遗忘。在图像识别和语音识别等基本任务上的进展几乎停滞不前。在这个学术上不受青睐的领域中，还有一个更小众的子领域，它通过使用“神经网络”（neural networks）—一种模仿人脑的计算结构—来解决问题。很多计算机科学家都认为神经网络是过时且无效的。“我曾被导师劝阻研究神经网络，”深度学习研究员 Catanzaro 回忆道，“因为当时人们认为它们已经落伍，而且效果不佳。”

Catanzaro 把坚持研究神经网络的科学家们比喻为“荒原中的先知”。其中一位先知是多伦多大学教授 Geoffrey Hinton。2009 年，Hinton 带领的研究团队利用 Nvidia 的 cuda 平台训练了一个识别人类语音的神经网络，并对其成果的高质量感到惊喜。他在那年的一个会议上展示了这些成果，并联系了 Nvidia。“我曾发邮件给 Nvidia，说‘我刚告诉了一千名机器学习研究人员他们应该购买 Nvidia 显卡。你们能免费给我一张吗？’”Hinton 说，“但他们拒绝了。”

尽管如此，Hinton 依然鼓励学生们使用 cuda，其中包括他的乌克兰学生 Alex Krizhevsky，他认为 Krizhevsky 可能是见过的最优秀的程序员之一。2012 年，Krizhevsky 和研究搭档 Ilya Sutskever 在预算有限的情况下，从 Amazon 购买了两张 GeForce 显卡。Krizhevsky 开始在 Nvidia 的并行计算平台上训练一个视觉识别神经网络，仅用一周的时间就处理了数百万张图像。“他的两张 G.P.U. 显卡一直在卧室里运转，”Hinton 补充道，“而他的父母为此支付了相当高的电费。”

Sutskever 和 Krizhevsky 对这些显卡的强大能力感到震惊。就在那年早些时候，谷歌的研究人员用大约一万六千个 C.P.U. 训练了一个能识别猫视频的神经网络。而 Sutskever 和 Krizhevsky 只用了两块 Nvidia 电路板就取得了世界级的成果。“G.P.U. 的出现就像一个奇迹，”Sutskever 说。

Krizhevsky 在他父母家中训练的神经网络，AlexNet，现在已与莱特飞行器和爱迪生灯泡齐名。2012 年，他把 AlexNet 带入年度 ImageNet 视觉识别竞赛，由于当时神经网络尚不普及，他成了唯一采用这种技术的参赛者。AlexNet 在比赛中的卓越表现，甚至让组织者一度怀疑其是否作弊。“那是一个划时代的时刻，”Hinton 如是说。“这标志着一个范式的转变。”

自从 Krizhevsky 发表了关于 AlexNet 架构的九页论文以来的十年里，该论文被引用了超过十万次，成为计算机科学史上最重要的论文之一。（AlexNet 成功识别了包括摩托车、豹子、集装箱船等在内的多种图像。）Krizhevsky 创新了许多重要的编程技巧，其核心发现是，专用 G.P.U. 训练神经网络的速度比通用 C.P.U. 快上百倍。“没有 cuda，机器学习将变得异常困难，”Hinton 表示。

不久之后，ImageNet 竞赛的每个参赛者都开始使用神经网络。到了二十一世纪十年代中期，基于 G.P.U. 训练的神经网络在图像识别准确率上达到了 96%，超过了人类。黄仁勋长达十年的推动超级计算民主化的努力终于获得了成果。“它们能解决复杂的计算机视觉问题，这让人不禁思考，还能教它们学习什么？”黄仁勋这样对我说。

答案似乎是一切。黄仁勋相信，神经网络将彻底改变社会，并借助 cuda 抢占硬件市场。他决定再次全力以赴。“周五晚上他发出邮件，宣布我们将全面转向深度学习，不再是一家专注于图形的公司，”Nvidia 的副总裁 Greg Estes 对我说。“到了周一早上，我们已经成为一家 AI 公司。转变就这么迅速。”

“嘿！不要非法录制演出！” —— Pia Guerra 和 Ian Boothby 创作的漫画

在黄仁勋发送邮件的那段时间，他找到 Nvidia 的 AI 领头人物 Catanzaro，向他提出了一个假设性的问题。“他让我想象一下，如果他把 Nvidia 的所有八千名员工都召集到停车场，”Catanzaro 讲道。“然后他说，我可以从那里挑选任何人加入我的团队。”

黄仁勋极少接受采访，总是尽量不让自己成为焦点。“我觉得我在这里并没有做什么特别的事情，”他这样告诉我。“这主要归功于我的团队。”（“他是无可替代的，”董事会成员 Jim Gaither 这样评价他。）“我也不太清楚为什么会被选为 CEO，”黄仁勋说。“我并没有什么特别的野心。”（“他早就立志在三十岁之前要经营一家公司，”他的合伙人 Chris Malachowsky 补充道。）“我并不擅长演讲，因为我其实很内向，”黄仁勋说。（“但他却是个出色的表演者，”他的朋友 Ben Bays 评论道。）“我只有一个特长——做功课，”黄仁勋说。（“他能在一个周末内掌握任何知识，”Nvidia 软件部门负责人 Dwight Diercks 说。）

黄仁勋倾向于打造一个灵活的公司架构，不设固定部门或等级。员工每周都要提交一份工作重点清单，简洁明了。黄仁勋会在深夜审阅这些邮件。他经常在 Nvidia 广阔的园区内巡视，偶尔会停下来询问初级员工的工作进展。黄仁勋的出现常常会让一个简单的工位变成严肃的审讯现场。“在硅谷，有时候人们可以含糊其辞，”行业分析师 Hans Mosesmann 对我说。“但在 Jensen 面前，这种做法行不通。他有时会因此而感到不悦。”

黄仁勋通过每天撰写数百封电邮与员工沟通，这些邮件往往简短得只有几个词。一位高管认为这些邮件仿佛俳句，而另一位则觉得它们像勒索信。黄仁勋还常常引用自己创造的一些管理智慧。在制定计划时，他会要求员工考虑到“光速”的快，这不单是指迅速完成任务，而是先设想任务能在最短时间内完成的可能，再据此设定一个实际可行的目标。员工也被鼓励去开拓“零十亿美元市场”，即那些既无竞争对手又缺乏明确客户群的探索性产品，比如 cuda。（这让我想起了凯文·科斯特纳在《梦幻成真》中的角色，他在爱荷华州一片玉米地中建造了一个棒球场，然后静候球员和观众的到来。）

黄仁勋最具颠覆性的信念或许是“失败必须共享”。二千年代初，英伟达发布了一款有缺陷的显卡，其风扇响声巨大、过度活跃。黄仁勋没有解雇负责这款显卡的产品经理，反而安排了一场会议，让这些经理向数百人详细讲解导致这场失败的每一个决策。（英伟达还向媒体放出了一段讽刺视频，由产品经理们主演，视频里把显卡改造成了吹叶机。）在英伟达，向人群公开展示自己的失败已成为一种深受欢迎的仪式，但这种公司内部的“斗争会议”并不是每个人都能接受的。“你可以很快看出谁能在这里生存下去，谁做不到，”迪尔克斯说。“如果有人开始变得防御，我就知道他们不适合这里。”

黄仁勋的员工有时会对他喜怒无常的性格表示不满。黄仁勋本人解释道：“这实际上是我大脑里的想法和我说出的话之间的差异。”“当这种差异很大时，就会表现为愤怒。”即便在平静时，黄仁勋的热情也可能让人感到难以承受。“和他交流就像把手指插进电源插座，”一位员工这样描述。但即便如此，Nvidia 的员工留存率依然很高。负责消费者部门的杰夫·费舍尔是最初的员工之一。现在他已经非常富有，但仍继续工作。“我们很多人现在是出于对使命的信仰而自愿留下，”费舍尔说。黄仁勋的两个孩子原先在酒店行业工作；在父亲多年的严格教导下，他们现在也在 Nvidia 工作。卡坦扎罗曾离开去另一家公司，几年后又回到 Nvidia。“与詹森相处并不总是容易，”卡坦扎罗说，“有时我会害怕他，但我也知道他很关心我。”

AlexNet 取得成功之后，风险投资家们开始大举投资于人工智能领域。“我们一直在为许多在各个领域应用深度学习的初创公司投资，他们几乎都是基于 Nvidia 的平台，”安德森·霍洛维茨公司的马克·安德森在 2016 年表示。大约在那个时候，Nvidia 向 OpenAI 的一个研究团队交付了其第一台专门用于人工智能的超级计算机 DGX-1。黄仁勋亲自将这台计算机送到 OpenAI 的办公室，当时的董事长埃隆·马斯克亲自用刀片打开了包装。

2017 年，谷歌的研究人员推出了一种新的神经网络训练架构，名为 Transformer。紧接着在第二年，OpenAI 的研究人员利用谷歌的框架开发出了第一个“生成预训练 Transformer (G.P.T.)”。这些 G.P.T. 模型在 Nvidia 的超级计算机上接受训练，吸收了大量文本资料，学会了如何进行类似人类的思维连接。到了 2022 年底，经过几个版本的迭代，ChatGPT 对外发布。

从那时起，Nvidia 开始面临海量的客户需求。公司推出的最新 AI 训练模块，名为 DGX H100，是一个重达三百七十磅、售价高达五十万美元的金属盒子。目前，这款产品的订单已经排到了数月以后。DGX H100 的运行速度是训练 ChatGPT 所用硬件的五倍之多，甚至能在不到一分钟内完成对 AlexNet 的训练。据预测，Nvidia 将在今年年底之前售出五十万台这样的设备。

处理能力越强的神经网络，其输出的复杂度也越高。对于顶尖的 AI 模型，Nvidia 提供了装有数十台 DGX H100 的机架。如果这还不足以满足需求，Nvidia 甚至可以将这些计算机像图书馆的书架一样排列，用价值数千万美元的超级计算设备填满整个数据中心。对于 AI 的能力似乎没有上限。Sutskever 曾对我说：“如果你相信人造神经元就像生物神经元一样，那就相当于你在训练大脑。它们理应能做到我们能做的所有事。”起初我对这种说法持怀疑态度——毕竟，我并没有通过观察一千万个参考图像来学习识别猫，也没有通过研究人类全部的作品来学会写作。但化石记录告诉我们，神经系统的发展始于几亿年前，并且一直在变得更加复杂。Catanzaro 补充道：“地球上存在了许久的生物学会了很多东西，这些都在我们大脑的物理结构中留下了痕迹。”

即使是 AI 的创造者们也对它们的能力感到惊讶。比如 GPT-4，ChatGPT 的继任者，它能将一张餐巾纸上的简单草图转化成一个完整的网站，并且在 LSAT 法学院入学考试中取得了排名前 12% 的好成绩。在未来几年内，Nvidia 的硬件将以计算机时钟周期的速度加速这种演化，训练出各种各样的 AI 模型。这些模型的用途五花八门：有的管理投资组合，有的操控无人机；有的能够复制你的肖像，有的甚至可以模仿已故人士的声音。有的将成为自主机器人的大脑，有的则能够创造定制药物。有的能作曲，有的能写诗。如果我们不小心，很可能有一天，这些 AI 将变得比我们更聪明。

Nvidia 的设备毛利率高达 70%。这一高利润率吸引了众多竞争者，就像血腥的鱼饵吸引鲨鱼一样。谷歌和特斯拉正积极研发人工智能训练硬件，众多初创公司也在此列。其中，Cerebras 推出了一款巨型芯片，其大小堪比晚餐盘。Cerebras 的首席执行官 Andrew Feldman 批评 Nvidia：“他们在对客户进行敲诈，却鲜有人敢公开指责。”（黄仁勋回应称，训练有素的人工智能模型能显著降低客户在其他业务方面的成本。“购买得越多，节约得越多，”他如是说。）

Nvidia 的主要竞争对手是 AMD。自 2014 年起，AMD 由从台湾移民至美国的杰出工程师 Lisa Su 领导。在 Su 执掌 AMD 后，公司股价飙升了 30 倍，仅次于黄仁勋，成为当代最成功的半导体公司 CEO 之一。Su 与黄仁勋还是堂兄妹关系。

黄仁勋告诉我，他们小时候并不相识，直到 Su 成为 CEO 他们才相遇。“她非常出色，”他评价道。“我们之间的竞争并不激烈。”（Nvidia 的员工可以准确背诵 Nvidia 和 AMD 显卡在市场上的份额。）他们性格迥异：Su 沉稳且坚忍，而黄仁勋性情多变且情感外露。“她总是面无表情，”行业分析师 Mosesmann 评论。“相比之下，Jensen 的情绪更为直接，尽管如此，他依然能在竞争中取胜。”

Su 擅长跟随市场领导者，伺机而动。与黄仁勋不同，她敢于与英特尔正面竞争，在过去十年中，AMD 成功夺取了英特尔大量的 CPU 市场份额，这曾被认为是不可能的壮举。最近，Su 开始将目光转向人工智能市场。“Jensen 是一个极具野心的人，他不愿意失败，”负责 AMD 人工智能业务的高管 Forrest Norrod 说。“但我们相信我们有能力与 Nvidia 竞争。”

在一个九月的阴沉星期五下午，我开车去了一家眺望太平洋的豪华度假村，去看黄仁勋被 Hao Ko 公开采访的场景。Hao Ko 是 Nvidia 总部的主要建筑师。我提前到达，看到他们两个面对大海，正沉浸在安静的对话中。两人几乎穿着一模一样的服装：黑色皮夹克、黑色牛仔裤和黑色鞋子，只不过 Ko 显得更高一些。我本以为能听到一些关于计算未来的真挚见解，结果却听到了黄仁勋对 Ko 的服饰进行了六分钟的幽默吐槽。黄仁勋开玩笑说：“看看这家伙，他穿得跟我一样。他在模仿我，这很明智，只是他的裤子口袋太多了。”Ko 尴尬地笑了笑，低头看着他的设计师牛仔裤，上面确实有不少多余的拉链口袋。黄仁勋又说：“简化点，伙计！”然后转向我：“他为什么穿成这样，因为是我教的。我教会了他所有的东西。”（黄仁勋的穿着风格被广泛模仿，今年早些时候，他甚至还登上了《时报》的风格版块。）

“欢迎你的到来！这是给你的备用毛巾，还有一个客房，不过找不到合适的地方挂毛巾。” —— 漫画作者：Asher Perlman

该采访由世界领先的公司设计公司 Gensler 赞助，现场聚集了数百名建筑师。随着活动的临近，黄仁勋开始变得越来越活跃，开起了一连串轻松的笑话，不时前后摇晃。黄仁勋一年要进行多次演讲，他在当天早些时候已经对另一群听众讲过话，但我发现他其实很紧张。他承认：“我其实很害怕公开演讲。”

然而，一上台，他就显得既轻松又自信。他讲述了他的总部大楼起伏的屋顶上的天窗是如何设计的，不仅为了照亮建筑，同时还能遮挡直射的阳光。为了完成这个设计，他让 Ko 戴上虚拟现实头盔，并将其连接到一排 Nvidia G.P.U.，以此来追踪光线的流动。黄仁勋自豪地宣称：“这是世界上第一个必须依赖超级计算机才能建造的建筑。”

采访结束后，黄仁勋回答了观众的提问，包括一个关于人工智能潜在风险的问题。“有些人工智能像末日般可怕——它们仿佛能从电脑里跳出来，吞噬大量信息，自行学习、调整态度和感知，甚至开始自主决策，比如模拟按动各种按钮，”黄仁勋边说边做出按按钮的手势。房间里一片寂静。“没有任何人工智能应该在没有人类参与的情况下进行学习，”他补充道。一位建筑师问道，人工智能何时能开始自主解决问题？黄仁勋回答说：“发展出推理能力可能还需要两到三年。”听众中响起了低声的议论。

随后，我与高进行了交谈。像黄仁勋的许多玩笑一样，关于教给高“所知道的一切”的玩笑实际上隐含了一个深意。黄仁勋在选择高参与英伟达总部项目时，高还未成为 Gensler 的合伙人，而是绕过了他的上司。我询问了高黄仁勋为何这样做。“你可能听过一些故事，”高说，“他的确很严厉，言辞犀利。”尽管黄仁勋没有建筑经验，但他经常指出高在建筑设计上的错误。“我猜大多数建筑师都会反击，”高说，“但我更愿意倾听。”

高回忆，黄仁勋对英伟达工程团队在虚拟现实头盔速度上的挑战。最初，头盔需要五个小时来渲染设计变更；在黄仁勋的推动下，工程师将这个时间缩短至十秒。“他对他们很严格，但背后有他的逻辑，”高解释道，“如果头盔需要五小时，我可能会随便选一个看起来还不错的绿色。但如果只需十秒，我就会花时间选出最佳的绿色。”

这些建筑的设计获得了数个奖项，也为高的职业生涯锦上添花。然而，回想起这个项目，高的心情依然复杂。“项目完成后，我们参观了这个精美的建筑，他却在质疑我关于饮水机的位置，”高说，“他不满这些饮水机紧挨着洗手间。按照规定这是必须的，毕竟这是一个价值十亿美元的建筑！但他似乎就是无法释怀。”

“我永远不满足，”黄仁勋对我说，“无论什么事，我总能看到不完美之处。”

我询问黄仁勋先生，他是否正如二十年前那样进行新的冒险尝试。他立刻回答了一个词：“Omniverse”。受虚拟现实架构的启发，Omniverse 是 Nvidia 探索以极高细节模拟真实世界的尝试。黄仁勋先生称之为“工业级元宇宙”。

从 2018 年起，Nvidia 的显卡开始使用“光线追踪”技术，这项技术能模拟光线如何在物体上反射，创造出逼真的视觉效果。在 Nvidia 的高层会议室里，一名产品演示专家向我展示了一个细致渲染的日式拉面店场景。随着画面角度变化，金属柜台上反射的光芒和煮沸汤锅中升腾的蒸汽栩栩如生，几乎让人分辨不出这不是现实。

接着，这位专家展示了名为“Diane”的超现实数字化头像，它能说五种语言。一个强大的生成式 AI (Generative A.I.) 经过分析数百万视频片段，创造出这个集合体。最引人注目的是它的不完美之处——Diane 鼻子上有黑头，上唇有细微的汗毛。唯一暗示她非真人的线索是眼白中微妙的闪光。专家表示他们正在改进这一点。

黄仁勋先生希望将 Nvidia 在计算机图形和生成式 AI 领域的研究结合起来。他认为，图像生成 AI 很快就会发展到能渲染出三维、可居住的世界，并在其中填充逼真的人物。同时，语言处理 AI 将能即时解析语音指令。黄仁勋先生曾说：“未来的编程语言将是‘人类’语言。”将这些技术与光线追踪结合后，用户将能够仅用语言即可创造出整个宇宙。黄仁勋先生希望通过这种“数字孪生”技术，安全地训练机器人和自动驾驶汽车。结合虚拟现实技术，Omniverse 甚至可以让用户体验到量身定制的虚拟世界。

当我走出产品展示会，感觉有些眩晕。我联想到了科幻小说，也想到了《创世纪》。我坐在一个修剪过角的三角形沙发上，努力描绘我女儿未来可能生活的世界。Nvidia 的高层正在打造一个类似于曼哈顿计划的计算机科学项目，但当我对他们创造超越人类智能的做法提出质疑时，他们看我的眼神，就像我在质疑洗衣机的实用性一样。我曾经公开质疑 AI 是否会有一天害死人。“嗯，每年都有人因电死亡，”Catanzaro 回应道。我也曾怀疑它是否会消灭艺术。“它会让艺术变得更加优秀！”Diercks 兴奋地说。“它还会让你的工作做得更好。”我甚至想过，AI 是否可能很快就会有自我意识。“要成为一个有生命的生物，你必须有意识，要对自己有所认知，对吗？”黄仁勋反问道。“我不知道这种事情会在哪里发生。”

黄仁勋领导的 Nvidia 如何推动 AI 革命 [译]

发表评价取消回复

最近更新

大语言模型的“破解”研究：仅需二十次尝试 [译]

Deep Research 与知识价值：从信息搜索到价值重新定义

什么是多模态大语言模型（MLLM）？[译]

比尔·盖茨：特朗普、马斯克，以及我的神经多样性如何塑造了我 [译]

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

Support

发表评价 取消回复

最近更新

相关推荐

发表评价取消回复