2024 AI 预测
既有亮点也有挑战 —— 并伴随着诸多炒作
伴随着假期的结束,我们满载热情回归,为大家带来 2024 年的最新观点!
回顾 2023 年,生成式 AI(Generative AI)和大语言模型(LLM)领域经历了不平凡的一年 —— 展示了许多令人印象深刻的演示(有些甚至是真实的!),各领域的创新速度之快令人咋舌,年末更有一些公司间的戏剧性事件。2024 年很可能延续这样的趋势。
来源:DALL-E 3。一幅以未来派和轻微赛博朋克风格为背景,展示 ‘2024’ 年的 3D 方块字母图像。
我们想分享一些关于今年发展趋势的预测。这些预测基于我们的工作经验和业内交流,但我们持有谨慎的态度。每个预测都附有一个大概的置信度(50%,70%,90%)。尽管这些数字只是估计,但它们反映了我们对未来发展方向的看法。
OpenAI 与商业大语言模型
尽管 OpenAI 内部的管理变动可能会放缓 GPT-5 最前沿研究的步伐,但降低成本的持续努力很可能不会停止。我们几乎可以确定,未来将会出现像去年 11 月那样的成本削减 (降低 2 到 3 倍),但市场竞争可能会促使更加激烈的成本削减。然而,我们认为 OpenAI 在质量和使用方面相对现有的大语言模型(LLM)所拥有的优势不会消失。
关于 OpenAI 如何构建和推广 GPTs 商店,还有很多值得期待的地方。但可以合理预期,一个精巧的应用将从 OpenAI 提供的巨大市场动力中受益。
-
OpenAI 不太可能发布 GPT-5。 50%
-
2024 年 GPT-4 每个 Token 的成本预计将至少降低 5 倍。 70%
-
无论是 GPT-4 还是如果发布了 GPT-5,它都将在 2024 年底的 LMSys 排行榜 上占据首位。 90%
-
Amazon 和 Google 在企业级大语言模型使用量上加起来将少于 OpenAI。 70%
-
OpenAI 应用商店中至少会有两个 GPT 应用创造出 10 万美元的收入。 50%
开源大语言模型
开源大语言模型的竞赛不会很快放缓,其他科技公司很可能加入这场竞赛,特别是那些非主流云服务提供商的公司。
尽管有资金投入,我们对开源大语言模型公司的成功持谨慎看法。我们认为,正如我们之前所述,商业大语言模型会继续在通用任务中占据主导地位,而开源大语言模型可能会面临挑战 —— 我们预测有 30% 的可能性,一家大型模型提供商将被收购,这就说明了这一点。我们依然认为,开源大语言模型最好的策略是转型为专业化平台。
-
Llama 3 预计将在 2024 年发布。90%
-
至少有 3 家开源大语言模型公司将获得 1 亿美元或更多的融资。70%
-
一家成熟科技公司将发布新的开源大语言模型(不包括 Meta 和 Llama 3)。50%
-
没有任何开源大语言模型的质量(ELO)会在LMSys 排行榜上顶尖商业模型的 10% 到 5% 范围内。90%
- 注:我们最初预测的数字是 10%,这是在 Mixtral(1121 ELO)加入 LMSys 排行榜之前。我们的初衷是表明开源大语言模型在质量上不会达到商业模型的水平,但 10% 的差距太大。以 GPT-3.5(1117 ELO)与 GPT-4 Turbo(1243 ELO)的比较为例,10% 是一个巨大的差距。因此,我们将预测调整为 5%。
-
一家截至 2023 年 12 月已筹集至少 5000 万美元的开源基础模型公司将被关闭或被收购。30%(1 – 70%)
-
没有任何开源大语言模型公司的年收入将达到 2000 万美元。70%
其他预测
-
2024 年投资于 AI 公司的资金将低于 2023 年。50%
- 尚未清楚 AI 热潮将如何发展,但在全球观望现有投资成果的背景下,AI 领域的资金投入可能会有所减缓。
-
至少会有一个美国政府机构参与建立一个公开的大语言模型 (LLM)。50%
- 鉴于拜登政府近期对 AI 的关注和行政命令,如果认为这是一项关键的世代技术,政府可能不会置身事外。
-
第三方服务的每 Token 微调费用将至少降低 5 倍。90%
-
第三方服务的每 Token 微调费用将至少降低 10 倍。70%
- 在 AI 领域的投资放缓背景下,提供微调和开源模型推理服务的公司正面临激烈的成本竞争。考虑到许多专家正在进行优化工作,尽管这些降价幅度看似巨大,但我们相信大幅降价是非常可能的。
-
Llama 3 将具备多模态功能。70%
-
Anthropic 将推出具有多模态功能的模型。70%
- 多模态功能在 2023 年底极为流行,尽管 Google 的 Gemini 演示并非真实,但它展现了多模态技术的潜力。预计其他模型开发者也将迅速采纳这一趋势。
奖励:大语言模型预测的未来
在撰写这篇文章的过程中,我们不经意间让 Notion AI 来完成了这篇文章。想到可能会有一些趣味,我们决定保留它,以防将来有 AI 领袖在 12 个月后阅读这篇文章 – 希望他们会对我们有好感。🙂 说真的,这些预测相当随机(甚至有些狂野),我们自己也并不完全认同。
-
至少会有一个大语言模型 (LLM) 在公认的 WMT 翻译基准测试中获得 0.8 或更高的 BLEU 分数,这表明它达到了与人类相媲美的水平。70%
-
与 2023 年相比,将有多达 50% 的实时语言翻译应用开始主要使用大语言模型 (LLM) 作为翻译引擎。90%
-
大语言模型 (LLM) 将创作出至少一部小说或剧本,这部作品将被出版,并获得知名文学或电影评论家的正面评价。50%