“提示注入”与“破解”并不是一回事 [译]
我注意到很多人在讨论“破解”时误用了“提示注入”这个术语。这种误用已经变得如此普遍,以至于我怀疑我们是否还能纠正回来。语言的含义(特别是新近创造的术语)源于人们的使用习惯…
揭秘 OpenAI 至 2027 年打造通用人工智能的蓝图 [译]
本文揭示了我搜集到的关于 OpenAI 计划(经过调整)于 2027 年打造达到人类水平的通用人工智能(AGI)的信息。虽然不是所有的信息都容易证实,但希望足够的证据能够…
谷歌 Deepmind 发布首个生成式交互环境模型 Genie [译]
我非常激动地分享 @Google DeepMind 开放创新团队的最新进展 🚀。我们推出了 Genie 🧞,这是一个从互联网视频中学习而来的创新世界模型,能够根据图像提示…
Gemini 与 Google 的文化观 [译]
Google,乃至更广泛的科技公司界,对于偏见的指控向来敏感,这种态度也延伸至图像生成领域。我理解这种在描绘假设场景时的谨慎态度。然而,很多图像反映的是真实历史。
V-JEPA:迈向 Yann LeCun 先进机器智能(AMI)愿景的新里程碑 [译]
我们人类对周遭世界的认知大多来源于观察——尤其是在生命的早期阶段。就拿牛顿的第三定律来说:甚至婴儿或是猫,在将物品从桌上推下观察其落下后,都能直观感受到“物体上抛必将下落…
探索 Sora:视频制作的魔法 [译]
Sora 的视频质量似乎是不可能的,所以我深入研究了它的工作原理 它使用了扩散(从噪声开始,细化到期望的视频)和 Transformer 架构(处理连续的视频帧)。
新手如何为演讲制作精美的幻灯片 [译]
在多年的会议演讲经历中,我发现自己喜欢设计幻灯片,为每个话题创造新的视觉主题,这不仅令人兴奋,也成为了我投入准备演讲的动力。许多人询问我关于技巧和推荐工具,因此,在这篇指…
视频生成模型:构建虚拟世界的模拟器 [译]
我们致力于在视频数据上开展生成模型的大规模训练。具体来说,我们针对不同时长、分辨率和宽高比的视频及图像,联合训练了基于文本条件的扩散模型。我们采用了一种 Transfor…
PyTorch 加速生成式 AI 第二部分:高速 GPT [译]
本篇博客是关于使用纯 PyTorch 加速生成式 AI 模型的系列文章的第二部分,由 PyTorch 团队撰写。我们在这里分享了 PyTorch 的最新性能特性,并通过实…
“提示工程师”:一个即将过时的职业 [译]
关于未来职业的讨论已经铺天盖地,我也曾深入探讨过从机器人管家到气候难民等多个领域。而在 AI 创造的众多工作中,最近一年多来,“提示工程师”这一职业引起了广泛关注。
大语言模型提示工程综述:技巧与应用领域 [译]
在扩展大语言模型 (LLM) 及视觉 - 语言模型 (VLM) 能力方面,提示工程已成为关键技术。它通过特定任务的指令,即提示,提升模型效能,无需更改模型核心参数。这些提…
如何使用 ChatGPT Api 和 Node.js 对 Youtube 视频内容进行摘要 [译]
本期,我将介绍一个教程,告诉你如何利用 Node.js 构建一个系统,该系统能够通过 Youtube 视频链接,利用 OpenAI 提供的 completions api…