顶尖 1% 工程师的七个简易习惯 [译]
我有幸与许多卓越的工程师合作过,他们既来自像 FAANG 这样的大型公司,也来自诸如创业公司这样的小型企业。他们让我领略到了传说中的“10 倍效能”工程师 - 他们确实存…
VideoPoet: 能零样本生成视频的大语言模型 [译]
近期,一系列新兴的视频生成模型引起了广泛关注,它们在很多情况下展示了令人惊叹的画质。然而,在视频生成领域,如何有效制作连贯的大范围动作仍是一大难题。目前即便是最先进的模型…
在命令行中运行 Mistral 模型的多种方法 [译]
目前,Mistral AI 是最引人注目的 AI 研究实验室。他们最近发布了两种功能强大的小型大语言模型,这些模型遵循 Apache 2 协议授权,还有一个更大的模型可通…
一个永无止境的个人项目带来的启示 [译]
今年,我领悟到,完成一个仅为自己而做的个人项目几乎是不可能的挑战。不论你的创作是什么,使用哪种方式,真正明白自己到底想要什么、并且能够把它与那些自己期望拥有的欲望区分开来…
推测性解码:实现 Whisper 推理速度提升两倍 [译]
Sanchit Gandhi 发表了一篇关于 Whisper 模型的最新研究进展。这是一个由 Open AI 开发的先进语音转录模型,能够在多种基准测试和不同的音频环境下…
构建搜索引擎,而非向量数据库(Vector DB) [译]
在过去 12 个月中,我们见证了向量数据库(Vector DB)创业公司的迅猛增长。我此刻并不打算深入探讨它们各自的设计取舍。相反,我更想探讨和解释一些关于向量数据库的常…
跨界思考:大语言模型中创意幽默生成的新思维探索 [译]
我们构建了一个新的框架,这个框架可以帮助我们更好地理解通用人工智能(AGI)及其早期版本的能力和表现。这个框架详细划分了 AGI 的性能、适用范围和自我控制能力的不同层次…
深入了解大语言模型运维 (LLMOps) [译]
虽然关于通过 OpenAI、Anthropic、Google 等公司的 API 调用 LLM 来构建应用的文章层出不穷,但我选择了一条不同的道路,尝试仅使用本地模型和技术…
Google 真正的“登月项目”(Moonshot) [译]
Google 的各种“登月项目” ——无论是 Waymo 无人驾驶汽车,Google Fiber 光纤网络,Nest 智能家居,Project Wing 无人机配送,Ve…
通用型基础模型能否超越专用调整模型?医学领域的案例研究 [译]
像 GPT-4 这样的通用型基础模型在众多领域和任务中表现出惊人的能力。但人们普遍认为,除非经过专业知识的深度训练,这些模型无法达到专家级别的性能。例如,到目前为止,大多…