跨界思考:大语言模型中创意幽默生成的新思维探索 [译]
我们构建了一个新的框架,这个框架可以帮助我们更好地理解通用人工智能(AGI)及其早期版本的能力和表现。这个框架详细划分了 AGI 的性能、适用范围和自我控制能力的不同层次…
深入了解大语言模型运维 (LLMOps) [译]
虽然关于通过 OpenAI、Anthropic、Google 等公司的 API 调用 LLM 来构建应用的文章层出不穷,但我选择了一条不同的道路,尝试仅使用本地模型和技术…
Google 真正的“登月项目”(Moonshot) [译]
Google 的各种“登月项目” ——无论是 Waymo 无人驾驶汽车,Google Fiber 光纤网络,Nest 智能家居,Project Wing 无人机配送,Ve…
通用型基础模型能否超越专用调整模型?医学领域的案例研究 [译]
像 GPT-4 这样的通用型基础模型在众多领域和任务中表现出惊人的能力。但人们普遍认为,除非经过专业知识的深度训练,这些模型无法达到专家级别的性能。例如,到目前为止,大多…
2023 年回顾:聚焦 ChatGPT 时代之后的发展及 2024 年展望 [译]
大语言模型 (LLM) 运营领域如何变革,以及为何尚未见到广泛应用的生成式 AI — 但 2024 年或有所改变。
ReST 与 ReAct 的交汇:多步推理大语言模型 (LLM) 智能体的自我进化之路 [译]
在回答复杂的自然语言问题时,往往需要通过多步推理并结合外部信息。目前已有几种系统能够结合大语言模型 (LLM) 和知识检索来应对此类问题。但这些系统存在一些失败的案例,且…
未来属于 Rust —— LLM 使编程语言学习曲线变平 [译]
现在,得益于大语言模型(LLMs)的发展,这个陡峭学习曲线的问题已经变得容易解决了。无论是 Rust、Haskell 还是其他任何语言,借助大语言模型的帮助,现在学习起来…
在本地运行 Mixtral 8×7 与 LlamaIndex [译]
在 LlamaIndex,我们是开源软件的忠实支持者,因此像 Mixtral 这样开放的模型和具有灵活授权的项目正合我们心意。我们收到了不少关于如何将 Mixtral 与…
Yann LeCun 对 AI 安全论证的五大失误 [译]
Yann LeCun,著名社交媒体公司 Meta 的首席 AI 科学家,坚信人工智能(AI)本质上是安全的,认为智能属性本身不会自动导致负面后果。他认为 AI 的对齐问题…
OpenAI 首席科学家创造 ChatGPT 的同时,对 AI 安全心存忧虑 [译]
这篇文章选自《自然》杂志的年度特辑《Nature's 10》,该特辑由杂志编辑精选,聚焦科学领域的重大进展及其贡献者。
数学队——及其他你为了进入斯坦福而做出的疯狂之举 [译]
我清晰地记得被普林斯顿大学拒绝的那一刻。那时我正在数学队的训练中,爸爸打来电话。他告诉我,提前录取通知已经到了。他没有提及信封的大小 - 大信封意味着被录取,小信封则代表…
构建“Mistral 7B 微调优化版”:最优秀的 7B 微调模型 [译]
自 9 月份推出以来,Mistral 7B 已成为我们向客户推荐最多的模型。今天,我们兴奋地宣布一个更加强大的版本:Mistral 7B 微调优化版。