多模态和多模态大模型 (LMM)[译]
以前,我们的机器学习模型一般都只处理一种类型的数据,比如只处理文本、图像或音频。但是,想想我们人类的大脑。我们不仅仅读写文字,还可以看图、看视频,听音乐,还能够辨识各种不…
把大语言模型封装成桌面应用 [译]
最近,我一直忙于开发 Ollama,因此投入了大量时间研究如何在本地系统上运行大语言模型(大语言模型),并探索如何将它们封装进应用程序。一般而言,大部分桌面应用程序只要求…
功能标记(Feature Flags)管理指南 [译]
在软件开发这个不断演变的领域,迅速适应、实验和高效发布功能显得至关重要。功能标记(Feature Flags),也称为功能开关,正是这种动态环境的核心。它们赋予开发者将代…
Mixtral 8x7B — 混合专家模型(Mixtral of Experts) [译]
Mistral AI 团队致力于为开发者社区提供顶尖的开源模型。在 AI 领域,要实现突破,不仅要超越现有的架构和训练方法,更重要的是让社区能够利用创新模型,激发新的发明…
深入解析“混合专家模型(Mixtral of Experts)” [译]
自从 Mixtral 8x7B(发布公告、模型说明)亮相以来,“混合专家模型”(Mixture of Experts,简称 MoEs)这类 Transformer 成了开…
探索编写提示词的乐趣:蒙特卡洛方法、木偶剧和笑声的融合 [译]
内部生产力工具中所采用的各种提示技术。这些技术结合了行业与学术研究以及我们自身的小规模内部开发成果。建议你在自己的评估环境下对这些技术进行测试,并根据你的具体需求进行调整…
TBM 258: “只需招募有才华的人并赋予他们权力” [译]
人们常认为,一个杰出的领导者的任务就是招聘员工,并授权他们去做出色的工作。但如果你不深入了解细节,你怎么能判断他们的工作是否出色呢?因此,我确保自己深入到细节中,并且我们…
深入探索:AI 驱动的 PDF 布局检测引擎源代码解析 [译]
上周,PDF 转 Markdown 的工具 Marker 成为 Hacker News 首页的热门话题。作为一个对机器学习(ML)充满好奇的学生,我觉得这是一个绝佳的机会…
AI 时代的商业市场新风貌 [译]
在不断演进的市场商业模式中,每一种新兴平台都在重新定义交易的方式和地点。互联网时代,我们从传统的分类广告和布告栏转向了亚马逊(Amazon)、eBay 和克雷格列表(Cr…