在数字化时代的浪潮中,得物正致力于推动数仓开发的变革,尤其在 AI Coding 工具的应用上取得了显著进展。得物团队通过 Claude Code 这一核心工具,极大地提升了在重复性工作上的效率。然而,在实际应用中,团队也发现了一些亟待解决的痛点。

开发期间,AI 的“记忆”不足是一个突出挑战。以 Claude Code 为例,在持续对话中,它容易丢失上下文信息,比如关键字段的单位。这可能导致生成的 SQL 出现严重偏差,造成数据结果产生高达千倍的误差。根本原因在于,当对话内容接近上下文长度限制时,系统会自动压缩历史信息,从而造成上下文丢失。

image.png

其次,团队在执行规范时的稳定性也不尽如人意。在项目紧张的情况下,人工遵守规范的比率降至60% 至70%,而 AI 的 “记忆” 执行率也只有70% 到80%。这表明,依赖 AI 的规范记忆并不可靠,真正需要的是将这些规范内置到系统中,实现强制检查。

最后,当面对大型需求时,AI 的表现往往更加不稳定。复杂的开发任务会快速消耗 AI 的上下文空间,加剧其“失忆”倾向,导致错误频发。针对这些问题,得物团队引入了“Harness”工程这一概念。其核心是通过编写代码级的“护栏”,确保每次执行都严格遵循既定规范,从而显著降低人为失误的概率。

“Harness” 工程的核心在于将执行规范转化为系统级的检查机制,通过 hooks 和自动化工具来增强 AI 的能力。得物团队表示,未来的目标是通过这些机制将开发过程中的不确定性消除,让 AI 能够在复杂的开发环境中更加可靠。

划重点:

🌟 **AI 的“失忆”困境**:在长时间对话中,AI 往往难以保持对重要上下文的记忆,这直接导致其生成的 SQL 查询错误频现。

🛡️ ** 规范执行不稳定 **:人工遵循规范的比率低,而 AI 的执行率也不理想,急需系统化解决方案。

🔧 **Harness 工程的诞生**:这一机制通过自动化检查,将开发规范转化为系统级的强制校验,从而有效提升开发过程的稳定性和可靠性。