💡 站外导读:在数字化浪潮中,企业正积极拥抱AI工具以提升研发效能。然而,正如得物团队在探索中所揭示的,AI Coding工具在实际落地,尤其是面对数仓开发这类复杂场景时,正遭遇严峻挑战。核心痛点在于AI模型在长时间交互中的上下文丢失与’失忆’问题,这不仅导致代码生成质量不稳定,甚至引发数据层面的严重错误。与此同时,单纯依赖AI记忆来执行开发规范,其可靠性远未达到企业级标准。这些痛点暴露了当前AI辅助编程从’能用’到’好用’之间的巨大鸿沟,亟需系统性工程解决方案。
在数字化时代的浪潮中,得物正致力于推动数仓开发的变革,尤其在 AI Coding 工具的应用上取得了显著进展。得物团队通过 Claude Code 这一核心工具,极大地提升了在重复性工作上的效率。然而,在实际应用中,团队也发现了一些亟待解决的痛点。
开发期间,AI 的“记忆”不足是一个突出挑战。以 Claude Code 为例,在持续对话中,它容易丢失上下文信息,比如关键字段的单位。这可能导致生成的 SQL 出现严重偏差,造成数据结果产生高达千倍的误差。根本原因在于,当对话内容接近上下文长度限制时,系统会自动压缩历史信息,从而造成上下文丢失。

其次,团队在执行规范时的稳定性也不尽如人意。在项目紧张的情况下,人工遵守规范的比率降至60% 至70%,而 AI 的 “记忆” 执行率也只有70% 到80%。这表明,依赖 AI 的规范记忆并不可靠,真正需要的是将这些规范内置到系统中,实现强制检查。
最后,当面对大型需求时,AI 的表现往往更加不稳定。复杂的开发任务会快速消耗 AI 的上下文空间,加剧其“失忆”倾向,导致错误频发。针对这些问题,得物团队引入了“Harness”工程这一概念。其核心是通过编写代码级的“护栏”,确保每次执行都严格遵循既定规范,从而显著降低人为失误的概率。
“Harness” 工程的核心在于将执行规范转化为系统级的检查机制,通过 hooks 和自动化工具来增强 AI 的能力。得物团队表示,未来的目标是通过这些机制将开发过程中的不确定性消除,让 AI 能够在复杂的开发环境中更加可靠。
划重点:
🌟 **AI 的“失忆”困境**:在长时间对话中,AI 往往难以保持对重要上下文的记忆,这直接导致其生成的 SQL 查询错误频现。
🛡️ ** 规范执行不稳定 **:人工遵循规范的比率低,而 AI 的执行率也不理想,急需系统化解决方案。
🔧 **Harness 工程的诞生**:这一机制通过自动化检查,将开发规范转化为系统级的强制校验,从而有效提升开发过程的稳定性和可靠性。
📝 站长洞察 (Editor’s Insight)
得物团队的实践揭示了AI Coding工具从概念验证走向生产环境的核心挑战:上下文管理与规则内化。这绝非个例,而是整个行业迈向’AI原生研发’必须跨越的工程峡谷。当前主流大模型的上下文窗口虽在增长,但有效信息密度和长期记忆的可靠性仍是瓶颈。得物提出的Harness工程理念极具前瞻性,它代表了一种范式转变——从’人适应工具’转向’工具守护人’,将最佳实践、数据规范、质量门禁编码为不可逾越的系统护栏。这本质上是在构建一种’结构化AI辅助’模式,通过工程化手段弥补模型的局限性。未来,顶尖的AI开发平台必然深度融合这类元编程与治理框架,使AI不仅能生成代码,更能生成’可信赖’的代码。这标志着企业级AI应用正从追求效率的1.0阶段,迈向追求可靠性与可控性的2.0深水区。
