Prompt engineering 总结


Prompt engineering 总结

提示工程优化流程

设定清晰成功标准 ➡️ 开发多样化测试用例 ➡️ 工程化初步提示设计 ➡️ 系统化测试与评估 ➡️ 迭代式提示优化 ➡️ 生产环境部署监控

  • 设定清晰成功标准: 从项目启动阶段就建立明确且可量化的成功指标,这些标准将成为整个提示优化过程的北极星。

  • 开发多样化测试用例:在明确任务定义和成功标准后,系统性地构建覆盖应用程序所有预期使用场景的测试用例集合。事先定义完善的测试用例是客观衡量提示性能的基础,使你能够准确评估是否达到既定的成功标准。

    这部分我个人认为是工作量最大的地方,需要提前对当前工作任务分类好测试用例以最方便地提供给AI。

  • 工程化初步提示设计: 精心制作初始提示框架,详细概述任务定义、优质回应的核心特征,以及Claude执行任务所需的关键背景信息。理想的初步提示应该包含典型输入输出的具体示例,为Claude提供清晰的行为模式参考。

    背景信息我的理解是:需求背景/代码运行环境/项目规范与代码风格/工具限制

  • 系统化测试与评估: 将精心准备的测试用例通过初步提示输入Claude,对模型生成的每个回应进行细致的评估分析。建立一致且客观的评分体系,可以采用人工专家评估、标准答案对比,或者基于评分准则的Claude实例判断等方法。关键在于建立系统性的性能评估机制,确保每次测试都能产生可比较和可追踪的结果。

  • 迭代式提示优化: 基于测试评估的具体结果,采用迭代方法持续改进提示设计,通过添加必要的澄清说明、补充典型示例或设置行为约束来优化Claude的表现。在这个过程中要特别注意避免过度拟合现象,不能仅仅针对狭窄的输入集合进行优化,而要保持良好的泛化能力以应对各种实际场景。

  • 生产环境部署监控: 当提示在测试用例中表现优异并完全满足预设成功标准后,将其正式部署到实际应用环境中。持续监控模型在真实场景中的表现,保持敏锐的观察力以识别可能出现的新边缘情况。这些在初始测试集中未曾预料到的情况需要及时处理,准备好根据实际运行情况进行进一步的提示优化调整。

提升 Claude 性能

  • 提供清晰的指令和背景信息!

    • 提供尽可能多的背景和细节,包括完成任务正确所需的任何特定规则或要求——在任务开始时就提供背景信息,给出具体的、逐步的、编号的指令,提供如何格式化输出的指导。

      如果希望模型有超越期望的行为,需要更明确地请求这些行为。

    • 提供指令背后的上下文或动机——向模型解释为什么这种行为很重要。

    • 告诉Claude应该做什么,而不是不应该做什么。

    • 🔔对于前端代码生成,您可以通过提供明确的鼓励来引导Claude 4模型创建复杂、详细和交互式的设计:

      Don't hold back. Give it your all.

      您还可以通过提供额外的修饰语和关注点的详细信息来提高Claude在特定领域的前端性能:

      • “包含尽可能多的相关功能和交互”
      • “添加周到的细节,如悬停状态、过渡和微交互”
      • “创建一个展示网页开发能力的令人印象深刻的演示”
      • “应用设计原则:层次结构、对比、平衡和动态”
  • 使用示例:在你的提示中包含示例,以展示所需的输出格式或风格!

    这是我平时使用时缺失的步骤,因为具体的示例需要提前分类好一起给它,但我还没有分类好。

  • 让Claude准备扮演一个特定的角色(比如专家),以提高你使用场景下的表现。

  • 使用XML标签:采用XML标签来构建提示和响应,以提高清晰度。

  • 链式提示:将复杂任务分解为更小、更易管理的步骤以获得更好的结果。

  • 让Claude思考:鼓励循序渐进的思考以提高克劳德输出的质量。

    • 鼓励逐步思考最简单的方法:在提示中加入“逐步思考”这个短语!

      在收到工具结果后,仔细反思其质量并确定最佳下一步行动,然后再继续。使用您的思考来基于这些新信息进行规划和迭代,然后采取最佳的下一步行动。
  • 预填Claude的回应:用几个词开始克劳德的回应,以指导其输出朝向期望的方向。

  • 控制输出格式:指定所需的输出格式以确保一致性和可读性。

  • 请向Claude请求重写:根据评分标准提出修改意见,让克劳德迭代并改进其输出内容。

  • 优化并行工具调用:

    Claude 4模型在并行工具执行方面表现出色。即使没有任何提示,它们在使用并行工具调用方面也有很高的成功率,但一些小的提示可以将这种行为的成功率提高到约100%。我们发现以下提示最有效:

    为了最大效率,当您需要执行多个独立操作时,同时调用所有相关工具,而不是按顺序调用。
  • 减少代理编码中的文件创建:

    Claude 4模型有时可能会创建新文件用于测试和迭代,特别是在处理代码时。这种方法允许Claude使用文件,尤其是Python脚本,作为”临时草稿”,然后再保存最终输出。使用临时文件可以改善代理编码用例的结果。

    如果您希望最小化新文件的创建,可以指示Claude在完成后进行清理:

    如果您创建了任何临时新文件、脚本或用于迭代的辅助文件,请在任务结束时通过删除这些文件来进行清理。
  • 占位


文章作者: QT-7274
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 QT-7274 !
评论
  目录