Prompt engineering 总结

提示工程优化流程

设定清晰成功标准 ➡️ 开发多样化测试用例 ➡️ 工程化初步提示设计 ➡️ 系统化测试与评估 ➡️ 迭代式提示优化 ➡️ 生产环境部署监控

设定清晰成功标准： 从项目启动阶段就建立明确且可量化的成功指标，这些标准将成为整个提示优化过程的北极星。
开发多样化测试用例：在明确任务定义和成功标准后，系统性地构建覆盖应用程序所有预期使用场景的测试用例集合。事先定义完善的测试用例是客观衡量提示性能的基础，使你能够准确评估是否达到既定的成功标准。

这部分我个人认为是工作量最大的地方，需要提前对当前工作任务分类好测试用例以最方便地提供给AI。
工程化初步提示设计： 精心制作初始提示框架，详细概述任务定义、优质回应的核心特征，以及Claude执行任务所需的关键背景信息。理想的初步提示应该包含典型输入输出的具体示例，为Claude提供清晰的行为模式参考。

背景信息我的理解是：需求背景/代码运行环境/项目规范与代码风格/工具限制
系统化测试与评估： 将精心准备的测试用例通过初步提示输入Claude，对模型生成的每个回应进行细致的评估分析。建立一致且客观的评分体系，可以采用人工专家评估、标准答案对比，或者基于评分准则的Claude实例判断等方法。关键在于建立系统性的性能评估机制，确保每次测试都能产生可比较和可追踪的结果。
迭代式提示优化： 基于测试评估的具体结果，采用迭代方法持续改进提示设计，通过添加必要的澄清说明、补充典型示例或设置行为约束来优化Claude的表现。在这个过程中要特别注意避免过度拟合现象，不能仅仅针对狭窄的输入集合进行优化，而要保持良好的泛化能力以应对各种实际场景。
生产环境部署监控： 当提示在测试用例中表现优异并完全满足预设成功标准后，将其正式部署到实际应用环境中。持续监控模型在真实场景中的表现，保持敏锐的观察力以识别可能出现的新边缘情况。这些在初始测试集中未曾预料到的情况需要及时处理，准备好根据实际运行情况进行进一步的提示优化调整。

提升 Claude 性能

提供清晰的指令和背景信息！
- 提供尽可能多的背景和细节，包括完成任务正确所需的任何特定规则或要求——在任务开始时就提供背景信息，给出具体的、逐步的、编号的指令，提供如何格式化输出的指导。
  
  如果希望模型有超越期望的行为，需要更明确地请求这些行为。
- 提供指令背后的上下文或动机——向模型解释为什么这种行为很重要。
- 告诉Claude应该做什么，而不是不应该做什么。
- 🔔对于前端代码生成，您可以通过提供明确的鼓励来引导Claude 4模型创建复杂、详细和交互式的设计：
```
Don't hold back. Give it your all.
```
  您还可以通过提供额外的修饰语和关注点的详细信息来提高Claude在特定领域的前端性能：
  - “包含尽可能多的相关功能和交互”
  - “添加周到的细节，如悬停状态、过渡和微交互”
  - “创建一个展示网页开发能力的令人印象深刻的演示”
  - “应用设计原则：层次结构、对比、平衡和动态”
使用示例：在你的提示中包含示例，以展示所需的输出格式或风格！

这是我平时使用时缺失的步骤，因为具体的示例需要提前分类好一起给它，但我还没有分类好。
让Claude准备扮演一个特定的角色（比如专家），以提高你使用场景下的表现。
使用XML标签：采用XML标签来构建提示和响应，以提高清晰度。
链式提示：将复杂任务分解为更小、更易管理的步骤以获得更好的结果。

让Claude思考：鼓励循序渐进的思考以提高克劳德输出的质量。

鼓励逐步思考最简单的方法：在提示中加入“逐步思考”这个短语！

在收到工具结果后，仔细反思其质量并确定最佳下一步行动，然后再继续。使用您的思考来基于这些新信息进行规划和迭代，然后采取最佳的下一步行动。

预填Claude的回应：用几个词开始克劳德的回应，以指导其输出朝向期望的方向。
控制输出格式：指定所需的输出格式以确保一致性和可读性。
请向Claude请求重写：根据评分标准提出修改意见，让克劳德迭代并改进其输出内容。
优化并行工具调用：

Claude 4模型在并行工具执行方面表现出色。即使没有任何提示，它们在使用并行工具调用方面也有很高的成功率，但一些小的提示可以将这种行为的成功率提高到约100%。我们发现以下提示最有效：
```
为了最大效率，当您需要执行多个独立操作时，同时调用所有相关工具，而不是按顺序调用。
```
减少代理编码中的文件创建：

Claude 4模型有时可能会创建新文件用于测试和迭代，特别是在处理代码时。这种方法允许Claude使用文件，尤其是Python脚本，作为”临时草稿”，然后再保存最终输出。使用临时文件可以改善代理编码用例的结果。

如果您希望最小化新文件的创建，可以指示Claude在完成后进行清理：
```
如果您创建了任何临时新文件、脚本或用于迭代的辅助文件，请在任务结束时通过删除这些文件来进行清理。
```
占位