在数据集上进行测试
通常,在数据集上测试提示词以了解您的模型在不同场景下的行为方式很有用。Playground 允许您轻松地在任何 LangSmith 数据集上测试提示词。
运行您的提示词
- 选择您要测试的提示词。这可以是已保存的提示词,也可以是未保存的提示词。您可以通过点击“+ 比较”向 Playground 添加多个提示词,它们都将在数据集上运行。
- 在 Playground 的右上角部分,从下拉列表中选择您的数据集。默认情况下,会选择整个数据集,但将鼠标悬停在数据集上将允许您选择数据集拆分(如果存在)。
- 这将加载一个包含数据集中前 20 个示例的表格。从这里,您可以单击“+ 评估器”为您的实验配置评估器。
- 这将打开一个窗格,您可以在其中选择您想在此实验中使用的评估器。您可以通过切换复选框来添加多个评估器到您的实验或删除它们。
- 选择评估器后,单击 Playground 中的“开始”按钮以运行您的实验。虽然数据集中的所有示例都将在您的实验中运行,但 Playground 只会显示前 20 个。要查看完整的实验结果,您可以单击结果表格中的“查看实验”按钮。