跳到主内容

如何在 Playground 中使用多条消息

本操作指南将引导您了解在 Playground 中设置多轮对话的各种方式,这将使您能够针对更长的消息线程测试不同的工具配置和系统提示。

从现有运行

首先,请确保您已正确追踪了多轮对话,然后导航到您的追踪项目。进入追踪项目后,只需打开运行,选择 LLM 调用,然后按如下方式在 Playground 中打开它

然后,您可以编辑系统提示、调整工具和/或输出模式,并观察多轮对话的输出如何变化。

从数据集

开始之前,请确保您已设置好数据集。由于您想要评估多轮对话,请确保您的输入中有一个键包含消息列表。

创建数据集后,前往 Playground 并加载您的数据集进行评估。

然后,向您的提示中添加一个消息列表变量,确保其名称与您的输入中包含消息列表的键相同

当您运行提示时,每个示例中的消息将以列表形式添加到“消息列表”变量的位置。

手动

有两种手动创建多轮对话的方式。第一种方式是简单地将消息附加到提示中

这有助于快速迭代,但由于多轮对话是硬编码的,因此比较僵硬。相反,如果您希望您的提示适用于任何多轮对话,您可以添加一个“消息列表”变量并将您的多轮对话添加到那里

这使您只需调整系统提示或工具,同时允许任何多轮对话取代 Messages List 变量,从而使您能够在各种运行中重用此提示。

后续步骤

现在您知道如何为多轮交互设置 Playground 了,您可以手动检查和判断输出,或者添加评估器来分类结果。

您还可以阅读这些操作指南,了解更多关于如何使用 Playground 运行评估的信息。


此页面有帮助吗?


您可以留下详细反馈 在 GitHub 上.