跳到主内容

评估操作指南

这些指南回答“我该如何…?”格式的问题。它们以目标为导向,具体实用,旨在帮助您完成特定任务。有关概念性解释,请参阅概念指南。有关端到端演练,请参阅教程。有关每个类和函数的详细说明,请参阅API 参考

主要功能

离线评估

在部署应用程序之前对其进行评估和改进。

运行评估

定义评估器

配置评估数据

配置评估任务

向数据集添加默认评估器

设置自动评估器,使其针对数据集对所有实验自动运行。

测试集成

使用您喜欢的测试工具运行评估。

在线评估

评估和监控您的系统在生产数据上的实时性能。

分析实验结果

使用用户界面和 API 了解您的实验结果。

数据集管理

管理您的评估在 LangSmith 中使用的数据集。

标注队列和人工反馈

收集主题专家和用户的反馈以改进您的应用程序。


此页面有帮助吗?


您可以留下详细反馈 在 GitHub 上.