使用 TruLens 进行评估与追踪#
本文介绍如何利用 TruLens 来评估和追踪基于 Llama-Index 构建的 LLM 应用程序。
TruLens 是什么?#
TruLens 是一个开源工具包,为基于大语言模型(LLM)的应用程序提供插桩和评估工具。包含相关性、情感分析等反馈函数评估,以及涵盖成本和延迟的深度追踪功能。

当您迭代开发 LLM 应用的新版本时,可以对比不同版本在所有预设质量指标上的表现。您还能查看记录级别的评估结果,并探索每条记录的应用程序元数据。
安装与配置#
安装 TruLens 非常简单,只需通过 pip 安装:
pip install trulens-eval
from trulens_eval import TruLlama