Skip to content

使用 TruLens 进行评估与追踪#

本文介绍如何利用 TruLens 来评估和追踪基于 Llama-Index 构建的 LLM 应用程序。

TruLens 是什么?#

TruLens 是一个开源工具包,为基于大语言模型(LLM)的应用程序提供插桩和评估工具。包含相关性、情感分析等反馈函数评估,以及涵盖成本和延迟的深度追踪功能。

TruLens 架构图

当您迭代开发 LLM 应用的新版本时,可以对比不同版本在所有预设质量指标上的表现。您还能查看记录级别的评估结果,并探索每条记录的应用程序元数据。

安装与配置#

安装 TruLens 非常简单,只需通过 pip 安装:

pip install trulens-eval
from trulens_eval import TruLlama

立即体验!#

llama_index_quickstart.ipynb

在 Colab 中打开

延伸阅读#