Jetson AGX Orin developer kit 安装 pytorch 踩坑流程

5 阅读2分钟

背景

由于组里面想要测试一个项目代码具体在jetson板子上的运行效率以及开销,让我一个小白学习一下jetson上怎么部署代码。花费4天,一共涉及jetson刷机,安装conda,pytorch。由于前面两项,有用的博客已经有很多了,就不多赘述。我这4天,3天花在这个pytorch的安装上了。所以记录一下,希望能帮到人。

Pytorch安装

首先,先明确一下我的配置。刷机之后,我的板子是jetpack6.2,cuda 12.6. 然后是几个比较有用的网址:

尝试1

首先,在第一个网址上面找到jetpack6.0对应的pytorch版本,创建完虚拟环境之后然后直接安装。 在执行import torch遇到报错

>>> import torch

Traceback (most recent call last):

  File "<stdin>", line 1, in <module>

  File "/home/jetson/.local/lib/python3.10/site-packages/torch/__init__.py", line 237, in <module>

    from torch._C import# noqa: F403

ImportError: libcudnn.so.8: cannot open shared object file: No such file or directory

在问问大G老师之后,发现是这个pytorch版本是在cudnn8.0编译的,但是jetpack6.2只有cudnn9,所以不对。 就是说,需要找jetpack6.2对应的pytorch版本,不知道为什么官网里面jetpack6给的pytorch版本也是不对的。 然后花了2天时间,尝试了各种ai提供的方法:创建软连接欺骗系统;下载cudnn8;运行docker;全部不行。

尝试2

后来发现,网页1里面第一行:

note:  future PyTorch wheels for Jetson are available from:  
[**https://docs.nvidia.com/deeplearning/frameworks/install-pytorch-jetson-platform/index.html**](https://docs.nvidia.com/deeplearning/frameworks/install-pytorch-jetson-platform/index.html)

但是这个网址没看懂,里面说安装特定版本直接修改网址里面的jetpack和pytorch的版本就好,不知道改成什么样。大G老师在这里就开始乱说了,给的网址全部无法访问,全部404。

尝试3(解决)

论坛里面翻到的。 原因就是大G老师说的,然后找到了专门针对jetpack6和cuda126的torch,在连接3.然后下载下来。 但是还有问题,说找不到cudss.so.0了。 然后在论坛里面翻到的解决方法: 手动安装一下,安装教程和链接在这个 cudss