背景
由于组里面想要测试一个项目代码具体在jetson板子上的运行效率以及开销,让我一个小白学习一下jetson上怎么部署代码。花费4天,一共涉及jetson刷机,安装conda,pytorch。由于前面两项,有用的博客已经有很多了,就不多赘述。我这4天,3天花在这个pytorch的安装上了。所以记录一下,希望能帮到人。
Pytorch安装
首先,先明确一下我的配置。刷机之后,我的板子是jetpack6.2,cuda 12.6. 然后是几个比较有用的网址:
尝试1
首先,在第一个网址上面找到jetpack6.0对应的pytorch版本,创建完虚拟环境之后然后直接安装。 在执行import torch遇到报错
>>> import torch
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/home/jetson/.local/lib/python3.10/site-packages/torch/__init__.py", line 237, in <module>
from torch._C import * # noqa: F403
ImportError: libcudnn.so.8: cannot open shared object file: No such file or directory
在问问大G老师之后,发现是这个pytorch版本是在cudnn8.0编译的,但是jetpack6.2只有cudnn9,所以不对。 就是说,需要找jetpack6.2对应的pytorch版本,不知道为什么官网里面jetpack6给的pytorch版本也是不对的。 然后花了2天时间,尝试了各种ai提供的方法:创建软连接欺骗系统;下载cudnn8;运行docker;全部不行。
尝试2
后来发现,网页1里面第一行:
note: future PyTorch wheels for Jetson are available from:
[**https://docs.nvidia.com/deeplearning/frameworks/install-pytorch-jetson-platform/index.html**](https://docs.nvidia.com/deeplearning/frameworks/install-pytorch-jetson-platform/index.html)
但是这个网址没看懂,里面说安装特定版本直接修改网址里面的jetpack和pytorch的版本就好,不知道改成什么样。大G老师在这里就开始乱说了,给的网址全部无法访问,全部404。
尝试3(解决)
论坛里面翻到的。 原因就是大G老师说的,然后找到了专门针对jetpack6和cuda126的torch,在连接3.然后下载下来。 但是还有问题,说找不到cudss.so.0了。 然后在论坛里面翻到的解决方法: 手动安装一下,安装教程和链接在这个 cudss