当前最流行的机器学习框架有很多种,最流行的框架有是tensorflow和pytorch两种。因此这里记录了这两种框架的搭建。为了便于安装和删除,以及统一管理和互相隔离,作者选择了在conda虚拟环境中搭建两种框架的环境。
什么是acaconda的虚拟环境:
- 虚拟环境:每个环境之间是隔离的,都可以设定不同的python版本以及各种包,不和系统的冲突,可以随便切换,要删除也是整个一起清理。
- 可以简单理解为acaconda是一个环境管理工具,可以通过它创建多个相互隔离的、互不影响的、版本不同的python环境。
- conda: 一个anaconda的工具管理器,它的作用和pip类似,但是比pip更强大。pip能做的conda也能做。
6.1 tensorflow2.2-GPU
- 创建虚拟环境并激活该环境
# 创建一个python版本为3.7的环境,环境名称可以自定义
conda create -n your_env_name python=3.7
# 激活并进入该虚拟环境
conda activate your_env_name
- 安装CUDA10.1
conda install cudatoolkit=10.1
- 安装cudnn7.6
conda install cudnn=7.6.5
- 安装tensorflow-gpu
pip3 install tensorflow-gpu==2.2.0 -i https://pypi.douban.com/simple
- 测试conda环境。完成以上步骤后请关闭终端并重新进入该虚拟环境!在控制台输入
python3激活并进入Ipython:
import tensorflow as tf
version = tf.__version__
gpu_ok = tf.test.is_gpu_available()
print("tf version:",version,"\nuse GPU",gpu_ok)
# 输出True即为安装成功。
提供删除虚拟环境命令:
conda env remove --name your_env_name
6.2 pytorch-GPU
1. 创建虚拟环境
首先在uubuntu界面打开终端:输入以下命令来创建一个新的python环境
conda create -n your_env_name python=3.7
create:python虚拟环境的创建命令-n:指定创建虚拟环境的名称python=3.x:指定虚拟环境中python的版本,x可以为[6,7,……]- 安装过程中会有提示,输入
y或yes即可。
这里以pytorch_test作为虚拟python环境的名称,执行成功后终端的提示符前会增加一个(base)的标志,这说明当前正处在base虚拟环境下:
2. 安装
以下教程都是在新建的虚拟环境中执行,即通过以下命令激活我们刚刚创建的python虚拟环境。我们所下载和安装的各种包都会保存在该虚拟环境中,如果真的出现问题且无法修复,我们可以删除该python虚拟环境再次创建一个新的虚拟环境进行测试。
conda activate pytorch_test
- 当命令行开头变为(pytorch_test)……时,说明我们已经进入该虚拟环境了
2.1 安装cudatoolkit10.1
安装CUDA,CUDA是英伟达专门为GPU计算推出的计算平台
conda install cudatoolkit=10.1
2.2 安装cudnn7.6
安装cuDNN,cuDNN是英伟达为CUDA加速运算推出的加速库
conda install cudnn=7.6.5
2.3 安装pytorch-GPU
conda install pytorch==1.4.0 torchvision==0.5.0 cudatoolkit=10.1
3.测试
关闭终端,重新进入该环境,并输入python3进入python的交互模式:
import torch
print(torch.cuda.is_available())
-
输出True即为安装成功。
提供删除虚拟环境命令
提供删除虚拟环境命令: 使用
exit命令退出当前环境后,执行conda env remove --name your_env_name