手把手,从0搭建一台深度学习的机器【六】机器学习环境搭建

225 阅读3分钟

上一篇:手把手,从0搭建一台深度学习的机器【五】搭建Anaconda环境 - 掘金 (juejin.cn)

当前最流行的机器学习框架有很多种,最流行的框架有是tensorflow和pytorch两种。因此这里记录了这两种框架的搭建。为了便于安装和删除,以及统一管理和互相隔离,作者选择了在conda虚拟环境中搭建两种框架的环境。

什么是acaconda的虚拟环境:

  • 虚拟环境:每个环境之间是隔离的,都可以设定不同的python版本以及各种包,不和系统的冲突,可以随便切换,要删除也是整个一起清理。
  • 可以简单理解为acaconda是一个环境管理工具,可以通过它创建多个相互隔离的、互不影响的、版本不同的python环境。
  • conda: 一个anaconda的工具管理器,它的作用和pip类似,但是比pip更强大。pip能做的conda也能做。

6.1 tensorflow2.2-GPU

  1. 创建虚拟环境并激活该环境
# 创建一个python版本为3.7的环境,环境名称可以自定义
conda create -n your_env_name python=3.7
# 激活并进入该虚拟环境
conda activate your_env_name
  1. 安装CUDA10.1
conda install cudatoolkit=10.1 
  1. 安装cudnn7.6
conda install cudnn=7.6.5
  1. 安装tensorflow-gpu
pip3 install tensorflow-gpu==2.2.0 -i https://pypi.douban.com/simple
  1. 测试conda环境。完成以上步骤后请关闭终端并重新进入该虚拟环境!在控制台输入python3激活并进入Ipython:
import tensorflow as tf
version = tf.__version__
gpu_ok = tf.test.is_gpu_available()
print("tf version:",version,"\nuse GPU",gpu_ok)
# 输出True即为安装成功。

提供删除虚拟环境命令:

conda env remove --name your_env_name

6.2 pytorch-GPU

1. 创建虚拟环境

首先在uubuntu界面打开终端:输入以下命令来创建一个新的python环境

conda create -n your_env_name python=3.7
  • create:python虚拟环境的创建命令
  • -n:指定创建虚拟环境的名称
  • python=3.x:指定虚拟环境中python的版本,x可以为[6,7,……]
  • 安装过程中会有提示,输入yyes即可。

这里以pytorch_test作为虚拟python环境的名称,执行成功后终端的提示符前会增加一个(base)的标志,这说明当前正处在base虚拟环境下:

image-20220410164442193

2. 安装

以下教程都是在新建的虚拟环境中执行,即通过以下命令激活我们刚刚创建的python虚拟环境。我们所下载和安装的各种包都会保存在该虚拟环境中,如果真的出现问题且无法修复,我们可以删除该python虚拟环境再次创建一个新的虚拟环境进行测试。

conda activate pytorch_test
  • 当命令行开头变为(pytorch_test)……时,说明我们已经进入该虚拟环境了

2.1 安装cudatoolkit10.1

安装CUDA,CUDA是英伟达专门为GPU计算推出的计算平台

conda install cudatoolkit=10.1 

2.2 安装cudnn7.6

安装cuDNN,cuDNN是英伟达为CUDA加速运算推出的加速库

conda install cudnn=7.6.5

2.3 安装pytorch-GPU

conda install pytorch==1.4.0 torchvision==0.5.0 cudatoolkit=10.1

3.测试

关闭终端,重新进入该环境,并输入python3进入python的交互模式:

import torch
print(torch.cuda.is_available())
  • 输出True即为安装成功。

    image-20220410183208084

提供删除虚拟环境命令

提供删除虚拟环境命令: 使用exit命令退出当前环境后,执行conda env remove --name your_env_name