一、AI 大模型环境搭建

41 阅读5分钟

声明:我是引用的 付费文章,文章搬过来只是为了自己学习方便,不用每次输入验证口令。如果侵权,第一时间删除。 原文链接:gxlbvdk4ilp.feishu.cn/wiki/EhEBwf…

本文讨论了预打卡课程中动手搭建实践环境的相关内容,介绍了推荐的实践环境及AI环境搭建步骤。关键要点包括:​

  1. 推荐实践环境:操作系统为Linux、Win11-WSL2;实操环境为miniconda/jupyter/docker;cuda版本12.4及以上;PyTorch为2.5.1;Python 3.10及以上;大模型可选VLM-7B、qwen2.5-14B;算力无要求,两张3090*24G可本地化完整体验,也可用API供应商方案。​
  2. WSL环境安装:针对win11系统同学,可通过“wsl --install”命令自动完成启用WSL功能等操作;若无法运行,需手动执行启用WSL和虚拟机平台功能、设置WSL默认版本为2、安装Linux发行版(Ubuntu)等步骤。​
  3. 安装CUDA:系统自带英伟达最新驱动安装较方便,需先安装gcc、更新Ubuntu,根据显卡驱动版本选择对应CUDA版本安装,安装后重启系统并查看是否成功。​
  4. 安装miniconda:先创建文件夹,再下载安装文件,安装完成后删除安装包。​
  5. 安装python+pip:推荐使用Python3.10,依次执行更新Ubuntu、导入存储库等操作安装,再安装pip,若安装不成功可手动安装并升级版本。

环境要求:

  • 操作系统:Linux、Win11-WSL2
  • 实操环境:miniconda/jupyter/docker
  • cuda版本:12.4及以上
  • PyTorch:2.5.1
  • Python:3.10及以上
  • 大模型:VLM-7B、qwen2.5-14B(均使用本地高并发部署,按自己算力选择)
  • 算力要求:无要求,两张3090*24G(本地化完整体验)或API供应商(纯API方案)

AI环境搭建

建议第一次使用Linux系统的同学,win11+Ubuntu24桌面版双系统,系统交互逻辑的相似的,即使是没有用过Linux的朋友,都可以快速过度,安装时到官网,下载Ubuntu 24.04.1 LTS版本,安装时选择同步安装显卡驱动,因为已经安装了最新的驱动,所以你到手后直接安装cuda即可,是匹配的,下载链接:

ubuntu.com/download/de…

部分依赖库,只有Linux版本,如果你不打算用Linux系统,必须在WSL环境下才能跑完全程;

1.WSL环境

Linux系统的同学可跳过此步骤!

针对win11系统的同学,需要先安装WSL环境

WSL 允许你在 Windows 系统上运行一个原生的 Linux 环境,而无需使用虚拟机或双系统

1.1启用WSL功能

打开 PowerShell(以管理员身份运行),执行以下命令来启用 WSL 功能:

wsl --install

该命令会自动完成以下操作:

  • 启用 WSL 功能
  • 安装 WSL 2 内核更新
  • 设置默认的 WSL 版本为 2
  • 安装一个默认的 Linux 发行版(通常是 Ubuntu)

如果wsl --install无法运行,可以手动执行以下步骤:

1.在 PowerShell 中运行以下命令启用 WSL 和虚拟机平台功能

dism.exe /online /enable-feature /featurename:Microsoft-Windows-Subsystem-Linux /all /norestart
dism.exe /online /enable-feature /featurename:VirtualMachinePlatform /all /norestart

2.将 WSL 的默认版本设置为 2

wsl --set-default-version 2

3.安装 Linux 发行版(Ubuntu)

wsl --install -d Ubuntu

安装完成后,在开始菜单中找到并启动你安装的 Linux 发行版(Ubuntu)

第一次启动时,系统会提示你设置一个新的 UNIX 用户名和密码

登录后,你就可以使用 Linux 终端了

后续的环境安装都在WSL的环境上操作


Linux的同学直接从这一步开始!

2.安装CUDA

因为系统已经自带英伟达最新驱动,所以cuda安装就方便了,如果你没有选择安装驱动,处理比较麻烦,建议新手重新安装系统;

进入系统后,打开终端,执行以下命令安装cuda

2.1安装gcc

# 先看看gcc是否正常安装
gcc --version
# 没装的先安装gcc,或者版本太低,都可以通过这个安装
sudo apt install gcc

2.2更新Ubuntu

sudo apt update && sudo apt upgrade

2.3安装cuda

需要注意的是,要根据不同的显卡驱动版本来选择对应的CUDA版本!

查看当前驱动版本

nvidia-smi

如下:驱动版本为550.54.14,它支持的CUDA版本是12.3

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 550.54.14    Driver Version: 550.54.14    CUDA Version: 12.3     |
|-------------------------------+----------------------+----------------------+

然后再去官网找到对应的cuda版本(developer.nvidia.com/cuda-toolki…

这边我装的是12.4.0的版本

进去后选择好ubuntu后下面就会出现安装说明

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-ubuntu2204.pin
sudo mv cuda-ubuntu2204.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/12.4.0/local_installers/cuda-repo-ubuntu2204-12-4-local_12.4.0-550.54.14-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu2204-12-4-local_12.4.0-550.54.14-1_amd64.deb
sudo cp /var/cuda-repo-ubuntu2204-12-4-local/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cuda-toolkit-12-4

根据安装说明进行安装

2.4安装完后,重启系统

reboot

2.5查看是否安装成功

nvcc --version

3.安装miniconda

这是一个环境管理工具,每一个环境都是独立的,避免了不同环境的依赖冲突问题,学习AI必须要会的工具,如果你习惯其他环境管理工具, 可以用自己熟悉的,如果是刚开始学, 跟着我们来实操;

3.1创建文件夹

存放下载的安装文件

mkdir -p ~/miniconda3

3.2下载miniconda

wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh -O ~/miniconda3/miniconda.sh

3.3安装miniconda

需要一直点回车,看到输入yes/no时,输入yes,回车

bash ~/miniconda3/miniconda.sh -b -u -p ~/miniconda3

3.4删除安装包

rm ~/miniconda3/miniconda.sh

4.安装python+pip

一意推荐你使用Python3.10,便于后面AI环境的操作

4.1安装python3.10

在终端依次执行

# 更新Ubuntu
sudo apt update && sudo apt upgrade
# 导入包含最新稳定版本的 Python 存储库
sudo add-apt-repository ppa:deadsnakes/ppa -y
# 更新Ubuntu
sudo apt update
# 安装3.10
sudo apt install python3.10
# 查看是否成功
python3.10 --version
# 安装所有Python附加功能(可选)
sudo apt install python3.10-full

4.2安装pip

我们下载许多库和包,都需要用PIP下载,到手后,也必须安装的,打开终端:

# 直接安装
sudo apt install python3-pip

# 如果安装不成功,手动安装
# 手动下载
wget https://bootstrap.pypa.io/get-pip.py
# 手动安装
python3 get-pip.py

# 升级一下版本
python3 -m pip install --upgrade pip
# 查看是否安装成功
pip --version

这样整个的AI环境就搭建好啦