Linux安装Pytorch1.8GPU(CUDA11.1)的实现

时间：2021-05-22

先说下自己之前的环境（都是Linux系统，差别不大）：

Centos7.6
NVIDIA Driver Version 440.33.01（等会需要更新驱动）
CUDA10.1
Pytorch1.6/1.7

提示，如果想要保留之前的PyTorch1.6或1.7的环境，请不要卸载CUDA环境，可以通过Anaconda管理不同的环境，互不影响。但是需要注意你的NVIDIA驱动版本是否匹配。

在这里能够看到官方给的对应CUDA版本所需使用驱动版本。

通过上表可以发现，如果要使用CUDA11.1，那么需要将显卡的驱动更新至455.23或以上（Linux x86_64环境）。由于我之前的驱动版本是440.33.01，那么肯定不满足，所以需要更新下显卡的驱动。通过以下指令可以查看你电脑上的驱动版本：

nvidia-smi

如果你的驱动版本是满足的，那么可以直接跳到创建Pytorch1.8虚拟环境章节。

更新驱动

卸载旧驱动

我之前安装的是NVIDIA-440的版本，找到之前下载的安装程序，然后打开终端通过以下指令进行卸载：

sh ./NVIDIA-Linux-x86_64-440.33.01.run --uninstall

安装新驱动

1）下载驱动，直接去NVIDIA官网下载：https:///NVIDIA/nvidia-docker
这里以Centos7为例：

首先根据你的系统类型以及版本下载对应.repo文件到/etc/yum.repos.d

distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \ && curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.repo | sudo tee /etc/yum.repos.d/nvidia-docker.repo

清空yum的过期缓存数据(如果不是root用户需要加sudo)

yum clean expire-cache

安装NVIDIA Container Toolkit(如果不是root用户需要加sudo)

yum install -y nvidia-docker2

重启docker服务(如果不是root用户需要加sudo)

systemctl restart docker

3）通过docker启动pytorch1.8.0容器

docker run --gpus all --rm -it --ipc=host pytorch/pytorch:1.8.0-cuda11.1-cudnn8-runtime

4）进入容器后可以通过nvidia-smi看到所有的GPU设备信息

5）接着进入python环境简单测试下pytorch能否正常调用GPU（打印True为成功）

import torchtorch.cuda.is_available()

到此这篇关于Linux安装Pytorch1.8GPU(CUDA11.1)的实现的文章就介绍到这了,更多相关Linux安装Pytorch GPU 内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持！

Linux安装Pytorch1.8GPU(CUDA11.1)的实现

更新驱动

卸载旧驱动

相关文章

pytorch多GPU并行运算的实现

Win10+GPU版Pytorch1.1安装的安装步骤

Pytorch1.5.1版本安装的方法步骤

PyTorch两种安装方法

Pytorch释放显存占用方式