您的位置:

Nvidia-Docker安装指南

一、为什么需要Nvidia-Docker

Nvidia-Docker是用于GPU加速的Docker容器,可以在容器中使用Nvidia GPU来运行CUDA代码,这样就能够方便地部署和运行深度学习/机器学习任务。

使用Nvidia-Docker的好处如下:

1、避免配置环境带来的麻烦,例如:在安装系统依赖库和Nvidia CUDA driver时与容器中的软件包版本进行交互。

2、可重复性高。Docker可以让开发人员沙箱环境在不同的机器/虚拟机上具有相同的环境,便于代码调试和运行。

3、在不同的系统上可以方便地运行相同的脚本和代码。

二、Nvidia-Docker安装步骤

步骤1:检查系统环境

$ uname -m && cat /etc/*release

确认机器硬件架构(x86_64还是aarch64)和Linux发行版。 Nvidia Docker依赖于Docker Engine1.12或更高版本。如果没有安装Docker Engine,请先按照官方文档安装。

步骤2:下载nvidia-docker软件包

$ curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -

添加GPG密钥到APT存储库。

$ distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
$ curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | \
  sudo tee /etc/apt/sources.list.d/nvidia-docker.list

添加nvidia-docker到存储库。

$ sudo apt-get update && sudo apt-get install -y nvidia-docker2

更新存储库并安装nvidia-docker2软件包。

$ sudo systemctl restart docker

重启Docker服务以使更改生效。

步骤3:测试Nvidia-Docker是否已正确安装

$ docker run --gpus all nvidia/cuda:10.0-base nvidia-smi

Nvidia-Docker启动一个 Nvidia GPU 支持的容器,输出nvidia-smi的运行结果。如果Nvidia GPU驱动程序启动,您将看到GPU列表。如果未看到GPU列表,请检查系统和Nvidia驱动程序设置。Nvidia-Docker的命令必须在具有GPU的主机上运行。

三、如何在Docker容器中使用GPU

使用Nvidia-Docker运行的容器可以自动检测Nvidia GPUs,并在容器内部映射Nvidia GPU装置文件。

使用Nvida GPU运行CUDA程序的关键是将GPU装置文件映射到容器内部。为此,首先需要在容器的启动时添加--gpus选项和显卡数量。

$ docker run --gpus all nvidia/cuda:10.2-base nvidia-smi

这个命令可以启动一个Docker容器,并在容器内运行nvida-smi工具,以验证容器内是否完成了GPU的映射工作。

小结

这篇文章介绍了如何安装nvidia-docker,并如何在Docker容器内部使用Nvidia-GPU。Nvidia-Docker通过Docker容器在Nvidia GPU上运行计算任务,具有便于部署、可重复性高、在不同的系统上可方便地运行相同的环境等优点。作为一名全能编程开发工程师,熟练掌握和应用Nvidia-Docker这一实用工具无疑是非常有必要的。