Docker GPU 설정

💡 개발환경
AWS EC2 / ubuntu 22.04 / 16GB / 500GB / g4dn.xlarge (nvidia t4, 16GB)

[00.] 기존 설치되어 있는 Docker 제거

sudo apt-get remove docker docker-engine docker.io containerd runc
sudo rm -rf /var/lib/docker
sudo apt-get autoclean
sudo apt-get update

[01.] NVIDIA Driver 설치

[01.01.] 설치할 드라이버 버전 확인

sudo apt-get install ubuntu-drivers-common

ubuntu-drivers devices

Untitled

[01.02.] 드라이버 설치

sudo apt -y install nvidia-driver-535

## 또는 밑의 명령어로 적절한 버전을 자동 설치 가능
# sudo ubuntu-drivers autoinstall

[01.03.] 재부팅

sudo reboot now

[01.04.] 드라이버 작동 확인

nvidia-smi

Untitled

[02.] Docker 설치

[02.01.] 패키지 설치

sudo apt-get update

sudo apt-get install \
    ca-certificates \
    curl \
    gnupg \
    lsb-release

[02.02.] GPG키 & 저장소 추가

curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo gpg --dearmor -o /usr/share/keyrings/docker-archive-keyring.gpg

[02.03.] Docker 엔진 설치

sudo apt update

sudo apt install docker-ce docker-ce-cli containerd.io

[02.04.] 현재 사용자에 Docker 권한 부여

sudo usermod -aG docker ${USER}

[03.] nvidia-docker 설치

[03.01.] GPG키 & 저장소 추가

distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \
   && curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - \
   && curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list

[03.02.] nvidia-docker 설치

sudo apt-get update

sudo apt-get install -y nvidia-docker2

[04.] Docker 재시작

sudo systemctl restart docker

[05.] GPU 작동 확인

docker run --rm --gpus all ubuntu:18.04 nvidia-smi

Untitled

docker run -itd --ipc host --gpus all -p 8888:8888 -p 6006:6006 -v /:/workspace --restart always --name pytorch-gpu pytorch/pytorch

Untitled