Docker GPU 설정
💡 개발환경
AWS EC2 / ubuntu 22.04 / 16GB / 500GB / g4dn.xlarge (nvidia t4, 16GB)
[00.] 기존 설치되어 있는 Docker 제거
sudo apt-get remove docker docker-engine docker.io containerd runc
sudo rm -rf /var/lib/docker
sudo apt-get autoclean
sudo apt-get update
[01.] NVIDIA Driver 설치
[01.01.] 설치할 드라이버 버전 확인
sudo apt-get install ubuntu-drivers-common
ubuntu-drivers devices
[01.02.] 드라이버 설치
sudo apt -y install nvidia-driver-535
## 또는 밑의 명령어로 적절한 버전을 자동 설치 가능
# sudo ubuntu-drivers autoinstall
[01.03.] 재부팅
sudo reboot now
[01.04.] 드라이버 작동 확인
nvidia-smi
[02.] Docker 설치
[02.01.] 패키지 설치
sudo apt-get update
sudo apt-get install \
ca-certificates \
curl \
gnupg \
lsb-release
[02.02.] GPG키 & 저장소 추가
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo gpg --dearmor -o /usr/share/keyrings/docker-archive-keyring.gpg
[02.03.] Docker 엔진 설치
sudo apt update
sudo apt install docker-ce docker-ce-cli containerd.io
[02.04.] 현재 사용자에 Docker 권한 부여
sudo usermod -aG docker ${USER}
[03.] nvidia-docker 설치
[03.01.] GPG키 & 저장소 추가
distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \
&& curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - \
&& curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
[03.02.] nvidia-docker 설치
sudo apt-get update
sudo apt-get install -y nvidia-docker2
[04.] Docker 재시작
sudo systemctl restart docker
[05.] GPU 작동 확인
docker run --rm --gpus all ubuntu:18.04 nvidia-smi
docker run -itd --ipc host --gpus all -p 8888:8888 -p 6006:6006 -v /:/workspace --restart always --name pytorch-gpu pytorch/pytorch