Skip to content

amp distributed pytorch

2020.07.14 07:37

WHRIA 조회 수:60

 

python -m torch.distributed.launch --nproc_per_node=4 main.py \
  --batch_size 60 \
  --num_workers 2 \
  --gpu_devices 0 1 2 3\
  --distributed \
  --log_freq 100


이 코드를 실행할 때는 다음 명령어를 사용해서 실행합니다. Torch.distributed.launch를 통해 main.py를 실행하는데 노드에서 4개의 프로세스가 돌아가도록 설정합니다. 각 프로세스는 GPU 하나에서 학습을 진행합니다. 만약 GPU가 2개라면 nproc_per_node를 2로 수정하면 됩니다. main.py에 batch_size와 num_worker를 설정하는데 각 GPU 마다의 batch_size와 worker 수를 의미합니다. batch size가 60이고 worker의 수가 2라면 전체적으로는 batch size가 240이며 worker의 수는 8입니다.

번호 제목 글쓴이 날짜 조회 수
1669 sql python WHRIA 2020.07.01 195
1668 modprobe WHRIA 2020.06.29 6439
1667 tab 구조 html WHRIA 2020.06.28 81
1666 imagenet classification SOTA WHRIA 2020.06.27 1426
1665 할일 WHRIA 2020.06.24 1518
1664 caffe hdf5 error WHRIA 2020.06.22 187
1663 resnest50 caffe WHRIA 2020.06.21 166
1662 reddit downloader WHRIA 2020.06.21 220
1661 바이두 WHRIA 2020.06.20 660
1660 regression model [6] WHRIA 2020.06.18 175
1659 MS bot framework [3] WHRIA 2020.06.13 111
1658 BERT WHRIA 2020.06.10 3271
1657 영어로 숫자 표현 WHRIA 2020.05.28 4461
1656 single file encrypt decrypt WHRIA 2020.05.17 1759
1655 encfs WHRIA 2020.05.17 35176

Powered by Xpress Engine / Designed by Sketchbook

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소