Skip to content

amp distributed pytorch

2020.07.14 07:37

WHRIA 조회 수:51

 

python -m torch.distributed.launch --nproc_per_node=4 main.py \
  --batch_size 60 \
  --num_workers 2 \
  --gpu_devices 0 1 2 3\
  --distributed \
  --log_freq 100


이 코드를 실행할 때는 다음 명령어를 사용해서 실행합니다. Torch.distributed.launch를 통해 main.py를 실행하는데 노드에서 4개의 프로세스가 돌아가도록 설정합니다. 각 프로세스는 GPU 하나에서 학습을 진행합니다. 만약 GPU가 2개라면 nproc_per_node를 2로 수정하면 됩니다. main.py에 batch_size와 num_worker를 설정하는데 각 GPU 마다의 batch_size와 worker 수를 의미합니다. batch size가 60이고 worker의 수가 2라면 전체적으로는 batch size가 240이며 worker의 수는 8입니다.

번호 제목 글쓴이 날짜 조회 수
1686 윈도우 raid ahci 전환 WHRIA 2019.12.26 37
1685 android / capture and crop [5] WHRIA 2020.05.10 37
1684 plum WHRIA 2020.04.03 38
1683 youtube WHRIA 2016.09.30 39
1682 lvm [2] WHRIA 2020.01.09 39
1681 회귀분석 종류 WHRIA 2020.04.14 39
1680 sql replication 성공 [1] WHRIA 2020.02.20 40
1679 서피스 3 질렀다. ㅎㅎ WHRIA 2015.12.15 41
1678 webapp [1] WHRIA 2020.05.10 41
1677 nvidia docker WHRIA 2020.01.15 42
1676 acquihire [1] WHRIA 2020.05.05 42
1675 onnx broswer WHRIA 2020.09.15 42
1674 multiple NIC ubuntu [6] WHRIA 2020.03.10 43
1673 raid 6 WHRIA 2020.07.23 43
1672 batch normalize WHRIA 2020.02.06 44

Powered by Xpress Engine / Designed by Sketchbook

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소