amp distributed pytorch
2020.07.14 07:37
python -m torch.distributed.launch --nproc_per_node=4 main.py \ | |
--batch_size 60 \ | |
--num_workers 2 \ | |
--gpu_devices 0 1 2 3\ | |
--distributed \ | |
--log_freq 100 |
이 코드를 실행할 때는 다음 명령어를 사용해서 실행합니다. Torch.distributed.launch를 통해 main.py를 실행하는데 노드에서 4개의 프로세스가 돌아가도록 설정합니다. 각 프로세스는 GPU 하나에서 학습을 진행합니다. 만약 GPU가 2개라면 nproc_per_node를 2로 수정하면 됩니다. main.py에 batch_size와 num_worker를 설정하는데 각 GPU 마다의 batch_size와 worker 수를 의미합니다. batch size가 60이고 worker의 수가 2라면 전체적으로는 batch size가 240이며 worker의 수는 8입니다.
번호 | 제목 | 글쓴이 | 날짜 | 조회 수 |
---|---|---|---|---|
1684 | Re: 조직 게시판 주소(링크법) | Ryan | 2000.09.27 | 2685 |
1683 | 장문연습 따로 문장 파일로 올려 주세엽!! | ..... | 2000.09.27 | 2762 |
1682 | 장문연습에 글 따로 제 메일로 보내 주세엽~! | ..... | 2000.09.27 | 2660 |
1681 | 어쩌다가.. | 우혜진 | 2000.09.28 | 2511 |
1680 | 홈페이지 경연대회 끝났습니다. | 서울의대문화국 | 2000.10.03 | 3277 |
1679 | Re: 홈페이지 경연대회 끝났습니다. | 영광 | 2000.10.04 | 2904 |
1678 | 사랑한다는 것은 | 채영광 | 2000.10.04 | 2841 |
1677 | Re: 홈페이지 경연대회 끝났습니다. | 한승석 | 2000.10.04 | 2624 |
1676 | 야호~ | 한승석 | 2000.10.04 | 2866 |
1675 | 옷 승석 추카추카... | 석원 | 2000.10.04 | 2650 |
1674 | 승석이형 저에요... | 김중희 | 2000.10.05 | 2588 |
1673 | 병욱임다... | 병욱 | 2000.10.05 | 2607 |
1672 | 와... 좋겠어요 ^^ | ^^ | 2000.10.06 | 2328 |
1671 | 승석오빠 그룹원이요~ | 윤지완 | 2000.10.07 | 2325 |
1670 | Re: 홈페이지 경연대회 끝났습니다. | 채영광 | 2000.10.07 | 2576 |
https://medium.com/daangn/pytorch-multi-gpu-%ED%95%99%EC%8A%B5-%EC%A0%9C%EB%8C%80%EB%A1%9C-%ED%95%98%EA%B8%B0-27270617936b