amp distributed pytorch
2020.07.14 07:37
python -m torch.distributed.launch --nproc_per_node=4 main.py \ | |
--batch_size 60 \ | |
--num_workers 2 \ | |
--gpu_devices 0 1 2 3\ | |
--distributed \ | |
--log_freq 100 |
이 코드를 실행할 때는 다음 명령어를 사용해서 실행합니다. Torch.distributed.launch를 통해 main.py를 실행하는데 노드에서 4개의 프로세스가 돌아가도록 설정합니다. 각 프로세스는 GPU 하나에서 학습을 진행합니다. 만약 GPU가 2개라면 nproc_per_node를 2로 수정하면 됩니다. main.py에 batch_size와 num_worker를 설정하는데 각 GPU 마다의 batch_size와 worker 수를 의미합니다. batch size가 60이고 worker의 수가 2라면 전체적으로는 batch size가 240이며 worker의 수는 8입니다.
번호 | 제목 | 글쓴이 | 날짜 | 조회 수 |
---|---|---|---|---|
1759 | 승석아 광주 못와? | 채영광 | 2000.08.08 | 3890 |
1758 | 승석아....아래 저 아가씨는 누구냐? | 윤재원 | 2000.08.09 | 3712 |
1757 | 승석아 | 재호 | 2000.08.14 | 4030 |
1756 | 승석아-2 | 재호 | 2000.08.14 | 3738 |
1755 | 멋진 걸~ | 희진 | 2000.08.15 | 3432 |
1754 | Re: 멋진 걸~ | 한승석 | 2000.08.15 | 3578 |
1753 | 재미있는 핸드폰 문자 모음.(뜨는데 오래걸림) | 한승석 | 2000.08.15 | 4095 |
1752 | Re: 승석아....아래 저 아가씨는 누구냐? | 한승석 | 2000.08.15 | 3129 |
1751 | 한! 내 개장 홈을 링크해줘! | 채영광 | 2000.08.18 | 3959 |
1750 | 현재 홈페이지에 문제가 있습니다. | 한승석 | 2000.08.19 | 3617 |
1749 | 에구구~~ | ho~ho~~~ | 2000.08.20 | 3317 |
1748 | 하이~ 승석!! | 박중성 | 2000.08.20 | 3632 |
1747 | 한승석군 | 최평균 | 2000.08.21 | 4406 |
1746 | **^.^** 참 잘했어요 | 세레스 | 2000.08.21 | 3643 |
1745 | 엉 잘보구간다 | 김국현 | 2000.08.22 | 3425 |
https://medium.com/daangn/pytorch-multi-gpu-%ED%95%99%EC%8A%B5-%EC%A0%9C%EB%8C%80%EB%A1%9C-%ED%95%98%EA%B8%B0-27270617936b