amp distributed pytorch
2020.07.14 07:37
python -m torch.distributed.launch --nproc_per_node=4 main.py \ | |
--batch_size 60 \ | |
--num_workers 2 \ | |
--gpu_devices 0 1 2 3\ | |
--distributed \ | |
--log_freq 100 |
이 코드를 실행할 때는 다음 명령어를 사용해서 실행합니다. Torch.distributed.launch를 통해 main.py를 실행하는데 노드에서 4개의 프로세스가 돌아가도록 설정합니다. 각 프로세스는 GPU 하나에서 학습을 진행합니다. 만약 GPU가 2개라면 nproc_per_node를 2로 수정하면 됩니다. main.py에 batch_size와 num_worker를 설정하는데 각 GPU 마다의 batch_size와 worker 수를 의미합니다. batch size가 60이고 worker의 수가 2라면 전체적으로는 batch size가 240이며 worker의 수는 8입니다.
번호 | 제목 | 글쓴이 | 날짜 | 조회 수 |
---|---|---|---|---|
1684 | 우분투 7.10 으로 업그레이드 | WHRIA | 2007.12.03 | 7753 |
1683 | VirtualBox | WHRIA | 2007.10.07 | 7751 |
1682 | 비상 [1] | WHRIA | 2007.11.12 | 7745 |
1681 | partimage 사용법 | WHRIA | 2011.04.25 | 7743 |
1680 | Pidgin | WHRIA | 2007.09.01 | 7732 |
1679 | 토미그린 (tomygreen) 해외 핸드폰 (nexus 4) 에 설치하기 | WHRIA | 2013.04.03 | 7726 |
1678 | 이랬으면 좋겠네. | WHRIA | 2012.07.15 | 7723 |
1677 | Interpretation of the Outputs of Deep Learning Model Trained with Skin Cancer Dataset [1] | WHRIA | 2018.06.02 | 7706 |
1676 | 추석 | WHRIA | 2007.09.25 | 7703 |
1675 | frame | WHRIA | 2008.12.11 | 7695 |
1674 | Minor update | WHRIA | 2007.08.09 | 7686 |
1673 | Face It. | WHRIA | 2007.08.09 | 7682 |
1672 | gomphoto 1.0.1 | WHRIA | 2013.01.10 | 7670 |
1671 | whria.net 복구 | WHRIA | 2012.12.09 | 7664 |
1670 | whria.net 홈페이지에 음악 삽입 | WHRIA | 2013.01.17 | 7618 |
https://medium.com/daangn/pytorch-multi-gpu-%ED%95%99%EC%8A%B5-%EC%A0%9C%EB%8C%80%EB%A1%9C-%ED%95%98%EA%B8%B0-27270617936b