amp distributed pytorch
2020.07.14 07:37
python -m torch.distributed.launch --nproc_per_node=4 main.py \ | |
--batch_size 60 \ | |
--num_workers 2 \ | |
--gpu_devices 0 1 2 3\ | |
--distributed \ | |
--log_freq 100 |
이 코드를 실행할 때는 다음 명령어를 사용해서 실행합니다. Torch.distributed.launch를 통해 main.py를 실행하는데 노드에서 4개의 프로세스가 돌아가도록 설정합니다. 각 프로세스는 GPU 하나에서 학습을 진행합니다. 만약 GPU가 2개라면 nproc_per_node를 2로 수정하면 됩니다. main.py에 batch_size와 num_worker를 설정하는데 각 GPU 마다의 batch_size와 worker 수를 의미합니다. batch size가 60이고 worker의 수가 2라면 전체적으로는 batch size가 240이며 worker의 수는 8입니다.
번호 | 제목 | 글쓴이 | 날짜 | 조회 수 |
---|---|---|---|---|
1759 | 이상한 사회현상들 | WHRIA | 2009.09.19 | 9026 |
1758 | gold | WHRIA | 2009.09.15 | 9015 |
1757 | 안녕하세염...저는.. | 그리니 | 2000.06.01 | 8978 |
1756 | 좋은 화장품 | WHRIA | 2012.07.11 | 8903 |
1755 | ASUS 1215N | WHRIA | 2011.01.19 | 8897 |
1754 | vs 2005 | WHRIA | 2008.02.22 | 8892 |
1753 | 과열된 증시 | WHRIA | 2009.09.19 | 8891 |
1752 | XP home 에서 동시 접속 늘리기 | WHRIA | 2012.08.25 | 8872 |
1751 | 곰녹음기 | WHRIA | 2013.01.22 | 8855 |
1750 | Nuvie Project | WHRIA | 2013.01.18 | 8829 |
1749 | 어 이상하다 | 한석근 | 2000.06.08 | 8828 |
1748 | Star excision [1] | WHRIA | 2007.08.14 | 8790 |
1747 | MSI U270 | WHRIA | 2011.04.27 | 8773 |
1746 | 남들이 괴로워할 때가 살 지점, 남들이 흥분할 때가 팔 시점 | WHRIA | 2009.09.14 | 8765 |
1745 | Visual Studio 에서 SVN 업로드를 위해 불필요한 파일 삭제 | WHRIA | 2013.01.13 | 8738 |
https://medium.com/daangn/pytorch-multi-gpu-%ED%95%99%EC%8A%B5-%EC%A0%9C%EB%8C%80%EB%A1%9C-%ED%95%98%EA%B8%B0-27270617936b