amp distributed pytorch
2020.07.14 07:37
python -m torch.distributed.launch --nproc_per_node=4 main.py \ | |
--batch_size 60 \ | |
--num_workers 2 \ | |
--gpu_devices 0 1 2 3\ | |
--distributed \ | |
--log_freq 100 |
이 코드를 실행할 때는 다음 명령어를 사용해서 실행합니다. Torch.distributed.launch를 통해 main.py를 실행하는데 노드에서 4개의 프로세스가 돌아가도록 설정합니다. 각 프로세스는 GPU 하나에서 학습을 진행합니다. 만약 GPU가 2개라면 nproc_per_node를 2로 수정하면 됩니다. main.py에 batch_size와 num_worker를 설정하는데 각 GPU 마다의 batch_size와 worker 수를 의미합니다. batch size가 60이고 worker의 수가 2라면 전체적으로는 batch size가 240이며 worker의 수는 8입니다.
번호 | 제목 | 글쓴이 | 날짜 | 조회 수 |
---|---|---|---|---|
1669 | deskzoom | WHRIA | 2012.05.22 | 7617 |
1668 | Ambition vs Passion | WHRIA | 2007.08.08 | 7593 |
1667 | 우분투에서 NETBIOS 설정 | WHRIA | 2012.04.02 | 7540 |
1666 | 구글 넥서스(nexus) 4 주문하는법 | WHRIA | 2012.12.14 | 7525 |
1665 | 작전 [4] | WHRIA | 2009.06.23 | 7517 |
1664 | PhotoPhoto 프로젝트 시작 | WHRIA | 2012.12.09 | 7513 |
1663 | 학생 | WHRIA | 2007.09.09 | 7504 |
1662 | Power | WHRIA | 2007.08.29 | 7497 |
1661 | Boost lib 를 쓸까 MFC 를 쓸까 | WHRIA | 2012.12.10 | 7483 |
1660 | 열심히 일하기 | WHRIA | 2007.09.11 | 7475 |
1659 | MedicalPhoto 1.0.5 | WHRIA | 2008.05.25 | 7457 |
1658 | 의전원 비용 | WHRIA | 2013.01.15 | 7424 |
1657 | Now I cover it. | WHRIA | 2007.08.03 | 7416 |
1656 | gold bar | WHRIA | 2008.10.19 | 7409 |
1655 | Bot | WHRIA | 2008.12.12 | 7332 |
https://medium.com/daangn/pytorch-multi-gpu-%ED%95%99%EC%8A%B5-%EC%A0%9C%EB%8C%80%EB%A1%9C-%ED%95%98%EA%B8%B0-27270617936b