Skip to content

mixed precision training

2018.11.06 06:56

WHRIA 조회 수:1757

train (math) 는 FP16 으로 하고 storage 는 FP32 로 해서 BVLC Caffe 에서도 잘 동작하는듯.

정확도는 아직 더 test 해봐야한다. scale factor 는 100~1000 이 적당한듯.

 

NVCaffe 에서 trainval.prototxt 에 아래와 같이 추가 

default_forward_type: FLOAT16
default_backward_type: FLOAT16
default_forward_math: FLOAT
default_backward_math: FLOAT

global_grad_scale:100

번호 제목 글쓴이 날짜 조회 수
1686 ubuntu cuda nvidia-smi WHRIA 2020.08.29 850
1685 concat network [3] WHRIA 2020.08.27 147
1684 GPT2 [1] WHRIA 2020.08.03 250
1683 scopus [1] WHRIA 2020.08.02 344
1682 melafind WHRIA 2020.08.01 771
1681 nvidia dali [1] WHRIA 2020.08.01 265
1680 pytorch optimize WHRIA 2020.08.01 126
1679 startup , 미국 WHRIA 2020.07.30 134
1678 consort , stard WHRIA 2020.07.30 81
1677 model split [1] WHRIA 2020.07.30 142
1676 FTC [1] WHRIA 2020.07.28 238
1675 암호화 WHRIA 2020.07.26 1000
1674 raid 6 WHRIA 2020.07.23 43
1673 asyncio WHRIA 2020.07.23 286
1672 amp distributed pytorch [1] WHRIA 2020.07.14 51

Powered by Xpress Engine / Designed by Sketchbook

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소