Skip to content

mixed precision training

2018.11.06 06:56

WHRIA 조회 수:1781

train (math) 는 FP16 으로 하고 storage 는 FP32 로 해서 BVLC Caffe 에서도 잘 동작하는듯.

정확도는 아직 더 test 해봐야한다. scale factor 는 100~1000 이 적당한듯.

 

NVCaffe 에서 trainval.prototxt 에 아래와 같이 추가 

default_forward_type: FLOAT16
default_backward_type: FLOAT16
default_forward_math: FLOAT
default_backward_math: FLOAT

global_grad_scale:100

번호 제목 글쓴이 날짜 조회 수
274 faster rcnn resnet 101 WHRIA 2018.09.09 176
273 pytorch optimize WHRIA 2020.08.01 175
272 concat network [3] WHRIA 2020.08.27 173
271 usb 3.1 + DP WHRIA 2020.01.07 172
270 역시 개원해서는 돈 버는 재미밖에 없다. WHRIA 2016.06.17 169
269 resnest50 caffe WHRIA 2020.06.21 169
268 pytorch pretrained WHRIA 2020.10.28 169
267 CORS WHRIA 2021.01.22 168
266 Transformer WHRIA 2020.10.09 166
265 file lock WHRIA 2020.09.22 165
264 pROC package [3] WHRIA 2019.05.11 163
263 fast rcnn cudnn 5.0 WHRIA 2017.01.08 161
262 yolo custom WHRIA 2019.07.25 159
261 SAS controller SAS 9212-4i WHRIA 2019.12.08 159
260 startup , 미국 WHRIA 2020.07.30 159

Powered by Xpress Engine / Designed by Sketchbook

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소