Skip to content

검색
로그인

로그인

아이디 비밀번호

로그인 유지

회원가입 | ID/PW 찾기 | 인증메일 재발송
가입하기
한국어

Whria World

Home

▲ ▼

mixed precision training

2018.11.06 06:56

WHRIA 조회 수:1778

train (math) 는 FP16 으로 하고 storage 는 FP32 로 해서 BVLC Caffe 에서도 잘 동작하는듯.

정확도는 아직 더 test 해봐야한다. scale factor 는 100~1000 이 적당한듯.

NVCaffe 에서 trainval.prototxt 에 아래와 같이 추가

default_forward_type: FLOAT16
default_backward_type: FLOAT16
default_forward_math: FLOAT
default_backward_math: FLOAT

global_grad_scale:100

이 게시물을

목록

댓글 1

WHRIA

2018.12.02 07:40

MIXED 셋팅

default_forward_type: FLOAT16
default_backward_type: FLOAT16
default_forward_math: FLOAT
default_backward_math: FLOAT

FP32

default_forward_type: FLOAT
default_backward_type: FLOAT
default_forward_math: FLOAT
default_backward_math: FLOAT

FP16

default_forward_type: FLOAT16
default_backward_type: FLOAT16
default_forward_math: FLOAT16
default_backward_math: FLOAT16

CUDA 8.0 으로 하면 속도 향상이 없다.

CUDA10.0 기준, cudnn 7.4.1, ResNeXt-50 , 100 iter

FP32 - 82 sec, 4779

FP16 - 69 sec+ test 오래걸림 , 2623

Mixed - store 16bit - 69 sec, 2623

Mixed - store 32bit - 69 sec, 2769

solver_data_type: FLOAT16 가 16bit 인 경우 memory 를 약간 더 잡아먹는다.

Mixed train 하는 경우

pascal 에서 속도가 30% 향상있고 메모리는 50% 감소한다.

댓글

번호	제목	글쓴이	날짜	조회 수
1564	거품이 끼었다.	WHRIA	2007.07.31	5254
1563	와우~	하은이	2007.06.23	5249
1562	Shizuoka	WHRIA	2007.06.27	5209
1561	802.11ac 규격	WHRIA	2013.02.15	5112
1560	환상이군~	최혜진	2000.06.10	5062
1559	Re: 조그만 구체적으로 뭐가 문제인지 설명해주세요.	하이...	2000.06.11	5034
1558	슬럼프	WHRIA	2007.06.19	5022
1557	문 힌지 수리	WHRIA	2015.10.28	5013
1556	Add a background music	WHRIA	2007.08.18	5001
1555	사업	WHRIA	2007.06.20	4968
1554	조그만 구체적으로 뭐가 문제인지 설명해주세요.	한승석	2000.06.11	4966
1553	어라...이쁘게 만들었다..	주혁	2000.06.11	4935
1552	GPL 프로그램으로 이행	WHRIA	2007.07.19	4925
1551	www.code.org	WHRIA	2013.02.28	4908
1550	야망	WHRIA	2007.07.24	4880

첫 페이지 13 14 15 16 17 18 19 20 21 22 끝 페이지

태그

Powered by Xpress Engine / Designed by Sketchbook

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내

이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.