머신러닝(Tensorflow) 사용기 5 ( Deep MNIST for Experts)

네트웍 more

검색 목록

쓰기

머신러닝(Tensorflow) 사용기 5 ( Deep MNIST for Experts)

백만스물하나

2016-08

2016-08-19 15:03:52

조회 23285 추천 6

안녕Ȣ16;세요

머신러닝 사용기 마1648;ኔ1; 강1340; 1077;니다.

1060;번 강1340;ǉ16; http://hunkim.github.io/ml/ 1032; 강1340;를 보고 1652;행 Ȣ16;였습니다.

소스코드ǉ16; http://pythonkim.tistory.com/notice/251032; 1088;료에 도움1012; 0155;았습니다.

1648;Ǆ12; 번에ǉ16; 머신러닝1012; 통해 90% 1032; 1064;식률1012; 보였습니다.

간단한 코드/196; Ȣ17;습1060; 가능Ȣ16;다ǉ16; ,163;1012; 보여1456; 예1228;였ǉ16;데요

Ȣ17;습 모델1012; 그/140;보면 아래와 같습니다.

X(1060;0120;1648; 픽셀 1221;보)를 1077;/141; 0155;아서 1060;에 해Ǌ17;Ȣ16;ǉ16; Weight(W)와 Bias(B)를 Ȣ17;습 Ȣ16;ǉ16; ,163;1060;1648;요

우리가 Ȣ17;습했ǋ12; 모델1008; 1060;,163;과 ᇼ1;1068;Ȣ16;1648;만 차1060;가 1080;다면

X1032; 개수가 28X28 = 784 였고, Y1032; 개수가 10 1060;었ǋ12; ,163; 1077;니다.

우리가 Ȣ17;습시Ȗ16; 파라메터1032; 숫1088;ǉ16; W 7840개, B 10개 해서 7850개 1077;니다.

속1012; 1096; 들여다 보면 결국 선형 회귀 0169;법1032; 1025;용1060;고 Ȣ17;습 층1060; 1층에 불과합니다.

오늘1008; 1060; 층1012; 쌓아서 성능1060; 개선.104;ǉ16; ,163;1012; 살6196;보,192;습니다.

사실 층1012; 쌓,172; .108; 1060;유와 층1012; 쌓아서 0156;생한 문1228;1216;, 그리고 해결0169;법들에 대한 1060;야기 들1060; 1080;1648;만 

오늘1008; ,148;너뛰고 단순7176; 층1012; 쌓고 Ȣ17;습1012; 시켜보,192;습니다.

오늘 Ȣ17;습시킬 모델1032; 모습1008; 아래와 같습니다.

보시ǉ16; ,163;처/100; 여러 층1004;/196; 0156;1204; 했습니다.

1473;간에 RELUǉ16; Activation function 1004;/196; 1077;/141;1012; 0155;아 1060;를 활성화 할1648; 여ǥ12;를 결1221;Ȣ16;ǉ16; 함수 1077;니다.

수Ȣ17;1201;1004;/196;ǉ16; 아래와 같1008; 행/148; 연산1060; .121;니다.

층1032; 개수와 크기ǉ16; 원Ȣ16;ǉ16; 대/196; 생성 할 수가 1080;습니다.

단 행/148; 곱1012; 해야 Ȣ16;,172; ǐ12;문에 앞1032; 층1032; 출/141;과 뒤1032; 층1032; 1077;/141;1060; 같1008; 개수를 가1256;야 합니다.

1060;번 예1228;에서ǉ16; 1077;/141;1060; (784,256) ->(256,256)->(256,10) 1064; Ȣ17;습 층1004;/196; 해 보,192;습니다. (1077;/141;,출/141;)

1060;를 코드/196; 구현해 보면 아래와 같습니다.

import tensorflow as tf

from tensorflow.examples.tutorials.mnist import input_data

mnist = input_data.read_data_sets("/tmp/data/", one_hot=True)

learning_rate = 0.001

training_epochs = 15

batch_size = 100

display_step = 1

X = tf.placeholder(tf.float32, [None, 784]) # mnist data image of shape 28*28=784

Y = tf.placeholder(tf.float32, [None, 10])  # 0-9 digits recognition => 10 classes

W1 = tf.Variable(tf.random_normal([784, 256]))

W2 = tf.Variable(tf.random_normal([256, 256]))

W3 = tf.Variable(tf.random_normal([256,  10]))

B1 = tf.Variable(tf.random_normal([256]))

B2 = tf.Variable(tf.random_normal([256]))

B3 = tf.Variable(tf.random_normal([ 10]))

L1 = tf.nn.relu(tf.add(tf.matmul(X, W1), B1))

L2 = tf.nn.relu(tf.add(tf.matmul(L1, W2), B2))      # Hidden layer with ReLU activation

hypothesis = tf.add(tf.matmul(L2, W3), B3)  # No need to use softmax here

cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(hypothesis, Y))   # softmax loss

optimizer = tf.train.AdamOptimizer(learning_rate=learning_rate).minimize(cost)

init = tf.initialize_all_variables()

with tf.Session() as sess:

           sess.run(init)

           for epoch in range(training_epochs):

                     avg_cost = 0.

                     total_batch = int(mnist.train.num_examples/batch_size)

                     for i in range(total_batch):

                                batch_xs, batch_ys = mnist.train.next_batch(batch_size)

                                _, c = sess.run([optimizer, cost], feed_dict={X: batch_xs, Y: batch_ys})

                                avg_cost += c / total_batch

                     if (epoch+1) % display_step == 0:

                    print("Epoch:", '%04d' % (epoch+1), "cost=", "{:.9f}".format(avg_cost))

           print("Optimization Finished!")     

           correct_prediction = tf.equal(tf.argmax(hypothesis, 1), tf.argmax(Y, 1))

           accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

           print("Accuracy:", accuracy.eval({X: mnist.test.images, Y: mnist.test.labels}))

결과ǉ16; 아래와 같습니다.

94.5%1032; 1064;식률/196; 1060;1204;보다 3%1221;도 가량 향상.108; 결과를 보1077;니다.

코드를 살6196;보,192;습니다.

1077;/141;1004;/196; 들Ǻ12;오ǉ16; 28X281032; 공간과 출/141;1004;/196; 나가ǉ16; 10개1032; 공간1012; 1221;1032; 합니다.

X = tf.placeholder(tf.float32, [None, 784]) # mnist data image of shape 28*28=784

Y = tf.placeholder(tf.float32, [None, 10])  # 0-9 digits recognition => 10 classes

Ȣ17;습할 Weight를 선Ǻ16;합니다. Weight1032; 숫1088;ǉ16; 각 층에 들Ǻ12;오ǉ16; 1077;/141;1032; 숫1088; X 출/141;1032; 숫1088;가 .121;니다.

W1 = tf.Variable(tf.random_normal([784, 256]))

W2 = tf.Variable(tf.random_normal([256, 256]))

W3 = tf.Variable(tf.random_normal([256,  10]))

Ȣ17;습할 Bias를 선Ǻ16;합니다. Weight1032; 숫1088;ǉ16; 각 층에서 나가ǉ16; 출/141;1032; 숫1088;1077;니다.

B1 = tf.Variable(tf.random_normal([256]))

B2 = tf.Variable(tf.random_normal([256]))

B3 = tf.Variable(tf.random_normal([ 10]))

각 층간1032; 관계를 1221;1032; 합니다.

L1 = X*W1+B1, L2= L1*W2+B2, hypothesis = L2*W3 +B3 1004;/196; 1221;1032; .121;니다.

L1 = tf.nn.relu(tf.add(tf.matmul(X, W1), B1))

L2 = tf.nn.relu(tf.add(tf.matmul(L1, W2), B2))      # Hidden layer with ReLU activation

hypothesis = tf.add(tf.matmul(L2, W3), B3)  # No need to use softmax here

Ȣ17;습1008; 코스트 값1012; 1221;1032;Ȣ16;고 1060; 코스트 값1060; 1460;Ǻ12;드ǉ16; 1901;1004;/196; W,B를 변ᅆ1;시켜 나가ǉ16; 과1221;1077;니다.

1060;1204;에ǉ16; Gradient Descendent 알고리1608;1012; 사용했었ǉ16;데 1060;번에ǉ16; AdamOptimizer를 사용했습니다. 0169;법1008; 다르1648;만 Ȣ16;ǉ16; 1068;1008; ᇼ1;1068;합니다. 코스트가 감소Ȣ16;ǉ16; 0169;향1004;/196; W,B를 1312;1221;해 1452;ǉ16; ,163; 1077;니다.

셋ᔚ1;1012; 마치고 모든 변수값1012; 초기화 합니다.

cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(hypothesis, Y))   # softmax loss

optimizer = tf.train.AdamOptimizer(learning_rate=learning_rate).minimize(cost)

init = tf.initialize_all_variables()

데1060;터1032; 크기가 크므/196; 데1060;터를 나누Ǻ12; 1652;행합니다.

데1060;터를 100개/196; 나누Ǻ12;서 1%1032; 데1060;터를 가1648;고 Ȣ17;습1012; 시Ȗ12;ǉ16; ,163;1012; 15번(training_epochs) 1652;행합니다. 위에서 설1221;한 AdamOptimizer가 0152;복1201;1004;/196; 실행.104;면서 Ȣ17;습1060; 1652;행.121;니다.

with tf.Session() as sess:

           sess.run(init)

           for epoch in range(training_epochs):

                     avg_cost = 0.

                     total_batch = int(mnist.train.num_examples/batch_size)

                     for i in range(total_batch):

                                batch_xs, batch_ys = mnist.train.next_batch(batch_size)

                                _, c = sess.run([optimizer, cost], feed_dict={X: batch_xs, Y: batch_ys})

                                avg_cost += c / total_batch

                     if (epoch+1) % display_step == 0:

                    print("Epoch:", '%04d' % (epoch+1), "cost=", "{:.9f}".format(avg_cost))

           print("Optimization Finished!")     

맞1008; 케1060;스를 세서 1221;확도를 계산합니다.

           correct_prediction = tf.equal(tf.argmax(hypothesis, 1), tf.argmax(Y, 1))

           accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

           print("Accuracy:", accuracy.eval({X: mnist.test.images, Y: mnist.test.labels}))

1060;/111;,172; Ȣ17;습 층1012; 쌓아서 1221;확도를 향상 시킬 수 1080;습니다.

7124;7176; 우리가 Deep learning1060;라고 불리ǉ16; ,163;1060; 1060; 0169;법1077;니다.

여기서 초기값 설1221;과 Drop out 1012; 설1221;Ȣ16;면 97% 1221;도 까1648; 1064;식률1060; 향상.104;며 

Convolution Neural network 를 1201;용Ȣ16;면 98~99% 1032; 1064;식률1060; 나Ꮢ1;니다.

각 층1032; 연결에 따라서 여러가1648; 0169;법들1060; 1080;1004;며

아1649;도 계속해서 새/196;운 0169;법들1060; 연구 .104;고 1080;습니다.

1452;마간산처/100; deep Learning1012; 살6196; 보았네요

개1064;1201;1004;/196;ǉ16; 시1089;할 ǐ12;ǉ16; 1096; 몰랐1648;만 1312;금 살6196;보고 나니 Machine Learning1060; 그/111;,172; Ǻ12;/157;1648; 않다ǉ16; ,163;1012; 알 수 1080;었습니다.

우리가 1060;러한 알고리1608;1012; 1649;1217; 향상시Ȗ12;ǉ16; ,163;1008; 쉽1648; 않,192;1648;만 1060;/111;,172; 

1096; 만들Ǻ12;1256; 1080;ǉ16; Ț12;1012; 가1648;고 우리 생활에 1201;용Ȣ16;면 1339;1008; 결과가 1080;1012; ,163;1060;라 생각합니다.

감사합니다.



elkiselee 2016-08 왜 이런걸 보고있으면 심장이 뛸까요 ㅋㅋ 전공 바꾸라는 말인가요 왜 이런걸 보고있으면 심장이 뛸까요 ㅋㅋ 전공 바꾸라는 말인가요



nshhsn 2016-08 진짜 이거 너무 재미있어요 진짜 이거 너무 재미있어요



하셀호프 2016-08 정말 훌륭하십니다. 점점 어려워지는 것 같습니다. 실질적으로 응용하시는 작업도 잘 진행되는 것으로 생각됩니다. 목표에 접근하시는 것 같습니다. 화이팅입니다. 정말 훌륭하십니다. 점점 어려워지는 것 같습니다. 실질적으로 응용하시는 작업도 잘 진행되는 것으로 생각됩니다. 목표에 접근하시는 것 같습니다. 화이팅입니다.



nshhsn 2016-08 감사합니다 :) 응원해 주셔서 점점 나아지고 있어요 감사합니다 :) 응원해 주셔서 점점 나아지고 있어요



stones 2016-08 감사합니다.. 이해는 다 못하지만.. 관심있고 배우고 싶었는데... 혹 시즌2는 없나요? 요런거 좀더 응용하는...ㅎㅎ 감사합니다.. 이해는 다 못하지만.. 관심있고 배우고 싶었는데... 혹 시즌2는 없나요? 요런거 좀더 응용하는...ㅎㅎ



nshhsn 2016-08 시즌 2는 없을것 같아요 저도 배우고 있는 중이어서요 :) 만들고 싶은게 있으신가요? 시즌 2는 없을것 같아요 저도 배우고 있는 중이어서요 :) 만들고 싶은게 있으신가요?



stones 2016-08 나에게 최적화된... 날씨 예측 시스템은 어떨런지요? 내 행동반경, 움직이는 시간등을 예측해서... 조언을 해주는... 개인 기상청이라고나 할까요..ㅎㅎ 나에게 최적화된... 날씨 예측 시스템은 어떨런지요? 내 행동반경, 움직이는 시간등을 예측해서... 조언을 해주는... 개인 기상청이라고나 할까요..ㅎㅎ



nshhsn 2016-08 그런 응용도 가능하겠군요 개인의 위치 정보를 가지고 있다면 만드어 볼 수 있겠네요 어디서 들은건데 데이터를 충분히 모으면 특정시간의 사람의 위치를 90%정도 예측 가능하다고 하더라구요 그런 응용도 가능하겠군요 개인의 위치 정보를 가지고 있다면 만드어 볼 수 있겠네요 어디서 들은건데 데이터를 충분히 모으면 특정시간의 사람의 위치를 90%정도 예측 가능하다고 하더라구요



stones 2016-09 로또처럼 기존 1등 데이터로 추론 예측도 가능할까요? 입력값이 랜덤이라 안될것도 같은데... 혹 인간의 직관이 간과 할 수 있는 부분을(알파고 처럼..) 학습을 통해 발견할 수도?? ㅎㅎ 로또처럼 기존 1등 데이터로 추론 예측도 가능할까요? 입력값이 랜덤이라 안될것도 같은데... 혹 인간의 직관이 간과 할 수 있는 부분을(알파고 처럼..) 학습을 통해 발견할 수도?? ㅎㅎ



PAMA머리 2016-10 1등 데이터 추론은 힘들 것으로 보입니다. 딥러닝은 패턴을 발견하고 학습하는 기법이기 때문이죠. 만약 로또 1등 예측을 한다면 ... 저도 바로 ... 1등 데이터 추론은 힘들 것으로 보입니다. 딥러닝은 패턴을 발견하고 학습하는 기법이기 때문이죠. 만약 로또 1등 예측을 한다면 ... 저도 바로 ...



이방인 2016-08 재미있게 잘 봤습니다. 재미있게 잘 봤습니다.



nshhsn 2016-09 감사합니다. 감사합니다.



falcon 2016-09 요즘 보안분야에서도 ML기술을 적용한 제품들이 나오고 있어서 기대를 하고 있습니다. 좋은글 잘 읽었습니다. ^^ 요즘 보안분야에서도 ML기술을 적용한 제품들이 나오고 있어서 기대를 하고 있습니다. 좋은글 잘 읽었습니다. ^^



토이박스 2016-10 정말 멋진 강의 잘들었습니다! 정말 멋진 강의 잘들었습니다!

로그인 하시면 댓글을 남길 수 있습니다

검색 목록

쓰기

강좌게시판

쓰기

1/26

번호	제목Page 1/26	글쓴이	날짜	조회	추천
506	EFI 파티션 만드는 방법 (7)	nightly	2015-07	17772	10
EFI 파티션 만드는 방법 (7) 2015-07 17772 1 nightly
505	WDS 구성 - 기본편 (2)	stone92김경민	2016-10	14811	5
WDS 구성 - 기본편 (2) 2016-10 14811 1 stone92김경민
504	visual studio code에서 php 경로 지정하기	회원K	2019-01	10698	0
visual studio code에서 php 경로 지정하기 2019-01 10698 1 회원K
503	하드,SSD 병목의 방안 Intel VROC 과 VMD 에 대하여 (SSD M.2 RAID Volume and Boota… (4)	제온프로	2019-06	18948	0
하드,SSD 병목의 방안 Intel VROC 과 VMD … (4) 2019-06 18948 1 제온프로
502	캠핑을 가자! (8) - 캠핑 입문자를 위한 몇 가지 안내 (3)	김준연	2020-02	6462	1
캠핑을 가자! (8) - 캠핑 입문자를 위한 … (3) 2020-02 6462 1 김준연
501	헤놀에서 NVME를 인식 방법 (8)	프로시아	2020-07	10832	2
헤놀에서 NVME를 인식 방법 (8) 2020-07 10832 1 프로시아
500	AMD EPYC™ 7003 Series CPUs support cTDP (1)	박문형	2021-03	12752	0
AMD EPYC™ 7003 Series CPUs support cTDP (1) 2021-03 12752 1 박문형
499	Ubuntu 20.04 OpenSSL을 이용한 사설 인증서 생성 및 Apache 적용	딥러닝서버	2021-07	11843	0
Ubuntu 20.04 OpenSSL을 이용한 사설 인증… 2021-07 11843 1 딥러닝서버
498	Ubuntu 18.04 s-tui 및 stress 툴 설치	딥러닝서버	2021-12	6255	0
Ubuntu 18.04 s-tui 및 stress 툴 설치 2021-12 6255 1 딥러닝서버
497	윈도우 서버에서 인텔 내장랜(I219-V) 드라이버 설치 (2)	딥러닝서버	2022-05	30556	0
윈도우 서버에서 인텔 내장랜(I219-V) 드… (2) 2022-05 30556 1 딥러닝서버
496	장터발 갤럭시노트 10.1 2014 edition (SM-P605S) 안드로이드6 마시멜로 업하기 (23)	ocarina	2022-11	46165	4
장터발 갤럭시노트 10.1 2014 edition (SM… (23) 2022-11 46165 1 ocarina
495	vncserver를 이용하여 Centos7.9 GUI 서버 원격 접속 하는 방법 입니다. (1)	딥러닝서버	2023-07	54171	0
vncserver를 이용하여 Centos7.9 GUI 서버… (1) 2023-07 54171 1 딥러닝서버
494	Ubuntu 22.04 에서 Rsync를 이용한 원격 백업하는 방법	딥러닝서버	2023-12	6508	0
Ubuntu 22.04 에서 Rsync를 이용한 원격 … 2023-12 6508 1 딥러닝서버
493	아톰플랫폼의홈서버 (7)	the촌놈	2010-10	23753	3
아톰플랫폼의홈서버 (7) 2010-10 23753 1 the촌놈
492	windows7 sp1 초기 설치시 익스플로어 8에서 11로 업그레이드하기... (9)	안형곤	2017-04	15334	3
windows7 sp1 초기 설치시 익스플로어 8에… (9) 2017-04 15334 1 안형곤
491	Windows 10 ISO 다운로드 받는 방법 (6)	TLaJ3KtYGr	2018-06	21751	2
Windows 10 ISO 다운로드 받는 방법 (6) 2018-06 21751 1 TLaJ3KtYGr
490	캠핑을 가자! (4) - 바닥재(매트), 타프 + 침낭 등등등... (5)	김준연	2019-06	14755	1
캠핑을 가자! (4) - 바닥재(매트), 타프 +… (5) 2019-06 14755 1 김준연
489	Free 클라우드 서버 모니터링하기 (1)	신영진	2020-02	10438	0
Free 클라우드 서버 모니터링하기 (1) 2020-02 10438 1 신영진
488	CentOS 7 bashtop 설치 (3)	딥러닝서버	2021-03	13210	0
CentOS 7 bashtop 설치 (3) 2021-03 13210 1 딥러닝서버
487	sysbench를 이용한 Mysql 부하 테스트	딥러닝서버	2021-07	9191	0
sysbench를 이용한 Mysql 부하 테스트 2021-07 9191 1 딥러닝서버