머신러닝

8-7 구글 Colab에서 TensorFlow Keras 사용 MNIST 문자 GPU 머신 러닝

coding art 2019. 8. 8. 18:41
728x90

 

지난해 겨울 텐서플로우 OpenCV 출간 이후 7개월 만에 2권에 해당하는 “Scikit PyTorch 머신러닝을 출간하게 되었다. 각권이 450 페이지이므로 합 900 페이지에 달하는 내용이라 무슨 머신러닝을 공부하는데 분량이 왜 이렇게 많은가? 하고 의문을 가질 수도 있겠으나 그 내용이 튜토리얼성에 가까워 사실 그렇게 큰 부담은 없는 책이다. 물론 책 내부에 파이선 코드를 끼워 넣는 먹통 짓은 지금 세상에서는 할 필요가 없을 것이다. 해당 책의 머리말에 써둔 하이퍼링크 목차를 다운받으면 블로그를 직접 열어 볼 수 있으며 거기서 예제 코드를 다운 받을 수 있다.

 

 

1권에 해당하는 텐서플로우 OpenCV 머신러닝에서는 20179월경부터 201812월 사이에 머신러닝을 이해하고자 하는 필자의 열공(?) 내용을 담아 보았다면 2권에서는 1권에서 제기되었던 여러 내용들에 대해서 해답을 찾아가는 내용들을 꽤 많이 포함하였다. 2권이라고 해서 내용적으로 완전히 정리된 것은 아니기 때문에 다시 3권의 출발점이 될 수도 있을 것이다.

 

다소 아쉬운 점은 흥미 위주로 시작했던 1, 2권의 Softmax 관련 내용을 완전히 정리하지는 못했는데 이 그 이유는 R&D 영역으로 넘어갔기 때문이다. 2020년에는그 내용까지도 포함하여 출간할 계획이다.

 

본 서의 출간 목적은 작가들과 출판사가 염원하는 베스트셀러 화가 목표가 아니다. 사회적으로 인공지능(머신러닝)에 대한 이해 필요성이 점증하는 시기이며, 인공지능 분야의 발전 속도가 상당히 빠르기 때문에 그에 맞춰서 비전공자라 할지라도 머신러닝에 입문해 볼 수 있도록 경험과 생각을 공유해 보고자 하는 것이다.

+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

 

아래의 왼쪽은 2018년 상반기에 설치한 아나콘다의 텐서플로우 버전이며 오른쪽은 20197월의 구글 Colabo에서의 업그레이드 된 텐서플로우 버전이다.

  

 

 

Keras를 사용하여 구글 Colabo에서 MNIST 수기문자 판독 문제 코드 작성도 큰 변화를 겪었음을 예제를 통해 알아보자. 텐서플로우와 아울러 import tensorflow.contrib.keras as keras 명령에 의해 2015년에 오픈되었던 Keras 라이브러리를 불러 쓸 수 있었으나 구글 Colabo에서는 tf.keras.∙∙∙ 형태로 발전되어 즉 import tensorflow as tf 명령 체계 내로 흡수 통합이 이루어졌다.

 

MNIST 데이터를 읽어 Normalization deep learning을 위한 첫 hidden 레어어 정의. ReLU 처리, Dropout 설정 및 마지막 classification 레이어 설정으로 구성된다.

 

 

 

이 컴팩트한 Keras 코드에서 기본적인 파라메터인 batch size가 보이질 않는데 Default 값이 32 임을 참조하자.

구글 Colabo에서 GPU를 설정하여 코드를 실행해 보면 5 epoch 별로 4초씩 합계 20초 가량의 실행 시간이 소요되며 인식률은 98% 선이다.