지난해 겨울 텐서플로우 OpenCV 출간 이후 7개월 만에 2권에 해당하는 “Scikit PyTorch 머신러닝”을 출간하게 되었다. 각권이 450 페이지이므로 합 900 페이지에 달하는 내용이라 무슨 머신러닝을 공부하는데 분량이 왜 이렇게 많은가? 하고 의문을 가질 수도 있겠으나 그 내용이 튜토리얼성에 가까워 사실 그렇게 큰 부담은 없는 책이다. 물론 책 내부에 파이선 코드를 끼워 넣는 먹통 짓은 지금 세상에서는 할 필요가 없을 것이다. 해당 책의 머리말에 써둔 하이퍼링크 목차를 다운받으면 블로그를 직접 열어 볼 수 있으며 거기서 예제 코드를 다운 받을 수 있다.
1권에 해당하는 텐서플로우 OpenCV 머신러닝에서는 2017년 9월경부터 2018년 12월 사이에 머신러닝을 이해하고자 하는 필자의 열공(?) 내용을 담아 보았다면 2권에서는 1권에서 제기되었던 여러 내용들에 대해서 해답을 찾아가는 내용들을 꽤 많이 포함하였다. 2권이라고 해서 내용적으로 완전히 정리된 것은 아니기 때문에 다시 3권의 출발점이 될 수도 있을 것이다.
다소 아쉬운 점은 흥미 위주로 시작했던 1, 2권의 Softmax 관련 내용을 완전히 정리하지는 못했는데 이 그 이유는 R&D 영역으로 넘어갔기 때문이다. 2020년에는그 내용까지도 포함하여 출간할 계획이다.
본 서의 출간 목적은 작가들과 출판사가 염원하는 베스트셀러 화가 목표가 아니다. 사회적으로 인공지능(머신러닝)에 대한 이해 필요성이 점증하는 시기이며, 인공지능 분야의 발전 속도가 상당히 빠르기 때문에 그에 맞춰서 비전공자라 할지라도 머신러닝에 입문해 볼 수 있도록 경험과 생각을 공유해 보고자 하는 것이다.
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
아래의 왼쪽은 2018년 상반기에 설치한 아나콘다의 텐서플로우 버전이며 오른쪽은 2019년 7월의 구글 Colabo에서의 업그레이드 된 텐서플로우 버전이다.
Keras를 사용하여 구글 Colabo에서 MNIST 수기문자 판독 문제 코드 작성도 큰 변화를 겪었음을 예제를 통해 알아보자. 텐서플로우와 아울러 import tensorflow.contrib.keras as keras 명령에 의해 2015년에 오픈되었던 Keras 라이브러리를 불러 쓸 수 있었으나 구글 Colabo에서는 tf.keras.∙∙∙ 형태로 발전되어 즉 import tensorflow as tf 명령 체계 내로 흡수 통합이 이루어졌다.
즉 MNIST 데이터를 읽어 Normalization 후 deep learning을 위한 첫 hidden 레어어 정의. ReLU 처리, Dropout 설정 및 마지막 classification 레이어 설정으로 구성된다.
이 컴팩트한 Keras 코드에서 기본적인 파라메터인 batch size가 보이질 않는데 Default 값이 32 임을 참조하자.
구글 Colabo에서 GPU를 설정하여 코드를 실행해 보면 5 epoch 별로 4초씩 합계 20초 가량의 실행 시간이 소요되며 인식률은 98% 선이다.
'머신러닝' 카테고리의 다른 글
“파이선 코딩 초보자를 위한 Scikit PyTorch 머신러닝” 출간 (0) | 2019.08.15 |
---|---|
파이선 코딩 초보자를 위한 Scikit PyTorch 머신러닝 (0) | 2019.08.09 |
1-18 Random Forest 계산 사례 (0) | 2019.08.05 |
1-19 GaussianNB Classification (0) | 2019.08.05 |
5-0 Bayesian Rule 과 기초 확률론 (0) | 2019.08.05 |