파이선 코딩을 배우는 초보자도 머신 러닝에 독학으로 한번 도전해 보자.
왜냐구요? 그다지 어렵지 않으니까요!
머신 러닝을 배우려는 파이선 코딩 초보자들이 가지게 될 확률이 높은 의문점들을
하나하나 찾아내어 실제 풀어보고 결과를 확인해볼 수 있는 머신 러닝!
인터넷 교보문고에서 450페이지19900원에 판매중입니다.
________________________________________________________________________________________________________________________
스탠포드 대학 서버에서 제공하는 IMDB 데이터 베이스를 사용하여 Sentiment 분석을 해 보기로 한다. Sentiment 라 함은 여론조사는 아니고 특정 사안에 대한 쏠림 경향 정도로 생각하면 될 듯하다.
첫 번째 시도는 Sevastian Raschka의 “Python Machine Learning” 8장의 오픈 소스를 사용해 보았으나 실제로 결과를 얻어낼 수 없었다. 이미 Sevastian Raschka의 친절한 가이드 내용에 따라 tfidf 계산 까지 성공적으로 마쳤으나 마지막 부분에 내용을 읽어 보면 코드 실행 시간이 데스크 톱 PC를 사용할 경우 40분이 걸린다는 언급이 있긴 하지만 뭔가 찾기 어려운 버그들이 내재되어 있는듯하여 또 다른 스텐포드 대학쪽에서 Github 에 올려 놓은 오픈소스로 노선을 바꾸기로 한다.
아래 url 주소로 이동하여 마저 읽어 보세요.
https://steemit.com/kr/@codingart/4-8-imdb-sentiment
'머신러닝' 카테고리의 다른 글
IMDB 영화등급 설정 파라메터 연구 머신 러닝 (0) | 2019.05.08 |
---|---|
텐서플로우∙OpenCV 머신 러닝 하이퍼 링크 목차 PDF 파일 무료 다운로드 안내 (0) | 2019.05.06 |
Information Gain, Gini impurity (0) | 2019.05.01 |
New Multi Hot Code 알고리듬에 의한 TensorFlow Softmax 훈민정음 자음 Classification 예제 (0) | 2019.05.01 |
Multi Hot Code 알고리듬 (0) | 2019.04.30 |