머신러닝 283

Markov Chain 매트릭스 예제 엑셀처리 예제

1800년대 후반에 물리학자인 볼츠만 혼자서만 열공한 줄 알았는데 러시아의 수학자였던 Markov 한 분이 더 있었군요. Markov Chain 이론이 직접 강화학습에 쓰이는 것은 아니지만 그 다음 단계로 보이는 MDP(Markov Decision Process) 단계에서 강화학습(Reinforcement learning)과 연결이 되는 것으로 보이는데 이 부분을 연결해주는 튜토리알이 거의 없는 듯하다. 그렇지만 이미 엑셀에서 매트릭스 처리 기법을 연습하였으므로 이를 바탕으로 Markov Chain 문제를 이해하고 엑셀로 문제를 풀어 본 후 다시 MDP 학습을 통해 강화학습과의 연결고리를 찾아 볼 계획이다. 볼츠만 확률분포에 이어 위 그림의 마코프 체인 확률 문제를 고려해 보자. 3개의 마트 A, B, ..

머신러닝 2019.03.12

RNN의 원조인 Hopfield Network의 정체

로직하면 AND, OR 가 있으며 XOR 로직은 특히 머신 러닝의 역사에서 뉴럴 네트워크를 사용에 의한 상당히 중요한 극복의 대상이었다. 한편 그밖에도 디지털 전자공학 관점에서 남겨진 로직이 바로 Flip Flop 이다. 이 로직은 1 비트의 정보를 저장한 상태에서 그대로 출력하든지 아니면 사용자가 원하면 1비트 정보를 그대로 설정(SET)하든지 아니면 재설정(RESET) 하는 기능을 가지고 있다고 한다. 따라서 머신 러닝 측면에서 검토를 통해 확인이 되어야 할 사항으로서 이러한 기능이 바로 Hopfield 네트워크의 생생한 사례가 아닌가 하는 생각이 들었다. 다음의 로직 게이트 그림은 하나는 NOR 게이트로 구성한 Flip Flop 이며 다른 하나는 NAND 로 구성한 경우이다. 결과는 마찬가지이므로 ..

머신러닝 2019.02.20