Markov Chain 매트릭스 예제 엑셀처리 예제
1800년대 후반에 물리학자인 볼츠만 혼자서만 열공한 줄 알았는데 러시아의 수학자였던 Markov 한 분이 더 있었군요. Markov Chain 이론이 직접 강화학습에 쓰이는 것은 아니지만 그 다음 단계로 보이는 MDP(Markov Decision Process) 단계에서 강화학습(Reinforcement learning)과 연결이 되는 것으로 보이는데 이 부분을 연결해주는 튜토리알이 거의 없는 듯하다. 그렇지만 이미 엑셀에서 매트릭스 처리 기법을 연습하였으므로 이를 바탕으로 Markov Chain 문제를 이해하고 엑셀로 문제를 풀어 본 후 다시 MDP 학습을 통해 강화학습과의 연결고리를 찾아 볼 계획이다. 볼츠만 확률분포에 이어 위 그림의 마코프 체인 확률 문제를 고려해 보자. 3개의 마트 A, B, ..