인공지능 응용 공학

Rnnlm 클라스를 사용 PTB 데이터세트 전체를 대상으로 학습시켜보자.

coding art 2023. 2. 3. 18:06
728x90

 

 

Time RNN 계층을 Time LSTM 계층으로 대체한 Rnnlm 클라스를 사용하여 PTB 데이터세트 전체에 대해 학습시켜보자. LSTM계층으로 변경함에 따라 하이퍼 파라메터 설정에 변동이 큼에 유의하자.

Rnnlm 클라스는 SimpleRnnlm 클라스와 거의 동일하지만 몇가지 메서드들이 추가되었다. save_params, load_params 메서드들은 가중치와 기울기 데이터를 피클링하여 저장하거나 부를 때 사용된다. 아우러 predict 메서드는 다음 절의 text generation에서 사용된다.

 

참조: 밑바닥부터 시작하는 딥러닝 2,  6장

 

 

 

 

 

 

 

 

 

 

 

perplexity 계산 결과

첨부된 Colab 파일을 다운받아 반드시 GPU 사용 설정 후에 실행해보자. (실행시간 27분)

train_rnnlm.ipynb
0.10MB