오늘부터 강화학습에 관한 내용들을 공부하고 있다.


애초에 국내에 머신러닝 강좌들도 많이 없지만,


그중에서도 RL(강화학습)에 관한 내용은 전무한 상황이라고 봐도 될정도다.


그러던 도중 아주 좋은 자료를 찾았고 오늘부터 정리를 하려고 한다.




Reinforcement Learning 


환경과 상호작용을 통한 학습 장법 중에서 computational 하게 접근하 것이 machine learning 이다.

이 ML의 학습 방법중 하나가 RL이다. 물론 DL(Deep Learning)도 ML의 하나이다.

ML 중에서 아이가 걷는것을 배우는 것처럼 처음에 어떻게 행동할 줄 모르지만, 환경과 상호작용을 하면서

걷는 법을 알아가는 것과 같은 학습을 RL이라고 한다.


좀더 자세하게 보면 어떤 Environment을 탐색하는 agent가 현재의 state를 인식하여 어떤 action을 취한다.

그러면 그 agent는 Environment로 부터 reward를 얻게 된다. reward는 양수와 음수 둘다 가능하다. 

강화학습의 알고리즘은 그 agent가 앞으로 누적될 reward를 최대화 하려는 일련의 행동으로 정의되는 policy를 찾는 방법이다.




+ Recent posts