저번 포스트에서는 절차지향형 코딩을 했지만


앞으로 여러개의 네트워크를 사용하는 DQN을 사용해야하기 때문에 객체지향형 코드로 바꿔봤다.


원래 내가 했던 코드대로 deque()대신 list를 사용했고 minibatch에서 스택을 사용하는 대신에 바로바로 값을 업데이트 하였다.


+ Recent posts