강아지 책에 나온 예제를 실행했다. 책 실행 환경과 내 그것이 달라 실행할 수 없었다. 나는 docker로 tensorflow를 사용한다. 그것도 cpu가 avx 등 을 지원하지 않아 직접 컴파일했다. openAi gym은 GUI 환경에서 실행되어 docker로 구동하기 힘들다. 데스크탑을 거실에 설치하여 다른 노트북에서 ssh로 접속하여 사용한다. 이런 모든 문제를 jypyter notebook로 해결했다. 전 글에 설명한대로 docker를 아래 명령으로…… CarpPole Deep Q Network 이해 계속 읽기
[태그:] reinforcementLearning
Monte Carlo Method 코드 분석
여기에 있는 코드 참조.. 책은 “파이썬과 케라스로 배우는 강화학습” 내용. Monte Carlo Method의 코드가 설명되어 있지 않아, python 디버그로 그 결과를 잠깐 살폈다. 메인 코드. # 메인 함수 if __name__ == “__main__”: env = Env() agent = MCAgent(actions=list(range(env.n_actions))) for episode in range(1000): state = env.reset() action = agent.get_action(state) while True: env.render() # 다음 상태로 이동…… Monte Carlo Method 코드 분석 계속 읽기