여기에 있는 코드 참조.. 책은 “파이썬과 케라스로 배우는 강화학습” 내용. Monte Carlo Method의 코드가 설명되어 있지 않아, python 디버그로 그 결과를 잠깐 살폈다. 메인 코드. # 메인 함수 if __name__ == “__main__”: env = Env() agent = MCAgent(actions=list(range(env.n_actions))) for episode in range(1000): state = env.reset() action = agent.get_action(state) while True: env.render() # 다음 상태로 이동…… Monte Carlo Method 코드 분석 계속 읽기