> 财经 >

强大募化念书 车杆游玩

2019-01-11 09:14

  import gym

  import time

  env =gym.make(‘CartPole-v0‘) # 得到游玩环境

  observation=env.reset() # 骈位游玩环境,新壹局游玩末了尾

  print (‘新壹局游玩 初始不雅察看={}‘.format(observation))

  for t in range(200):

  env.render()

  action =env.action_space.sample() # 遂机选择举止

  print (‘{}: 举止={}‘.format(t, action))

  observation, reward, done, info =env.step(action) # 实行行为

  print (‘{}: 不雅察看={}, 本步得分={}, 完一齐训示={}, 其他信息={}‘.format(

  t, observation, reward, done, info))

  if done:

  break

  time.sleep(1)#却加以却不加以,拥局部话就却以看到图

  env.close()

分享到:
收藏
相关阅读