トップページ -> データベース関連技術 -> 強化学習 -> OpenAI Gym, Gym Atari のインストール
[サイトマップへ], [サイト内検索へ]

OpenAI Gym, Gym Atari のインストール

OpenAI は、強化学習のツールキット. このページでは,インストール手順を示す.

謝辞:OpenAI Gym の作者に感謝します

参考Webページ https://gym.openai.com/


前準備

前準備として,Python, git のインストールが終わっていること.

Python のインストール

※ Python のプログラム作成には、PyCharmなどが便利である.

git のインストール

以下,Windows に Python, git をインストール済みであるものとして説明を続ける.


OpenAI Gym, Gym Atari のインストール

  1. Window でコマンドプロンプトを実行
  2. OpenAI Gym のダウンロード

    ダウンロードに,gitを用いる.

    mkdir c:\pytools
    cd c:\pytools
    rmdir /s /q gym
    git clone https://github.com/openai/gym
    

    [image]
  3. OpenAI Gym のインストール

    ※ 「pip install ...」は,Python パッケージをインストールするための操作. Ubuntu でシステム の python3 を使っているときは,「pip install ...」の代わりに「sudo pip3 install ...」のように操作すること.

    cd c:\pytools
    cd gym
    pip install -e .
    

    [image]
  4. OpenAI Gym のバージョン確認

    Windows のコマンドプロンプトで、次のコマンドを実行

    ※ バージョン番号が表示されれば OK.下の図とは違うバージョンが表示されることがある

    python -c "import gym; print( gym.__version__ )"
    

    [image]
  5. Gym Atari のインストール

    pip install gym[atari]
    

    [image]

試しに動かしてみる

Python プログラムを動かす.

※ Python プログラムを動かすために, Windows では,「python」コマンドやPythonランチャーである「py」を使う. Ubuntu では「python3」コマンドを使う. あるいは, PyCharmなどにある Python コンソールも便利である.

SpaceInvaders-v0

import gym
env = gym.make('SpaceInvaders-v0')
observation = env.reset()
for i_episode in range(20):
    observation = env.reset()
    for t in range(100):
        env.render()
        print(observation)
        action = env.action_space.sample()
        observation, reward, done, info = env.step(action)
        if done:
            print("Episode finished after {} timesteps".format(t+1))
            break

[image]

[image]

CartPole-v0

import gym
env = gym.make('CartPole-v0')
observation = env.reset()
for i_episode in range(20):
    observation = env.reset()
    for t in range(100):
        env.render()
        print(observation)
        action = env.action_space.sample()
        observation, reward, done, info = env.step(action)
        if done:
            print("Episode finished after {} timesteps".format(t+1))
            break

[image]

Copy-v0

import gym
env = gym.make('Copy-v0')
observation = env.reset()
for i_episode in range(20):
    observation = env.reset()
    for t in range(100):
        env.render()
        print(observation)
        action = env.action_space.sample() # your agent here (this takes random actions)
        observation, reward, done, info = env.step(action)
        if done:
            print("Episode finished after {} timesteps".format(t+1))
            break

[image]

toy_text

import gym
env = gym.make('FrozenLake-v0')
observation = env.reset()
for i_episode in range(20):
    observation = env.reset()
    for t in range(100):
        env.render()
        print(observation)
        action = env.action_space.sample() # your agent here (this takes random actions)
        observation, reward, done, info = env.step(action)
        if done:
            print("Episode finished after {} timesteps".format(t+1))
            break

[image]

本サイトは金子邦彦研究室のWebページです.サイトマップは,サイトマップのページをご覧下さい. 本サイト内の検索は,サイト内検索のページをご利用下さい.

問い合わせ先: 金子邦彦(かねこ くにひこ) [image]