Giter Site home page Giter Site logo

shiraco / techcircle_openai_handson Goto Github PK

View Code? Open in Web Editor NEW

This project forked from icoxfog417/techcircle_openai_handson

0.0 1.0 0.0 1.13 MB

Tech-Circle OpenAI Handson Repository

Home Page: https://docs.google.com/presentation/d/1hU2s1bk61VGLbpAn8kREhY6BnzMR6Fe5PgDtEv9lPog/edit?usp=sharing

License: MIT License

Python 100.00%

techcircle_openai_handson's Introduction

Tech Circle OpenAI Gym Handson

Tech-Circle #18 「Pythonではじめる強化学習 OpenAI Gym 体験ハンズオン」のハンズオン資料です。

Setup

事前準備としてOpenAI GymとChainerをインストールします(Chainerは、DQNのサンプルを実行するのに必要です)。
Windowsの場合、atariのゲームを動かす環境の構築(手順5以降)はネイティブでは非常に困難です。そのため、以下を参考にbash on Windows環境を構築し、bash環境(=Ubuntu環境)で環境構築を行ってください。

Bash on Ubuntu on Windowsをインストールしてみよう!

また、bash on Windows側から画面を描写するのにvcXsrvXmingのインストールが必要です。 インストールするのは新しいvcXsrvのほうが良いですが、動かないケースが報告されているのでその場合はXmingを試してみてください。 これらをインストールしServerを起動すると、スクリーンが立ち上がります。bash側でexport DISPLAY=:0を行い出力先をこのスクリーンに設定することで、実行結果を確認できます(.bashrcに書いておくと実行し忘れを防げます)。

  1. Pythonのインストール
    Pythonは3を利用します。こちらなどを参考に、Pythonのインストールを行ってください。 なお、bash on Windowsを利用している場合Linuxベースの環境構築となります(中身はUbuntuのため)。 Windows側でPythonがインストールされていてもそれはbash環境とは別個なので、仮にWindows側でPythonをインストールしていてもbash側でもインストールを行う必要がある点に注意してください。

  2. リポジトリのfork/clone
    本リポジトリをforkし、cloneしてください(良ければStarもよろしくですm(_ _)m)。以後、cloneしたフォルダ(techcircle_openai_handson)の中で作業をしていきます。

  3. OpenAI Gymのインストール
    pip install gymでOKです。なお、インストールはvirtualenvcondaを使い、仮想環境にインストールすることをお勧めします。仮想環境の作成についての詳細は、上記のリンク先の資料をご参照ください。

  4. Gymの動作確認
    本リポジトリの中にあるconfirm_hello_gym.pyを実行し動くかどうかを確認してください。

    python confirm_hello_gym.py
    

    上手くインストールできていれば、以下のようにCartPoleが動くはずです。特にWindowsで環境構築を行っている場合は、まずここで実行を確認しておいてください。

    cartpole.PNG

  5. 依存モジュールのインストール
    ここから、gymでatariのゲームが扱えるよう追加のインストールを行っていきます。公式ページに記載の通り、atari環境を実行するのに必要なライブラリなどをインストールします。

  6. atari環境のインストール
    pip install 'gym[atari]' でインストールを行います

  7. Chainerのインストール
    pip install chainerでインストールします

  8. atariの動作確認
    本リポジトリの、confirm_dqn_env.pyを実行し動くかどうか確認してください。

    python confirm_dqn_env.py
    

    pong.PNG

これで準備は完了です。お疲れさまでした!

Trouble Shuooting

  • Windowsの場合、atari環境の実行のためにpython-openglの追加インストールが必要かもしれません
  • Windowsの場合、Xmingでないと動かないという報告がありました
  • Python 3.5とChainer(1.17)を組み合わせて使う場合、export CHAINER_PYTHON_350_FORCE=1の設定が必要になる可能性があります

Lecture

Pythonではじめる強化学習 OpenAI Gym 体験ハンズオン 講義編

Hands on

解答編は以下になります

Handson Answer

Trouble Shuooting

  • Pythonはインデントで制御構造を判断するため、インデントには気を付けてください
  • インデントをつける際、空白を利用するかタブを利用するかは統一されている必要があります。ハンズオンのコードは空白を利用しているため、タブを混在させてしまわないよう、注意してください
  • コードは、UTF-8(BOM無)で保存する必要があります。Windowsの一部のエディタでは保存時Shift-JISになってしまうので、注意してください
  • コマンドの実行が上手くいかない際は、所定のフォルダにいるかどうかを確認してください。optional以外は、それぞれ該当のフォルダ上(例えば、handson_1ならコマンドプロンプト/ターミナルのcdコマンドでhandson_1フォルダに移動してからコマンドを実行する必要があります)
  • コマンドの実行時には、仮想環境を利用している場合activateされているか、またWindowsの場合表示用の画面を立ち上げているかを確認してください

techcircle_openai_handson's People

Contributors

icoxfog417 avatar decchi avatar negokaz avatar

Watchers

James Cloos avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.