ホームニューステックニュースGymnasiumで始める強化学習入門 #gymnasium - Qiita

Gymnasiumで始める強化学習入門 #gymnasium – Qiita

By インモビ運営局

2025年4月22日

0

1

Gymnasiumで始める強化学習入門 #gymnasium - Qiita

環境名	説明	画像
CartPole	台車の上に立てられた棒をバランスさせる問題
MountainCar	谷間に配置された車を山の頂上まで加速させる問題
Pendulum	振り子を上向きに維持する問題

環境名	説明	画像
LunarLander	月面に宇宙船を安全に着陸させる問題
BipedalWalker	2足歩行ロボットを効率よく歩かせる問題
CarRacing	レーストラックを速く走り抜ける問題

環境名	説明	画像
Ant	4足歩行ロボットの制御
Humanoid	人型ロボットの制御
HalfCheetah	チーター型ロボットの制御

環境名	説明
Breakout	ブロック崩し
Pong	ピンポン
Space Invaders	スペースインベーダー

Gymnasiumで始める強化学習入門 #gymnasium – Qiita

いいね:

関連

「ワンフェス2025夏、シュタゲのタイムマシン発見！」

Next.js初心者向けガイドライン

「炭治郎＆義勇、無限城フィギュア登場！」

返事を書く返事をキャンセル

ABOUT US

FOLLOW US

go!go!vanillas新EP「SCARY MONSTERS EP」9月24日発表！ジャケ写も公開！

「料理男子と吸血鬼女子の心温まるラブコメ新連載！」

味噌汁は沸騰させたらダメなのか リュウジが「炎上覚悟」で3パターン検証、明らかになった「新事実」: J-CAST ニュース

Gymnasiumで始める強化学習入門 #gymnasium – Qiita

はじめに

Gymnasiumとは？

インストール方法

インストールオプション

Condaを使用する場合

インストール後の確認

基本的な使い方

主要な環境ファミリー

Classic Control

Box2D

Toy Text

MuJoCo

Atari

環境の構造を理解する

観測空間 (Observation Space)

行動空間 (Action Space)

ステップ関数 (Step)

リセット関数 (Reset)

レンダリング (Render)

独自環境の作成

環境の登録

カスタム環境のポイント

強化学習アルゴリズムの実装例

Q学習とは？

FrozenLake環境でのQ学習実装

解説

Q学習のポイント

関連ライブラリと活用法

1. CleanRL

2. Stable Baselines3

3. PettingZoo

4. Gymnasium Wrappers

5. Weights & Biases と連携

まとめと次のステップ

Gymnasiumの魅力

次に学ぶべきトピック

おすすめの学習リソース

さいごに

共有:

いいね:

関連

「ワンフェス2025夏、シュタゲのタイムマシン発見！」

Next.js初心者向けガイドライン

「炭治郎＆義勇、無限城フィギュア登場！」

返事を書く 返事をキャンセル

ABOUT US

FOLLOW US

味噌汁は沸騰させたらダメなのか　リュウジが「炎上覚悟」で3パターン検証、明らかになった「新事実」: J-CAST ニュース

返事を書く返事をキャンセル