ホームニューステックニュース【DeepRacer】令和のミニ四駆！？～DeepRacerを触ってみた～ #AWS - Qiita

【DeepRacer】令和のミニ四駆！？～DeepRacerを触ってみた～ #AWS – Qiita

2025年5月5日

2

【DeepRacer】令和のミニ四駆！？～DeepRacerを触ってみた～ #AWS - Qiita

（LTのネタになりそうで）業務では使わなさそうな面白いAWSサービスはないかと調べていたところ、カーレースシミュレーションを通じて強化学習を経験・学習できるAWS DeepRacerというサービスを見かけ、試しに触ってみたので、その内容についてアウトプットしていきたいと思います。

公式からは以下のような説明がされています。

あらゆるレベルレベルのデベロッパーが、クラウドベースの 3D レーシングシミュレーター、強化学習により駆動する 1/18 スケールの完全自走型レーシングカーを通じて機械学習を実践的に学べます。

<br />

一言でいうと、「強化学習を楽しく、実践的に学べるプラットフォーム」といったところでしょうか。

本サービスは、2025年12月で終了予定です。
試してみたい方はお早めに触ってみることをお勧めします。

<br />

余談ですが、AWS Summit2023や2024では実際に大会が行われていたそうなので、ご存知の方も多いかもしれません。

<br />

強化学習は、人間や動物が「試行錯誤しながら学ぶ」という自然な学習プロセスに着想を得た機械学習の一種です。簡単に言えば、「行動して、結果を見て、より良い結果を得るために行動を調整する」という学習方法です。

種類	学習方法	入力データ	フィードバック	目的
教師あり学習	正解（ラベル）付きのデータセットを使って学習	ラベル付きデータ	予測と正解の差（誤差）	入力から出力へのマッピングを学習
教師なし学習	データの中からパターンを見つけ出す学習	ラベルなしデータ	なし（自己組織化）	データの構造やパターンの発見
強化学習	環境との相互作用から試行錯誤で学習	環境の状態	行動に対する報酬	報酬を最大化する方策の獲得

特性	PPO	SAC
開発年	2017年（OpenAI）	2018年（UC Berkeley）
学習方式	オンポリシー型（現在の方針で得たデータのみで学習）	オフポリシー型（過去の経験も再利用して学習）
データ効率	中程度	高い（経験再利用あり）
実装の複雑さ	比較的簡単	やや複雑
行動空間	離散・連続の両方に対応	主に連続行動空間に強い
ハイパーパラメータ	比較的少ない	調整が必要
計算効率	並列化に適している	やや計算コストが高い

【DeepRacer】令和のミニ四駆！？～DeepRacerを触ってみた～ #AWS – Qiita

いいね:

関連

ライトとボックス – CodePen

愛情を込めて難解な CSS – CodePen

クリスのコーナー: タイプ – CodePen

返事を書く返事をキャンセル

ABOUT US

FOLLOW US

新・AR計画第9話 #ヒカキン #頭脳比べ #強さ比べ #ヒカマニ強さ比べ #ヒカマニ #edit

新曲を作るHIKAKINさん！🤣#shorts #hikakin #歌

生理現象は仕方ない。 #shorts #ヒカキン切り抜き

【DeepRacer】令和のミニ四駆！？～DeepRacerを触ってみた～ #AWS – Qiita

基本要素

プロセス

他の機械学習と違い

1. モデルの作成

1-1. シミュレーション環境の設定

1-2. レースタイプとトレーニングアルゴリズムの設定

1-3. アクションスペースの設定

1-4. マシンの設定

1-5. 報酬関数の設定

1-6. トレーニング時間の設定

2. モデルのトレーニング

3. モデルの評価

4. モデルの改善（今回は未実施）

共有:

いいね:

関連

ライトとボックス – CodePen

愛情を込めて難解な CSS – CodePen

クリスのコーナー: タイプ – CodePen

返事を書く 返事をキャンセル

ABOUT US

FOLLOW US

返事を書く返事をキャンセル