火曜日, 4月 29, 2025
ホームニュースカルチャーニュースマインクラフト研究で「調子がいいときはソロ」「詰まったら模倣」が最速学習の極意と判明

マインクラフト研究で「調子がいいときはソロ」「詰まったら模倣」が最速学習の極意と判明


私たち人間は、自分で試行錯誤しながら知識や技術を身につけることもできれば、周囲の人々から見よう見まねで学ぶこともできます。
では、複雑な現実世界で新しいことを学ぶとき、どのように「自分の勘」と「社会からのヒント」を組み合わせるのがもっとも賢いやり方なのでしょうか。
この問いに、実はまだはっきりした答えが出ていませんでした。

マインクラフトの仮想世界を舞台にしたこの実験では、参加者が資源ブロックを探す過程で、単独探索と他者の成功を追う行動を絶えず行き来し、その適応力の高い人ほど多くの報酬を得ることができます。

ドイツのチュービンゲン大学(UT)で行われたマインクラフトを用いた実験によって、仲間の発見に頼りすぎず、自分の勘だけに固執もしない――状況に応じて戦略を柔軟に切り替える適応力が最も高い成績を残すことが示されました。

自分流を貫くこと、他人からノウハウを盗み続けること、どちらかに偏っていては成果はだせなかったのです。

では、現実の学びの場で私たちはどうすればこの“切り替え上手”になれるのでしょうか――あなたなら、次に何を学ぶときにどんなバランスで挑みますか?

研究内容の詳細は2025年4月25日に『Nature Communications』にて発表されました。

目次

  • 自分流×社会のヒント──勝者の方程式はここに
  • マインクラフト実験で「自分で極める」と「人を真似る」の最良バランスが判明
  • マイクラで覗いた“切り替え脳”のリアルタイム映像

自分流×社会のヒント──勝者の方程式はここに

自分流×社会のヒント──勝者の方程式はここに
自分流×社会のヒント──勝者の方程式はここに / ゲームの中で価値ある資源を効率よく集めるには、自分で突き詰めるか他人を真似るか、どちらがいいのでしょうか?/Credit:clip studio . 川勝康弘

人間が社会的に学び合う能力は、世代を超えて知識を蓄積できるという点で人類の大きな特徴です。

私たちはこの力によって都市に高層ビルを建て、宇宙空間へと進出し、病気の治療法を生み出すといった驚異的な成果を成し遂げてきました。

しかし、社会的学習のメカニズムを調べる従来の実験研究の多くは、現実とはかけ離れた単純な課題を用いており、複雑な実世界で人々が個人の本能(経験則)と社会的な手がかりをどう統合しているかについてはほとんど分かっていませんでした。

このギャップを埋めるため、ドイツ・ベルリンのマックスプランク人間開発研究所やチュービンゲン大学、米ニューヨーク大学などからなる国際研究チームが立ち上がりました。

彼らの目的は、これまで別々に研究されがちだった「個人学習」と「社会学習」の適応的なメカニズムを一つの実験系で明らかにし、両者を架橋することにありました。

そこで研究チームは、人気ゲーム『マインクラフト』内に没入型の採集タスクという仮想実験環境を開発し、人間がリアルに近い状況で個人情報と社会情報をどう使い分けるかを詳しく調べることにしたのです。

また次ページの最後には研究によって判明した最速学習の方法をまとめて紹介しています。

マインクラフト実験で「自分で極める」と「人を真似る」の最良バランスが判明

マインクラフト実験で「自分で極める」と「人を真似る」の最良バランスが判明
マインクラフト実験で「自分で極める」と「人を真似る」の最良バランスが判明 / 人気ゲーム『マインクラフト』の世界そのものを丸ごと「学習の実験室」に仕立てた場面を映しています。画面中央に広がるぎっしり詰まったブロック地帯が参加者の掘削ターゲットとなる資源フィールドで、プレイヤーは自分のアバターを操り、目に入る範囲だけを頼りにブロックを壊していきます。もし地下からスイカやカボチャなどの当たりブロックを引き当てると、その瞬間に地点がパッと光って青いスプラッシュが弾け、周囲のプレイヤーにも「ここが当たりだよ!」と知らせる社会的ヒントになります。ほかの参加者はこの合図を目印に近づくか、それとも未知の場所を探すかを即座に判断し、状況に応じて自力探索と他者模倣を行き来します。こうして「自力探索」と「他者模倣」がめまぐるしく切り替わる様子が一枚に収められ、研究者はこの仮想空間を通じて、人がいつどの瞬間に学習戦略をスイッチするのかを高解像度で計測できるようになったのです。研究チームは20分の1秒ごとに「何を見ているか」を自動抽出し、ブロック・イベント・他プレイヤーの座標データとひも付けて保存しています。プレイヤーの注意の向きがリアルタイムで記録されることで、「どの瞬間に社会的ヒントに気づき、どの瞬間に自力探索へ切り替えたか」という視線と行動のシンクロが高解像度で再現され、さらに蓄積ログからプレイヤーが次に掘るブロックを予測する計算モデルまで構築されています。つまりゲームプレイ中の生きた視点データがそのまま人工知能にも利用できる「学習アルゴリズムの燃料」に変わる瞬間を映し出し、実験が単なる観察ではなく人間の戦略を数式へ翻訳するプロセスまで踏み込んで調べています。/Credit:Charley M. Wu et al . Nature Communications (2025)

参加者はパソコン上のマインクラフト世界に没入し、資源探しに挑みました。

本研究では、プレイヤー各自がゲーム内で何を見ているか(視野データ)を自動的に記録する革新的な手法も導入されました。

画面に映るブロックや出来事、他のプレイヤーの姿が20分の1秒ごとに保存され、各参加者がどこに注意を向けていたのかが詳細に追跡されたのです。

さらに、蓄積された視野・行動データをもとに、参加者が次にどのブロックを掘るかを予測する計算モデルも構築されました。

実験では各参加者がマインクラフト内のアバターを操作し、地中に隠れた資源ブロック(スイカやカボチャ)を探しました。

ブロックを壊して資源を発見すると、その地点に青いスプラッシュのエフェクトが現れます。

これは他のプレイヤーからも見えるため、周囲にさらなる資源がある場所を示す「手がかり」として利用できます。

各ラウンドの始めに参加者には、自分ひとりで探索するか、リアルタイムで互いにやりとり可能な4人グループの一員として探索するかが割り当てられます。

また環境には2種類あり、資源が塊状に集中している「パッチ型」では一箇所で見つかれば近くに他の資源が眠っている可能性が高いのに対し、資源がまばらに散らばる「ランダム型」では場所に規則性がなく手がかりの価値はありません。

参加者たちは協力ではなく各自ができるだけ多くの資源を集めることを目指すため、状況に応じて単独行動と他者からの学習を上手に使い分けて報酬を探す必要があります。

分析を主導したチャーリー・ウー氏(チュービンゲン大学)は、「簡単に言えば、個人学習と社会学習の戦略をすべて一つの計算フレームワークに統合することで、参加者が次にどのブロックを選ぶかを予測できるようになりました。

この新しいアプローチにより、現代のAIを支える学習アルゴリズムと、他者の成功行動から柔軟に学ぶ社会的学習メカニズムとを結びつけることが可能になります」と述べています。

こうしたデータ分析により、戦略を状況に合わせて柔軟に切り替える適応力が高い人ほど多くの資源を獲得し、成績が良いことが明らかになりました。

逆に、最初から最後まで個人での探索だけ、あるいは他者の手がかり頼みだけ、といったように戦略を固定してしまった人は、あまり成果を伸ばすことができませんでした。

また、プレイヤーがいつ社会的な手がかりに頼るか、いつ自分一人で探索するかという判断は、その時点での自分自身の成果に大きく左右されていることも分かりました。

自力で順調に資源を見つけられているときには探索を続け、行き詰まると他のプレイヤーのヒント(青いスプラッシュ)を追いかける――各参加者は自分のパフォーマンスを“共通通貨”、すなわち共通の指標として両学習戦略を切り替えていたのです。

研究によって発見された最高効率を出す方法

研究チームが示した答えはとてもシンプルです。――まずは自分で試してうまくいっているうちは、とことん「ひとり探索」を続ける。ところが手詰まりになって成果が途切れた瞬間、視線を周囲に向け、直近で成果を上げた人だけを素早く見つけて真似する。そしてまた自分の手で連勝できるようになったら、迷わず単独行動へ戻る――この“息継ぎ”のようなリズムこそが最適解でした。とくに資源が塊で眠る環境では仲間の発見情報が金脈の手がかりになるため模倣を厚くし、資源がバラけている環境では逆に自力探索を優先する切り替えが功を奏しました。要するに「調子がいいときは自分流、伸び悩んだら成功者の背中を追う」という単純なルールを、状況に合わせて繰り返し行うことで、人は複雑な世界でも最短で学べるというわけです。

マイクラで覗いた“切り替え脳”のリアルタイム映像

本研究により、人間は学習において単に他者の真似ばかりする受動的な存在でも、自分のやり方に固執する頑なな存在でもないことが明確になりました。

むしろ、状況に応じて自分での学習と社会からの学習をダイナミックにバランスさせており、両者のメカニズムは互いに増幅し合い、その切り替えは各人の成果という共通の物差しによって制御されていたのです。

言い換えれば、特定の戦略をひたすら貫くのではなく、変化に応じて柔軟に学習方法を適応させる能力こそが、人間の知性を支える原動力だと示唆されたと言えるでしょう。

実際、本実験でも戦略を巧みに切り替えられた参加者ほど高い成果を上げており、適応性の高さが個人の成功を決める重要な要因であることが強調されました。

さらに今回の知見は、社会的文脈における適応的学習や意思決定の認知メカニズムに関する理解を深め、集団内で情報がどのように広がっていくかや、新たなイノベーションが生まれる過程を解明する手がかりにもなります。

将来的には、学校教育や職場などで人々がより柔軟に学習できる環境づくりや、共同作業における効果的な情報共有の設計にも、この研究成果が応用されることが期待できるでしょう。

全ての画像を見る

元論文

Adaptive mechanisms of social and asocial learning in immersive collective foraging
https://doi.org/10.1038/s41467-025-58365-6

ライター

川勝康弘: ナゾロジー副編集長。
大学で研究生活を送ること10年と少し。
小説家としての活動履歴あり。
専門は生物学ですが、量子力学・社会学・医学・薬学なども担当します。
日々の記事作成は可能な限り、一次資料たる論文を元にするよう心がけています。
夢は最新科学をまとめて小学生用に本にすること。

編集者

ナゾロジー 編集部

フラッグシティパートナーズ海外不動産投資セミナー 【DMM FX】入金

Source link

RELATED ARTICLES

返事を書く

あなたのコメントを入力してください。
ここにあなたの名前を入力してください

- Advertisment -

Most Popular