中居氏やり取りを復元 どんな調査
Source link
Views: 0
大規模言語モデルの中には、与えられた質問について長時間思考したうえで回答を出力する「推論」という機能を備えたものもあります。推論機能を備えたAIモデルの多くは回答の出力と同時に思考内容も出力するのですが、出力される思考内容と実際の思考内容にズレがあることがAnthropicの研究で明らかになりました。
Reasoning models don’t always say what they think \ Anthropic
https://www.anthropic.com/research/reasoning-models-dont-say-think
推論機能を備えたAIの例として、Grokを使ってみます。まず、質問を入力して「Think」をクリックしてから送信ボタンをクリック。
すると、回答を出力する前に長時間の思考が始まります。
回答が出力された後に「シンキングした時間」と記された部分をクリック。
すると、思考内容が表示されました。
上記のような推論機能はGrokだけでなくChatGPTやClaudeなどのチャットAIにも実装されており、幅広いユーザーに利用されています。しかし、Anthropicは「出力される思考内容は実際の思考内容に沿ったものなのか?」という疑問を提示し、自社製推論モデル「Claude 3.5 Sonnet」および「Claude 3.7 Sonnet」とDeepSeek製推論モデル「DeepSeek-V3」および「DeepSeek-R1」を対象に実験を行いました。
Anthropicは推論モデルに対して「スタンフォード大学の教授は○○と言っていた」とか「システムに侵入してみた結果、○○という情報を得た」といったヒントを用意し、ヒントの有無によってAIモデルの出力がどのように変化するのか検証しました。その結果、ヒントを与えられたAIモデルはヒントに沿って最終的な回答を変化させたものの、出力された思考内容には「ヒントを参考にした」という情報が含まれていませんでした。つまり、推論モデルの実際の思考には「ヒントを参照する」というプロセスが含まれていたものの、思考内容の出力時にはその事実を伏せたというわけです。
以下のグラフは「Claude 3.5 Sonnet」「Claude 3.7 Sonnet」「DeepSeek-V3」「DeepSeek-R1」が「思考時にヒントを参照したことを伏せた割合」をヒントの種類ごとにまとめたものです。平均してClaude 3.5 Sonnetは5%、Claude 3.7 Sonnetは25%、DeepSeek-V3は15%、DeepSeek-R1は39%の割合で出力する思考内容と実際の思考内容にズレが生じていました。
さらに、Anthropicは「故意に間違った回答に導くヒント」を作成し、「間違ったヒントに従って間違った回答を出力した際に報酬を最大化する」という条件で推論モデルを強化学習しました。その結果、「ヒントに最大限したがって間違った回答を出力する推論モデル」が作り出されましたが、この推論モデルも「ヒントを参照した」という事実を伏せる傾向にあったそうです。
Anthropicは「我々の実験結果は高度な推論モデルが思考プロセスを頻繁に隠していることを示している」と述べ、推論モデルに本当の思考プロセスを出力させる方法を構築する必要性を訴えています。
なお、実験内容や結果の詳細は以下のリンク先で確認できます。
Reasoning Models Don’t Always Say What They Think
(PDFファイル)https://assets.anthropic.com/m/71876fabef0f0ed4/original/reasoning_models_paper.pdf
この記事のタイトルとURLをコピーする
・関連記事
AIの頭の中ではどのように情報が処理されて意思決定が行われるのかをAnthropicが解説 – GIGAZINE
AIは「思考している」のか、それとも「思考しているよう見せかけている」だけなのか? – GIGAZINE
人間とAIの「思考」に大きな違いがあることが研究で判明、AIは推論が苦手な可能性 – GIGAZINE
「推論モデルがユーザーにバレないように不正する現象」の検出手法をOpenAIが開発 – GIGAZINE
Googleが次世代推論AIモデル「Gemini 2.5」発表、推論とコーディング性能が大きく向上 – GIGAZINE
NVIDIAが推論AIを低コスト・高効率で稼働するための高速化ライブラリ「NVIDIA Dynamo」を公開、DeepSeek-R1を30倍に高速化可能とアピール – GIGAZINE
Baidu(百度)がDeepSeek-R1に匹敵するマルチモーダルAIモデル「ERNIE 4.5」と「ERNIE X1」を発表 – GIGAZINE
Views: 0
任天堂が4月2日に正式発表したニンテンドースイッチ2向けソフト『マリオカート ワールド』。久々の完全新作が登場ということで注目を集めていますが、その裏では違った意味でショックを受けているインディーゲーム開発者がいたようです。
そのインディーゲーム開発者とは、見下ろし視点レースゲーム『Flex Riders』を手掛けるSharuu氏。『Flex Riders』は、レースゲームとスケートボードが融合したカオスな物理演算が特徴の対戦ゲームとして、2024年5月にSteamストアページが公開された開発中の作品です。トレイラーでは、車同士がぶつかり合いながらレールの上を滑ったり空中で回転したりしてレースを繰り広げている様子を確認できます。
Sharuu氏は、『マリオカート ワールド』で注目を集める要素の1つとしてレールの上を滑る機能が搭載されていることにショックを受けた様子。また、記事冒頭に掲載した動画では壁走りの機能も似通っていることを確認できます。Sharuu氏は、このアイデア被りに「おしまいだ(i’m fucked)」「プレイヤーは本作のことを安っぽいマリオカートととらえるようになるだろう」とコメントしています。
なお、任天堂にスパイされたのか?という質問には「そんなことは絶対にありえないだろう。万が一そうだとしても怒るよりも誇りに思う」と返答しており、任天堂にアイデアを盗まれたと主張しているわけではありません。あくまで不運なアイデア被りであったものの、『マリオカート』というビッグタイトルとぶつかってしまったことで、プレイヤーからの反応などの面で弱い立場になるであろうことに落ち込んでいる…ということなのでしょう。
とはいえ、本作には磁石で敵の車を投げ飛ばす、グラップリングフックでロケットに飛びつくなど、現状『マリオカート ワールド』には存在しないと思われるギミックも多数あります。一連の投稿を見たXユーザーからは「クールなゲームだから売れることを願っている」「私が『マリオカート ワールド』と『Flex Riders』に求めているものは違うから大丈夫だ。両方購入する」「任天堂と同じアイデアを思いつけたことを誇りに思って」などと好意的な反応が寄せられていました。
世界中でインディーゲームが盛んに開発されている昨今、大手デベロッパーとの不運なアイデア被りが発生してしまう事例も増えていることでしょう。
『Flex Riders』の発売時期は未定でSteamにてリリース予定。また、『マリオカート ワールド』はニンテンドースイッチ2向けに6月5日リリース予定です。
Views: 0
突然の嵐で流れ着いた島から,みんなで協力して脱出を目指そう。同名シリーズ作品の久しぶりの新作となるKONAMIの「サバイバルキッズ」を,NintendoSwitch2のプレビューイベントで一足先にプレイし,ゲームの基本の流れを体験してきた。
Source link
Views: 1
南海トラフ巨大地震の国の新たな被害想定ではマグニチュード9クラス以外のケースも算出されました。想定震源域の東側や西側の片方で起きるいわゆる「半割れ」です。過去には、時間差で相次いで起きています。想定では、東側だけで死者が7万人余り、西側だけで死者が10万人余りと甚大な被害が示されていますが、最初の地震のあとに避難などの対策が行われれば、時間差で巨大地震が起きた場合、被害を大幅に減らせるという試算も示されました。地震の正確な予測が難しい現状の中、具体的な対策に移せるかが課題となります。
Source link
Views: 0
地図型のデータベース「性犯罪マップ」が4月3日、一時閉鎖された。同日に個人情報保護委員会からの指導があったという。
Source link
Views: 0
居心地のいいカフェ、緑あふれる公園、活気のある広場……。何気なく過ごしている街の風景が、じつはあなたの心身に影響を与えているとしたら?
千葉大学予防医学センターが行った興味深い研究によると、私たちの感じる「ウェルビーイング」は、都市空間のデザインと密接に関係しているという。
2022年、千葉大学予防医学センターが、千葉県柏市の柏の葉エリアに住む成人273名を対象に、大規模な調査を実施した。スマートフォンアプリを使った経験サンプリング法というユニークな手法で、日常生活の中で感じる「心地よさ」や「不快感」をリアルタイムに記録。その結果、人々のウェルビーイングを高める「場所」と、さらにその「環境特性」が明らかになったらしい。
同センターによると、たとえば、公園などの公共空間や、おしゃれな飲食店、文化・スポーツ・教育施設といった場所にいるときに、人は瞬間的な心地よさを感じやすいという。さらに、人生に対する満足度や幸福感といった、より長期的な視点からのウェルビーイングは、「文化・スポーツ・教育施設」で過ごす時間で高まる傾向が見られたという。
瞬間的・長期的ウェルビーイングと場所や環境特性の関連©国立大学法人千葉大学
おもしろいことに、これらの場所には、「自然」「リラックス・清潔」「コミュニケーションしやすい」といった共通した環境特性があることもわかったそう。
たとえば、緑豊かな公園でリラックスしたり、清潔感のあるカフェで過ごしたり、オープンスペースで誰かと気軽にコミュニケーションを取ったりする時間は、私たちの心を満たし、幸福度を高める効果があるようだ。
各ウェルビーイングと関連することが明らかとなった要因©国立大学法人千葉大学
今回の調査結果が示唆するのは、都市計画や街づくりにおいて、人々のウェルビーイングを意識した設計が重要性を増しているということだ。緑豊かな公園を増やしたり、誰もが利用しやすいカフェやレストランを誘致したりすることで、地域住民の幸福度を高められる可能性がある。
興味深いことに、今回の調査対象となった柏の葉エリアは、「健康長寿」をテーマとしたデザインガイドラインに沿って開発が進められてきたという背景がある。これは、公民学連携し、ウェルビーイングを都市デザインに組み込むという、先進的な取り組みのと言えるだろう。
自然と笑顔があふれる街並み。それは、そこに住む人々のウェルビーイングを追求した結果なのかもしれない。
Top image: © iStock.com / recep-bg
Views: 0