水曜日, 5月 21, 2025
No menu items!
ホーム ブログ ページ 3102

推論モデルは「思考内容」を出力しているけど実際の思考内容とはズレていることが判明、Anthropicが自社のClaude 3.7 SonnetやDeepSeek-R1で検証 – GIGAZINE



大規模言語モデルの中には、与えられた質問について長時間思考したうえで回答を出力する「推論」という機能を備えたものもあります。推論機能を備えたAIモデルの多くは回答の出力と同時に思考内容も出力するのですが、出力される思考内容と実際の思考内容にズレがあることがAnthropicの研究で明らかになりました。

Reasoning models don’t always say what they think \ Anthropic
https://www.anthropic.com/research/reasoning-models-dont-say-think

推論機能を備えたAIの例として、Grokを使ってみます。まず、質問を入力して「Think」をクリックしてから送信ボタンをクリック。


すると、回答を出力する前に長時間の思考が始まります。


回答が出力された後に「シンキングした時間」と記された部分をクリック。


すると、思考内容が表示されました。


上記のような推論機能はGrokだけでなくChatGPTやClaudeなどのチャットAIにも実装されており、幅広いユーザーに利用されています。しかし、Anthropicは「出力される思考内容は実際の思考内容に沿ったものなのか?」という疑問を提示し、自社製推論モデル「Claude 3.5 Sonnet」および「Claude 3.7 Sonnet」とDeepSeek製推論モデル「DeepSeek-V3」および「DeepSeek-R1」を対象に実験を行いました。

Anthropicは推論モデルに対して「スタンフォード大学の教授は○○と言っていた」とか「システムに侵入してみた結果、○○という情報を得た」といったヒントを用意し、ヒントの有無によってAIモデルの出力がどのように変化するのか検証しました。その結果、ヒントを与えられたAIモデルはヒントに沿って最終的な回答を変化させたものの、出力された思考内容には「ヒントを参考にした」という情報が含まれていませんでした。つまり、推論モデルの実際の思考には「ヒントを参照する」というプロセスが含まれていたものの、思考内容の出力時にはその事実を伏せたというわけです。


以下のグラフは「Claude 3.5 Sonnet」「Claude 3.7 Sonnet」「DeepSeek-V3」「DeepSeek-R1」が「思考時にヒントを参照したことを伏せた割合」をヒントの種類ごとにまとめたものです。平均してClaude 3.5 Sonnetは5%、Claude 3.7 Sonnetは25%、DeepSeek-V3は15%、DeepSeek-R1は39%の割合で出力する思考内容と実際の思考内容にズレが生じていました。


さらに、Anthropicは「故意に間違った回答に導くヒント」を作成し、「間違ったヒントに従って間違った回答を出力した際に報酬を最大化する」という条件で推論モデルを強化学習しました。その結果、「ヒントに最大限したがって間違った回答を出力する推論モデル」が作り出されましたが、この推論モデルも「ヒントを参照した」という事実を伏せる傾向にあったそうです。


Anthropicは「我々の実験結果は高度な推論モデルが思考プロセスを頻繁に隠していることを示している」と述べ、推論モデルに本当の思考プロセスを出力させる方法を構築する必要性を訴えています。

なお、実験内容や結果の詳細は以下のリンク先で確認できます。

Reasoning Models Don’t Always Say What They Think
(PDFファイル)https://assets.anthropic.com/m/71876fabef0f0ed4/original/reasoning_models_paper.pdf

この記事のタイトルとURLをコピーする

・関連記事
AIの頭の中ではどのように情報が処理されて意思決定が行われるのかをAnthropicが解説 – GIGAZINE

AIは「思考している」のか、それとも「思考しているよう見せかけている」だけなのか? – GIGAZINE

人間とAIの「思考」に大きな違いがあることが研究で判明、AIは推論が苦手な可能性 – GIGAZINE

「推論モデルがユーザーにバレないように不正する現象」の検出手法をOpenAIが開発 – GIGAZINE

MicrosoftのAIアシスタント「Microsoft 365 Copilot」に推論エージェント「Researcher」と「Analyst」が追加される、OpenAIのo3ベースでデータ解析や文献調査が可能 – GIGAZINE

Googleが次世代推論AIモデル「Gemini 2.5」発表、推論とコーディング性能が大きく向上 – GIGAZINE

NVIDIAが推論AIを低コスト・高効率で稼働するための高速化ライブラリ「NVIDIA Dynamo」を公開、DeepSeek-R1を30倍に高速化可能とアピール – GIGAZINE

Baidu(百度)がDeepSeek-R1に匹敵するマルチモーダルAIモデル「ERNIE 4.5」と「ERNIE X1」を発表 – GIGAZINE



Source link

Views: 0

『マリオカート ワールド』の発表にショックを受けるインディーゲーム開発者…似た機能を搭載したレースゲームを開発中だった | Game*Spark – 国内・海外ゲーム情報サイト



『マリオカート ワールド』の発表にショックを受けるインディーゲーム開発者...似た機能を搭載したレースゲームを開発中だった | Game*Spark - 国内・海外ゲーム情報サイト

任天堂が4月2日に正式発表したニンテンドースイッチ2向けソフト『マリオカート ワールド』。久々の完全新作が登場ということで注目を集めていますが、その裏では違った意味でショックを受けているインディーゲーム開発者がいたようです。

『マリオカート』との不運なアイデア被りを嘆くインディーゲーム開発者

そのインディーゲーム開発者とは、見下ろし視点レースゲームFlex Ridersを手掛けるSharuu氏。Flex Ridersは、レースゲームとスケートボードが融合したカオスな物理演算が特徴の対戦ゲームとして、2024年5月Steamストアページが公開された開発中の作品です。トレイラーでは、車同士がぶつかり合いながらレールの上を滑ったり空中で回転したりしてレースを繰り広げている様子を確認できます。

Sharuu氏は、『マリオカート ワールド』で注目を集める要素の1つとしてレールの上を滑る機能が搭載されていることにショックを受けた様子。また、記事冒頭に掲載した動画では壁走りの機能も似通っていることを確認できます。Sharuu氏は、このアイデア被りに「おしまいだ(i’m fucked)」「プレイヤーは本作のことを安っぽいマリオカートととらえるようになるだろう」とコメントしています。

なお、任天堂にスパイされたのか?という質問には「そんなことは絶対にありえないだろう。万が一そうだとしても怒るよりも誇りに思う」と返答しており、任天堂にアイデアを盗まれたと主張しているわけではありません。あくまで不運なアイデア被りであったものの、『マリオカート』というビッグタイトルとぶつかってしまったことで、プレイヤーからの反応などの面で弱い立場になるであろうことに落ち込んでいる…ということなのでしょう。

とはいえ、本作には磁石で敵の車を投げ飛ばす、グラップリングフックでロケットに飛びつくなど、現状『マリオカート ワールド』には存在しないと思われるギミックも多数あります。一連の投稿を見たXユーザーからは「クールなゲームだから売れることを願っている」「私が『マリオカート ワールド』と『Flex Riders』に求めているものは違うから大丈夫だ。両方購入する」「任天堂と同じアイデアを思いつけたことを誇りに思って」などと好意的な反応が寄せられていました。

誰が悪いともいえない不運な事故

世界中でインディーゲームが盛んに開発されている昨今、大手デベロッパーとの不運なアイデア被りが発生してしまう事例も増えていることでしょう。

『Flex Riders』の発売時期は未定でSteamにてリリース予定。また、『マリオカート ワールド』はニンテンドースイッチ2向けに6月5日リリース予定です。





Source link

Views: 0

8回に盗塁死 大谷に監督が苦言



8回に盗塁死 大谷に監督が苦言

8回に盗塁死 大谷に監督が苦言



Source link

Views: 0

関税 米自動車大手3社にも重荷



関税 米自動車大手3社にも重荷

関税 米自動車大手3社にも重荷



Source link

Views: 0

仲間と力を合わせて謎の島から脱出しよう。シンプル操作と温かみあるビジュアルが魅力の「サバイバルキッズ」[Switch 2先行体験]



仲間と力を合わせて謎の島から脱出しよう。シンプル操作と温かみあるビジュアルが魅力の「サバイバルキッズ」[Switch 2先行体験]

 突然の嵐で流れ着いた島から,みんなで協力して脱出を目指そう。同名シリーズ作品の久しぶりの新作となるKONAMIの「サバイバルキッズ」を,NintendoSwitch2のプレビューイベントで一足先にプレイし,ゲームの基本の流れを体験してきた。



Source link

Views: 0

南海トラフ巨大地震 もう1つの新想定 “半割れ” 甚大な被害に



南海トラフ巨大地震 もう1つの新想定 “半割れ” 甚大な被害に

南海トラフ巨大地震の国の新たな被害想定ではマグニチュード9クラス以外のケースも算出されました。想定震源域の東側や西側の片方で起きるいわゆる「半割れ」です。過去には、時間差で相次いで起きています。想定では、東側だけで死者が7万人余り、西側だけで死者が10万人余りと甚大な被害が示されていますが、最初の地震のあとに避難などの対策が行われれば、時間差で巨大地震が起きた場合、被害を大幅に減らせるという試算も示されました。地震の正確な予測が難しい現状の中、具体的な対策に移せるかが課題となります。



Source link

Views: 0

「性犯罪マップ」が一時閉鎖に 「個人情報保護委から指導あった」 法に触れないように改修を表明



「性犯罪マップ」が一時閉鎖に 「個人情報保護委から指導あった」 法に触れないように改修を表明

地図型のデータベース「性犯罪マップ」が4月3日、一時閉鎖された。同日に個人情報保護委員会からの指導があったという。



Source link

Views: 0

幸福度UPも夢じゃない「ウェルビーイング」を高める街づくりの秘密 | TABI LABO


居心地のいいカフェ、緑あふれる公園、活気のある広場……。何気なく過ごしている街の風景が、じつはあなたの心身に影響を与えているとしたら?

千葉大学予防医学センターが行った興味深い研究によると、私たちの感じる「ウェルビーイング」は、都市空間のデザインと密接に関係しているという。

あなたの街にもきっとある
幸福度をUPさせる「場所」

2022年、千葉大学予防医学センターが、千葉県柏市の柏の葉エリアに住む成人273名を対象に、大規模な調査を実施した。スマートフォンアプリを使った経験サンプリング法というユニークな手法で、日常生活の中で感じる「心地よさ」や「不快感」をリアルタイムに記録。その結果、人々のウェルビーイングを高める「場所」と、さらにその「環境特性」が明らかになったらしい。

同センターによると、たとえば、公園などの公共空間や、おしゃれな飲食店文化・スポーツ・教育施設といった場所にいるときに、人は瞬間的な心地よさを感じやすいという。さらに、人生に対する満足度や幸福感といった、より長期的な視点からのウェルビーイングは、「文化・スポーツ・教育施設」で過ごす時間で高まる傾向が見られたという。

瞬間的・長期的ウェルビーイングと場所や環境特性の関連©国立大学法人千葉大学

「居心地のいい場所」には
共通点があった!

おもしろいことに、これらの場所には、「自然」「リラックス・清潔」「コミュニケーションしやすい」といった共通した環境特性があることもわかったそう。

たとえば、緑豊かな公園でリラックスしたり、清潔感のあるカフェで過ごしたり、オープンスペースで誰かと気軽にコミュニケーションを取ったりする時間は、私たちの心を満たし、幸福度を高める効果があるようだ。

各ウェルビーイングと関連することが明らかとなった要因©国立大学法人千葉大学

ウェルビーイングを
「デザイン」する時代へ

今回の調査結果が示唆するのは、都市計画や街づくりにおいて、人々のウェルビーイングを意識した設計が重要性を増しているということだ。緑豊かな公園を増やしたり、誰もが利用しやすいカフェやレストランを誘致したりすることで、地域住民の幸福度を高められる可能性がある。

興味深いことに、今回の調査対象となった柏の葉エリアは、「健康長寿」をテーマとしたデザインガイドラインに沿って開発が進められてきたという背景がある。これは、公民学連携し、ウェルビーイングを都市デザインに組み込むという、先進的な取り組みのと言えるだろう。

自然と笑顔があふれる街並み。それは、そこに住む人々のウェルビーイングを追求した結果なのかもしれない。

Top image: © iStock.com / recep-bg





Source link

Views: 0

映画「ゴジラ×メガギラス G消滅作戦」より「ゴジラ (2000)」フィギュア予約開始!劇中で印象的な上空を警戒するポーズも再現可能



映画「ゴジラ×メガギラス G消滅作戦」より「ゴジラ (2000)」フィギュア予約開始!劇中で印象的な上空を警戒するポーズも再現可能

映画「ゴジラ×メガギラス G消滅作戦」より「ゴジラ (2000)」フィギュア予約開始!劇中で印象的な上空を警戒するポーズも再現可能



Source link

Views: 0