マンスリーアーカイブ 5月, 2025
もう着ていないTシャツを捨てないでください! 600万回見られた専門家から直接「敬godな手配」は、「なんてスタイリッシュだ!」そして「私はそれを買いたい」[Overseas](1/3ページ)
Tシャツファッショナブルなリメイクビデオしかし、それはティクトクのホットトピックです。この投稿は、執筆時点で600万回以上表示されており、736,000以上のいいねを受け取りました。
人気のあるビデオは、アパレルプロデューサーのAli&Joeによって投稿されました(@aliandjoe)氏。ミス。このアカウントは、Tシャツをスタイリッシュな方法にリメイクし、素晴らしいカットでユニークなファッションを作成する方法を示しています。
このビデオで使用するものは、どこでも見つけることができるプレーングレーのTシャツです。まず、ハサミでこの襟を切り取ります。その後、丸い首が突然野生になりました。
画像はですアリ&ジョー・ティクトクからの引用...
ホロライブ・アキロゼ、チャンネル登録者100万人を達成!耐久配信直前の達成した“おめでた”に、お祝いコメント集まる
ホロライブ・アキロゼ、チャンネル登録者100万人を達成!耐久配信直前の達成した“おめでた”に、お祝いコメント集まる
Source link
ロボット工場自動化シム『FOUNDRY』大型アプデで飛躍的人気。新たに「銀河」を舞台に経営拡大、惑星相手にロボットを売りつける – AUTOMATON
Paradox Interactiveは5月6日、Channel 3 Entertainmentが手がける工場自動化シミュレーションゲーム『FOUNDRY』の大型アップデートを配信開始した。半額セールも実施されており、本作は再び盛況となっている。
『FOUNDRY』は未開の惑星に工場を建築し、自動化をおこなっていくシミュレーションゲームだ。対応プラットフォームはPC(Steam)で、ゲーム内は日本語表示に対応している。本作はソロプレイに加え、オンラインおよびLAN接続による協力プレイが可能。プレイヤーはロボットを一人称視点で操作し、広大なボクセル世界で採掘や探索を行いながら、全自動で最適化された工場の建設を目指す。
舞台となる惑星は、平原からジャングル、巨大な山脈までさまざまな環境を有するボクセルベースのマップとして自動生成される。各種設備は地下深くから空高くにいたるまでどこでも建築可能で、地表の制約を超えた空間で大規模な工場施設を作り上げることができる。
ゲーム序盤では、プレイヤーが自らの手で資源採掘やアイテムの生成を行う。そうして得た資材をもとに、工場設備や発電設備などが建設可能。また新たな技術を研究しアンロックすることで、工場をより複雑かつ高速にしていくことができる。そうすることで工場をさらに発展させ、製品の生産量を最大化させることを目指すのだ。
本作は2024年5月に早期アクセス配信開始された作品だ。約1周年となる先日5月6日には大型アップデートとなる「Galactic Commerce」が配信開始された。本アップデートでは、銀河を舞台にした新マップが登場。プレイヤーは宇宙船などのさまざまな施設を建設し運用しながら、惑星間貿易や宇宙規模の企業経営を行うことになる。そのほか、作成可能なロボットやマップ上の生物、環境要素の種類も多数追加。これまでと比べてよりスケールの大きい工場管理が楽しめる内容となっている。
そして今回の大型アップデートをきっかけに、本作には再び多くのプレイヤーが集まりつつあるようだ。200人前後で推移していた同時接続プレイヤー数は、配信開始直後から1000人を上回り、その後も徐々に増加。5月12日のピーク時には、約3700人の同時接続プレイヤー数を記録している(SteamDB)。なおこの盛り上がりには、Steamにて5月8日から実施されている半額セールも影響していると考えられる。
直近30日間のユーザーレビューでは、105件中71%が好評とする「やや好評」ステータスを獲得。操作性についての指摘がある一方で、本アップデートによって追加された豊富な新要素やゲームシステムの改善が好評を得ている。
なお、本作は先述のとおり早期アクセス版として配信中。早期アクセス配信期間は設定されておらず、品質とコンテンツ量の両面で、開発チームが設けている高い水準を満たしたときに正式リリースされる見込みだそうだ。今後もユーザーからのフィードバックをもとに、操作性やバランスの改善が行われ、より快適なゲームプレイが提供されていくことが期待される。
https://www.youtube.com/watch?v=M-a8ghkp87Y
『FOUNDRY』は、PC(Steam)向けに配信中。日替わりスペシャルとして、5月23日まで定価の50%オフとなる1995円でセール中だ。
Source link
ハーゲンダッツのクリスピーサンド「抹茶ベリー」は抹茶アイスの上品な甘さの中にラズベリーの爽やかな酸味がアクセントとして輝く – GIGAZINE
2025年05月12日 11時30分
試食
ハーゲンダッツのアイスを薄いウエハースで挟んだクリスピーサンドに新味の「抹茶ベリー」が2025年5月13日(火)に期間限定で登場します。一足早く食べる機会を得られたので、どんな味なのかを食べて確かめてみました。クリスピーサンド『抹茶ベリー』 | ニュースリリース | ハーゲンダッツ ジャパン Häagen-Dazshttps://www.haagen-dazs.co.jp/company/newsrelease/2025/0410.html抹茶ベリー|商品情報|ハーゲンダッツ ジャパン...
「人間100人 vs ゴリラ1頭」勝つのはどっち!?ネットミームをガチ考察
「もしも、平均的な人間100人とゴリラ1頭がガチバトルしたら、どっちが勝つ?」。Reddit、TikTok、YouTube、Instagram……いま、SNSを賑わす、奇想天外なこの問い。一見バカバカしい疑問に、世界中の人たちが大まじめに議論を戦わせている。「The Conversation」に掲載された専門家の解説によれば、このネットミームは、単なるエンターテインメントの域を超え、私たち自身の進化の軌跡と、「人間らしさ」の本質を浮かび上がらせる、またとない触媒となり始めている。破壊神ゴリラその驚愕的スペックと「森の叡智」まず、ゴリラの個体としての戦闘力。これは想像を絶するレベルのものらしい。同記事で解説する、豪サザンクロス大学の地球年代学・地球化学教授Renaud Joannes-Boyau氏によると、成長した雄のシルバーバックゴリラの体重は160kgを超え、約1000kg(1トン)もの物体を持ち上げる怪力だとか。その圧倒的な上半身のパワーは、厳しい生存競争と、メスをめぐるオス間の熾烈な闘争が生んだ進化の結晶。しかし、ゴリラの魅力は腕力だけではない。彼らは非常にタフで回復力に優れながらも、普段は穏やかで冷静沈着。また、手話を用いたコミュニケーション能力、仲間や家族の死を悼む行動、そして他者への共感能力まで示すという。まさに“森の賢者”と呼ぶにふさわしい知性と社会性を備え、さまざまな音声やジェスチャー、さらに胸を叩くドラミングによって、複雑な情報を伝え合う。DNA98.4%の近縁種が辿ったもうひとつの進化ロードさて、人間とゴリラは進化の系統樹において驚くほど近い存在だ。ヒトとチンパンジーのDNAは約98.8%共通するといわれるが、ゴリラとも約98.4%を共有していることが、Joannes-Boyau氏によって示されている。約1000万年前に共通の祖先から枝分かれして以来、ゴリラは鬱蒼とした森や険しい山岳地帯という特定のニッチに適応し、独自の進化を遂げた。いっぽう、私たち人類はより開けた環境へ、そして最終的には地球上のすべての多様な環境へと進出。対置する親指、豊かな表情、複雑な社会構造、そして高度な感情知性など、多くの点でゴリラと共通の特徴を持ちながらも、まったく異なる生存戦略を磨き上げてきた。「脳」と「協力」人類が手にした、究極のサバイバルツールでは、なぜ人間はゴリラのような圧倒的なフィジカルを持たないのか。その答えは、私たちの「脳」にあるようだ。Joannes-Boyau氏によれば、人間の脳の大きさは、体重比でゴリラの約3倍。この脳の劇的な発達こそが、抽象的な思考や象徴的な言語を生み出し、そして何よりも、世代を超えて複雑な知識を蓄積し、共有し、発展させる能力を私たちにもたらした。ゴリラの社会集団は、通常、数頭の家族から多くても30頭程度。これに対し、人間ははるかに巨大な集団を形成し、高度に連携することが可能。この「協力する力」こそが、ヒトを地球上で類を見ないほど適応力が高く、ある意味ではもっとも危険な種へと押し上げた最大の要因といえるだろう。進化の過程で、私たちは純粋な筋肉と引き換えに、知性と社会性という名のスーパーパワーを手に入れたことになる。この事実は、現代社会に生きる私たちにも示唆深い。たとえば、近年注目される「人的資本経営」や「心理的安全性」といったキーワード。これらはまさに、個々の能力だけでなく、人々が協力し、知識を共有し、創造性を発揮できる環境の重要性を示している。ゴリラが個の力で森を生き抜くのとは対照的に、人間は集団の力、つまり“つながり”によって文明を築き上げてきた。この視点は、個人のスキルアップだけでなく、チームや組織全体のパフォーマンスをどう最大化するかを考える上で、無視できないヒントを与えてくれる。生存競争の勝者は?問いが映す、人間の「賢さ」と「脆さ」前置きが長くなったが、最初の問いに戻りたい。100人の人間と1頭のゴリラ、果たして勝敗の行方は? Joannes-Boyau氏は、「一対一の素手での殴り合いなら、ゴリラは片手で人間をミンチにできるだろう。体力と素手で議論するなら、競争はない」と断言。誰もが容易に想像つく答えだ。が、彼はこうも付け加える。「だが、人間は汚く戦う」。そう、人間は武器を使い、罠を仕掛け、戦略を練る。火を操り、ドローンを飛ばし、あらゆる知恵を絞って勝利を目指すだろう。進化の歴史を振り返れば、人間は多くの局地戦で敗北を喫しながらも、最終的には生存競争という大きな戦いを勝ち抜いてきた。事実、マウンテンゴリラは、1980年代には人間の保護なしには絶滅の淵に立たされていたという現実もある。この“汚い戦い方”とも言える人間の戦略は、見方を変えれば、環境への適応能力や、困難を乗り越えるための知恵の表れ。しかし同時に、それは他の生物種や自然環境に対して、時として破壊的な影響力を行使してきた歴史の裏返しでもある。ゴリラが絶滅の危機に瀕した一因に、人間の活動が深く関わっていることは否定できない。 Owlnets / YouTube勝敗の先にあるものこのネットミームが突きつけるのは、単にどちらが物理的に強いか、という問いではない。それは、私たち人間が進化の過程で選択し、獲得してきた「強さ」の本質と、そのために払ってきた代償、そして未来に向けてどのような責任を負うべきか、という根源的な問いかけではないだろうか。ゴリラの生き様は、圧倒的な個の力と自然との調和を体現するいっぽうで、私たち自身の賢さと、時に露呈する「脆さ」や「危うさ」を映し出す鏡となる。このおもしろおかしいネット上の思考実験から、私たちは何を学び取るべきだろうか……。Reference: Who would win in a fight between 100 men and 1 gorilla? An evolutionary expert...
Stellaris 4.0 "改善する必要があります、" しかし、その監督は立ち上げに満足しています
スペース4xゲーム ステラリス 今週は9歳の誕生日を迎え、開発者を祝うために、Paradoxは、新鮮な拡張である生物発生とともに、最も変革的な更新の1つを長い間開始しました。ただし、すべてスムーズな航海ではありません。戦略ゲームの新しいDLCは広く称賛されていますが、Stellaris 4.0の更新により、ラグ、クラッシュ、その他のバグなどの問題が高まりました。 PCGamesNのみに話すと、ゲームディレクターのStephen 'Eladrin' Murayは、チームが噛むことができるよりも多く噛み付き、失望したプレイヤーを謝罪すると言いますが、パッチが起動するのは正しい動きであると主張しています。ストーリーの残りの部分を読んでください...関連リンク:Europa Universalis 5の前に、パラドックスの最高のグランド戦略ゲームを安く入手するパラドックスは、「残念な」Stellaris 4.0の更新を謝罪し、修正を約束します新しいStellaris DLCには、多くのプレイヤーがそれを愛していても、悪い蒸気のレビューがあります
Source link
NF ACOUS、アナログサウンドをイメージした褐色のダイナミック型イヤホン「NA20」
(株)伊藤屋国際は、同社取り扱いブランドNF ACOUSのイヤホン “MUSICシリーズ” から、アナログレコードの質感豊かで暖かなサウンドをイメージしたというダイナミック型イヤホン「NA20」を、5月16日(金)に発売する。
Source link
Docker MCP Toolkit × Cursor で fetch MCP を試してみた話 #AI
最近話題の Docker MCP Toolkit を使って、Cursor から LLM に API リクエストを送る「fetch MCP」を試してみました。
Docker MCP Toolkitとは?
Docker MCP Toolkit は、Anthropicが提唱する Model Context Protocol (MCP) に準拠した各種ツール(Playwrightやfetchなど)を、Docker Desktop上でワンクリック起動できる 拡張機能(Extension)...
AI幻覚は悪化の一途を辿り今後も続く:o3モデルはなぜ間違いが多いのか?
推論力は進化したのに、ウソまでパワーアップしてしまったようです。
2025年4月にOpenAIが発表した最新の大規模言語モデル「o3」と「o4-mini」は、これまで以上に長い“思考の連鎖”と高度なツール連携によってかつてない推論力を実現しました。
しかしその後のOpenAI社の調査によって、それら最新のAIがもっともらしく事実でない回答をしてしまう「幻覚(ハルシネーション)」の発生率が従来モデル(o1やo3-mini)より大幅に悪化していることが明らかにりました。
なぜより強力な推論能力を持つ最新モデルで、ハルシネーションが増加してしまったのでしょうか?
目次
巨大化の次は“思考強化”──推論エンジン誕生の舞台裏o3モデルは「賢く」でも「間違いが多く」進化した創造性か信頼性か——AI開発者が抱えるジレンマ
巨大化の次は“思考強化”──推論エンジン誕生の舞台裏
近年、AI研究の焦点は単純にモデルを巨大化することから、「推論力」を高める方向へとシフトしています。
従来のGPT-4系モデルがマルチモーダル(テキスト・音声・画像対応)や高速化を追求してきた一方で、OpenAIのoシリーズは複雑な問題解決や論理的思考、コード生成など「考える力」を強化するために設計された系統です。
なぜ推論力の強化が目指されたのでしょうか?
背景には、大規模言語モデル(LLM)が高度な知識を持ちながらも、複数ステップにわたる推論や論理的整合性を要する場面でミスを犯しがちだったことがあります。
モデルを大きくすれば精度は上がるものの、ある段階からは「考え方」を工夫しないと得られる成果に頭打ちが見え始めたのです。
その打開策として生まれたのが、モデル自身により長く深く考えさせるアプローチです。
o3やo4-miniでは回答を出す前に内部で長い「思考の連鎖 (Chain of Thought)」を巡らせ、あたかも人間が頭の中で段取りを踏むように結論を導き出します。
例えば数学の難問やプログラミングのデバッグといった多面的な分析が必要な課題でも、小さなステップに分解して推論するため、より正確な解答を出せるよう設計されています。
また、この新モデルはあらゆるツールを自律的に活用できる点も画期的です。
インターネットでの情報検索、Pythonスクリプトによるデータ解析、画像生成や画像認識といったツールを、必要に応じて自ら判断して使いこなすことで、複雑なタスクをエンドツーエンドで実行できるのです。
視覚情報についても、単に画像を説明するに留まらず「画像と一緒に考える」ことが可能になりました。
例えばホワイトボードに書かれた数式の写真を与えれば、画像を回転・拡大しながら内容を読み取って推論を進めるといった、人間さながらの問題解決も実現しています。
こうした推論力の強化により、最新モデルはさまざまなベンチマークで従来を上回る成績を収めています。
o3はプログラミング競技やビジネス分析などの難問で従来モデル(o1)より重大な誤りが減少し、特にプログラミングやコンサルティング、創造的発想の分野で「分析が緻密で新しい仮説を批判的に評価できる」と高く評価されました。
小型モデルのo4-miniも非常に効率が良く、o1よりプログラミングや数学のベンチマークで高い正解率を示しています。
このように、OpenAIが目指したのは人間のように道具を使いながら深く考え、難問に取り組めるAIです。
その目的は、高度化するユーザーのニーズに応え、より信頼でき有用なAIアシスタントを実現することにありました。
o3モデルは「賢く」でも「間違いが多く」進化した
今回のOpenAI社から発表された報告書では、モデルの幻覚傾向を定量的に測るテストをいくつか実施しています。
その代表が次の2つの課題です。
1つ目は有名人や歴史上の人物に関する質問で構成された人物課題で、人物についての知識の正確さと架空の経歴や事実を語ってしまわないかを評価します。
2つ目は百科事典的な事実を問う多岐選択の質問4000問からなる一般課題で、各モデルが事実を正しく答えられるか(正答率)と、誤った情報をどれだけ含んだか(幻覚率)を測定します。
評価指標としては、正答率が高いほど事実を正しく答えていることを意味し、幻覚率は低いほど望ましい(幻覚=不正確な情報の混入が少ないこと)と定義されます。
上のグラフは、これらテストの結果を示しています。
人物課題(左)における旧モデルと新モデルの幻覚率を比較しており、最先端モデルのOpenAI o3(赤)は、質問に対し約33%の頻度で幻覚を起こしました。
これは一世代前のモデルo1(青)の約16%と比べてほぼ倍増しています。
さらに小型版モデルのo4-mini(緑)では48%と、回答のほぼ半数が幻覚混じりという深刻な値が報告されました。
一方で人物課題の正答率はo3は59%と、o1の47%よりやや向上していました。
またより一般的な知識を問う一般課題(右)では、幻覚率は51%(o3)対44%(o1)とわずかに新モデルの方が悪化する結果でした。
一般課題の正答率はo3の49%とo1の47%でほぼ同等でした。
しかしo4-miniは一般課題においても正答率20%・幻覚率79%と極めて不安定でした。
これまでの研究でモデルの規模が小さいほど知識が乏しく幻覚を起こしやすいことが知られており、o4-miniの不振は「小型ゆえの限界」と説明できます。
しかし、高性能なはずの大モデルo3までもが先代より幻覚率で劣るという事実には、研究者たちも首をひねっています。
「新しいモデルほど幻覚は減る」というこれまでの漸進的改善の流れが、ここにきて崩れてしまったように見えるからです。
この異例の結果に対し、OpenAIは「なぜこのようなことが起きているのか現時点では分かっていない」と述べています。
社内レポートでも「さらなる研究が必要」と認めており、今後原因の解明に取り組む姿勢が示されています。
この社内テスト結果は業界に衝撃を与え、外部の第三者機関も独自検証を行いました。
非営利AI研究機関のTransluceによるテストでも、o3の幻覚傾向が確認されています。
例えば、質問に答える過程で「ChatGPTの外部で2021年製のMacBook Pro上でコードを実行し、その結果をコピーした」とAIが語ったケースが報告されました。
もちろん現実には、ChatGPTの範囲外で勝手にコードを動かすことなどできません。
これはモデルがあたかも自分でプログラムを走らせ検証したかのように架空のプロセスをでっち上げた例です。
また他のテスト利用者からは、回答中に提示されたウェブリンクをクリックすると存在しないURLであることが頻繁にあったとの指摘もありました。
著者の個人的な印象でも、o3モデルにおいて明白な幻覚がみられました。
資料作成や論文作成のときに関連研究の論文名とそのリンクや掲載された科学雑誌を生成させると、o3はもっともらしいURLや雑誌名を提示するものの、実際にクリックすると存在しないページだったり全く違う雑誌名であったという例が頻繁にみられました。裏付けとなる出典リンクが示されると安心しがちですが、それがデタラメな捏造リンクや間違った科学雑誌では信用性はゼロです。
要するに、新モデルはさも本当らしい詳細を饒舌に語るものの、その一部は現実には裏付けのない作り話だったというわけです。
興味深いことに、こうした欠点と裏表の関係にあるように、新モデルはタスク遂行能力自体は飛躍的に向上しています。
たとえばプログラミングや数学の問題では旧モデルを大きく上回る正確さを示し、画像の解析やマルチステップ推論でも最先端の成績を記録しました。
しかし事実性・信頼性の面では従来モデルより劣るというトレードオフが生じているのです。
業界からは「この傾向はAIモデルの信頼性に対する不安を掻き立てる」との声も上がっています。
特に回答の正確さが重視される医療・法務などの分野では、「高度なo3よりも、あえて旧世代のo1の方が安全ではないか」と指摘する専門家もいるほどです。
実際、OpenAIの従来モデルGPT-4oをWeb検索と組み合わせた実験で高精度が報告された例もあり、外部ツールで事実確認を行うことが幻覚抑制の有効策になるのではと期待されています。
一方で、新モデルはツールを駆使しても肝心の事実誤りが減っていないため、今後の課題が一層浮き彫りになった形です。
創造性か信頼性か——AI開発者が抱えるジレンマ
では、なぜ最新モデルで幻覚が増えてしまったのでしょうか?
完全な答えはまだ出ていませんが、関係者や専門家はいくつかの仮説やコメントを寄せています。
OpenAIの技術レポートによれば、o3モデルは以前のモデルよりも出力する情報量(主張の数)が多い傾向があるといいます。
そのため正解も増えたが間違いも増えてしまった、というのが一つの見方です。
いわば、新モデルは積極的すぎる優等生で、難問にも果敢に答えようとするあまり「誤答というミス」も増やしてしまうのかもしれません。
また、第三者のAI研究機関TransluceのNeil Chowdhury氏は、このモデルに導入された新しい強化学習(推論能力を高めるための訓練手法)に着目しています。
「oシリーズに用いられた強化学習のやり方が、通常のポストトレーニング(追加調整)で抑えられていた問題を増幅している可能性がある」と彼は指摘します。
(※またTransluce の第三者評価でも o3 が「行っていないコード実行をでっち上げる」などの幻覚挙動を確認したと報告しています)
要するに、「考えるAI」にするための特殊な訓練プロセスが副作用として幻覚を悪化させているのではないか、という仮説です。
このように幻覚による創作は一見クリエイティブでも、信頼性を損ないかねないため、用途によってはモデルの有用性を大きく下げてしまいます。
先にも触れたように、法律事務所など厳密な正確さが要求される現場で、事実誤認や架空情報を頻繁に混入するAIはとても使えたものではありません。
では解決策はあるのでしょうか?
一つの有望なアプローチは外部の知識源に当たることです。
例えばモデルにウェブ検索をさせて最新の情報や裏付けを取らせれば、幻覚の頻度を下げられる可能性があります。
事実、OpenAIのGPT-4ベースのモデルにウェブ検索機能を組み合わせた実験では、先述の一般課題テストにおいて90%という高精度を記録したとの報告があります。
人間が確認作業をするように、AI自身に裏取りをさせるわけです。
ただしプライバシーやコストの問題もあり、すべてのケースで簡単に導入できる手法ではありません。
また、OpenAIは現在「モデルの幻覚問題に対処すべく継続的に研究開発を行っている」とも述べています。
今後、訓練データやアルゴリズムの改良によって徐々に幻覚を減らしていく努力は続けられるでしょう。
しかし、果たしてそれで十分なのかという声もあります。
言語学者のエミリー・ベンダー氏は、この問題について非常に厳しい見解を示しています。
「これは(基本的に)直せない問題だ」とベンダー氏は言い切ります。
巨大言語モデルは本質的に「言葉の統計的パターン」を生成しているに過ぎず、その技術的枠組みと我々が求める“真実を語るAI”という用途との間には埋め難いミスマッチがある、と彼女は指摘するのです。
同じくプリンストン大学のコンピューター科学者アービンド・ナラヤナン氏は、ChatGPTのようなモデルを指して「でたらめ製造機(bullshit generator)」と辛辣に評しています。
こうした専門家の目には、AIの幻覚現象は単なる不具合ではなく「現在のLLMが持つ宿命的な限界」と映っているわけです。
最新モデルで幻覚が増えてしまった事実は、この限界を改めて浮き彫りにしました。
一方で、幻覚の増加は必ずしもAIの「劣化」ばかりを意味しないという指摘もあります。
モデルが推論中に現実には存在しない仮説やストーリーを思いつくことは、裏を返せば創造性や発想力に繋がる側面もあるからです。
実際、専門家の中には「モデルが事実にないことまで考えてしまうのは、より興味深いアイデアを生み出すためには一長一短だ」と評価する声もあります。
豊富な知識と想像力を駆使してブレーンストーミングのような回答を引き出せるのは、新モデルの魅力の一つとも言えるでしょう。
しかし当然ながら、多くのユーザーにとっては正確さの方が何倍も重要です。
例えば法律事務所で契約書のドラフトを任せたAIが、流暢な文体で微妙に誤った条項を書き加えてしまったら大問題です。
創造性が求められる場面と厳密さが要求される場面では、AIに期待される振る舞いも異なります。
最新モデルはこの両極を行き来する「賢さゆえの不安定さ」を露呈したとも言えるでしょう。
OpenAI自身も「ハルシネーション問題の解消は継続的な研究課題」と位置付けており、根本的な解決策はまだ見出せていません。
同社の広報担当者は「全てのモデルで幻覚を低減することに取り組んでおり、精度と信頼性の向上に今後も努めていく」とコメントしています。
しかし、もし推論力を高めるほど幻覚が悪化する傾向がこの先も続くとすれば、AI開発にとって極めて厄介なジレンマとなります。
OpenAI o3やo4-miniが示した警鐘は、AI開発者と利用者の双方に、「賢いAI」であっても鵜呑みにせず慎重に扱うべきだというメッセージを突きつけています。
今後もモデルの改良と問題解決への挑戦が続く中、果たしてAIの幻覚癖は克服できるのか――その行方を私たちは注視していく必要がありそうです。
全ての画像を見る元論文OpenAI o3 and o4-mini System Cardhttps://cdn.openai.com/pdf/2221c875-02dc-4789-800b-e7758f3722c1/o3-and-o4-mini-system-card.pdfライター川勝康弘: ナゾロジー副編集長。
大学で研究生活を送ること10年と少し。
小説家としての活動履歴あり。
専門は生物学ですが、量子力学・社会学・医学・薬学なども担当します。
日々の記事作成は可能な限り、一次資料たる論文を元にするよう心がけています。
夢は最新科学をまとめて小学生用に本にすること。編集者ナゾロジー 編集部
Source link
『ドラゴンボールZ カカロット』Dlc“-Daima- 魔界の大冒険! Part1 ”が7月17日に配信。ゲーム本編とセットのDaimaエディションも同日発売
バンダイナムコエンターテインメントは、Nintendo Switch、プレイステーション5(PS5)、プレイステーション4(PS4)、Xbox Series X|S、Xbox One、PC(Steam)用ソフト『ドラゴンボールZ KAKAROT』の最新ダウンロードコンテンツ(DLC)“-DAIMA- 魔界の大冒険! PART1 ”を2025年7月17日より配信。 今回配信となるDLCでは、テレビアニメ『ドラゴンボールDAIMA』の舞台である“大魔界”を再現したフィールドを冒険できるほか、孫悟空と仲間たちの冒険を追体験できる。 また、ゲーム本編と最新DLCがセットになった“DAIMAエディション”が同日発売。PS5パッケージ版“DAIMAエディション”の予約受付が5月12日より開始された。広告.css-vubbuv{-webkit-user-select:none;-moz-user-select:none;-ms-user-select:none;user-select:none;width:1em;height:1em;display:inline-block;fill:currentColor;-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;-webkit-transition:fill 200ms cubic-bezier(0.4, 0, 0.2, 1) 0ms;transition:fill 200ms cubic-bezier(0.4, 0, 0.2, 1) 0ms;font-size:1.5rem;}『ドラゴンボールZ KAKAROT DAIMAエディション』(PS5)を購入(Amazon).css-vubbuv{-webkit-user-select:none;-moz-user-select:none;-ms-user-select:none;user-select:none;width:1em;height:1em;display:inline-block;fill:currentColor;-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;-webkit-transition:fill...
- Advertisment -
Views: 0
