ホームニュースAIニュースAIモデルはまだソフトウェアをデバッグするのに苦労している、とMicrosoftの調査によると

AIモデルはまだソフトウェアをデバッグするのに苦労している、とMicrosoftの調査によると

2025年4月11日

3

OpenAI、人類、およびその他のトップAIラボのAIモデルは、プログラミングタスクを支援するためにますます使用されています。 Google CEOのSundar Pichai 10月に言った会社の新しいコードの25％がAIとMeta CEO Mark Zuckerbergによって生成されています野心を表明しましたソーシャルメディアの巨人内にAIコーディングモデルを広く展開します。

しかし、今日の最高のモデルのいくつかでさえ、経験豊富な開発者をつまずかないソフトウェアのバグを解決するのに苦労しています。

a 新しい研究 MicrosoftのR＆D部門であるMicrosoft Researchから、人類を含むモデルが明らかにしていますクロード3.7ソネットそしてOpenai’s o3-mini、 SWE-Bench Liteと呼ばれるソフトウェア開発ベンチマークで多くの問題をデバッグできません。結果は、それにもかかわらず、落ち着いたリマインダーです大胆な発音 Openaiのような企業からAIは、コーディングなどのドメインの人間の専門家に依然として一致していません。

この調査の共著者は、Pythonデバッガーを含む多くのデバッグツールにアクセスできる「単一のプロンプトベースのエージェント」のバックボーンとして9つの異なるモデルをテストしました。彼らは、このエージェントに、SWE-Bench Liteからの300のソフトウェアデバッグタスクのキュレーションセットを解決することを任命しました。

共著者によると、より強力で最近のモデルを装備している場合でも、エージェントはデバッグタスクの半分以上を正常に完了することはめったにありません。 Claude 3.7 Sonnetの成功率は最も高く（48.4％）、OpenaiのO1（30.2％）、O3-Mini（22.1％）が続きました。

Microsoft AIデバッグベンチマーク — 研究からのチャート。「相対的な増加」とは、デバッグツールを装備することから得られたブーストモデルを指します。**画像クレジット：**マイクロソフト

なぜ圧倒的なパフォーマンスがあるのですか？一部のモデルは、利用可能なデバッグツールを使用するのに苦労し、さまざまなツールがさまざまな問題にどのように役立つかを理解しました。しかし、共著者によると、より大きな問題はデータ不足でした。彼らは、現在のモデルのトレーニングデータに「順次意思決定プロセス」、つまり人間のデバッグトレースを表す十分なデータがないと推測しています。

「私たちは、トレーニングまたは微調整を強く信じています [models] 彼らの研究の共著者は次のように書いています。「しかし、これには、バグの修正を提案する前に必要な情報を収集するためにデバッガーと対話するエージェントを記録する軌跡データなど、このようなモデルトレーニングを満たすために特別なデータが必要になります。」

調査結果はまったく衝撃的ではありません。多くの研究があります表示されていますこのコード生成AIは、プログラミングロジックを理解する能力などの分野の弱点により、セキュリティの脆弱性とエラーを導入する傾向があります。 Devinの最近の評価人気のあるAIコーディングツールは、20のプログラミングテストのうち3つしか完了できないことを発見しました。

しかし、Microsoftの作業は、モデルの持続的な問題領域で、より詳細な外観の1つです。おそらく湿らせないでしょう投資家の熱意 AIを搭載したアシスタントコーディングツールの場合、運が良ければ、開発者とその上位の上位は、AIにコーディングショーを実行できるようになります。

その価値のために、ますます多くの技術者がAIがコーディングジョブを自動化するという概念に異議を唱えています。 Microsoftの共同設立者Bill Gates 彼はプログラミングを職業だと考えていると言っています滞在するためにここにあります。そうです CEOのAmjad Masadをレプリします、 OKTA CEOのトッド・マッキノンそして IBM CEO Arvind Krishna。

Source link

返事を書く返事をキャンセル

あなたのコメントを入力してください。

ここにあなたの名前を入力してください

間違ったメールアドレスを入力しました。

ここにあなたのEメールアドレスを入力してください

AIモデルはまだソフトウェアをデバッグするのに苦労している、とMicrosoftの調査によると

いいね:

関連

伝えられるところによると、リビアンは関税のないバッテリーの備蓄に座っています

Appleは世界中のスパイウェア攻撃の新しい犠牲者に通知します

gruve.aiは、AI Techコンサルティングのためのソフトウェアのようなマージンを約束し、数十年前の産業を混乱させます

返事を書く返事をキャンセル

ABOUT US

FOLLOW US

#ヒカキン #ヒカル #鎮西寿々歌 #ほりえもん #高一早苗 #ピース界隈 #エロ #ワンピース #ピアノ #吹奏楽 #bgm #音楽

HIKAKIN edit

なめらかヒカキン2025.12.12@TORU#vlog #iphone#切り抜き

AIモデルはまだソフトウェアをデバッグするのに苦労している、とMicrosoftの調査によると

共有:

いいね:

関連

伝えられるところによると、リビアンは関税のないバッテリーの備蓄に座っています

Appleは世界中のスパイウェア攻撃の新しい犠牲者に通知します

gruve.aiは、AI Techコンサルティングのためのソフトウェアのようなマージンを約束し、数十年前の産業を混乱させます

返事を書く 返事をキャンセル

ABOUT US

FOLLOW US

#ヒカキン　#ヒカル　#鎮西寿々歌 #ほりえもん #高一早苗　#ピース界隈　#エロ　#ワンピース #ピアノ #吹奏楽 #bgm #音楽

返事を書く返事をキャンセル