メタのバニラマーベリックAIモデルは、人気のチャットベンチマークでライバルの下にランクされています

Amazon Fire HD 10 キッズモデル (10インチ) グリーン対象年齢3歳から数千点のキッズコンテンツが1年間使い放題

(648)

￥23,980 (2025年4月26日 13:09 GMT +09:00 時点 - )

ALLDOCUBE iPlay 70 mini Ultra タブレット 8.8インチ Snapdragon7+Gen3 2560×1600解像度 144Hz高リフレッシュレート 20GB+256GB+1TB拡張 7300mAh PD20W デュアルスピーカーDTSサウンド 6軸ジャイロ WiFi6 BT5.4 WidevineL1 重力センサー光センサー Androidタブレットアンドロイド

(107)

(2025年4月26日 13:07 GMT +09:00 時点 - )

USB Type C ケーブル純正品質【1M/2M 各２本】タイプc ケーブル PD対応 60W急速充電 TPE材質 ABSシースナイロン編み断線防止高耐久 480Mbps高速データ転送 USB C 3.0 iPhone 16/15/iPad/MacBook Pro/Galaxy S24/Matebook/iPad/Xperia Galaxy等USB-C各種対応

(261)

￥899 (2025年4月26日 13:05 GMT +09:00 時点 - )

今週初め、メタお湯に着陸しました Llama 4 Maverickモデルの実験的な未発表のバージョンを使用して、クラウドソーシングベンチマークLM Arenaで高いスコアを達成するため。事件 LMアリーナのメンテナーに謝罪しましたポリシーを変更し、変更されていないバニラマーベリックを獲得します。

結局のところ、それはあまり競争力がありません。

変更されていないマーベリック、「llama-4-maverick-17b-128e-instruct」モデル以下でランク付けされました OpenaiのGPT-4O、Anthropic’s Claude 3.5 Sonnet、およびGoogleのGemini 1.5 Proを金曜日に含む。これらのモデルの多くは数ヶ月前です。

Llama 4のリリースバージョンは、彼らがだまされたことがわかった後、Lmarenaに追加されましたが、32位にスクロールしなければならないので、おそらくあなたはそれを見なかったでしょう。 pic.twitter.com/a0bxkdx4lx

-p：vsn（@pigeon__s） 2025年4月11日

なぜパフォーマンスが悪いのですか？メタの実験的マーベリック、ラマ-4-Maverick-03-26-経験は「会話のために最適化された」と同社は説明した。公開されたチャート先週の土曜日。これらの最適化は、人間の評価者がモデルの出力を比較し、それらが好むものを選択しているLMアリーナにとって明らかにうまく機能しました。

前に書いたようにさまざまな理由で、LMアリーナはAIモデルのパフォーマンスの最も信頼できる尺度ではありませんでした。それでも、モデルをベンチマークに合わせて調整することは、誤解を招くだけでなく、開発者がモデルが異なるコンテキストでどれだけうまく機能するかを正確に予測することを困難にします。

声明の中で、メタの広報担当者はTechCrunchに、「あらゆる種類のカスタムバリアント」を使用してメタが実験することを語った。

「 ‘llama-4-maverick-03-26-Experimmal’は、ラマーナでもうまく機能するチャット最適化バージョンです」とスポークスマンは言いました。「私たちは現在、オープンソースバージョンをリリースしており、開発者が自分のユースケースのためにLlama 4をカスタマイズする方法を確認します。彼らが何を構築するかを見て、進行中のフィードバックを楽しみにしています。」

Source link