月曜日に中国のハイテク企業Alibaba リリース AIモデルのファミリーであるQwen 3は、同社が一致すると主張しており、場合によってはGoogleとOpenaiから利用可能な最高のモデルよりも優れています。
ほとんどのモデルは、AI DEVプラットフォームから「オープン」ライセンスの下でダウンロードできます。 顔を抱き締める そして ギルブ。サイズは0.60億パラメーターから2350億パラメーターの範囲です。パラメーターは、モデルの問題解決スキルにほぼ対応しており、より多くのパラメーターを持つモデルは一般に、パラメーターが少ないものよりも優れたパフォーマンスを発揮します。
Qwenのような中国起源のモデルシリーズの台頭により、Openaiなどのアメリカの研究室への圧力が高まり、より有能なAIテクノロジーを提供しています。彼らはまた、政策立案者がモデルのトレーニングに必要なチップを取得する中国のAI企業の能力を制限することを目的とした制限を実施するように導いた。
Alibabaによると、Qwen 3モデルは、複雑な問題を介して時間をかけて「理由」をかけたり、より単純なリクエストに迅速に答えたりすることができるという意味で、「ハイブリッド」モデルです。推論により、モデルは、OpenAIのO3などのモデルと同様に、より高い潜伏を犠牲にして、モデルを効果的に事実チェックすることができます。
「思考と非考えのモードをシームレスに統合しているため、ユーザーに思考予算を制御する柔軟性を提供します」とQwenチームはブログ投稿に書いています。
Qwen 3モデルは119の言語をサポートしており、Alibabaによると、36兆個近くのトークンのデータセットで訓練されました。トークンは、モデルが処理するデータの生ビットです。 100万個のトークンは、約750,000語に相当します。 Alibaba氏によると、Qwen 3は教科書、「質問回答ペア」、コードスニペットなどの組み合わせで訓練されたと言います。
これらの改善は、他の人とともに、前任者のQwen 2と比較して、Qwen 3のパフォーマンスを大幅に向上させました。 Codeforcesでは、プログラミングコンテストのプラットフォームであり、最大のQwen 3モデルであるQwen-3-235B-A22B – は、OpenaiのO3-Miniを打ち負かします。 QWen-3-235B-A22Bは、問題についてモデルの能力を評価するためのテストである、挑戦的な数学ベンチマークであるAIMEの最新バージョンでO3-MINIをベストします。
しかし、Qwen-3-235B-A22Bは公開されていませんが、少なくともまだ利用できません。
最大のパブリックQWEN 3モデルであるQWEN3-32Bは、中国のAIラボDeepseekのR1を含む多くの独自およびオープンAIモデルと依然として競争力があります。 QWEN3-32Bは、LiveBenchと呼ばれる精度ベンチマークを含む、いくつかのテストでOpenaiのO1モデルを上回ります。
Alibabaは、Qwen 3がツールを呼び出す機能に「優れている」だけでなく、指示に従い、特定のデータ形式をコピーすると述べています。ダウンロード用のモデルのリリースに加えて、Qwen 3は花火AIや双曲線などのクラウドプロバイダーから入手できます。
AI Cloud Host Basetenの共同設立者兼CEOであるTuhin Srivastavaは、Qwen 3はOpenaiなどのクローズドソースシステムとペースを維持しているオープンモデルのトレンドラインのもう1つのポイントであると述べました。
「米国は、チップの中国への販売の制限と中国からの購入を倍増していますが、最先端でオープンなQwen 3のようなモデル […] 彼は声明でTechCrunchに語った。「企業が独自のツールを構築しているという現実を反映している。 [as well as] AnthropicやOpenaiなどのクローズドモデル企業を介して棚を購入します。」