ディープコギトは、ハイブリッドAI「推論」モデルでステルスから出現します

新しい会社、 ディープコギト「推論」モードと非合理的なモードの間で切り替えることができる、公然と利用可能なAIモデルのファミリーとともにステルスから出現しました。

Openaiのような推論モデル O1 複雑な問題を段階的に作業することで、自分自身を効果的に事実チェックする能力のおかげで、数学や物理学などのドメインで大きな期待を示しています。ただし、この推論にはコストがかかります。コンピューティングと遅延が高くなります。それが理由です 人類のようなラボ 推論コンポーネントと標準的な非季節要素を組み合わせた「ハイブリッド」モデルアーキテクチャを追求しています。ハイブリッドモデルは、より挑戦的なクエリを考慮して、追加の時間を費やしながら、簡単な質問にすばやく答えることができます。

Cogito 1と呼ばれる深いCogitoのモデルはすべて、ハイブリッドモデルです。 Cogitoは、メタや中国のAIスタートアップのモデルを含む、同じサイズの最高のオープンモデルよりも優れていると主張しています deepseek

「各モデルは直接答えることができます […] または、回答する前に(推論モデルのように)自己反映」、会社 ブログ投稿で説明しました。 「[All] 約75日で小さなチームによって開発されました。」

Cogito 1モデルの範囲は30億パラメーターから700億パラメーターの範囲であり、Cogitoは、今後数週間および数か月で最大671億億のパラメーターの範囲のモデルがそれらに参加すると述べています。パラメーターは、モデルの問題解決スキルにほぼ対応しており、一般的により多くのパラメーターが優れています。

Cogito 1はゼロから開発されていませんでした。メタのオープンラマとアリババのQwenモデルの上に構築されたディープコギトは、独自のものを作成しました。同社は、基本モデルのパフォーマンスを高め、トッジ可能な推論を可能にするために、新しいトレーニングアプローチを適用したと述べています。

Cogitoの内部ベンチマークの結果によると、最大のCogito 1モデルであるCogito 70bは、いくつかの数学と言語評価のDeepseekのR1推論モデルを上回ります。 Cogito 70bは、Reasoning Disabledを備えたEclipses Metaの最近リリースされたLlama 4 Scout Model on LiveBenchで、汎用AIテストです。

すべてのCogito 1モデルは、クラウドプロバイダーの花火AIおよび一緒にAIでAPIを介してダウンロードまたは使用できます。

ディープコギト
他の一般的に利用可能な他のAIモデルと比較したCogito 1のパフォーマンス、画像クレジット:ディープコギト

「現在、私たちはまだ初期段階にあります [our] コギトはブログ投稿で書いています。「前進して、自己改善のための補完的なトレーニング後のアプローチを調査している」とコギトは次のように書いています。

カリフォルニア州への提出によるとサンフランシスコに本拠を置くディープコギトは2024年6月に設立されました。 LinkedInページ Drishan AroraとDhruv Malhotraの2人の共同設立者をリストしています。 Malhotraは、以前はGoogle AI Lab DeepMindのプロダクトマネージャーでした。 AroraはGoogleのシニアソフトウェアエンジニアでした。

サウスパークコモンズを含む支援者のディープコギト、 Pitchbookによると野心的に「一般的な緊密な」を構築することを目指しています。同社の創設者は、ほとんどの人間よりもタスクを上手に実行できるAIを意味するフレーズを理解し、「私たちがまだ想像していないまったく新しい機能を明らかにしています」。

フラッグシティパートナーズ海外不動産投資セミナー 【DMM FX】入金

Source link