水曜日, 7月 30, 2025
水曜日, 7月 30, 2025
- Advertisment -
ホームニューステックニュースGoogleによる Deep Research の新手法、OpenAI超え

Googleによる Deep Research の新手法、OpenAI超え


本記事では、精度の高い「Deep Research」機能を実装するための手法について、ざっくり解説します。

株式会社ナレッジセンスは、「エンタープライズ企業の膨大なデータを掘り起こし、活用可能にする」プロダクトを開発しているスタートアップです。

この記事は、「Deep Research」の新手法「Test-Time Diffusion Deep Researcher(TTD-DR)」の論文について、日本語で簡単にまとめたものです。

https://www.arxiv.org/abs/2507.16075

ざっくりサマリー

Googleによる「Deep Research」の新手法、OpenAI超え

「TTD-DR」は、Deep Researchの精度を上げるための新しい手法です。 Google Cloud の研究者らによって2025年7月に提案されました。

最近、OpenAIの「Deep Research」が話題です。この機能では、Web上の情報をもとに深く考え、高精度な回答をすることができます。ただ残念ながら、OpenAI本家の「Deep Research」の実装は、公開されていません。

しかし、GPT ResearcherOpen Deep Researchなど、オープンソースのプロジェクトがアルゴリズムを予想して、実装を公開しています。ただ、まだまだ精度が十分ではない、というのが現状です。

そこで、今回紹介する「TTD-DR」という手法は、従来のDeep Research手法とは全く違う手法によって、精度を高めています。具体的には、ユーザーの質問に対して、まず回答の「下書き」を作成し、それを徐々にブラッシュアップしていくという手法です。(著者らはこれを「Diffusion」プロセスと呼んでいます。)

問題意識

Googleによる「Deep Research」の新手法、OpenAI超え

「Deep Research」機能を自分で実装しようとすると、高精度にするのが難しいです。

例えば、GPT Researcher のような従来の「Deep Resaerch」プロジェクトでは、アルゴリズムが直線的でした。(「計画→Web検索→レポート作成」というステップで実装するのが一般的。)

こうした従来の手法では、柔軟性がありません

どういうことかと言うと、例えば、Web情報を検索している中で重要な事実に気づいたとしても、その後の調査も「当初の計画」に従って実行され、計画が変わりません。なので、最終回答に向けて、どんどん、ピントのズレた調査が進んでしまいます。

また、「Open Deep Research」という従来手法では(※上記の画像の(c))、少し柔軟性がありますが、セクションに分割されてしまっているため、限界があります。

手法

TTD-DRは、「シゴデキ人間」のレポート執筆プロセスを、AIエージェントが再現するようなアルゴリズムです。具体的には「初期仮説でざっくり下書きを書いてから、細部を修正していく」ただし、「必要であれば、大胆に、全体の方向性を変える」という感じです。

Googleによる「Deep Research」の新手法、OpenAI超え

具体的な手順は以下です。

【ユーザーが質問を入力して来たとき】

  1. まずは検索せず、下書き作成 & 計画作成

    • ユーザーの質問に基づき、レポートの骨子となる「初期の下書き」を生成
    • →この際、特にWeb検索をせず、LLMの内部知識だけを使う
    • 同時に、「リサーチ計画」も作成
  2. Web検索して反復的に改良

    • 現在の「下書き」と「リサーチ計画」を基にWeb検索
    • Web検索の結果を使い、初期の下書きの全体(ここがポイント)をブラッシュアップ
    • これを繰り返す
  3. 各要素の自己進化 (Self-Evolution)

    • 2の検索を繰り返している間、「計画」自体も変更可能

TTD-DRという手法のキモは、①LLMに全体を俯瞰させるようにしていること、②そして必要があれば全体の計画を変更できるようにしていることです。こうすることで、LLMの回答に、かなりの柔軟性を持たせています。

成果

Googleによる「Deep Research」の新手法、OpenAI超え
(↑左2つのベンチマークの「Win Rate」はOpenAIのDRと勝負させた時の勝率)

  • あらゆるベンチマーク(LongForm Research、DeepConsult、HLE、GAIA)において、既存のDeep Researchサービスを上回る性能
  • 特にOpenAI Deep Researchと比較して、長文レポート生成タスクで69.1%〜74.5%の勝率を達成
  • 短文回答タスクでも、HLE-Searchで33.9%(OpenAIの29.1%を上回る)、GAIAで69.1%(OpenAIの67.4%を上回る)の正答率を記録

  • OpenAI Deep Researchと同等以下の処理時間で、これを上回る性能を達成

弊社では普段から、エンタープライズ向けに生成AIサービスを開発しています。ここまで述べたようなシンプルな「Deep Research」機能も自前で実装し、リリースしています。

ただ、2025年は、「Deep Research x 社内データ(RAG)」の実装が非常に重要になると考えています。

普段からエンタープライズ企業の社内データ事情を聞いていると、「社内データが散らばっている」「通常のRAGみたいな1回の検索では不十分」という課題が浮き彫りになってきます。

なので、単なるRAGではなく、まさに、Deep Researchのような、「深く」「繰り返し」検索できる手法が必要になってきます。

みなさまが業務でRAGシステムを構築する際も、選択肢として参考にしていただければ幸いです。今後も、RAGの回答精度を上げるような工夫や研究について、記事にしていこうと思います。我々が開発しているサービスはこちら



Source link

Views: 0

RELATED ARTICLES

返事を書く

あなたのコメントを入力してください。
ここにあなたの名前を入力してください

- Advertisment -