水曜日, 5月 21, 2025
ホームニューステックニュースRAGに「狩猟本能」を搭載して、答えにたどり着くまで検索

RAGに「狩猟本能」を搭載して、答えにたどり着くまで検索


本記事では、RAGの性能を高めるための「InForage」という手法について、ざっくり理解します。株式会社ナレッジセンスは、エンタープライズ企業向けに「社内データ検索サービス」を提供しているスタートアップです。

この記事は、RAGの新手法である「InForage」の論文について、日本語で簡単にまとめたものです。

https://arxiv.org/abs/2505.09316

今回も「そもそもRAGとは?」については、知っている前提で進みます。確認する場合は、こちらの記事もご参考下さい。

ざっくりサマリー

RAGに「狩猟本能」を搭載して、答えにたどり着くまで検索

InForageは、RAGの精度を上げるための新しい手法です。BAAIの研究者らによって2025年5月に提案されました。

InForageは、情報探索理論(Information Foraging Theory)という、「動物が餌を探す行動をモデル化した理論」に着想を得た手法です。野生の動物が嗅覚を使って獲物にたどり着くイメージで、LLMが、「嗅覚」を使って答えにたどり着けるようにしています。

従来のRAGでは、最初に一度だけ情報を検索し、その結果を使って回答を生成します。しかし、この方法では、複数の情報源を組み合わせる必要がある場合に、精度が低下してしまうという課題がありました。

そこで InForage は、検索→推論を繰り返す動的なプロセスを採用しています。LLM自身が「どの情報が足りないか」「次に何を探すべきか」を判断します。情報の「匂い」をたどりながら、ユーザーの質問に回答するために必要な情報を、粘り強く探します。

問題意識

従来のRAGには 「柔軟性がない」 という問題があります。

例えば、ユーザーの質問に答えるために必要な情報が、複数の文書に散らばっている場合。通常、こうした質問に答えるには、①「xx」について調べる→考える→②「yy」について調べる。というステップが必要です。

しかし通常のRAGだと、ユーザーの質問に対して1回しか検索しないので、回答精度が悪いです。

※一応、既存手法はたくさんありますが、それぞれ課題がありました↓
  • この「柔軟性がない」という課題に対して、「IRCoT」や「HiRAG」のようなRAG手法も登場していますが、やはり、柔軟性には問題があり、十分では有りませんでした。
  • また、これまで私も「RAG x Deep検索」の手法を何度も紹介してきましたが、「Deep検索だと回答速度が遅すぎる」ということが、新しく課題になっています。

手法

InForageでは、以下のステップでRAGの回答精度を高めます。

【事前にやっておくこと】

  1. データセットの構築

    • 人間が複雑な質問に対して、情報を探索→判断→答えにたどり着く、という軌跡を記録したデータセットを準備
  2. 教師ありファインチューニング

    • 1を使ってLLMをファインチューニング、強化学習
    • 最終的な回答の正しさに加えて、「途中の情報収集がどれだけ有益だったか」「効率的に探索できたか」といった点も報酬として与える

RAGに「狩猟本能」を搭載して、答えにたどり着くまで検索

【ユーザーが質問を入力して来たとき】

  1. 初期探索と推論

    • ユーザーの質問に基づいて最初の情報検索(通常のRAGと同じ)
    • LLMが、この時点での答え・初期仮説を生成
  2. 次の探索戦略を立てる

    • LLMは、1の初期回答が、十分メタ的に評価
    • 「次にどんな情報が必要か、どうやって探すべきか」、自動で戦略を立てる
  3. 1・2の繰り返し

    • 回答にたどり着くまで、必要なだけこのサイクルを繰り返す
  4. 最終回答を生成

InForageという手法のキモは、「人間が検索するとき、答えにたどり着くまでの軌跡」を学習データとして用意して強化学習に使っている点です。これにより、「センスの良い」検索を実現しています。検索のセンスが良いと、回答速度が速くなるので、ユーザー満足も高まります。

成果

RAGに「狩猟本能」を搭載して、答えにたどり着くまで検索

  • HotpotQAなど複数のベンチマークで、従来のRAG手法に比べて顕著な性能向上
  • 特に、初回の検索クエリが曖昧であったり、不十分だった場合に、大きな性能改善

弊社では普段、法人向けにRAGサービスを提供しています。その際、お客様からは「情報が足りない場合に、最後まで調べてしてほしい」といったお声も頂くことがあります。

こうした場合、従来のRAGのように「1回しか検索しない」パターンだと、回答精度が低いです。だからこそ、人間のように「1回検索して仮説立てて、もう何度か深く調査する」という柔軟な動きができる「InForage」は、重要な手法です。

みなさまが業務でRAGシステムを構築する際も、選択肢として参考にしていただければ幸いです。今後も、RAGの回答精度を上げるような工夫や研究について、記事にしていこうと思います。我々が開発しているサービスはこちら



Source link

Views: 0

RELATED ARTICLES

返事を書く

あなたのコメントを入力してください。
ここにあなたの名前を入力してください

- Advertisment -

インモビ転職