Copyright © GFLOPS Co., Ltd. All Rights Reserved.
RAG (Retrieval Augmented Generation / 検索拡張生成) は、事前に読み込ませたデータベースに対して、ユーザーが自然対話形式で質問して回答を得るフレームワークです。AskDonaには『生成AIチャット』と『高度検索』があり、『生成AIチャット』がRAGのフレームワークを用いたプロダクトで、『高度検索』はRAGのフレームワークのうち最後のGenerationを行わずに、ユーザーの質問に最も関連度の高い資料をデータベースからリスト化して表示するプロダクトです。
このページの『生成AIチャット』と『高度検索』のデモ用に読み込ませたデータについてご説明します。
RAGのフレームワークそのものは一般的なものであり、誰でもRAGを活用したチャットボットを作成することができます。しかし、高い回答精度を出すことは容易ではありません。特に、読み込ませるデータに『表(テーブル)』や『チャート』、『画像』が含まれている場合に正しく回答できないケースがあります。データベースに読み込ませるドキュメントの数が多かったりや容量が大きい場合も回答精度が下がる傾向にあります。その点、AskDonaは独自のドキュメントプロセス技術を用いて、どのような表やチャート、画像が含まれている資料についても高い回答精度を実現しています。(1万6000ページを超えるPDFやその他の資料をデータベースに登録した理化学研究所様の導入事例はこちら)
生成AIチャットのデモ用に読み込ませた『AIの進化に伴う課題と現状の取組.pdf』には、以下の表やチャート、画像が含まれています。これらについて、ぜひ質問してみてください。
『高度検索』デモでは、『情報通信白書』の第Ⅰ部と第Ⅱ部の合計36件PDFを横断で検索できます。左側に『すべての検索結果』が表示され、右側に『検索結果の上位ファイル』が表示されます。
『すべての検索結果』では、データベース内にある36件のPDFがページ単位で検索結果として表示されます。検索結果をクリックすると、PDFの該当ページが表示されます。また、「カテゴリー」「フォーマット」「ファイル名」「本文」などの情報も検索結果内で表示されるため、別タブでPDFを開くことなく内容を確認できます。
『検索結果の上位ファイル』では、『すべての検索結果』に含まれていた検索結果をファイル単位で表示します。カテゴリーごとに最大5件、『すべての検索結果』に含まれている件数の降順で表示されるため、検索したキーワードに関連度の高いファイルを見つけやすくなります。
特に、『高度検索』は従来のキーワード検索とは異なり、RAGの技術を応用しているため、自然言語での検索が可能です。例えば、「生成AI」といったキーワード検索だけでなく、「生成AIのリスクを教えて」などの文章での検索が可能です。ぜひお試しください。