開く

目次

第1章

はじめに:スーパーコンピューター「 富岳 」サポートサイトの生成AIの取り組み

はじめに:スーパーコンピューター「 富岳 」サポートサイトの生成AIの取り組み

本レポートでは、スーパーコンピュータ「富岳」のサポートサイトにおける生成AIチャット「AskDona(アスクドナ)」(以下、AskDona)の導入・運用実績を報告する。生成AIチャット「AskDona」の導入・運用は、株式会社GFLOPS(ジーフロップス、以下「当社」)が理化学研究所計算科学研究センター(以下、R-CCS)と共同で行ったものであり、本レポートではこの一連の取り組みを「本プロジェクト」と称す。当社とR-CCSは、本プロジェクトで得られた知見を公開し、それによって生成AI技術の社会実装を促進することを目指している。

R-CCSは、スーパーコンピュータ「富岳」(以下、「富岳」)の利用者へ質の高い支援を提供するため、利用者専用の富岳サポートサイトを運営している。「富岳」は年間を通じて多数の利用者によって活用されており、その利用者数は増加傾向にある。「富岳」に関する様々な情報や活動を報告する富岳年報によると、2023年度の利用者数は約3,800名、一日あたりの平均ログインユーザー数(アクティブユーザー数)は約395名であり、これは2022年度(利用者数: 約2,916名、アクティブユーザー数: 約355名)と比較して、それぞれ1割以上増加している。

「富岳」を利用するユーザーは、富岳サポートサイトを通じて質の高いサポートを受けることができる。しかし、R-CCSの従来のサポート体制は有人対応が中心であり、近年の利用者数の増加に伴ってサポート担当者の業務負荷が増大し、サポート業務の効率化が課題となっていた。

サポート負荷増大の背景には要因がいくつか存在したが、その最大の要因は富岳に関する情報量の豊富さである。富岳を利用して計算科学的な手法で課題を解決していく上で、富岳を利用するための正しい知識が必要であり、そのための詳細な技術情報がマニュアル・利用手引書等の文書としてPDF・HTMLなどの形式で提供されているが、そのボリュームは数万ページ分に及ぶ。利用者が疑問や質問を持った際に、複数の場所に分かれて掲載されているこれらの膨大とも言える文書の中から、必要な情報を探し当てて自己解決を図ることは容易でない場合があり、サポート担当者への質問チケットとして発行されることが頻繁にあった。豊富な情報源から、単なる検索ではなく、利用者の質問意図に沿った適切な回答を自動的に提示するサービスの実現が望まれていた。また、寄せられる多数の質問の中から共有価値が高いと考えられるものを適宜抽出し、その回答とあわせて要約したFAQ記事として富岳サポートサイトに掲載しているが、実務で役に立つこれら多数のFAQ記事をマニュアルや利用手引書とあわせて横断的に有効利用してもらう環境の整備も必要であった。

こうした背景から、R-CCSは、大規模言語モデル(LLM)を活用した生成AI技術を活かし、富岳サポートサイトにおけるRAGのデータソースに基づく自動回答生成サービス、ならびに従来の単純な検索機能に代わる、利便性が高く、あいまい検索や類似検索が可能な高度な検索機能の導入を検討した。

当社は、生成AI技術とデータ分析力を強みとする企業として、独自のRAG(Retrieval-Augmented Generation:検索拡張生成)ソリューションを基盤とした生成AIチャット「AskDona」を提供している。当社が本プロジェクトへ参画するにあたり、まずはR-CCSが定めた技術要件を満たすことを確認するための「導入前技術評価」が2024年5月に実施され、AskDonaの初期バージョン(dona-rag-1.0)が、R-CCSが定める技術要件(回答精度80%以上)に対し設定質問へ全問正解(回答精度100%)を達成し、大容量データから高い回答精度を実現する基本的なRAGの仕組みが評価されて採択された。

本レポートで報告する実績は、生成AIチャット「AskDona」が富岳サポートサイトに導入された2024年7月9日時点から2025年6月時点までのものである。これらの実績は共同検証を行ったR-CCSの協力のもとに得られたものである。R-CCSは、日本の科学技術とAI活用の発展に貢献するという観点から、本取り組みで得られた知見の公開を推進している。

インタビュー記事:理化学研究所 計算科学研究センター(R-CCS)が考えるスーパーコンピュータ「富岳」と生成AI活用の未来

本レポートの構成は以下の通りである。まず第2章では、生成AI導入後の利用者の行動変容に焦点を当て、質問傾向や自己解決プロセスがどう変化したかを実際の利用データから定量的・定性的に分析する。特に質問傾向が質的に変化し、複数の文書を横断的に参照する必要がある「複合的なクエリ」が増加したことを実際のデータから明らかにする。続く第3章で、これらの利用動向的な変化が、富岳サポートサイトのR-CCSの対応業務へどのような具体的な効果をもたらしたかを、有人サポートの負荷軽減と品質維持の両面から明らかにする。そして第4章では、第2章で提示した課題への技術的な解決方法として、次世代RAGアーキテクチャの有効性を比較検証によって実証する。具体的には、「複合的なクエリ」を含む質問セットに対し、AskDonaの最新RAGアーキテクチャと複数の標準的なRAGシステムとの回答精度を比較することで、実務条件下で求められる技術的要件を明らかにする。

本レポートでは、スーパーコンピュータ「富岳」のサポートサイトにおける生成AIチャット「AskDona(アスクドナ)」(以下、AskDona)の導入・運用実績を報告する。生成AIチャット「AskDona」の導入・運用は、株式会社GFLOPS(ジーフロップス、以下「当社」)が理化学研究所計算科学研究センター(以下、R-CCS)と共同で行ったものであり、本レポートではこの一連の取り組みを「本プロジェクト」と称す。当社とR-CCSは、本プロジェクトで得られた知見を公開し、それによって生成AI技術の社会実装を促進することを目指している。

R-CCSは、スーパーコンピュータ「富岳」(以下、「富岳」)の利用者へ質の高い支援を提供するため、利用者専用の富岳サポートサイトを運営している。「富岳」は年間を通じて多数の利用者によって活用されており、その利用者数は増加傾向にある。「富岳」に関する様々な情報や活動を報告する富岳年報によると、2023年度の利用者数は約3,800名、一日あたりの平均ログインユーザー数(アクティブユーザー数)は約395名であり、これは2022年度(利用者数: 約2,916名、アクティブユーザー数: 約355名)と比較して、それぞれ1割以上増加している。

「富岳」を利用するユーザーは、富岳サポートサイトを通じて質の高いサポートを受けることができる。しかし、R-CCSの従来のサポート体制は有人対応が中心であり、近年の利用者数の増加に伴ってサポート担当者の業務負荷が増大し、サポート業務の効率化が課題となっていた。

サポート負荷増大の背景には要因がいくつか存在したが、その最大の要因は富岳に関する情報量の豊富さである。富岳を利用して計算科学的な手法で課題を解決していく上で、富岳を利用するための正しい知識が必要であり、そのための詳細な技術情報がマニュアル・利用手引書等の文書としてPDF・HTMLなどの形式で提供されているが、そのボリュームは数万ページ分に及ぶ。利用者が疑問や質問を持った際に、複数の場所に分かれて掲載されているこれらの膨大とも言える文書の中から、必要な情報を探し当てて自己解決を図ることは容易でない場合があり、サポート担当者への質問チケットとして発行されることが頻繁にあった。豊富な情報源から、単なる検索ではなく、利用者の質問意図に沿った適切な回答を自動的に提示するサービスの実現が望まれていた。また、寄せられる多数の質問の中から共有価値が高いと考えられるものを適宜抽出し、その回答とあわせて要約したFAQ記事として富岳サポートサイトに掲載しているが、実務で役に立つこれら多数のFAQ記事をマニュアルや利用手引書とあわせて横断的に有効利用してもらう環境の整備も必要であった。

こうした背景から、R-CCSは、大規模言語モデル(LLM)を活用した生成AI技術を活かし、富岳サポートサイトにおけるRAGのデータソースに基づく自動回答生成サービス、ならびに従来の単純な検索機能に代わる、利便性が高く、あいまい検索や類似検索が可能な高度な検索機能の導入を検討した。

当社は、生成AI技術とデータ分析力を強みとする企業として、独自のRAG(Retrieval-Augmented Generation:検索拡張生成)ソリューションを基盤とした生成AIチャット「AskDona」を提供している。当社が本プロジェクトへ参画するにあたり、まずはR-CCSが定めた技術要件を満たすことを確認するための「導入前技術評価」が2024年5月に実施され、AskDonaの初期バージョン(dona-rag-1.0)が、R-CCSが定める技術要件(回答精度80%以上)に対し設定質問へ全問正解(回答精度100%)を達成し、大容量データから高い回答精度を実現する基本的なRAGの仕組みが評価されて採択された。

本レポートで報告する実績は、生成AIチャット「AskDona」が富岳サポートサイトに導入された2024年7月9日時点から2025年6月時点までのものである。これらの実績は共同検証を行ったR-CCSの協力のもとに得られたものである。R-CCSは、日本の科学技術とAI活用の発展に貢献するという観点から、本取り組みで得られた知見の公開を推進している。

インタビュー記事:理化学研究所 計算科学研究センター(R-CCS)が考えるスーパーコンピュータ「富岳」と生成AI活用の未来

本レポートの構成は以下の通りである。まず第2章では、生成AI導入後の利用者の行動変容に焦点を当て、質問傾向や自己解決プロセスがどう変化したかを実際の利用データから定量的・定性的に分析する。特に質問傾向が質的に変化し、複数の文書を横断的に参照する必要がある「複合的なクエリ」が増加したことを実際のデータから明らかにする。続く第3章で、これらの利用動向的な変化が、富岳サポートサイトのR-CCSの対応業務へどのような具体的な効果をもたらしたかを、有人サポートの負荷軽減と品質維持の両面から明らかにする。そして第4章では、第2章で提示した課題への技術的な解決方法として、次世代RAGアーキテクチャの有効性を比較検証によって実証する。具体的には、「複合的なクエリ」を含む質問セットに対し、AskDonaの最新RAGアーキテクチャと複数の標準的なRAGシステムとの回答精度を比較することで、実務条件下で求められる技術的要件を明らかにする。