人とAIを共に進化させるグラフ文書技術
専門性の高い業務や信頼性を必要とされる業務での大規模言語モデル活用
関連キーワード
大規模言語モデル(LLM) / 生成AI / グラフ文書 / 知識表現 / 検索拡張生成(RAG)
技術概要
急速に社会実装が進んでいる大規模言語モデル(LLM)は、インターネットをはじめ、さまざまな公開データを大量に事前学習することで汎用的な対話能力を発揮します。モデルが事前学習していない、社内限定のデータなどの非公開されていない情報や、最新の情報に対応する検索拡張生成(RAG)といった技術も登場してきています。しかし、LLMには、誤った情報を生成する「ハルシネーション(幻覚)」が起こりやすい、という課題があり、実際の業務で活用する際にはこの点が問題となります。
OKIは、この問題を解決するために、下図のようなグラフ文書と呼ばれる特徴的な形式で知識を表現し、利活用する技術を開発しています。グラフ文書を利用することにより、専門性の高い業務や、信頼性を必要とされる業務にもLLMを効果的に活用することができるようになります。
OKIならではの強みはなにか?
LLMの生成能力を拡張するために、外部の情報源から関連データを取り込むRAGに、グラフ文書を活用しています。グラフ文書は、単語や文をノードとし、ノードとノードの意味関係をエッジ(リンク)で表現したネットワークの構造(グラフ構造)を持つ文書形式です。この構造により、RAGにおいて必要な情報をLLMに渡す際、質問に近い内容の情報だけでなく、グラフ文書内の文間の意味関係や参照関係を辿って得られる情報も加えることができます。これにより、LLMは回答に必要十分な情報を得ることができ、ハルシネーションを避けることができます。
想定される市場領域は?
社内に閉じた情報、専門的な情報や最新情報をLLMが正確に取り扱うことができるため、コールセンターにおける問い合わせ対応等といった、正確な回答が必要とされる業務領域や、社内の情報を鑑みた新規ビジネス検討といったアイデア創出、日々の業務支援など様々な場面での活用が期待できます。
今後のビジョン
グラフ文書はAI(LLM)にとって効果的な形式であると同時に、人が扱う上でも論理構造を理解しやすく、人の思考能力の向上にも寄与します。グラフ文書を知識源とするエコシステムを構築することで、AI・人双方の能力が継続的に進化する社会を目指します。
この成果は、国立研究開発法人新エネルギー・産業技術総合 開発機構(NEDO)の「人と共に進化する次世代人工知能に関する技術開発」委託業務の結果得られたものです。