スキルアップ

ナレッジグラフによる知識のデータ化とAIへの活用

ナレッジグラフによる知識のデータ化とAIへの活用

ナレッジグラフ、RDFによる知識のデータ表現

IT技術の進歩は、人間が持つ情報や知識を理解し、利用する方法を変えてきました。その中の一つとして昨今注目されているのが「ナレッジグラフ」という技術です。

ナレッジグラフとは、知識(Knowledge)をグラフ形式で表現するものであり、個々の事物や事象とそれらの間に存在する関係性をノード(点)とエッジ(線)で表現し、ナレッジグラフを用いることで、情報と情報がどのように関連し、どのように組み合わさるかを示します。

ナレッジグラフを実現するための代表的なフレームワークとしてRDF(Resource Description Framework)が利用されています。RDFはワールドワイドウェブコンソーシアム(W3C)により開発された標準的なメタデータモデルで、任意の事物間の関係性を表現します。RDFの基本単位は「トリプル」と呼ばれ、主語、述語、目的語からなります。RDFにより、さまざまな種類の情報源からデータを取り出し、融合し、その統一的な表現を可能としています(図表1)。

図表1:RDF形式で記載されたナレッジグラフの例

出典:https://www.asahi-net.or.jp/~ax2s-kmtn/internet/rdf/NOTE-rdf11-primer-20140225.html

ナレッジグラフの活用事例

ナレッジグラフを活用し、人間が暗黙的に理解している知識を可視化し、検索可能なデジタル情報に置き換えることで、知識をより広く深く理解でき、システムとして活用することが可能になります。

では、ナレッジグラフの具体的な活用事例を見てみましょう。

まずはわれわれが日々利用しているGoogleの検索エンジンでの活用例を紹介します(図表2)。Googleでは、ユーザーが検索ボックスに入力したキーワードと関連する情報を、ナレッジグラフを介して「ナレッジパネル」という枠組みでユーザーに提示します。ユーザーが"東京"と検索すると、街の基本情報、地理、歴史、観光スポットなど、"東京"と関連する豊富な知識を一覧で見ることが可能です。これは、Googleがインターネット上の膨大な情報をナレッジグラフとして構造化し、それを検索結果として利用者に提供することで実現されています。

また他の例として、医療分野では急速に発展する医療知識をナレッジグラフで管理することで、医師が質の高い医療サービスを提供する手助けをしています。遺伝子、疾患、症状、治療法、薬剤といった多様な医療データをナレッジグラフで表現し、それを用いて病態の解析や治療方針の決定を支援しています。

図表2:ナレッジグラフを用いたGoogle検索のナレッジパネル

出典:https://keywordmap.jp/academy/knowledge-graph/

GNNを使ったナレッジグラフのAI適用

ナレッジグラフの登場は、統計学や情報科学だけでなく、AI技術にも大きな影響を与えています。特にグラフニューラルネットワーク(GNN)という、グラフ形式のデータに対する新しい手法は、ナレッジグラフとの相性が良く、昨今のAI技術でも注目されています。

GNNは、ナレッジグラフに含まれるノードとエッジの情報を取り込むことにより、そのグラフの特性を捉え、より予測値を正確にすることが可能となります。実際にGNNを応用した事例として、SNSにおけるユーザー同士のリレーションシップ分析による人物間の関係の予測や、意思決定を支援する製品レコメンデーションなどが挙げられます。

また、化学反応などの関係を考える際にもグラフ構造が用いられることがあります(図表3)。

頂点を分子、化学反応を辺として扱うことでグラフ構造とみなす事が可能となり、このグラフに対してGNNを用いることで化学反応の成功予測などが可能になります。

図表3:GNNを用いた化学反応予測の例

出典:https://zenn.dev/dena/articles/83c2daff760f5d

LLM等を使ったナレッジグラフの今後の使われ方

ナレッジグラフとAIの組み合わせによる可能性は、これからも広がり続けると考えられています。特に大規模な自然言語処理モデル、いわゆるLarge Language Model(以下、LLM)とナレッジグラフを組み合わせた活用が期待されています。

そもそも、LLMは大量のテキストデータから言語のパターンを学習し、一般的な質問への応答や文書の生成を行うものです。しかし、LLMが知識を学ぶ際は学習したテキスト情報に依存しており、知識レベルでの相互関係を捉える学習方法にはなっていないという課題があります。そこでナレッジグラフをLLMに組み込むことで、より具体的で関連性のある応答を生成することが考案されています。

まだ研究段階ではありますが、今後、大規模なナレッジグラフにある知識構造をLLMに取り組めれば、それは抽象的な応答から、より具体的かつ事実に基づいた信頼性の高い情報を提供するAIへと進化する可能性を示しています。

ナレッジグラフとLLMの統合を題材にした研究

LLMが正確な事実知識を捉えるのが難しく、根拠のない回答を生成してしまうハルシネーション問題に対応するために、事実知識のデータベースであるナレッジグラフを結合させ、タスク遂行能力を向上させる研究も発表されています。

図表4:フレームワーク『Graph Neural Prompting(GNP)』

出典:https://ai-data-base.com/archives/57018

まとめ

ナレッジグラフは、データ表現を革新するものとして注目されており、事物や事象とそれらの間に存在する関係性を明示的かつ効率的に把握することを可能にしました。ナレッジグラフは広範な応用領域を持ち、さらにはGNNなどのような先端的なAI技術と組み合わせることで、新たな価値を創出することが可能になっています。また、今後も技術の進化とともに、ナレッジグラフの利用法は、LLMや他の領域との組み合わせによりさらなる進化を遂げていくことが可能になるでしょう。それは、われわれ人間が情報を理解し、解釈し、そして利用する方法を根本から変える可能性を持っており、これからのデジタル社会への影響は非常に大きいと予想されます。

SNSシェア

この記事は面白かったですか?

今後の改善の参考にさせていただきます!

Ranking

ランキング

もっと見る