インフォマートと東京大学の共同研究論文が最優秀賞を受賞:AIでデータ活用を加速させる「合成データ」の新しい技術とは?

生成AI(Generative AI)

インフォマートと東京大学の共同研究チームが、AIを活用した新しいデータ生成技術に関する論文で「第6回とめ研究所若手研究者懸賞論文」の最優秀賞を受賞しました。この研究は、プライバシーを守りながら、もっと多くのデータをAIで活用できるようにする「合成データ」を作る技術を進化させたものです。

表彰式

合成データとは?

「合成データ」とは、実際のデータと似た特徴を持つようにAIが作り出した、架空のデータのことです。個人情報など、見せてはいけない情報が含まれる実際のデータをそのまま使うと、プライバシーの問題が出てきます。そこで、合成データを使うことで、プライバシーを守りつつ、AIの研究開発やデータ分析を安全に進めることができます。

これまでの合成データは、統計的な数字は本物と似ていても、データ同士の関係性(例えば「Aという商品を買う人はBという商品も買う」といった論理的なつながり)がうまく再現できないという課題がありました。この課題を解決するために開発されたのが「KGSynX(ケージーシンクス)」という新しい技術です。

KGSynXの画期的なアプローチ

KGSynXは、次の3つの技術を組み合わせて、より本物に近い合成データを作り出します。

  1. 知識グラフ:データ同士の関係性を図のように表現する技術です。これにより、データが持つ意味や構造をAIが理解しやすくなります。
  2. 大規模言語モデル(LLM):文章を理解したり生成したりするAIです。KGSynXでは、このLLMを使って、データ間の複雑な関係性を学び、新しいデータを生成します。
  3. 説明可能なフィードバック:AIがデータを生成する際に、人間が「この部分はこう修正してほしい」と具体的に指示を出せる仕組みです。これにより、AIが作ったデータが、より現実のビジネスルールや常識に合うように調整できます。

これらの組み合わせにより、KGSynXは、プライバシーを保護しながら、より正確で意味的に一貫性のある合成データを生成できるようになりました。これにより、大量のデータをAIで分析したり、AIの学習データとして活用したりする道が大きく開かれました。

インフォマートの貢献

株式会社インフォマートは、2024年から東京大学 早矢仕研究室とAIを用いた共同研究を進めています。今回の研究では、インフォマートが提供する「BtoBプラットフォーム」で取り扱われた年間60兆円を超える膨大な商取引データを提供しました。このデータは、匿名化や統計処理が施された上で、KGSynXの開発と検証に役立てられました。

受賞の背景と今後の展望

本研究は、その理論的な展開の素晴らしさだけでなく、人とAIが協力して社会をより良くしていく未来において、非常に実用的で幅広い応用が期待される点が評価され、今回の最優秀賞受賞につながりました。

東京大学大学院工学系研究科 システム創成学専攻の兪 科氏からは、「社会に安全で役立つデータ活用の方法を探りたいという思いから応募した」とのコメントがあり、今回の受賞を励みに、今後も実社会に貢献できる研究を進めていく意向が示されました。

インフォマートの取締役である村上 肇氏も、本研究で培われた高度なAI技術を社会に役立て、顧客や社会の発展に貢献していくと述べています。

両者は今後も共同研究を続け、AI技術のさらなる進化を通じて、データの価値を最大限に引き出すことに注力していく方針です。

本研究の詳細は、以下の論文で確認できます。

インフォマートに関する詳細情報は、以下のURLから確認できます。

タイトルとURLをコピーしました