EQUESの製薬特化AI『JPharmatron』、難関国際会議「IJCNLP-AACL 2025」に論文採択!その画期的な成果とは?

自然言語処理(NLP)

IJCNLP-AACL 2025 論文採択

株式会社EQUESが開発した、製薬業務に特化した人工知能(AI)モデル「JPharmatron」に関する論文が、自然言語処理分野の権威ある国際会議「IJCNLP-AACL 2025」の本会議に採択されたことが発表されました。この会議は2025年12月にインド・ムンバイで開催される予定です。

JPharmatronとは

JPharmatron(ジェー・ファーマトロン)は、EQUESが経済産業省とNEDOが進める「GENIAC」プロジェクトの一環として開発した、製薬分野に特化した大規模言語モデル(LLM)です。LLMとは、人間のように文章を理解したり生成したりできるAIのことで、特定の分野に特化させることで、その分野での高い精度を発揮します。

GENIACプロジェクトについては、以下の経済産業省のサイトで詳しく紹介されています。

論文の概要:画期的な研究内容

今回の論文では、JPharmatronがどのように構築されたかが説明されています。具体的には、20億の日本語製薬・薬学関連文書と80億の英語生物医学関連文書を使い、AIに継続的に学習させることで、製薬・薬学分野に特化した日本語LLMとして開発されました。

さらに、製薬・薬学分野の日本語LLMを評価するための基準が不足していることを受け、以下の3つの新しい評価テスト(ベンチマーク)も開発されました。

  1. YakugakuQA: 薬剤師国家試験を基にした質問応答能力を測るテストです。
  2. NayoseQA: 複数の言語にわたる同義語を認識する能力、つまり同じ意味の言葉を見つける能力を評価します。
  3. SogoCheck: 複数の文書を比較し、情報が食い違っている箇所を見つけ出す推論能力を測定します。

開発されたJPharmatronは、他のオープンソースの医療分野LLMや、有名な商用モデルであるGPT-4oと比較評価されました。その結果、JPharmatronは同じくらいの規模の既存オープンモデルよりも優れた性能を示しました。また、SogoCheckタスクでは、GPT-4oでさえも性能が大きく落ち込むことがわかり、複数の文書間の情報の一貫性を理解する推論能力は、AIにとってまだまだ難しい課題であることが示唆されています。

このプロジェクトの成果は、実用的で安全性が高く、そしてコスト効率の良い日本語の分野特化型LLMを開発できる可能性を示しています。また、製薬・薬学分野の自然言語処理研究において、今後の研究活動に役立つ評価リソースも提供されました。JPharmatronの成果は、以下のHuggingfaceのサイトで公開されています。

今後の展望

EQUESは今後、開発したJPharmatronを、製薬業界向けのAIソリューション「QAI」に導入したり、共同研究に活用していくことを目指しています。

論文情報

  • 論文タイトル: A Japanese Language Model and Three New Evaluation Benchmarks for Pharmaceutical NLP

  • 著者: Shinnosuke Ono, Issey Sukeda, Takuro Fujii, Kosei Buma, Shunsuke Sasaki

  • 発表予定学会: IJCNLP-AACL2025 Main Conference

  • 学会URL: https://2025.aaclnet.org/

  • プレプリントURL: https://arxiv.org/abs/2505.16661v2

本成果は、経済産業省と国立研究開発法人新エネルギー・産業総合開発機構(NEDO)が実施する「GENIAC(Generative AI Accelerator Challenge)」プロジェクトの成果をもとに作成されました。

株式会社EQUESについて

株式会社EQUESは、「最先端の機械学習技術をあやつり社会の発展を加速する」という理念のもと、生成AIや数理最適化に焦点を当てて研究開発を行っている、東京大学松尾研究室発のスタートアップ企業です。現役の東京大学院生を中心としたメンバーが、それぞれの専門性を活かし、企業の課題解決に向けてAI・機械学習分野の最先端技術を社会に導入しています。

タイトルとURLをコピーしました