
株式会社EQUESが開発した、製薬業務に特化した人工知能(AI)モデル「JPharmatron」に関する論文が、自然言語処理分野の権威ある国際会議「IJCNLP-AACL 2025」の本会議に採択されたことが発表されました。この会議は2025年12月にインド・ムンバイで開催される予定です。
JPharmatronとは
JPharmatron(ジェー・ファーマトロン)は、EQUESが経済産業省とNEDOが進める「GENIAC」プロジェクトの一環として開発した、製薬分野に特化した大規模言語モデル(LLM)です。LLMとは、人間のように文章を理解したり生成したりできるAIのことで、特定の分野に特化させることで、その分野での高い精度を発揮します。
GENIACプロジェクトについては、以下の経済産業省のサイトで詳しく紹介されています。
論文の概要:画期的な研究内容
今回の論文では、JPharmatronがどのように構築されたかが説明されています。具体的には、20億の日本語製薬・薬学関連文書と80億の英語生物医学関連文書を使い、AIに継続的に学習させることで、製薬・薬学分野に特化した日本語LLMとして開発されました。
さらに、製薬・薬学分野の日本語LLMを評価するための基準が不足していることを受け、以下の3つの新しい評価テスト(ベンチマーク)も開発されました。
- YakugakuQA: 薬剤師国家試験を基にした質問応答能力を測るテストです。
- NayoseQA: 複数の言語にわたる同義語を認識する能力、つまり同じ意味の言葉を見つける能力を評価します。
- SogoCheck: 複数の文書を比較し、情報が食い違っている箇所を見つけ出す推論能力を測定します。
開発されたJPharmatronは、他のオープンソースの医療分野LLMや、有名な商用モデルであるGPT-4oと比較評価されました。その結果、JPharmatronは同じくらいの規模の既存オープンモデルよりも優れた性能を示しました。また、SogoCheckタスクでは、GPT-4oでさえも性能が大きく落ち込むことがわかり、複数の文書間の情報の一貫性を理解する推論能力は、AIにとってまだまだ難しい課題であることが示唆されています。
このプロジェクトの成果は、実用的で安全性が高く、そしてコスト効率の良い日本語の分野特化型LLMを開発できる可能性を示しています。また、製薬・薬学分野の自然言語処理研究において、今後の研究活動に役立つ評価リソースも提供されました。JPharmatronの成果は、以下のHuggingfaceのサイトで公開されています。
今後の展望
EQUESは今後、開発したJPharmatronを、製薬業界向けのAIソリューション「QAI」に導入したり、共同研究に活用していくことを目指しています。
論文情報
-
論文タイトル: A Japanese Language Model and Three New Evaluation Benchmarks for Pharmaceutical NLP
-
著者: Shinnosuke Ono, Issey Sukeda, Takuro Fujii, Kosei Buma, Shunsuke Sasaki
-
発表予定学会: IJCNLP-AACL2025 Main Conference
-
学会URL: https://2025.aaclnet.org/
-
プレプリントURL: https://arxiv.org/abs/2505.16661v2
本成果は、経済産業省と国立研究開発法人新エネルギー・産業総合開発機構(NEDO)が実施する「GENIAC(Generative AI Accelerator Challenge)」プロジェクトの成果をもとに作成されました。
株式会社EQUESについて
株式会社EQUESは、「最先端の機械学習技術をあやつり社会の発展を加速する」という理念のもと、生成AIや数理最適化に焦点を当てて研究開発を行っている、東京大学松尾研究室発のスタートアップ企業です。現役の東京大学院生を中心としたメンバーが、それぞれの専門性を活かし、企業の課題解決に向けてAI・機械学習分野の最先端技術を社会に導入しています。
- 会社ホームページURL: https://www.eques.co.jp

