AIのすごい国際大会「NeurIPS 2025」で日本チームが優勝!
電通総研、東北大学 言語AI研究センター、そしてStudio Ousiaという3つの組織が力を合わせ、AI分野で世界トップクラスの国際会議「NeurIPS(ニューリプス) 2025」のコンペティションで優勝しました。特に、みんなが使える「オープンソース技術」を使って、まるで専門家のように情報を集めて分析する「Deep Research」という長文質問応答システムを構築したことが高く評価されています。

「NeurIPS」ってどんな会議?「Deep Research」って何?
「NeurIPS」は、AIの技術、特に機械学習や深層学習といった分野で、世界で最も権威があり、規模の大きい国際会議の一つです。この会議の中で行われたコンペティション「MMU-RAG」では、「Deep Research」という少し難しい名前のAIシステムの性能が競われました。
Deep Researchとは、ChatGPTやGeminiのような生成AIが持っている、自分で情報を探し、それをまとめて、質問に答えるという、とても高度なリサーチ機能を指します。普段私たちが使っているこれらのAIサービスは、企業が作った「クローズドな技術」ですが、今回のコンペティションでは、誰でも使える「オープンソース技術」でどこまでできるかを競い、電通総研たちのチームが高い精度と再現性を実現し、優勝を勝ち取りました。
これまでのAI研究では、短い質問に答えることに注目が集まりがちでした。なぜなら、短い質問ならAIの答えと正しい答えを比べやすいからです。しかし、今回のコンペティションは、長い文章での質問に答えることが課題でした。この難しい課題を解決する新しい評価方法や学習の仕方が重要になったのです。
「Deep Research」がすごい理由
Deep Researchシステムは、大規模言語モデル(LLM)というAIを核に、色々な「ツール」を組み合わせて作られています。これにより、まるで専門家が調査したレポートのような、とても詳しい回答をAIが自動で作れるようになります。例えば、こんな場面で役立つと期待されています。
-
市場の調査や、ライバル会社の分析
-
学術論文をたくさん調べて、最新の情報を把握する
-
商品のマーケティングのためのリサーチ
-
金融のデータや経済の動きを分析する
この高度な調査能力は、私たちが普段使うキーワード検索とは違う、いくつかの特別な仕組みによって支えられています。
- 質問の意図を深く理解し、自分で調査計画を立てる
単に質問の言葉を検索するだけでなく、質問の背景や目的をAIが推測し、何段階もの調査手順を自動で計画します。 - 幅広い情報源から自動で情報を集める
計画に沿って、AIが持つ知識やインターネット上の様々な情報、データベースなどから、必要な情報を段階的に、そして漏れなく集めます。 - 情報の信頼性を評価し、どこから得た情報かを教えてくれる
集めた情報がどれくらい信頼できるか、情報同士に矛盾がないかをAIが判断し、回答に使った情報の出典(どこから得た情報か)をきちんと示してくれます。 - 多角的に分析し、質の高い洞察を生み出す
情報同士のつながりや一貫性を確認しながら、色々な角度から分析することで、単に情報をまとめるだけでなく、より質の高い、深い考えを提供します。
なぜこの研究に取り組んだのか?
電通総研は、自分たちのサービスに生成AIを組み込む中で、Deep Researchがとても重要な機能だと考えています。これまでも、デジタルファイナンス(金融とテクノロジーを組み合わせたサービス)の分野などで、専門的な作業を効率化するために、主に企業が提供するDeep Researchの機能を使ってきました。
しかし、一般的なサービスとして提供されるDeep Research機能では、個別の会社の細かい要望に合わせたカスタマイズが難しかったり、利用にかかる費用が課題になったりすることがありました。そこで電通総研は、将来的にオープンソース技術を使ってDeep Research機能を自分たちで作れるようにすることを目指し、東北大学やStudio Ousiaと協力して、この最先端技術の研究と検証を行うために、今回のコンペティションに参加しました。
どのようにして優勝したのか?
今回の挑戦では、Studio Ousiaの山田氏がリーダーとなり、オープンソースのAIモデルをベースに、長文の回答をより正確に生成するための工夫を凝らしました。特に、AIの回答が「事実と合っているか」を自動で評価するのが難しいという課題に対し、「Key Point Recall」という指標を使って、自動で評価できる仕組みを新しく作り上げました。さらに、高度な検索機能も取り入れ、細かな設定を調整することで、長い質問にも効率よく答えるシステムを作り上げました。これらの取り組みが実を結び、最高の成績を収め、優勝につながりました。
今回の成果がもたらす未来
今回の優勝により、オープンソース技術だけでDeep Researchシステムを設計し、作り、評価するための知識と、再利用できる仕組みを手に入れることができました。この成果を活用することで、学術研究はもちろん、企業での知識活用、公共分野など、様々な場所で長文質問応答を中心とした高度なリサーチ機能をシステムに組み込むことが可能になります。
電通総研は、このDeep Research機能を自分たちのサービスに段階的に取り入れていくことで、調査や企画、書類作成、お客様からの問い合わせ対応といった、頭を使う業務をより効率的で高度なものにしていきます。例えば、製造業での技術文書や過去のトラブル事例をまとめて検索したり、公共分野で政策を作るための資料調査をしたり、コンサルティングプロジェクトのリサーチを自動化したりと、幅広い分野での活用が期待されています。
中でも特に重要な応用分野の一つが「デジタルファイナンス」です。金融の様々なサービスが細かく分かれて提供されるようになっている中で、Deep Research技術を組み合わせることで、法律や市場のデータ、企業の公開情報など、色々な情報をまとめて分析し、新しい金融サービスの企画、審査、監視をより高度にすることを目指します。電通総研は、新しい発想で作られた金融サービスを充実させ、金融を含む様々な産業で、より良い意思決定を支えるプラットフォーム作りに貢献していきます。
関係者の声
株式会社電通総研 事業開発室 データサイエンティスト 尾崎 尚憲 氏
「今回の『NeurIPS 2025』のコンペティションで、今とても注目されているDeep Researchという方法を核としたシステムで優勝できたことを、大変光栄に思います。何段階もの情報探索と推論を組み合わせるだけでなく、AIのチューニングも行った今回のアプローチは、AIが人間のように情報を探すことを目指した取り組みです。今回の成果をスタート地点として、本当に役立つDeep Researchシステムを実用化・高度化することに、これからも継続して取り組んでいきます。」
東北大学 言語AI研究センター センター長 鈴木潤 氏
「私たちが毎日使っているWeb検索がさらに進化した形で、これからの様々な調べ物の中心になる可能性を秘めたDeep Researchという方式の技術を、自分たちで独自に作り上げる貴重な機会となりました。今後の研究に役立つ知見や経験を得ることができました。」
株式会社Studio Ousia チーフサイエンティスト 山田育矢 氏
「最近、ChatGPTやGeminiなどに搭載されている、AIが自分でリサーチするDeep Research機能は、主に企業が提供するAIを使って実現されていますが、オープンな技術で同じような機能を実現するのは難しい課題です。今回のコンペティションで開発した、誰でも使えて再現可能なDeep Researchが、その解決の助けとなり、この分野の研究がさらに発展していくことを期待します。」
協力した企業・研究機関について
-
東北大学 言語AI研究センター
東北大学は、AI研究の中でも「自然言語処理」(人間の言葉をAIが理解・生成する技術)の分野で国内最大級の研究グループを持っています。2023年10月に設立された言語AI研究センターは、生成AIを含む高度なAI技術の仕組みを解き明かし、安全なAIの開発や、AIの基本となる技術の発展を進めています。
詳細はこちら: https://langai.tohoku.ac.jp/ -
株式会社Studio Ousia
Studio Ousiaは、「テキストを『使える知識』へ」という目標を掲げ、自然言語処理の技術を使って、組織が持つ情報から新しい価値を生み出すことを目指しています。ウェブ上の知識だけでなく、それぞれの組織が持つ特別な知識も活用できる大規模言語モデル(LLM)の開発を得意としています。
詳細はこちら: https://www.ousia.jp/ -
株式会社電通総研
電通総研は、「HUMANOLOGY for the future~人とテクノロジーで、その先をつくる。~」という企業ビジョンのもと、システムの開発、コンサルティング、シンクタンクという3つの機能を組み合わせることで、企業や社会の課題解決を支援し、より良い社会の実現を目指しています。テクノロジーや業界の壁を越えた「X Innovation(クロスイノベーション)」を推進し、新しい価値を創造し続けています。
詳細はこちら: https://www.dentsusoken.com

