Qlean Dataset、東洋経済新報社のテキストデータをRAG開発用途に提供開始
AI(人工知能)を活用したサービス開発を手がけるVisual Bank株式会社は、傘下の株式会社アマナイメージズを通じて、AI学習用データソリューション「Qlean Dataset(キュリンデータセット)」の新たな取り組みを発表しました。
このたび、株式会社東洋経済新報社が保有する記事テキストやグラフデータを、RAG(Retrieval-Augmented Generation)開発用途として提供を開始します。RAGとは、生成AIが回答を作成する際に、外部の正確な情報を参照して、より信頼性の高い文章を生成するための技術です。

RAG開発における「高品質テキストソース」の重要性
これまで、東洋経済新報社のデータは主に生成AIモデルやアルゴリズムの「学習用途」として提供されてきました。しかし今回の提供開始により、RAGの「ナレッジベース・参照データソース」として、生成AIが直接参照・引用し、生成された文章の根拠として活用できるようになります。
これにより、AIが「なぜその回答をしたのか」という根拠を明確に示せるようになり、企業や研究機関は、出力の信頼性や透明性が保証された生成AIの開発をよりスムーズに行うことができるようになります。
Qlean Datasetについて、さらに詳しい情報は以下のサイトで確認できます。
東洋経済新報社のテキストデータセットとは
提供されるデータセットには、ビジネス誌系サイトのトップランナーである「東洋経済オンライン」や、株式投資領域で独自の地位を築く「会社四季報オンライン」をはじめとした、過去20年以上にわたる記事テキストやグラフデータが含まれます。
これらのデータは、各業界の専門記者が執筆した質の高い日本語データであり、経済、金融、産業動向など多岐にわたる専門知識が集約されています。
サンプルイメージ




サンプル詳細については、以下のURLで確認できます。
東洋経済新報社のテキストデータセット サンプル詳細
提供されるデータ形式の例


「東洋経済新報社のテキストデータセット」の活用例
この高品質なデータセットは、さまざまなAI開発シーンで役立つことが期待されます。
RAG・LLMの検索精度・根拠提示の強化
企業や経済、金融に関する網羅的な記事群をRAGの参照元として使うことで、専門性の高いRAG運用が可能になります。特に、AIの回答に出典を明示したい場合に有効です。
投資分析・経営リスクモニタリングの知識更新
「会社四季報オンライン」や「株式ウイークリー」などの記事やグラフを参照元として組み込むことで、最新の業績や経営動向を反映した分析モデルを開発できます。これにより、経営判断をサポートするAIや自動リサーチエージェントの信頼性向上に貢献します。
社内ナレッジRAGとの統合による高度な情報検索
企業内のFAQやレポートといった情報に、東洋経済の信頼できる記事・グラフデータを加えることで、社内外の知見を統合した、より精度の高いナレッジRAGを構築できます。リサーチ、広報、法務などの部門で、情報探索と判断の効率化を実現します。
『Qlean Dataset(キュリンデータセット)』について
『Qlean Dataset』は、Visual Bank傘下の株式会社アマナイメージズが提供する、商用利用が可能なAI学習用データソリューションです。画像、動画、音声、3D、テキストなど、多様な形式のデータに対応しており、研究・商用どちらの用途でも安全に利用できる環境が整えられています。
株式会社千葉ロッテマリーンズや株式会社東洋経済新報社など、多くのデータパートナーとの協力により、業界に特化した最新トレンドのデータラインナップ「AIデータレシピ」を継続的に拡充しています。Qlean Datasetは、AI開発におけるデータ収集や準備の負担を減らし、権利が明確で法的なリスクのないAI開発環境の構築を支援します。


『Qlean Dataset』の提供価値と特徴
Qlean Datasetは、AI開発に必要なデータセット(データ素材、アノテーション、キャプションなど)を、商用利用可能な「AIデータレシピ」から提供します。

その強みとして、安価かつスピーディーなデータ提供、多様なデータ形式へのカスタマイズ対応、AIデータレシピにないデータの拡充、そして著作権や肖像権などの権利処理が済んでいるため商用利用も安心して行える点が挙げられます。

Qlean Datasetに関するお問い合わせは、以下のページから可能です。
お問い合わせ
Visual Bank株式会社について
Visual Bank株式会社は、「あらゆるデータの可能性を解き放つ」をミッションに掲げ、AI開発力を最大化する次世代型データインフラを構築・提供するスタートアップ企業です。漫画家をサポートするAI補助ツール『THE PEN』や、AI学習用データセット開発サービス『Qlean Dataset』を提供する株式会社アマナイメージズを100%子会社に持っています。
また、Visual Bankは国の研究開発プログラム「GENIAC」にも採択されており、社会実装に向けた取り組みを加速させています。

