AIの賢さをアップ!『Qlean Dataset』が東洋経済新報社の記事データをRAG開発に提供開始

AIツール・サービス紹介

はじめに:AIの信頼性を高める新しい取り組み

Visual Bank株式会社傘下の株式会社アマナイメージズが提供するAI学習用データソリューション『Qlean Dataset(キュリンデータセット)』が、株式会社東洋経済新報社が持つ記事テキストやグラフデータを、RAG(Retrieval-Augmented Generation)開発というAIの技術に使える形で提供を開始しました。

RAGとは、AIが何かを生成する際に、事前に用意された情報の中から関連性の高いものを探し出し、それを参考にしながら答えを作り出す技術のことです。これにより、AIはただ漠然と答えるのではなく、具体的な根拠に基づいた、より信頼性の高い情報を生成できるようになります。今回のデータ提供は、このRAG開発において、AIが参照する「知識の源」を高品質なものにすることで、より賢く、より信頼できるAIを作るための大きな一歩となります。

『Qlean Dataset』とは?

『Qlean Dataset』は、AIの研究や商業的な開発をサポートするためのデータソリューションです。画像、動画、音声、テキストなど、さまざまな種類のデータを、AIが学習しやすい形に整えて提供しています。特に、権利関係がクリアな(安心して商用利用できる)高品質なデータを提供することで、AI開発者がデータの準備にかかる手間を減らし、開発に集中できるよう支援しています。

『Qlean Dataset』では、多様なデータラインナップを「AIデータレシピ」として提供しており、各業界のニーズに合わせたデータが用意されています。

AIデータレシピのデータ種別/産業別提供内容

東洋経済新報社の高品質データがAI開発に

今回、『Qlean Dataset』を通じて提供されるのは、東洋経済新報社が長年にわたり蓄積してきた信頼性の高いテキストデータとグラフデータです。これには、ビジネス誌のトップランナーである「東洋経済オンライン」や、株式投資に特化した「会社四季報オンライン」など、20年以上にわたる記事や、各業界の専門記者が執筆した質の高い日本語データが含まれます。これらのデータは、これまでAIモデルの「学習用途」として提供されていましたが、今後はRAGの「知識ベース」として直接参照・引用し、生成される文章の根拠として活用できるようになります。

サンプルデータの詳細はこちらから確認できます。

提供されるデータは、以下のような形で利用できます。

週刊東洋経済の様々な号の表紙

東洋経済オンラインのトップページ

週刊東洋経済の様々な号の表紙

会社四季報オンラインのトップページ

株式ウイークリーのページ

RAG開発での活用イメージ

東洋経済新報社のデータは、RAG開発において様々な場面で役立ちます。

  • RAG・LLMの検索精度・根拠提示の強化に
    企業や経済、金融に関する幅広い記事をRAGの知識源として使うことで、専門性の高いRAGが実現します。特に、AIが生成した回答の出典をはっきりと示す必要がある場合に有効です。

  • 投資分析・経営リスクモニタリングの知識更新に
    「会社四季報オンライン」や「株式ウイークリー」などの記事やグラフを参考にすることで、最新の業績や経営の動きを反映した分析モデルを作ることができます。これにより、経営判断を助けるAIや自動リサーチエージェントの信頼性が高まります。

  • 社内ナレッジRAGとの統合による高度な情報検索に
    企業のFAQ(よくある質問)やレポートに、東洋経済の信頼できる記事・グラフデータを加えることで、社内外の知識を統合した高精度な知識検索システムを構築できます。これにより、リサーチ、広報、法務といった部署での情報探しや判断の効率化が期待できます。

中期経営計画、政治、米大統領選に関するテキストデータ例

ビール、保険、自動車、大学、空き家、ベンチャーなどの統計データグラフ例

『Qlean Dataset』のその他の特徴

『Qlean Dataset』は、AI開発をよりスムーズに進めるための、いくつかの優れた特徴を持っています。

  • すべての被写体から同意取得済み
    データに含まれる人物など、すべての被写体から適切な同意を得ているため、法的なリスクを心配することなく商用利用が可能です。

  • 既存データは最短1日で納品可能
    必要なデータを迅速に手に入れることができるため、AI開発のスピードアップに貢献します。

  • カスタム撮影・収録・収集による独自データ構築にも対応
    既存のデータだけでなく、お客様の特定のニーズに合わせて、独自のデータを撮影・収録・収集することも可能です。

Qlean Datasetの提供価値

Qlean Datasetの強み

より詳しい情報やご質問は、お問い合わせページからご連絡ください。

Visual Bank株式会社について

Visual Bank株式会社は、「あらゆるデータの可能性を解き放つ」をミッションに掲げ、AI開発を最大限に引き出すための次世代型データインフラを提供しているスタートアップ企業です。漫画家をサポートするAI補助ツール『THE PEN』の提供や、AI学習用データセット開発サービス『Qlean Dataset』を提供する株式会社アマナイメージズを100%子会社として持っています。

同社は、国の研究開発プログラム「GENIAC」にも採択されており、社会に役立つAI技術の実用化に向けて積極的に取り組んでいます。

まとめ

今回の『Qlean Dataset』による東洋経済新報社のテキストデータ提供は、AIがより正確で信頼性の高い情報を生成できるようになるため、AIのビジネス活用を大きく後押しするものです。特に、情報源の信頼性が求められる金融や経済分野でのAI開発において、この高品質なデータは強力な味方となるでしょう。AI初心者の方々も、この新しいデータ活用によって、より身近で役立つAIが生まれてくることを期待できます。

タイトルとURLをコピーしました