Qlean Datasetが「海外文学の朗読音声とトランスクリプト」を提供開始 – AI開発を支援する新たなデータセット

AIツール・サービス紹介

Visual Bank株式会社のAI学習用データソリューション「Qlean Dataset」が、AI開発を助ける新しいデータセット「海外文学の朗読音声とトランスクリプト」の提供を始めました。これは、AIが人の言葉をより正確に理解したり、自然な声で話したりするための学習に役立つデータです。

Qlean Datasetが海外文学の朗読音声とトランスクリプトを提供開始

データセットの詳しい内容

このデータセットには、海外の文学作品を日本語に翻訳した文章を、一人の日本人話者が落ち着いた声で朗読した音声と、その音声に対応する正確な文字データ(トランスクリプト)が含まれています。

特に注目すべきは、日常会話とは違う、文学作品ならではの「書き言葉」に特化している点です。例えば、物語の情景描写や哲学的な表現など、複雑な言い回しや文脈を含む文章が多く含まれています。これにより、AIは長い文章の文脈を理解したり、高度な言葉を使った自然言語処理の学習を進めたりできます。

このデータは、オーディオブックのようなナレーションを作るAIの開発や、文脈を理解する音声認識エンジンのテストなどに使われることが想定されています。

データ種別 音声、テキスト
被写体属性 日本人
データ形式 音声データ:mp3
収録時間 1音声30秒〜90分
音声レート 44.1kHz / 48kHz
対象のシーン 海外文学作品の文章を日本語訳文として朗読するシーン

サンプル詳細はこちらで確認できます: https://qleandataset.visual-bank.co.jp/lineup/pn-040

AI開発での活用例

このデータセットは、様々なAI開発の場面で役立ちます。

  • 研究での利用

    • 長い文章の音声認識の精度を高める: 翻訳文学のように長い文や複雑な表現が含まれる日本語を、AIがどれだけ正確にテキストにできるかを試すための基準データとして使えます。
  • ビジネスでの利用

    • ナレーションに特化した音声合成AIの開発: オーディオブックやニュースの自動読み上げサービスなど、感情を抑えつつも聞き手に情景を伝えるような、表現力豊かな合成音声を作るための学習データとして活用できます。
  • 教育や社会貢献での利用

    • 日本語学習者の発音練習や聞き取り支援AI: 標準的で丁寧な日本語の発音を「正しいお手本」として使うことで、外国人の日本語学習者が発音を直したり、視覚に障がいのある方向けの読書支援デバイスで、自然で聞き取りやすい読み上げ機能を実現したりするのに役立ちます。

    • 文学的な内容を理解するAIの調整: 論理的な構造を持つ文学作品の音声とテキストをAIに学習させることで、文章の要約や文学的な表現の翻訳をより正確に行える、専門的なAIモデルを作るために使えます。

『Qlean Dataset(キュリンデータセット)』とは

『Qlean Dataset』は、Visual Bank傘下の株式会社アマナイメージズが提供する、AIが学習するために使えるデータを提供するサービスです。画像、動画、音声、3D、テキストなど、様々な種類のデータを取り扱っており、研究だけでなく商業目的でも安心して利用できます。

特に、様々な業界のAI開発に対応するオリジナルのデータラインナップ「AIデータレシピ」を継続的に増やしています。

Qlean Dataset AIデータレシピ

AIデータレシピの提供価値

Qlean Datasetは、AI開発でデータ集めや準備にかかる手間を減らし、著作権などの権利問題をクリアした、安心して使えるAI開発環境の構築をサポートします。

Qlean Datasetが提供するデータセット「AIデータレシピ」には、以下のような特徴があります。

  • すべての被写体から同意を得ている

  • 既存のデータは最短1日で受け取れる

  • 必要な場合は、特別な撮影や収録、データ収集でオリジナルのデータも作れる

Qlean Datasetの強み

お問い合わせはこちら: https://qleandataset.visual-bank.co.jp/contact

Visual Bank株式会社について

Visual Bank株式会社は、「あらゆるデータの可能性を解き放つ」を目標に掲げ、AI開発力を高めるためのデータ基盤を提供するスタートアップ企業です。漫画家をサポートするAI補助ツール『THE PEN』のほか、AI学習用データセット開発サービス『Qlean Dataset』を提供する株式会社アマナイメージズを子会社としています。

同社は、国の研究開発プログラム「GENIAC」にも選ばれており、AI技術の社会への応用を積極的に進めています。

タイトルとURLをコピーしました