「Qlean Dataset」が日本語の文学朗読音声データを公開!AI開発をサポート

AIツール・サービス紹介

Qlean Dataset 日本語・1話者・文学の朗読音声コーパスとトランスクリプトを提供開始

AI開発を手がけるVisual Bank株式会社は、AI学習用データソリューション「Qlean Dataset」を通じて、新しいデータセットの提供を開始しました。今回提供されるのは、「日本語・1話者の文学朗読音声データセット」です。

このデータセットは、AIがより自然な音声を生成したり(音声合成:TTS)、人が話した言葉を正確に文字にしたり(自動音声認識:ASR)、言葉の意味を理解したりするための技術(自然言語処理:NLP)を開発・研究するのに役立つものです。

文学作品の朗読でAIを賢くする

このデータセットには、日本の文学作品や小説を、一人の日本人話者が最初から最後まで朗読した音声と、その音声を正確に書き起こしたテキスト(トランスクリプト)が含まれています。

朗読された音声は、物語の情景や地の文(登場人物のセリフ以外の部分)を、一定の速さで丁寧に読み上げる、文学作品ならではのスタイルを持っています。感情の大きな起伏は抑えられていますが、文学的な表現に基づいた微妙な声の調子の変化も含まれているため、文脈(文章の流れ)を考慮した、より高度な音声生成技術の開発に利用できます。

長時間の音声でも一貫した話し方をするため、AIが長い文章を読み上げる際のポーズ(間)や抑揚(声の上げ下げ)を自然に制御する研究にも活用できるでしょう。

どんなことに使えるの?

このデータセットは、AI開発のさまざまな場面で役立つことが期待されています。

研究での活用例

  • 長尺の音声合成(TTS)の韻律制御研究: 数十分から1時間を超える長いテキストに対して、AIが話者の一貫性を保ちつつ、文脈に合った自然なポーズや抑揚で音声を生成する技術の検証に利用できます。

産業での活用例

  • オーディオブックやナレーション生成AIの開発: 出版業界などで、文学作品の複雑な文章を正確に読み上げるナレーションAIを作るための学習データとして活用できます。これにより、人間が朗読したかのような自然なオーディオブック体験を実現する機能の開発が進むでしょう。

  • 文学表現に特化した自動音声認識(ASR)の音響モデル最適化: 日常会話とは異なる、文学作品特有の言葉遣いや語彙(ごい)が含まれる音声をAIが正しく聞き取り、文字にするためのASRモデルを、より専門的に調整(ファインチューニング)するために利用できます。

Qlean Dataset とは

QLean Dataset AIデータレシピ あらゆる業界のAI開発に対応する、機械学習用データセットラインナップ「AIデータレシピ」を提供

「Qlean Dataset(キュリンデータセット)」は、Visual Bankの子会社である株式会社アマナイメージズが提供する、AI学習用のデータソリューションです。画像、動画、音声、3D、テキストなど、さまざまな種類のデータを扱っており、研究から商用利用まで、安心してAI開発に使える環境を提供しています。

Visual Bankは、国の研究開発プログラム「GENIAC」にも採択されており、AI開発力の向上と社会実装に向けた取り組みを加速させています。

特に「AIデータレシピ」というオリジナルのデータラインナップでは、以下のような特徴があります。

  • すべての被写体から同意取得: データに含まれる人物などからは、事前に同意を得ています。

  • 既存データは最短1日で納品: 必要なデータがあれば、すぐに手に入れることができます。

  • カスタム撮影・収録・収集にも対応: もし既存のデータで足りない場合は、要望に応じて新しいデータを撮影したり、録音したりして用意することも可能です。

Qlean Datasetは、AI開発でデータ集めや準備にかかる手間を減らし、著作権などの法的リスクを心配せずにAIを開発できる環境をサポートしています。

関連リンク

Qlean Dataset Japanese Literary Audio Corpus Ideal for TTS / ASR / NLP Research

タイトルとURLをコピーしました