Qlean Datasetが「日本語・1話者・文学朗読音声データセット」を提供開始!AIがより自然な声で物語を語る時代へ

生成AI(Generative AI)

AI開発を加速する「日本語・1話者・文学朗読音声データセット」が登場

Qlean Dataset 日本語・1話者・文学の 朗読音声コーパスと トランスクリプトを提供開始

Visual Bank株式会社は、高品質なAIを開発するための新しいデータセット「日本語・1話者・文学朗読音声データセット」の提供を開始しました。このデータセットは、AIがまるで人間のように自然な声で話したり(音声合成、TTS)、話された言葉を正確に聞き取ったり(自動音声認識、ASR)、言葉の意味を理解したり(自然言語処理、NLP)する技術の研究や開発に役立ちます。

文学作品を同一話者が朗読、AI学習に最適なデータ

このデータセットは、日本の文学作品や小説を対象としています。一人の日本人話者がすべての作品を丁寧に朗読した音声と、その内容を正確に文字に起こしたテキスト(トランスクリプト)で構成されています。朗読は、作品の情景や文章の流れに合わせて、一定のテンポで読み上げられる文学作品特有のスタイルを保っています。

特に注目すべきは、長時間にわたる朗読でも声の特徴が一貫している点です。感情の起伏を抑えた安定した声色から、文学的な表現に基づく細かな声の上げ下げまで含まれているため、AIが文脈を理解し、より高度な音声を作り出す技術の検証に最適です。

データセットの詳しい情報やサンプルは、以下のページで確認できます。
サンプルページ

AI開発での具体的な活用例

このデータセットは、さまざまなAI開発シーンで活用が期待されています。

研究用途

  • 長文の音声合成(TTS)における声の調子やリズムの研究
    数十分から1時間を超える長いテキストでも、AIが一貫した声の特徴を保ちながら、文脈に合った自然な間合いや抑揚(声の上げ下げ)で話すことができるか、その精度を検証するのに使えます。

産業用途

  • オーディオブックやナレーションを生成するAIの開発
    出版業界やエンターテインメント分野で、文学作品の複雑な文章を正確に読み上げるナレーションAIを作るための学習データとして活用できます。これにより、人間が朗読したかのような自然な聞き心地のオーディオブックなどを開発できます。

  • 文学表現に特化した自動音声認識(ASR)の精度向上
    普段の会話とは異なる文学作品特有の言葉遣いや語彙が含まれる音声を、AIが正しく聞き取ってテキストにするための、専門分野に特化したASRモデルをより賢くするために利用できます。

AI開発を支える『Qlean Dataset(キュリンデータセット)』

QLean Dataset AIデータレシピ あらゆる業界のAI開発に対応する、機械学習用データセットラインナップ「AIデータレシピ」を提供

『Qlean Dataset』は、Visual Bankの子会社である株式会社アマナイメージズが提供する、AI学習用のデータソリューションです。画像、動画、音声、3D、テキストなど、さまざまな種類のデータを扱っており、研究からビジネス利用まで、どのような目的でも安心して使える環境が整っています。

「AIデータレシピ」というオリジナルのデータラインナップを通じて、AI開発の現場で求められるデータを継続的に提供しています。これにより、AI開発でデータ集めや準備にかかる手間を減らし、著作権などの権利問題をクリアした、安心して使えるAI開発環境の構築をサポートしています。

『Qlean Dataset』が提供するデータの強み

  • すべてのデータは同意取得済み
    データに含まれる人物など、すべての被写体から事前に同意を得ています。

  • 既存データは最短1日で納品可能
    必要なデータを素早く手に入れることができます。

  • オリジナルのデータ作成にも対応
    「こんなデータが欲しい」という要望に応じて、カスタムで撮影や収録を行い、独自のデータを作ることも可能です。

お問い合わせはこちらから:お問い合わせ

Visual Bank株式会社について

Visual Bank株式会社は、「あらゆるデータの可能性を解き放つ」をミッションに掲げ、AI開発力を高めるための次世代データインフラを提供するスタートアップ企業です。漫画家向けのAI補助ツール『THE PEN』の提供や、『Qlean Dataset』を提供する株式会社アマナイメージズを子会社に持っています。

同社は、国の研究開発プログラム「GENIAC」にも採択されており、社会へのAI技術の導入を加速させています。

タイトルとURLをコピーしました