Qlean Datasetが「日本語・1話者・児童書の朗読音声データセット」を提供開始

Visual Bank株式会社が展開するAI学習用データソリューション「Qlean Dataset(キュリンデータセット)」は、「日本語・1話者・児童書・童話・絵本・昔話テーマの朗読音声コーパスとトランスクリプト」の提供を開始しました。この新しいデータセットは、ASR(自動音声認識)やNLP(自然言語処理)、LLM(大規模言語モデル)といった音声や言語を扱うAIの開発を強力にサポートします。
児童書の朗読音声でAI開発を支援
今回提供されるデータセットは、子ども向けの物語を日本人の一人の話者が朗読した音声と、その内容を正確に文字にしたテキスト(トランスクリプト)で構成されています。特徴は、登場人物の気持ちや物語の展開が伝わるように、自然な抑揚や間の取り方で朗読されている点です。
一人の話者による長い時間の朗読音声がまとまっているため、特定の人の話し方に特化した音声認識モデルの性能を調べたり、物語のような長い文章を理解する言語モデルの学習や評価に役立てることができます。音声とテキストがきちんと対応しているので、音声とテキストを組み合わせて使うAI(マルチモーダルAI)の研究にも活用できるでしょう。
データセットの概要と利用例
このデータセットは、研究から実際のビジネスまで、さまざまなAI開発シーンで活用が期待されています。
データセットの概要
-
データ種別: 音声、テキスト
-
話者属性: 日本人(1話者)
-
データ形式: 音声データ:mp3
-
収録時間: 1音声あたり30秒〜120分
-
音声レート: 44.1kHz / 48kHz
-
対象シーン: 子ども向け物語を一人の話者が朗読するシーン、登場人物や物語展開をわかりやすく伝える読み上げシーン
より詳しいサンプルは以下のリンクから確認できます。
サンプル詳細
ユースケースイメージ
【研究用途】
-
朗読音声の音声認識精度検証: 児童書の朗読音声を使って、AIが物語の読み上げをどれだけ正確に文字にできるかを評価できます。
-
長文を扱う言語モデルの理解検証: 物語形式の連続したテキストを使い、AIが物語の流れや登場人物の関係性をどれだけ理解できるかを調べることができます。
【産業用途】
-
音声読み上げAI・ナレーション生成モデルの評価: 児童向けコンテンツ用の音声読み上げAIが、物語らしい自然な話し方をどれだけ再現できるかを確認するデータとして利用できます。
-
音声入力を使う対話型AIの基礎検証: 朗読音声とテキストを組み合わせ、音声からの対話や応答処理、音声と言語を統合したAIの検証に役立ちます。
Qlean Datasetについて
「Qlean Dataset」は、Visual Bankのグループ会社である株式会社アマナイメージズが提供する、AI学習用のデータソリューションです。画像、動画、音声、3D、テキストなど、さまざまな形式のデータを取り扱っており、研究用だけでなく、商用利用も安心して行えるようにデータを提供しています。

また、株式会社千葉ロッテマリーンズや株式会社東洋経済新報社といったパートナーとの協力により、特定の業界に特化したデータや最新のトレンドに合わせたデータセット「AIデータレシピ」を増やし続けています。Qlean Datasetは、AI開発でデータ集めや準備にかかる手間を減らし、著作権などの問題をクリアした安全なAI開発環境を整える手助けをします。

Qlean Datasetのウェブサイトはこちらです。
Qlean Datasetサイト
AIデータレシピのラインナップはこちらです。
AIデータレシピ
お問い合わせはこちらです。
お問い合わせ
Visual Bank株式会社は、「あらゆるデータの可能性を解き放つ」をミッションに、AI開発力を高めるための次世代データインフラを構築・提供しています。同社は、国の研究開発プログラム「GENIAC」にも採択されており、社会へのAI技術の普及に向けた取り組みを進めています。

