Qlean Datasetが日本の伝統話芸「講談」の音声データをAI研究・開発向けに提供開始

AIツール・サービス紹介

Visual Bank株式会社は、AI学習用データソリューション「Qlean Dataset(キュリンデータセット)」を通じて、「日本語・1話者・講談の音声コーパスとトランスクリプト」の提供を開始しました。これは、AIが人の言葉を理解したり、音声を文字にしたりする技術(ASR:自動音声認識、音声理解、音声言語モデルなど)を開発・研究するために作られたデータセットです。

Qlean Dataset Japanese Kodan Narrative Speech Dataset Single-Speaker Long-Form Expressive Audio

講談の自然な語りをAI学習に活かす

今回提供が始まったデータセットは、日本の伝統的な話芸である「講談」の語りを使っています。1人の話者が物語を語る音声と、その内容を忠実に書き起こした日本語のテキスト(トランスクリプト)で構成されています。

講談ならではの、声の抑揚(声の上げ下げ)、間(話すのを一時止めること)、話す速度の変化など、自然な話し方が連続して収録されています。これは、ただ文章を読み上げる音声や、日常会話の音声とは違い、日本語の物語を語る特有の構造を含んだ貴重なデータです。

物語の進行に合わせて、風景の説明や登場人物の話し方の違い、緊張感を出す演出などが含まれるため、AIが音声とテキストの関係を深く学ぶのに役立ちます。単調なデータでは得られない、より実践的な学習環境を提供します。短い語りから長い語りまで様々な構成が含まれているため、長い音声の中で文脈を保ったり、区切りを見つけたりする研究にも活用できます。

データセットの概要

Qlean Datasetが提供する「日本語・1話者・講談の音声コーパスとトランスクリプト」の主な内容は以下の通りです。

  • データ種別: 音声、テキスト

  • 被写体属性: 日本人

  • データ形式: 音声データはmp3、テキストデータはtxt, json, csv

  • 収録時間: 1つの音声につき30秒から45分

  • 音声レート: 44.1kHz / 48kHz

  • 対象のシーン: 講談特有の語り口で物語を語る音声シーン、抑揚や間を活かしながら進行する語りのシーン

詳しいサンプルはこちらから確認できます。

様々なAI開発・研究での活用例

このデータセットは、AIの研究や、私たちが日々使うAIサービスの開発に幅広く役立ちます。

研究での使い方

  • 日本語音声認識モデルの精度向上: AIが人の声を文字にする(ASRモデル)研究で、講談の語りに含まれる抑揚や間のある連続音声を使うことで、通常の読み上げ音声とは違う、自然な話し方での認識精度や間違いの傾向を検証できます。

  • 音声と言葉の表現の関係性研究: 音声データと書き起こしテキストを合わせて使うことで、日本語の語り方や、声の調子(韻律情報)が、AIの言葉の理解にどう影響するかを分析する研究に役立ちます。

産業での使い方

  • 音声入力型AIの長尺音声処理検証: 音声で検索したり、音声の記録を分析したりするAI製品の開発において、長時間にわたる1人語りの音声を使って、音声の区切り方、全体の文字起こし、要約処理などの機能を試すのに使えます。

  • 日本語音声言語モデルの事前学習・評価: 日本語ならではの語り口や物語の構成を含む音声・テキストデータとして、AIが言葉を学ぶためのモデル(音声言語モデル)を開発する際の、最初の学習や評価の補助データとして活用できます。

『Qlean Dataset』について

Qlean Datasetは、Visual Bank株式会社の子会社である株式会社アマナイメージズが提供する、AI学習用のデータソリューションです。画像、動画、音声、3D、テキストなど、様々な形式のデータを取り扱っており、研究目的でも商用目的でも安心して使えるように、権利処理や利用条件が明確にされています。

Qlean Datasetの強みを示すスライド

Qlean Datasetは、株式会社千葉ロッテマリーンズや株式会社東洋経済新報社など、様々なデータパートナーとの協力により、特定の業界に特化したデータや最新トレンドに合わせたデータ群「AIデータレシピ」を継続的に増やしています。これにより、AI開発現場でのデータ集めや準備の手間を減らし、法的なリスクのないAI開発環境の構築をサポートしています。

AIデータレシピのウェブページ

Visual Bank株式会社について

Visual Bank株式会社は、「あらゆるデータの可能性を解き放つ」をミッションに掲げ、AI開発力を高めるための次世代データ基盤を構築・提供するスタートアップ企業です。漫画家をサポートするAI補助ツール「THE PEN」や、AI学習用データセット開発サービス「Qlean Dataset」を提供する株式会社アマナイメージズを100%子会社としています。

同社は、国の研究開発プログラム「GENIAC」にも採択されており、AI技術の社会への普及に向けた取り組みを加速させています。

タイトルとURLをコピーしました