Qlean Datasetが「怪談朗読音声データ」を提供開始!AIが感情を理解する時代へ

開発・プログラミング

AI(人工知能)技術の進化は目覚ましく、私たちの生活に深く関わるようになってきました。AIの能力をさらに高めるためには、たくさんの「学習データ」が必要不可欠です。そんな中、Visual Bank株式会社のAI学習用データソリューション「Qlean Dataset(キュリンデータセット)」が、AI開発を強力に後押しする新しいデータセットの提供を開始しました。

このたび提供が始まったのは、「日本語・1話者・怪談系テーマの朗読音声コーパスとトランスクリプト」です。これは、ASR(自動音声認識)やLLM(大規模言語モデル)といった音声・言語系のAIを開発したり、研究したりする際に役立つデータです。

Qlean Dataset 日本語・1話者 怪談系テーマの朗読音声とトランスクリプトを提供開始

怪談テーマの朗読音声データとは?

このデータセットは、怪談や怖い話といった物語の日本語テキストを、一人の日本人話者が感情を込めて朗読した音声と、その内容を正確に書き起こしたテキスト(トランスクリプト)で構成されています。

なぜ「怪談」なのでしょうか。怪談は、物語が進むにつれて不安や緊張といった感情が自然に声に表れるのが特徴です。そのため、ただ単に文章を読み上げるだけでなく、感情がこもった連続した話し方での音声表現が含まれています。抑揚や間の取り方、声のトーンの変化が物語の文脈と深く結びついているため、短い文だけでなく、長い文章全体の意味を理解するAIの学習に非常に適しています。

また、一人の話者が朗読しているため、複数の話者の声を区別する必要がないAIモデルの検証や、話者の条件を固定した上での音声や言語の分析にも使いやすい設計になっています。

データセットの概要

データ種別 音声、テキスト
被写体属性 日本人
データ形式 音声データ:mp3
収録時間 1音声30秒〜90分
音声レート 44.1kHz / 48kHz
対象のシーン ・怪談やホラー作品の文章を、一人の話者が感情を込めて朗読するシーン ・不安感や緊張感を伴う語り口で物語が進行する朗読シーン
サンプル詳細 https://qleandataset.visual-bank.co.jp/lineup/pn-039

このデータセットでできること(ユースケース)

このデータセットは、AI開発のさまざまな場面で活用されることが期待されています。

研究用途

  • 長文音声入力に対する音声認識・音声理解モデルの評価
    怪談の朗読に含まれる連続的な語り口を使って、ASRモデルが長い発話をどれだけ正確に認識できるか、文脈が続いたときにどんな間違いが起こりやすいかなどを検証する研究に役立ちます。

  • 音声入力を起点とした言語モデルの文脈理解検証
    音声認識した結果をLLMや音声理解モデルに入力し、物語の文脈をどれだけ保ちながら内容を理解できるかを評価するのに使えます。

産業用途

  • 音声対話AI・ナレーション生成AIの検証用データ
    怪談朗読に含まれる抑揚や間を含んだ音声表現を使って、音声対話AIや音声生成AIが入力された音声をどれだけ正確に理解し、自然な音声を生成できるかを検証するのに役立ちます。

  • コールセンター・音声UI向け音声処理モデルの事前検証
    感情を含む連続した発話音声を利用して、音声を使った操作インターフェース(音声UI)や音声処理システムが、どれだけ安定して音声を認識し、誤作動のリスクがないかを事前に検証する用途に利用できます。

『Qlean Dataset』とは

『Qlean Dataset』は、Visual Bank株式会社の子会社である株式会社アマナイメージズが提供する、AI学習用のデータソリューションです。画像、動画、音声、3D、テキストなど、さまざまな形式のデータに対応しており、研究目的でも商用目的でも安全に利用できる環境が整えられています。

Qlean Dataset AIデータレシピ

株式会社千葉ロッテマリーンズや株式会社東洋経済新報社といった企業との協力により、特定の業界に特化したデータや最新のトレンドに合わせたデータラインナップ「AIデータレシピ」を継続的に増やしています。

『Qlean Dataset』は、AI開発の現場でデータ集めや準備にかかる手間を減らし、権利関係がはっきりしていて法的なリスクがないAI開発環境を作る手助けをしています。

『Qlean Dataset』の提供するデータセット『AIデータレシピ』の特徴

Qlean Datasetの強み

  • すべての被写体から同意取得がされています。

  • 既存のデータは最短1日で納品可能です。

  • お客様の要望に応じて、写真撮影や音声収録などを行い、独自のデータを作ることもできます。

Visual Bank株式会社は、「あらゆるデータの可能性を解き放つ」をミッションに掲げ、AI開発を最大化する次世代型データインフラを構築・提供しています。

タイトルとURLをコピーしました