Visual Bank株式会社のAI学習用データソリューション「Qlean Dataset」が、AI開発をさらに進めるための新しいデータセットの提供を開始しました。
今回提供されるのは、「日本語・1話者・サブカル・スピリチュアル系テーマの朗読音声コーパスとトランスクリプト」です。これは、AIが人の声を理解したり、言葉を処理したりする能力(自動音声認識、音声理解、音声×言語系の基盤モデル開発など)を向上させるために使われるデータ集です。

新しいデータセットのポイント
このデータセットは、サブカルチャー、スピリチュアル、ヒーリングといったテーマに関する日本語の文章を、一人の日本人話者が落ち着いた口調で朗読した音声データと、その朗読内容を正確に文字にしたテキスト(トランスクリプト)で構成されています。
特徴
-
単一話者: 一人の話者による音声なので、話者ごとの声のばらつきが少なく、AIモデルの評価や学習がしやすくなっています。
-
朗読形式: 会話ではなく、文章を読み上げる形式のため、言葉の構造や語彙の流れをAIが学びやすくなっています。
-
テーマの独自性: 思想や概念、内省的な内容を含む文章が中心で、より深い言語理解を目指すAIの開発に役立ちます。
データ形式
-
データ種別: 音声、テキスト
-
話者の属性: 日本人
-
形式: 音声データはmp3、テキストデータはtxt, json, csv
-
収録時間: 1つの音声につき30秒から22分
-
音声レート: 44.1kHz / 48kHz
詳しいサンプルはこちらから確認できます。
サンプル詳細
どのようなAI開発に役立つのか
このデータセットは、研究からビジネスまで、幅広いAI開発の場面で活用が期待されています。
研究での活用例
-
音声認識・音声理解モデルの検証: AIが人の声を文字に変換したり、内容を理解したりする技術(自動音声認識や音声理解モデル)が、文章構造を持つ連続した発話をどれだけ正確に処理できるかを分析するのに使えます。
-
音声と言語表現の基礎研究: 思想的・概念的な文章を含む朗読音声を用い、AIが声の信号と言葉の意味をどのように結びつけるかを研究し、意味理解に関わるAIモデルの挙動を検証するのに役立ちます。
産業(ビジネス)での活用例
-
音声入力型AIアシスタントの精度評価: ナレーションや読み上げを想定した音声入力に対し、音声認識や音声理解機能を持つAIプロダクトの精度を評価し、改善するために利用できます。
-
音声×言語系基盤モデルのファインチューニング: AIの土台となる大きなモデル(基盤モデル)を、この単一話者の朗読音声とテキストの組み合わせで学習させ、特定の目的に合わせて調整(ファインチューニング)するのに適しています。
Qlean Dataset(キュリンデータセット)について
「Qlean Dataset」は、Visual Bank傘下の株式会社アマナイメージズが提供する、AI学習用のデータソリューションです。画像、動画、音声、3D、テキストなど、さまざまな形式のデータを提供しており、研究目的でも商用目的でも安心して利用できるよう、権利処理をクリアにしています。

AIデータレシピ
Qlean Datasetでは、AI開発に役立つオリジナルのデータラインナップを「AIデータレシピ」として提供しています。これにより、AI開発現場でのデータ収集や準備にかかる手間を減らし、法的なリスクを気にせずにAI開発を進められるようサポートしています。
Qlean Datasetの主な強み
-
安価かつスピーディーなデータ提供
-
画像・動画・音声・3D・テキストなど、多様なデータ形式や構成に柔軟に対応
-
「AIデータレシピ」にないデータも、要望に応じて新たに作成・提供
-
著作権や肖像権などの権利処理が済んでおり、研究・商用利用ともに安心して利用可能

Qlean Datasetは、AI開発に必要なデータを安全かつ効率的に提供することで、国内外のAI研究・開発を支援しています。
Visual Bank株式会社
Visual Bank株式会社は、「あらゆるデータの可能性を解き放つ」をミッションに、AI開発力を最大化する次世代型データインフラを構築・提供するスタートアップ企業です。AI学習用データセット開発サービス『Qlean Dataset』を提供する株式会社アマナイメージズを100%子会社に持ちます。同社は国の研究開発プログラム「GENIAC」にも採択されており、社会実装に向けた取り組みを加速させています。

