Qlean DatasetがAI開発を加速する新データセットを提供:ビジネス・自己啓発テーマの日本語朗読音声と文字起こし

AIツール・サービス紹介

Qlean Dataset、AI開発向けに日本語の朗読音声と文字起こしデータを提供開始

Visual Bank株式会社は、傘下の株式会社アマナイメージズを通じて展開するAI学習用データソリューション「Qlean Dataset(キュリンデータセット)」から、AI開発や研究に役立つ新しいデータセットの提供を開始しました。

この新しいデータセットは、「日本語・1話者・ビジネス・自己啓発・趣味実用テーマの朗読音声コーパスとトランスクリプト」というもので、AIが人の声を理解したり、言葉の意味を読み取ったりする学習に使うデータです。

Qlean Datasetが日本語のビジネス・自己啓発朗読音声とトランスクリプトの提供開始を告知する画像

新しいデータセットの特長

このデータセットは、ビジネス書や自己啓発書、趣味・実用に関する文章を、日本人の話者が一人で朗読した音声と、その内容を文字にしたもの(トランスクリプト)で構成されています。特に、業務の解説や考え方の整理、手順の説明など、知識や概念を言葉で伝えるような文脈が多く含まれています。

単に文章を読み上げるだけでなく、内容を理解して話しているような発話が収録されているため、AIが言葉の意味を深く理解する能力を高めるのに適しています。また、朗読形式で話者の発話が安定しているため、AIが音声と文字の関係を明確に捉えやすいという利点もあります。

長い文章や論理的な話の流れも含まれているため、短い文章中心のデータでは難しい、文脈の理解や情報の整理を伴う音声処理の検証にも活用できます。

AI開発における活用例

このデータセットは、AIのさまざまな分野で活用が期待されています。

  • 自動音声認識(ASR)の精度向上: AIが人の話した言葉を正確にテキストに変換する能力を向上させるために使えます。

  • 音声からの言語理解: 音声入力された内容をAIが理解し、要約したり、質問に答えたりするモデルの検証に役立ちます。

  • 大規模言語モデル(LLM)の学習: 音声から得られたテキストデータを使って、説明文の生成や論理的な回答の生成といったLLMの能力を向上させるためのファインチューニングに利用できます。

  • 話者依存性の確認: 特定の話者による一貫したデータなので、AIが話す人の声に左右されずに、言葉そのものを理解する力を確認する用途にも適しています。

データセットの概要

データ種別 音声、テキスト
被写体属性 日本人
データ形式 音声データ:mp3
収録時間 1音声30秒〜160分
音声レート 44.1kHz / 48kHz
対象のシーン ・ビジネス書や自己啓発書、実用書の文章を一人の話者が朗読するシーン
・手順説明や考え方を整理しながら読み上げる朗読シーン
サンプル詳細 https://qleandataset.visual-bank.co.jp/lineup/pn-037

Qlean Datasetについて

「Qlean Dataset」は、Visual Bankの子会社である株式会社アマナイメージズが提供する、商用利用が可能なAI学習用データソリューションです。画像、動画、音声、3D、テキストなど、さまざまな形式のデータに対応しており、研究用途からビジネスでのAI開発まで、安全に利用できる環境を整えています。

AIデータレシピというウェブサイトで、機械学習用の多様なデータセットを紹介

同社は、データパートナーとの協力により、「AIデータレシピ」という名前で、業界に特化した最新のデータラインナップを継続的に増やしています。これにより、AI開発現場でのデータ収集や準備の手間を減らし、権利がクリアで法的なリスクのないAI開発環境の構築をサポートしています。

Qlean Datasetの強みを示すスライド

Visual Bank株式会社について

Visual Bank株式会社は、「あらゆるデータの可能性を解き放つ」をミッションに掲げ、AI開発力を最大化する次世代型データインフラを構築・提供するスタートアップ企業です。AI学習用データセット開発サービス「Qlean Dataset」を提供する株式会社アマナイメージズを100%子会社に持っています。

タイトルとURLをコピーしました