Qlean DatasetからAI学習用「日本語・1話者・社会/文化テーマトーク音声コーパス」が登場!

AIツール・サービス紹介

Visual Bank株式会社のAI学習用データソリューション「Qlean Dataset(キュリンデータセット)」から、「日本語・1話者・社会/文化テーマトーク音声コーパスデータセット」の提供が始まりました。

この新しいデータセットは、AIが人間の言葉をより深く理解し、さまざまな形で活用するための強力なツールとなることが期待されています。

Qlean Dataset 日本語・1話者 社会・文化テーマトーク 音声コーパスを提供開始

日常の「一人語り」でAIの学習をサポート

今回提供が開始されたデータセットには、話者が台本を使わずに、自身の記憶や経験に基づいて自由に語る音声が収録されています。日常の出来事、家族や学校生活の思い出、自身の価値観や気づきなど、身近な社会・文化テーマについて一人が連続して話す様子が記録されています。

このような「一人語り」の音声には、回想したり、何かを説明したり、話題を切り替えたりと、人間が自然に使う多様な言葉の表現が含まれています。そのため、連続した長い会話を理解するAIモデルの学習や、その性能を試すのに非常に適しています。

さまざまなAI開発での活用が期待される

このデータセットは、AI開発の様々な場面で役立ちます。

研究での活用例(アカデミア)

  • 音声認識(ASR)の評価:音声から文字を自動で書き起こす技術である音声認識が、自然な会話の途中で話題が変わったり、過去を振り返ったり、感情がこもった表現が含まれていても、どれだけ正確に聞き取れるかを試すのに使えます。

  • 長い文章の意味理解・要約モデルの研究:個人の体験談に基づく長い話は、話の流れを時間順に理解したり、話の要点を見つけ出したり、話題の区切りを特定したりする、言葉を理解するAIの研究にぴったりの素材です。

産業での活用例(企業)

  • 音声入力型生成AIの品質向上:自然な一人語りの音声を使うことで、音声からテキストに変換し、さらにそのテキストを要約したり説明を生成したりするような、長い文章を扱うAIの精度を高めることができます。

  • ライフログ・日記AIの音声解析:個人の生活記録や回想、感情が混じり合った一人語りの音声を扱うサービス(例えば、日記をAIが自動で整理するようなサービス)の検証データとして活用できます。

  • カスタマーサポートAIの文脈理解強化:実際のユーザーが説明する際に含まれがちな、少し回りくどい言い方や本筋から外れた話なども含まれているため、AIが話の文脈を正確に追跡できるかを評価するのに適しています。

その他の実用例

  • 学習支援・教材AIにおける説明音声の解析:具体的な体験談は、長い文章を要約したり、内容を理解したり、キーワードを抽出したりするような、教育分野のAIの検証素材としても利用できます。

このデータセットのサンプルは、以下のリンクから確認できます。
https://qleandataset.visual-bank.co.jp/lineup/pn-011

『Qlean Dataset』について

『Qlean Dataset』は、Visual Bank傘下の株式会社アマナイメージズが提供する、AI学習用のデータソリューションです。画像、動画、音声、3D、テキストなど、さまざまな種類のデータに対応しており、研究目的でも商業目的でも安心して使えるよう、法的な権利処理がしっかりと行われています。

AIデータレシピ ウェブサイトのスクリーンショット

Qlean Datasetは、AI開発の現場でデータ集めや準備にかかる手間を減らし、著作権などの心配なくAI開発を進められる環境をサポートしています。

AIデータレシピの概要図

Qlean Datasetのご提供価値

Qlean Datasetの主な特長

  • すべての被写体から同意を得ています。

  • すでに存在するデータは最短1日で手元に届きます。

  • お客様の要望に応じて、独自のデータを撮影・収録・収集することも可能です。

Qlean Datasetの強み

Visual Bank株式会社について

Visual Bank株式会社は、AI開発の力を最大限に引き出すための新しいデータ基盤を構築・提供しているスタートアップ企業です。「あらゆるデータの可能性を解き放つ」をミッションに掲げ、事業を展開しています。

漫画家をサポートするAI補助ツール『THE PEN』の提供や、AI学習用データセット開発サービス『Qlean Dataset』を提供する株式会社アマナイメージズを100%子会社としています。

同社は、国の研究開発プログラム「GENIAC」にも採択されており、社会実装に向けた取り組みを加速させています。

タイトルとURLをコピーしました