Visual Bank株式会社が展開するAI学習用データソリューション「Qlean Dataset(キュリンデータセット)」は、新たに「日本語・2話者・コメディテーマトーク音声コーパスデータセット」の提供を開始しました。

AIの「会話力」を高める新しいデータセット
このデータセットは、20代から50代の男女2名による、日本語の自然な会話音声を収録しています。特にユニークなのは、ユーモアや笑いを交えた軽快な雑談が中心である点です。台本を使わない自由な会話なので、
-
即興的な反応
-
会話のテンポの変化
-
話題の脱線
-
ボケとツッコミ
といった、実際の人間同士の会話でよく見られる要素が豊富に含まれています。また、2人の話者が交互に話したり、時には重なって話したりする様子も収録されており、よりリアルな会話の状況をAIに学習させることができます。
なぜ「コメディテーマトーク」がAIに重要なのか
AIが人間と自然に会話するためには、単に言葉の意味を理解するだけでなく、会話の流れや感情、ユーモアのニュアンスを捉えることが重要です。このデータセットは、リラックスした環境での会話を想定して収録されているため、音声認識(ASR)や自然言語処理(NLP)を基盤とする対話型AIや音声アシスタントの開発に役立ちます。これにより、AIがより人間らしい、親しみやすい応答を生成できるようになるでしょう。
データセットの概要
| 概略 | ユーモアのある雑談などを中心に2名が軽快に話し合う日本語対話音声データセットです。 |
|---|---|
| データ種別 | 音声 |
| 被写体属性 | 20代〜50代の男女 |
| データ形式 | mp3 / wav |
| 収録時間 | 計約330時間(1音声約5分〜60分) |
| 音声レート | 44.1kHz |
| サンプル詳細 | https://qleandataset.visual-bank.co.jp/lineup/pn-020 |
様々な分野での活用が期待される
このデータセットは、研究から産業、教育まで幅広い用途で活用できます。
研究での活用例
-
対話構造の解析: 2人の話者の発話の交代や話題の移り変わりを分析し、より自然な対話の仕組みを解明する研究に役立ちます。
-
雑談対話の自然言語処理: 台本にない雑談を通して、AIがどのように話題を展開し、応答を生成するかを評価する研究に利用できます。
産業での活用例
-
音声対話AIの開発: 音声アシスタントや対話型サービスにおいて、自然な会話の流れを前提とした応答生成や理解モデルの学習・評価に活用できます。
-
話者識別・ターンテイキング技術の検証: 誰が話しているか(話者識別)や、いつ話者が交代するか(ターンテイキング)といった、AIの対話制御技術の検証に利用できます。
教育での活用例
- 音声処理・対話AIの学習: 大学や専門学校で、音声認識や対話AIの演習用データとして、実践的な学習教材に利用できます。
Qlean Datasetについて
「Qlean Dataset」は、Visual Bank株式会社の傘下である株式会社アマナイメージズが提供する、AI学習用のデータソリューションです。画像、動画、音声、3D、テキストなど多様な形式のデータを取り扱っており、研究用途はもちろん、商用利用も安心して行えるよう、権利処理済みのデータを提供しています。

「AIデータレシピ」というラインナップを通じて、千葉ロッテマリーンズや東洋経済新報社などのデータパートナーと協力し、業界に特化した最新のデータセットを継続的に拡充しています。これにより、AI開発現場でのデータ収集や準備の負担を減らし、法的リスクのないAI開発環境の構築を支援しています。


Qlean Datasetの主な特徴
-
すべての被写体から同意取得済み: 著作権や肖像権などの権利処理が完了しており、安心して商用利用できます。
-
最短1日で納品可能: 既存データは迅速に提供されます。
-
独自データの構築にも対応: 要件に応じたカスタム撮影や収録も可能です。

▶ Qlean Datasetサイト:https://qleandataset.visual-bank.co.jp/
▶ AIデータレシピ:https://qleandataset.visual-bank.co.jp/lineup
Visual Bank株式会社は、「あらゆるデータの可能性を解き放つ」をミッションに掲げ、AI開発力を最大化する次世代型データインフラの構築・提供を行っています。
Visual Bank企業URL:https://visual-bank.co.jp/
アマナイメージズ企業URL:https://amanaimages.com/about/

