Visual Bank株式会社のAI学習用データソリューション『Qlean Dataset(キュリンデータセット)』が、新たに「日本語・2話者・ファッション・美容テーマトーク音声コーパスデータセット」の提供を開始しました。このデータセットは、AIがより自然な会話を理解し、認識する能力を高めるために開発されました。

データセットの概要
このデータセットには、20代から50代の男女2名が、ファッションや美容をテーマに意見を交わす日本語の対話音声が収録されています。メイクやコーディネート、アイテム選び、流行といった具体的な話題について、感想の共有やアドバイス、経験談が自然なテンポで会話されています。台本に頼らず、実際の会話に近い流れで収録されている点が特徴です。
また、2人の話者が交互に話したり、話題が変わったりする様子も含まれており、日常の会話に近い環境でのAIの性能を試すのに適しています。このデータセットは、音声認識(声の言葉を文字に変換する技術)や、対話理解(会話の内容をAIが把握する技術)など、音声対話AIの研究や開発に役立ちます。
データセットの詳しい情報はこちらで確認できます。
データセットの活用例
このデータセットは、さまざまなAI開発の場面で活用が期待されています。
研究分野での活用
-
話者の交代や応答の分析: 2人の会話における話者の入れ替わりや、お互いの応答の仕方を分析するAIモデルの評価に使えます。
-
特定の分野に特化した言語の研究: ファッションや美容に関する言葉や表現に特化した会話データとして、AIがその分野の言葉を学ぶための研究に利用できます。
産業分野での活用
-
音声対話型AIの学習: ファッションや美容に関するサービスで使われるAIアシスタントやチャットボットが、ユーザーとの会話をより正確に理解し、音声認識する能力を高めるための学習データとして活用できます。
-
コールセンターや接客支援AIの検証: 商品の提案やアドバイスを含む自然な会話データとして、コールセンターや接客支援を行うAIが、会話をどれだけ理解できるか、どのように応答すべきかを検証するために利用できます。
Qlean Datasetについて
『Qlean Dataset』は、Visual Bank株式会社のグループ会社である株式会社アマナイメージズが提供する、AI学習用のデータソリューションです。画像、動画、音声、3D、テキストなど、さまざまな形式のデータを取り扱っており、研究目的だけでなく、商用利用でも安心して使えるように、権利関係をクリアにしたデータを提供しています。
AI開発の現場でデータ集めや準備にかかる手間を減らし、法的なリスクを心配せずにAI開発を進められる環境を支援しています。




Visual Bank株式会社について
Visual Bank株式会社は、「あらゆるデータの可能性を解き放つ」をミッションに掲げ、AI開発を最大限に引き出すためのデータ基盤を構築・提供している企業です。国の研究開発プログラム「GENIAC」にも採択されており、AI技術の社会実装に向けた取り組みを加速させています。

