AIがファッション・美容の会話を学習!Qlean Datasetが新データセットを提供
AI(人工知能)の開発を支援するVisual Bank株式会社の『Qlean Dataset(キュリンデータセット)』が、新しい学習データセット「日本語・2話者・ファッション・美容テーマトーク音声コーパスデータセット」の提供を開始しました。
このデータセットは、AIがファッションや美容に関する人の会話をより深く理解するために作られたものです。

ファッション・美容のリアルな会話をAIの学習に
今回提供が始まったデータセットには、20代から50代の男女2名が、ファッションや美容をテーマに話し合う日本語の音声が収録されています。AIが人の声を理解する技術(音声認識)や、会話の内容を把握する能力(対話理解)の研究・開発に活用できます。
収録されている会話は、メイクやコーディネート、アイテム選び、流行といった具体的な話題が中心です。参加者は台本に頼らず、感想やアドバイス、経験談を交えながら、まるで普段の会話のような自然なテンポで意見を交換しています。
また、2人の話者が交互に話したり、話題が変わったりする様子もそのまま収録されているため、実際の生活で使われるAIの性能を試すのに適しています。
データセットの概要
このデータセットは、約50時間分の音声で構成されており、1つの音声は約5分から60分です。音声形式はmp3またはwavで提供されます。
サンプル音声の詳細は、以下のページで確認できます。
https://qleandataset.visual-bank.co.jp/lineup/pn-034
どのような場面で役立つのか
このデータセットは、AIの研究や産業のさまざまな場面で活用が期待されています。
研究での活用例
-
会話における話者の交代や応答の分析:AIが2人の会話における発話の入れ替わりや応答の仕方を評価・検証する際に使えます。
-
特定分野の会話データを使った言語研究:ファッションや美容に特化した言葉遣いや表現を分析したり、AIをその分野に特化させる研究に利用できます。
産業での活用例
-
会話型AIの学習データ:ファッションや美容に関するサービスで使われるAIアシスタントやチャットボットの、音声認識や対話理解の学習データとして役立ちます。
-
顧客対応AIの会話理解の検証:商品提案やアドバイスを含む自然な会話を通して、顧客対応AIの会話理解の正確さや、適切な返答ができるかの検証に利用できます。
Qlean Datasetについて
『Qlean Dataset』は、Visual Bank株式会社のグループ会社である株式会社アマナイメージズが提供する、AIの学習に使えるデータを提供するサービスです。写真、動画、音声、3Dデータ、テキストなど、様々な形式のデータを取り扱っており、研究目的でも商業目的でも安心して利用できる環境を整えています。

Qlean Datasetは、AI開発に必要なデータを集めたり準備したりする手間を減らし、著作権などの問題をクリアした、安心してAI開発ができる環境づくりをサポートしています。
-
Qlean Datasetのウェブサイト:https://qleandataset.visual-bank.co.jp/
-
AIデータレシピのラインナップ:https://qleandataset.visual-bank.co.jp/lineup
Visual Bank株式会社について
Visual Bank株式会社は、「あらゆるデータの可能性を解き放つ」をミッションに、AI開発の力を最大限に引き出すためのデータ基盤を構築・提供しているスタートアップ企業です。漫画家をサポートするAI補助ツール『THE PEN』の提供や、AI学習用データセット開発サービス『Qlean Dataset』を提供する株式会社アマナイメージズを子会社に持っています。
同社は、国の研究開発プログラム「GENIAC」にも選ばれており、AI技術の社会への普及を加速させています。
-
Visual Bank株式会社のウェブサイト:https://visual-bank.co.jp/
-
株式会社アマナイメージズのウェブサイト:https://amanaimages.com/about/

