Visual Bank株式会社が提供するAI学習用データソリューション「Qlean Dataset(キュリンデータセット)」は、この度「日本語・1話者・事件犯罪テーマトーク音声データセット」の提供を開始しました。
この新しいデータセットは、事件や犯罪に関する一人語りの音声を収録しており、AIが人間の言葉を理解したり、新しい文章などを生成したりする技術の発展に貢献することが期待されています。

事件・犯罪テーマの独り語り音声データセットとは
このデータセットには、事件や犯罪に関する歴史的な事例、制度の説明、社会問題などをテーマに、話者が連続して説明や解説を行う音声が約350時間分(1音声あたり5分〜40分)収録されています。20代から50代の男女の声で構成されており、AIが学習しやすい44.1kHzのmp3形式で提供されます。
特徴として、台本に沿わない自然な話し方で、話題の転換や文脈に合わせた語り口、主張の整理、エピソード紹介などが含まれています。これにより、AIがより人間らしい自然な会話や文章を理解・生成するための学習材料として活用できます。
どのような場面で役立つのか
このデータセットは、AIモデルが文脈を理解したり、長い音声データを処理したり、言葉の意味を深く理解したりする能力を高めるのに適しています。具体的な活用例は以下の通りです。
-
研究目的(大学などの研究機関)
-
長い独り語り音声に対応する音声認識(ASR)モデルの研究:文脈に依存した話し方や話題転換を含む日本語の音声認識能力の検証に利用できます。
-
自然言語処理(NLP)における文脈理解や要約モデルの評価:一人語りの長い文章構造から、意味の単位を抽出したり、文章の構造を分析したり、要約を作成するAIモデルの評価に役立ちます。
-
-
産業目的(企業)
-
専門的な内容を扱うAIの精度向上:事件や制度説明のような専門用語を含むため、コールセンターでの音声処理や、知識ベースから情報を検索するAI、特定の分野に特化した会話AIの精度向上に活用できます。
-
生成AIの能力強化:音声からテキストへ、そしてその意味を理解する一連の処理を強化し、音声から要約や説明を自動で生成するマルチモーダルAIの性能向上に貢献します。
-
-
その他(教育や社会での利用)
- 司法や社会教育向けの教材AI研究:事件・犯罪領域の説明音声を元に、教育用AIの音声理解や自動説明生成モデルの基礎データとして利用できます。
Qlean Datasetについて
Qlean Datasetは、Visual Bank株式会社の子会社である株式会社アマナイメージズが提供する、商用利用が可能なAI学習用データソリューションです。画像、動画、音声、3D、テキストなど、さまざまな形式のデータに対応し、研究や商用利用のどちらでも法的な心配なく安全に利用できる環境が整っています。

株式会社千葉ロッテマリーンズや株式会社東洋経済新報社など、多くのデータパートナーとの協力により、特定の業界に特化したデータや最新トレンドに合わせたデータセット「AIデータレシピ」を継続的に増やしています。

Qlean Datasetは、AI開発の現場でデータ収集や準備にかかる負担を減らし、著作権などの権利が明確で、法的なリスクのないAI開発環境の構築をサポートしています。

Qlean Datasetの主な特長
- すべての被写体から同意を得ており、国際的な法律(GDPRやCCPA)にも対応しています。
- 既存のデータであれば、最短1日で納品が可能です。
- お客様の要望に応じて、特別な撮影や収録、収集による独自のデータ構築にも対応しています。

お問い合わせはこちら:
https://qleandataset.visual-bank.co.jp/contact
Visual Bank株式会社について
Visual Bank株式会社は、「あらゆるデータの可能性を解き放つ」をミッションに掲げ、AI開発力を最大限に引き出すための次世代型データインフラを構築・提供するスタートアップ企業です。漫画家をサポートするAI補助ツール「THE PEN」のほか、AI学習用データセット開発サービス「Qlean Dataset」を提供する株式会社アマナイメージズを100%子会社としています。
また、Visual Bankは国の研究開発プログラム「GENIAC」にも採択されており、社会でのAI活用に向けた取り組みを加速させています。
-
Qlean Datasetサイト: https://qleandataset.visual-bank.co.jp/
-
Visual Bank企業URL: https://visual-bank.co.jp/
-
アマナイメージズ企業URL: https://amanaimages.com/about/
-
データセットサンプルページ: https://qleandataset.visual-bank.co.jp/lineup/pn-008

