AIがビジネス文書を賢く理解するために
AI(人工知能)が私たちの生活や仕事にどんどん入り込んできています。特に、文章を理解したり、自動で作業をしたりするAIは、会社での業務を大きく変える可能性を秘めています。
そんなAIをもっと賢くするために、Visual Bank株式会社が提供するAI学習用データソリューション「Qlean Dataset(キュリンデータセット)」が、新しいデータセット「様々なドキュメント・帳票データセット」の提供を開始しました。このデータセットは、AIが書類を正確に理解し、活用できるようになることを目指しています。

実際のビジネス文書でAIを鍛える
このデータセットには、私たちが普段の仕事で使うような、履歴書、職務経歴書、領収書、申込書、アンケートといった多種多様な書類が含まれています。これらの書類は、PDFや画像形式で提供されます。単なる文字のデータとは違い、実際の書類が持つ「どこに何が書かれているか」「どんな形で情報が並んでいるか」といった、見た目の情報も含まれているのが大きな特徴です。
AIがこれらの実際の書類のデータで学習することで、例えば、手書きの文字やバラバラなレイアウトにも対応できるようになります。これにより、まるで人間が書類を読んで理解するように、AIも複雑なビジネス文書から必要な情報を正確に見つけ出せるようになるでしょう。

なぜこのデータセットが必要なの?
最近では、文章を自動で作ったり、仕事を自動化したりするAIが注目されています。しかし、会社の中には、整理されていないたくさんの書類があります。これらの書類をAIに理解させるのは、実はとても難しいことなのです。
また、ビジネスで使う書類には、個人情報や契約に関する大切な情報がたくさん含まれています。そのため、AIの学習に使うデータは、個人情報などがきちんと保護され、法律に問題がないように慎重に準備する必要があります。Qlean Datasetのデータセットは、AI開発のために特別に整理されており、安心して利用できる形になっています。
AIの活用イメージ
このデータセットは、AIをより賢くするための様々な場面で役立ちます。
研究で使う場合
-
書類の構造を理解するAIの研究: 書類の中で、情報がどのように配置されているかをAIが解析する研究に役立ちます。
-
情報を抜き出すAIや質問に答えるAIの検証: 履歴書などから特定の情報を抜き出したり、書類の内容について質問すると答えてくれるAIの性能を試したりするのに使えます。
ビジネスで使う場合
-
業務書類を自動で処理するAI(OCR・IDP)の開発: 領収書や申込書を読み取って、文字を認識したり、必要な情報を自動で抜き出したりするAIシステムの開発に役立ちます。
-
社内向けのAIの書類理解能力の評価: 社内にある書類を検索するAIや、質問に答えるチャットボットAIが、どれだけ正確に社内文書を理解できるかを評価するために使えます。

Qlean Datasetについて
「Qlean Dataset」は、Visual Bank株式会社の子会社である株式会社アマナイメージズが提供する、AI学習用のデータソリューションです。画像、動画、音声、3D、テキストなど、さまざまな形式のデータを取り扱っており、研究目的でもビジネス目的でも安心して使える環境が整っています。
「AIデータレシピ」という名前で、様々な業界に特化したデータセットを提供しており、AI開発の現場でデータ集めや準備にかかる手間を減らし、法律的な問題がないAI開発をサポートしています。

Visual Bank株式会社について
Visual Bank株式会社は、「あらゆるデータの可能性を解き放つ」を目標に、AI開発を最大限にサポートするデータ基盤を提供するスタートアップ企業です。AI学習用データセットの開発サービス「Qlean Dataset」の他にも、漫画家をサポートするAI補助ツール「THE PEN」などを提供しています。また、国の研究開発プログラム「GENIAC」にも選ばれており、AI技術の社会への普及を加速させています。
Qlean Datasetのデータセットやサービスに関する詳細は、以下のリンクから確認できます。
-
Qlean Datasetサイト: https://qleandataset.visual-bank.co.jp/
-
サンプル詳細: https://qleandataset.visual-bank.co.jp/lineup/ds-047

Visual Bank株式会社の詳細は、こちらからご覧いただけます。
-
Visual Bank企業URL: https://visual-bank.co.jp/
-
アマナイメージズ企業URL: https://amanaimages.com/about/

