「言った言わない」問題を解決へ!AI音声認識「mocoVoice」が小児外科にもたらす医療DXの変革

AIツール・サービス紹介

メイン画像

医療現場の「言った言わない」問題をAIで解決へ

医療の現場では、日々さまざまな情報がやり取りされています。診察や手術の説明、患者さんやご家族との大切な会話など、後から「あの時、何て言ったっけ?」と振り返る必要がある場面がたくさんあります。しかし、忙しい医療スタッフにとって、それらの内容を正確に記録するのは大変な手間でした。特に、治療内容の説明と同意を得る「インフォームド・コンセント」の場面では、「言った・言わない」という問題が起こることもあり、大きな悩みの種となっていました。

このような課題を解決するため、AI(人工知能)を使った音声認識技術への期待が高まっています。今回、mocomoco株式会社は、自社が提供するAI音声認識サービス「mocoVoice(モコボイス)医療モデル」が、広島大学病院 小児外科の佐伯 勇(さえき・いさむ)医師との共同開発を通じて、どのように医療現場に変化をもたらしているか、対談記事を公開しました。

▼インタビュー記事全文はこちらからご覧いただけます!
医療現場の「言った言わない」を防げるか? AI音声認識が小児外科の最前線にもたらす変革

小児外科医とAI研究者が語る「mocoVoice 医療モデル」の力

今回の対談では、小児外科医としての現場の視点と、AI研究者としての技術的な視点が交わり、医療現場に特化したAIの開発の裏側が語られました。

佐伯勇医師

佐伯 勇医師は、2020年から広島大学病院 小児外科 講師/臨床准教授を務める小児外科医です。日々の診療だけでなく、医学生の教育にも力を入れ、診察の技術を体系的に教えるプログラムの研究も行っています。

大西一誉取締役CRO

mocomoco株式会社の取締役CROである大西 一誉は、理化学研究所で対話型AIの研究にも携わりながら、mocoVoiceの医療モデルの研究開発をリードしています。

AI音声認識が医療現場の負担を大幅に軽減

佐伯医師は以前、市販の一般向けAI文字起こしサービスを利用していましたが、医療の専門用語をなかなか正確に認識できず、1ページあたり10箇所以上もの修正が必要で、2時間の録音の修正に約5時間もかかっていたそうです。

そこで「mocoVoice 医療モデル」と共同で、2時間以上の診療音声を使った学習と調整を約20回繰り返した結果、文字起こしの精度が大きく向上しました。

  • 1ページあたりの修正箇所:10箇所以上 → 1〜2箇所、場合によってはゼロ

  • 2時間の録音の修正にかかる時間:約5時間 → 1時間未満

佐伯医師は「このままでは大変すぎて続けられないと思っていた修正作業が、ようやく現実的に続けられるレベルになった」と語っています。

「大泉門」や「うんち」も正確に認識

今回の共同開発では、小児外科ならではの言葉にも注目しました。赤ちゃんの頭にある柔らかい部分を指す「大泉門(だいせんもん)」や、新生児の状態を評価する「アプガースコア」といった専門用語はもちろん、「うんち」「おしっこ」のように、一般的なAIサービスでは伏字にされがちな言葉も、診察では非常に重要な情報です。

「mocoVoice 医療モデル」では、医療の現場で使うことに限り、これらの言葉も正確に認識し、表示できるように調整されています。

インフォームド・コンセントとAIの「解釈しない設計」

特に重要な場面であるインフォームド・コンセント(IC)では、治療内容の説明と患者さんの同意を正確に記録することが求められます。この対談では、患者さんが実際に発した言葉をAIがどう扱うべきか、例えば「吐いた」という言葉を「嘔吐」とAIが勝手に書き換えてしまって良いのか、といった具体的な点についても深く議論されました。

医療AIには、あえて「解釈しない」という設計が必要ではないかという問題提起を含め、詳細な内容はインタビュー全文で確認できます。

mocoVoiceについて

「mocoVoice」は、企業の現場の声から生まれた、オールインワンのAI音声認識サービスです。議事録作成や、誰が話したかを区別する話者分離など、これ一つで対応できます。

mocoVoice

主な機能

  • 高い正確性と処理速度: 大規模言語モデル(LLM)と独自の技術を組み合わせることで、90%以上の高い精度と、1時間の音声を最短3分で文字起こしする速さを実現しています。

  • 文脈を加味した校正機能: 文字起こしされた文章の誤字脱字を、前後の文脈を考えて修正し、より正確なテキストに仕上げます。

  • 用語の辞書登録機能: 医療、法律、金融など、それぞれの業界で使われる専門用語や固有名詞をあらかじめ登録することで、正しく文字起こしできます。読み仮名の登録は不要です。

  • 話者分離機能: 最大12人までの発言を個別に識別し、「誰が何を話したか」をはっきりと表示します。

  • カスタマイズ可能な議事録・要約: 長時間の会話や講義の内容を、分かりやすい要点にまとめてくれます。

  • 実務運用しやすいチーム管理機能: 文字起こしの結果や作成した議事録を、チーム内で簡単に共有・管理できます。

  • オンプレミス対応: セキュリティや秘密情報を厳重に扱いたい企業向けに、クラウドを使わずに安全にデータを処理できる、自社サーバーでの運用(オンプレミス環境)も提供可能です。

    • (※上記機能の一部は、特定のプランやオプションでの提供となる場合があります。)

今後の展望

mocomoco株式会社は、今回の広島大学病院 佐伯医師との共同開発で得られた知識を活かし、医療分野での音声認識技術をさらに正確にし、機能も充実させていく予定です。これからも、医療従事者の皆さんの業務を効率化し、医療DX(デジタル変革)を進めるために役立つサービス開発に努めていくとのことです。

サービス利用について

mocoVoiceの利用を始めたい方は、以下のフォームからお申し込みください。医療モデルの利用や詳しい情報については、お問い合わせフォームから相談できます。

タイトルとURLをコピーしました