IBMとDeepgramがエンタープライズAI向け高度音声機能を発表
IBMとDeepgram社は、企業向けのAI(人工知能)をさらに進化させるため、Deepgram社の高度な音声認識(話された言葉を文字にする技術)と音声合成(文字を音声にする技術)の機能を、IBMの生成AIソリューション「watsonx Orchestrate」に統合する提携を発表しました。これにより、Deepgram社はIBMにとって初の音声パートナーとなります。

この提携は、企業が求める高性能で信頼性の高い文字起こしや、リアルタイムでの字幕表示といったニーズに応えるものです。ユーザーは、より自然な音声でAIと対話できるようになり、企業の業務自動化や対話型AI技術の活用が大きく進むと期待されています。
高精度な音声認識と多様な言語対応
多くの企業では、周囲の雑音があったり、さまざまなアクセントの言葉が話されたりするような現実の環境でも、正確に動作するAI音声認識システムを求めています。今回の統合により、Deepgram社の技術は、数十種類にも及ぶアラビア語の方言やインドで使われる多様な言語に対応し、地域特有のアクセントを反映した音声を提供できるようになります。
さらに、個別のニーズに合わせて音声を調整する「カスタム・チューニング」や、話された内容をその場で文字にする「リアルタイム字幕生成」、そして、より人間らしい自然な音声を作り出す機能も加わります。
これらの進んだ音声技術は、医療や金融といった幅広い業界で、以下のような新しい可能性を開きます。
-
お客様からの問い合わせに自動で対応するサポートの高度化
-
電話での会話内容を分析する「通話分析」
-
声を使ってデータを入力する「音声主導型データ入力」
両社のリーダーシップと今後の展望
Deepgram社の共同創業者兼CEOであるスコット・スティーブンソン氏は、「音声は人とテクノロジーをつなぐ重要な手段として、急速に広まっています。企業で使うには、非常に正確で、遅延が少なく、大規模な環境でも安定して動作するリアルタイムのプラットフォームが不可欠です。Deepgramの技術をwatsonx Orchestrate Agent Builderに組み込むことで、IBMのお客様は、長年培ってきたリアルタイム基盤の上に音声エージェントや音声対応のワークフローを構築できるようになります」と述べています。
IBMのAIテクノロジー・パートナーシップ担当バイス・プレジデントであるニック・ホルダ氏は、「Deepgram社のAPIをwatsonx Orchestrateと連携させることで、IBMのお客様に新しい音声認識・文字起こし機能を提供し、業務の高度化と最新化を支援します。この提携は、企業でのAI活用を加速させることを目指しており、IBMのオープンなエコシステムをさらに強化しながら、最先端の音声技術と選択肢をパートナーやお客様に提供します」と語っています。
音声インターフェースは、これからの企業向けAIに欠かせない要素となりつつあります。今回の提携は、IBMが現代的で柔軟なソリューションを提供していく上で、その役割をさらに強化するものです。Deepgram社にとっても、信頼できるIBMを通じて新しいお客様にリーチし、大規模な利用に対応できるリアルタイム音声プラットフォームとしての地位をさらに確立する機会となります。
Deepgram社について
Deepgram社は、音声AIエコノミーを支えるリアルタイムAPIプラットフォームを提供しています。同社のVoice AIプラットフォームは、話された言葉を文字にする「音声認識(STT)」、文字を音声にする「音声合成(TTS)」、そして音声から別の音声へ変換する「音声間変換(STS)」の機能を備えており、これらはすべて企業向けの安定した基盤上で提供されています。20万人以上の開発者が、Deepgram社の音声に特化したAIモデルをクラウドAPIや自社サーバー上で利用しています。高い精度、低い遅延、そして競争力のある価格設定により、多くの企業に採用されています。
詳細については、以下のリンクをご参照ください。
IBMについて
IBMは、世界をリードするハイブリッドクラウドとAI、およびコンサルティング・サービスを提供する企業です。世界175カ国以上のお客様が、データからの洞察を活用し、ビジネスプロセスを効率化し、コスト削減と競争力向上を実現できるよう支援しています。金融サービス、通信、ヘルスケアなどの重要な社会インフラ領域における多くの政府機関や企業が、IBMのハイブリッドクラウド・プラットフォームとRed Hat OpenShiftを活用して、迅速かつ効率的、そして安全にデジタル変革を進めています。IBMは、AI、量子コンピューティング、業界別のクラウド・ソリューション、コンサルティングなどの革新的な技術を通じて、オープンで柔軟な選択肢をお客様に提供しています。
詳細については、以下のリンクをご参照ください。

