NTTテクノクロス株式会社は、テキストをまるで人が話しているかのような自然な音声に変換するAI音声合成プロダクト「FutureVoice」の新しいバージョンを、2025年11月27日より提供開始しました。
今回のアップデートでは、AI音声の自然さや、特定の話者の声を再現する能力がさらに向上しました。これにより、さまざまな状況に合わせて選べるAI音声の種類が増え、さらに企業が自分たちでオリジナルのAI音声を簡単に作れるようになります。
この新しい「FutureVoice」は、NTT西日本株式会社が提供する、声の価値を高める音声AI事業「VOICENCE」にも採用されています。

AI音声の進化とその背景
近年、文章や画像、動画などを自動で作る「生成AI」が広く使われるようになり、音声も自動で作り出すことへのニーズが高まっています。エンターテインメントの分野だけでなく、自治体や公共交通機関などでもAI音声が使われるようになり、私たちの生活に深く浸透しつつあります。
NTTテクノクロスは、NTT人間情報研究所が開発したAI音声技術を使い、「FutureVoice」を2015年7月から提供し、AI音声の分野をリードしてきました。今回の新しいバージョンは、市場の多様な要望に応えるため、AI音声の価値をさらに高める機能が搭載されています。
新しい機能の主なポイント
(1) 多様なシーンに対応するAI音声バリエーションの追加
これまで特に要望の多かったコールセンターでの自動応答、研修や講義、観光案内、窓口での対応など、さまざまな場面で活用できるAI音声の種類が増えました。これにより、用途にぴったりのAI音声を選ぶことができます。
(2) 自社でオリジナルのAI音声を生成可能に
これまでは、オリジナルのAI音声を作るにはNTTテクノクロスに依頼する必要がありました。しかし、新しいバージョンでは、声の権利を持つ企業が自分たちでAI音声を作れるようになります。タレントや声優の数秒から数分の音声データを用意するだけで、自社でオリジナルのAI音声が生成でき、独自のサービスに素早く組み込むことが可能になります。※ご利用には、別途個別契約が必要です。
(3) 6ヵ国語に対応する多言語AI音声
一つの言語の音声データから、その言語を母国語とする人が話すような多言語のAI音声を生成する「クロスリンガル音声合成技術」が、これまでの日本語、英語、中国語(普通話)、韓国語に加えて、新たにフランス語とスペイン語にも対応しました。
想定される使い方・利用シーン
(1) コールセンターの自動音声案内
お客様の問い合わせ内容に合わせてAI音声を使い分けることで、まるでオペレーターが実際に話しているかのような自然な音声ガイダンスを作成できます。
(2) タレントや声優の音声コンテンツへの活用
既存の動画などに収録されているタレントやキャラクターの音声を使って、自社でオリジナルのAI音声を生成できます。これにより、新しい音声広告やファン向けのコンテンツなどを制作し、声の権利を持つ企業の新たなビジネスチャンスにつながります。
(3) eラーニング教材の多言語展開
「クロスリンガル音声合成技術」を活用することで、講師の声を他の言語のAI音声で再現し、多言語に対応したeラーニングを展開できます。これにより、講師の負担を増やすことなく、事業を広げることが可能になります。
今後の展望
NTTテクノクロスは、「FutureVoice」を大規模言語モデル(LLM)や動画生成技術などの生成AIと組み合わせることで、さらに高度な音声コミュニケーションサービスを作り出すことを目指しています。また、パートナー企業との協力関係を通じて、AI音声の利用をさらに広げていく計画です。
「FutureVoice」についてさらに詳しく知りたい方、またはデモンストレーションを試したい方は、以下のリンクをご覧ください。
また、NTT西日本が提供する音声AI事業「VOICENCE」については、以下のリンクをご参照ください。

