Mavericks AIニュース12月8日号配信!Lovartの画像内テキスト編集、Kling O1の動画編集革新、ChatGPTボイスモードの進化を解説

AIツール・サービス紹介

株式会社Mavericksは、生成AIプロダクト開発で培った独自の視点から、最新のAI情報を分かりやすく解説する「Mavericks AI ニュース」の12月8日号を配信しました。今回のニュースレターでは、デザインAIツールの新機能、動画生成AIの革新、そしてChatGPTの音声対話機能の進化といった、注目すべきトピックが取り上げられています。

Mavericks AI ニュースとは?

「Mavericks AI ニュース」は、日々AIプロダクトの開発・運用を行うプロフェッショナルチームが、数多くのニュースの中から「今、市場で本当に注目されているサービス」や「将来のスタンダードになる技術」を厳選して紹介するニュースレターです。購読者数は8万人を超え、多くのビジネスパーソンや開発者が活用しています。

株式会社Mavericksは、リアルタイム動画生成AI「NoLang」などの先端AIプロダクトを手がけており、その最前線で得た知見をもとに、AIの前提知識がない方でも「明日からどう活用できるか」を具体的にイメージできるような情報発信を心がけています。

Mavericks AI ニュース

今週号(12月8日配信)の主なトピック

1. デザインAIツールLovartの新機能:画像内テキスト編集が可能に

これまで、AIで生成した図解で文字が崩れてしまうといった課題がありました。デザインAIツール「Lovart」は、デザインやフォントのスタイルを保ったまま、画像内のテキストを直接編集できる画期的な新機能をリリースしました。

この機能は、先日公開されたレイヤー分け機能と組み合わせることで、まるでPowerPointを使うように、オブジェクトの位置やサイズ調整からテキストの書き換えまで、直感的に修正できるようになります。これにより、画像生成AIにおけるパーソナライゼーション(個別のニーズに合わせた調整)が大きく進展すると考えられます。

Lovart テキスト修正機能

2. 「世界初の統合型マルチモーダル動画モデル」Kling O1が登場

画像編集だけでなく、動画編集の分野にも大きな変化が訪れています。中国発の「Kling」が、「世界初の統合型マルチモーダル動画モデル」として、新しいモデル「Kling O1」を発表しました。

このモデルは、テキストの指示に加えて、画像や動画を直接含めることで、動画の一部を修正したり、スタイルを変更したり、さらにはストーリーに基づいた新しいカットを作成したりといった作業をスムーズに行えます。動画の生成と編集の境界をなくす「Kling O1」は、将来的に全てが統合されたAIの実現に向けた重要な一歩となるでしょう。

Kling O1 ユーザーガイド

3. ChatGPTのボイスモードがアップデート!音声対話AIの未来

ChatGPTのボイスモードがアップデートされ、チャット画面から直接、画像や地図を表示しながらスムーズな会話ができるようになりました。これにより、画面を切り替えることなく、より自然な対話が可能になります。

一方で、AIエージェントの進化に伴い処理時間が長くなる傾向があり、すぐに返答が求められる音声対話では、まだ進化を実感しにくい面もあります。しかし、大規模言語モデル(LLM)のコストが急速に下がり、処理速度も改善していることから、近い将来、さらに進化した音声対話AIが登場する可能性が高いと考えられます。

ChatGPT ボイスモードアップデート

今後の展望

株式会社Mavericksは、自社での先端AIプロダクト開発で得た知見を社会に還元することを重要な使命と考えています。今後も「Mavericks AI ニュース」を通じて、AI時代を切り拓くビジネスパーソン、開発者、DX担当者にとって、信頼できる実用的な情報を継続的に発信していくとのことです。

関連情報

Mavericks ロゴ

タイトルとURLをコピーしました