ELYZA、高速かつ日本語に強い新しいAI「ELYZA-LLM-Diffusion」を公開

生成AI(Generative AI)

ELYZAが新しい日本語AIモデル「ELYZA-LLM-Diffusion」を開発・公開

AI(人工知能)の研究開発を行う株式会社ELYZAは、日本語の文章を高速に、そして高い精度で作り出す新しいタイプのAIモデル「ELYZA-LLM-Diffusion」シリーズを開発し、商用利用できる形で公開しました。

日本語性能に特化した拡散言語モデル ELYZA-LLM-Diffusion

拡散言語モデル(dLLM)ってどんなAI?

「ELYZA-LLM-Diffusion」は、「拡散型大規模言語モデル(dLLM)」と呼ばれる、これまでにないAIの仕組みを使っています。この「拡散モデル」という技術は、もともと画像を生成するAIでよく使われていました。

従来の文章を作るAIは、まるで人間が文章を書くように、左から右へと一文字ずつ順番に言葉を生成していました。これに対してdLLMは、まずノイズだらけの状態からスタートし、そこから少しずつノイズを取り除いていくことで、最終的にきれいな文章を作り出します。この方法だと、一度にたくさんの情報を処理できるため、文章を作るスピードが速くなり、使う電力も抑えられる可能性があります。

AIアプリケーションのダークテーマUIが表示されています。メッセージ入力欄と送信ボタンがあり、AutoRegressive、Diffusion (x1)、Diffusion (x8) といったモデル選択肢が見られます。

日本語に特化した「ELYZA-LLM-Diffusion」

ELYZAが今回開発した「ELYZA-LLM-Diffusion」は、既存の拡散言語モデルをベースにしつつ、たくさんの日本語データを追加で学習させることで、日本語の知識や、指示に従って文章を生成する能力を大幅に向上させています。現在、以下の2つのモデルが公開されています。

これらのモデルを使ったチャット形式のデモも公開されており、実際にその性能を体験できます。ただし、アクセスが集中すると、少し待つことがあるかもしれません。

日本語タスクで高い性能を発揮

「ELYZA-LLM-Diffusion」の日本語に関する能力を評価した結果、一般的な日本語の理解力を問うテストで、他のオープンな拡散言語モデルと比べて、同等かそれ以上の高い性能を発揮していることが確認されました。

大規模言語モデル(LLM)の性能を比較した表。一般的な日本語能力、コーディング、数学の3分野で、ELYZA、Dream、WeDLMの各モデルがベンチマークテストで評価されています。

AIの電力消費問題への貢献と今後の展望

AIの利用が広がるにつれて、AIを動かすために必要な電力の量が増え、データセンターの不足などが世界的な問題となっています。ELYZAは、このdLLMの研究を進めることで、電力消費を抑えながらも高性能な日本語AIの開発を加速させたいと考えています。

ELYZAはこれからも、最先端のAI技術の研究開発に取り組み、その成果を広く公開することで、日本におけるAIの社会での活用を推進し、自然言語処理技術のさらなる発展を支援していく方針です。

タイトルとURLをコピーしました