AI開発のコスト課題を解決!カラクリが「AWS Trainium」活用ノウハウを無償公開

開発・プログラミング

AI開発のコスト課題を解決!カラクリが「AWS Trainium」活用ノウハウを無償公開

AI(人工知能)の進化が目覚ましい現代において、大規模なAIモデル(LLM)の開発には高性能なコンピューターの部品である「GPU」が不可欠です。しかし、世界的なAIブームにより、このGPUの価格が高騰し、多くの企業がAI開発のコストに悩んでいます。

このような状況の中、国産LLM開発企業のカラクリ株式会社は、GPUに代わる選択肢として注目されるAmazon Web Services(AWS)が開発した深層学習に特化したチップ「AWS Trainium」の活用ノウハウを、AI開発に携わるエンジニア向けに無償で公開しました。この取り組みは、日本のAI開発コミュニティがより多様な技術を選べるようにすることを目指しています。

KARAKURI Techblog

AWS Trainiumとは?なぜ今注目されるのか

AWS Trainiumは、AIの中でも特に「深層学習」という技術に特化して作られたチップです。一般的なGPUと比較して、AIモデルの訓練や調整(ファインチューニング)において、より優れたコストパフォーマンスを発揮すると言われています。

しかし、AWS Trainiumを使いこなすには、専用のソフトウェア(SDK)への対応や、AIモデルの計算方法をTrainiumに合わせて調整する「モデル移植」といった専門的な知識が必要です。特に日本語での詳しい解説が不足していたため、導入のハードルが高いと感じる開発者も少なくありませんでした。

カラクリは、自社でAWS Trainiumを実際に使って得た経験と知識をまとめ、このノウハウを公開することで、より多くの技術者がTrainiumを有効活用できるよう支援したいと考えています。

公開されたノウハウの内容

今回公開されたノウハウは、AWS Trainiumの基本的な使い方から、Llama 3という人気のAIモデルをTrainiumで動かすための高度な技術まで、幅広く網羅しています。具体的には、以下のような内容が含まれています。

  • AWS Trainiumの基本: Trainiumを動かすための基本的な設定や、チップの動きを確認する方法、Trainium特有の計算の仕組みについて解説します。

  • コンピューターの集団(クラスタ)の構築: たくさんのTrainiumチップを組み合わせて、大規模なAI学習を行うためのコンピューターの集団を、AWSのツールを使って作る手順を詳しく説明します。

  • AIモデルの分散学習: 複数のTrainiumチップを使って、AIモデルを効率的に学習させるための環境設定や、学習の実行方法を紹介します。

  • 最先端のモデル移植技術: Llama 3のような有名なAIモデルを、Trainiumの仕組みに合わせて調整(移植)する具体的な手順を解説します。これは、新しいAIモデルを新しいチップで動かすための重要な技術です。

  • 分散学習の理論: データ並列、テンソル並列、パイプライン並列といった、AIを効率的に学習させるための様々な方法(分散学習戦略)の基本的な考え方と、Trainium環境での適用方法を説明します。

特に、Llama 3ベースモデルの移植に関するノウハウは、最新のAIモデル開発において非常に役立つ技術であり、AI開発の可能性を大きく広げるものと言えるでしょう。

このノウハウは、カラクリのTechblogにて「AWS Trainium 50本ノック」として公開されています。

今後の展望

カラクリは、このノウハウ公開を通じて得られるフィードバックや新たな知見を活かし、AI開発における技術的な課題解決とイノベーションを今後も推進していく予定です。将来的には、AWS Trainiumの次期バージョンである「Trn2」への対応など、最新のAIアクセラレータ活用ノウハウも継続的にコミュニティに提供していく方針です。

カラクリ株式会社について

カラクリ株式会社は、「FriendlyTechnology」というビジョンを掲げ、AIの技術をカスタマーサポートの分野で役立てることを目指すAIスタートアップ企業です。2018年からAIモデル「BERT」の研究を始め、2022年からはGPTを含む大規模言語モデルの研究に取り組んでいます。同社が提供するカスタマーサポート向けAIシリーズは、高島屋、SBI証券、セブン-イレブン・ジャパン、星野リゾートなど、多くの有名企業で採用されています。

タイトルとURLをコピーしました