国産AIエージェント「JAPAN AI Code」がソフトウェア開発ベンチマークで高い解決率を達成

JAPAN AI株式会社は、同社が独自に開発したAIコーディングエージェント「JAPAN AI Code」が、ソフトウェア開発AIの国際的な評価基準である「SWE-bench Verified」ベンチマークにおいて、全500問の評価で80.2%という高い解決率を達成したことを発表しました。この成果は、国内で独自に開発されたAIエージェント基盤として、世界最高水準の性能を示すものです。
JAPAN AI Codeとは?
JAPAN AI Codeは、JAPAN AI株式会社が独自に開発したAIエージェント基盤の上で動く、ソフトウェア開発を助けるAIエージェントです。
従来のコードを自動で補完するツールとは異なり、抱えている課題を理解し、その原因を調べ、実際にコードを書き、そしてそれが正しく動くかを確認するところまでを、AIがすべて自動で行うことができます。コードを書くだけでなく、バグの原因を探したり、書かれたコードをチェックしたり、テスト用のコードを作ったり、さらにはアプリケーション全体を開発したりと、ソフトウェア開発の幅広い業務をAIが担当します。
JAPAN AI Codeは、JAPAN AIが提供するAIプラットフォーム「JAPAN AI STUDIO」と連携しており、企業が持っている知識や資料、これまでのプロジェクト情報などを活用しながら作業を進めることができます。単なるコーディングツールではなく、企業の状況や背景を理解した上で開発を支援する、企業向けのAIエージェントです。
世界最高水準の性能を実証
「SWE-bench Verified」は、AIが実際のソフトウェア開発の課題をどれくらい解決できるかを測るための国際的な評価基準です。世界中で広く使われているオープンソースプロジェクト(例えばDjango、Matplotlib、scikit-learnなど)で、実際に報告されたバグや機能の要望の中から、専門家が選んだ500問で構成されています。
AIエージェントには、問題の説明とプログラムのソースコードだけが与えられます。この情報だけを頼りに、AIはコード全体を調べて原因を特定し、修正を行い、既存のテストが問題なく通ることを確認するまでの一連の作業を、自律的に完了させる必要があります。人間からのヒントは一切与えられません。
この厳しい評価において、JAPAN AI Codeは全500問中401問を解決し、解決率80.2%を達成しました。
この成果は、AIモデルの開発元が自社のモデル向けに最適化したAIエージェントの構成で評価した結果と比べても、同等の高いスコアを実現していると報告されています。これは、JAPAN AI独自のAIエージェント基盤の技術力が非常に高いことを客観的に示しています。
SWE-benchの公式リーダーボードについては、以下のリンクから詳細を確認できます。
SWE-bench Verified
JAPAN AI独自のAIエージェント基盤の秘密
JAPAN AI Codeの最大の特徴は、JAPAN AIが完全に独自で開発したAIエージェント基盤の上で動いている点です。
多くのAIコーディングツールがAIモデルの性能に大きく依存するのに対し、JAPAN AIのエージェント基盤は、AIモデルの上に独自の技術を組み合わせることで、AIモデル単体では達成できないような高い精度と安定性を実現しています。その主な技術要素は以下の通りです。
-
マルチAIエージェント連携: 複雑な作業を複数の専門的なAIエージェントに分け、それぞれが協力して問題解決にあたります。
-
動作ツールの最適な選択: 100種類以上のツールの中から、作業内容に合わせて最適なツールをAIが自動で選び、実行します。
-
コンテキスト管理: 長時間かかる作業でも、文脈を要約したり圧縮したりする技術によって、関連する情報を忘れずに、一貫した作業を続けることができます。
-
マルチAIモデル対応: Claude、GPT、Gemini、Kimiといった主要なAIモデルだけでなく、オープンソースのモデルにも対応しています。これにより、用途や予算に応じて最適なモデルを選ぶことが可能です。
これらの技術は、SWE-benchのような国際的な評価基準で高い成果を出すだけでなく、実際の開発現場で複雑な作業を安定してこなすための土台となっています。
JAPAN AI Codeの強み
JAPAN AI Codeには、以下のような強みがあります。
-
組織の文脈を理解する: JAPAN AI STUDIOと連携しているため、プロジェクトの資料やこれまでの会話、社内の知識ベースにアクセスし、チームの一員として組織の文脈を理解した上で開発を支援します。
-
エンジニアリングの民主化: エンジニアだけでなく、JAPAN AIのユーザーであれば誰でも、自然な言葉で指示を出すだけで業務の自動化や簡単なアプリケーション作成などが行えます。これにより、技術部門と非技術部門の橋渡しとなり、組織全体の生産性向上に貢献します。
-
コストと品質の柔軟な選択: 複数のAIモデルに対応しているため、作業の重要度や予算に合わせて最適なモデルを選ぶことができます。高い精度が必要な作業には高性能なモデルを、日常的な調査やレビューにはコスト効率の良いモデルを使い分けることで、品質とコストの最適なバランスを実現します。
JAPAN AI Codeの活用例
JAPAN AI Codeは、エンジニアと非エンジニアの双方にとって、さまざまな業務で役立ちます。
エンジニアの活用例
-
古いコードの解析と改善: ドキュメントが少ない古いコードの仕様を解析し、現代的な構成への改善案を提示します。これにより、ブラックボックス化していたシステムの保守コストを大幅に削減できます。
-
テストコードの自動生成と品質向上: 既存のコードを分析し、さまざまな状況を考慮したテストコードを自動で生成します。開発者が新機能の作成に集中している間に、AIが裏側でテストの網羅性を高め、品質を底上げします。
-
問題発生時の初期対応・原因特定: システムに問題が発生した際、大量のログやソースコードを素早く分析し、「どの変更が原因か」「どのデータベース処理が遅いか」といった仮説を即座に提示します。これにより、障害からの復旧までの時間を最小限に抑えます。
非エンジニアの活用例
-
データ抽出・分析のセルフサービス化: 「先月の売上データを地域別にまとめてほしい」と依頼するだけで、必要なデータを取り出し、グラフ化するといった作業を自動で行います。エンジニアに依頼して待つ必要がなくなります。
-
業務効率化ツールの即時開発: 日常の決まった作業を自動化するプログラムや、社内で使う簡単な管理画面をその場で作ることができます。アイデアを思いついたその日のうちに、実際に動くツールとして手に入れることが可能です。
-
「作りたい」を具体的な技術仕様へ変換: 漠然としたビジネス上の要望をAIに投げかけると、それを実現するための具体的な機能仕様やデータの構造案を提示します。開発チームに相談する前に「要望の具体性」を高め、手戻りを防ぎます。
さらに、JAPAN AIが提供するノーコード開発環境「JAPAN AI STUDIO」と組み合わせることで、JAPAN AI Codeが作ったコードやアプリケーションをSTUDIOのページとして直接公開し、すぐに業務で活用することもできます。
今後の展望
JAPAN AI株式会社は、JAPAN AI Codeのさらなる進化を続けていく予定です。
AIエージェント基盤の改良に加え、開発者向けのターミナルCLIツールの提供を計画しています。これにより、エンジニアが普段使っているターミナル環境から直接JAPAN AI Codeを利用できるようになり、JAPAN AI STUDIOとの連携を通じて、ローカルでのコード編集からJAPAN AI STUDIOでの公開まで、一貫した開発体験が実現すると期待されます。企業のお客様のセキュリティ要件や仕事の進め方に最適化されたAIコーディング環境を目指していくとのことです。
また、世界水準の技術力を維持・向上させるため、同じビジョンを持つ優秀な技術者の採用を積極的に進めていくとしています。AIエージェント技術の最前線で、日本発の技術革新を共に推進していく仲間を募集しています。
採用情報については、以下のリンクをご覧ください。
採用情報
JAPAN AI株式会社について
JAPAN AI株式会社は「AIで持続可能な未来の社会を創る」をビジョンに掲げ、AIに関連する製品やサービスの開発を通じて、様々な業界や産業のさらなる発展に貢献しています。
会社名:JAPAN AI株式会社
代表者:代表取締役社長 工藤 智昭
本社:東京都新宿区西新宿6-8-1 住友不動産新宿オークタワー5/6階
設立:2023年4月
事業内容:人工知能の研究開発、人工知能に関するコンサルティングサービス
詳細については、以下のウェブサイトをご覧ください。
JAPAN AI株式会社

