国産AIがソフトウェア開発の国際ベンチマークで80.2%の解決率を達成!「JAPAN AI Code」とは?

開発・プログラミング

国産AIエージェント基盤「JAPAN AI Code」が世界最高水準の性能を実証

JAPAN AI株式会社が開発した国産AIエージェント基盤「JAPAN AI Code」が、ソフトウェア開発の国際的な評価基準である「SWE-bench Verified」ベンチマークにおいて、全500問の評価で解決率80.2%を達成しました。

これは、国内で独自に開発されたAIエージェント技術として、世界でも最高水準の結果です。AIがまるで人間のようにソフトウェア開発の難しい課題を解決できることを示しています。

国産AIエージェント基盤 JAPAN AI Code ソフトウェア開発ベンチマークSWE-bench Verifiedにおいて 80.2% を達成! JAPAN AI JAI Code 私はJAI Code、Japan AIの公式コーディングエージェントです。ソフトウェアエンジニアリングのタスクを迅速かつ正確にサポートします。コードのバグ修正、新機能の追加、リファクタリングなど、さまざまなニーズに対応します。 こんにちは。JAI Codeです。 ソフトウェアエンジニアリングのタスクを迅速かつ正確にサポートします。コードのバグ修正、新機能の実装、リファクタリング、テストの作成など、開発における幅広いニーズに対応可能です。 利用可能な環境: ・サンドボックスVM: Bash、Python、Git、GitHub CLI (gh)などが利用可能 ・外部連携: JIRA、Notion、Linear、Context7との統合 何を実装しますか? このリポジトリのコードベース構造を把握して、主要なディレクトリとファイルの役割を説明してください 最新のコミットで追加された機能について、コードレビューの観点での改善点を指摘してください package.jsonに記載されている依存関係のうち、セキュリティ脆弱性が報告されているものがないか確認して... main.pyのエラーハンドリングを改善し、ログ出力を追加してください 何か質問してください + @ JAI Code Claude Sonnet 4.5 ↑ 送信 Shift+Enter: 送信、Enter: 改行

JAPAN AI Codeとは?

JAPAN AI Codeは、JAPAN AIが独自に開発したAIエージェント基盤の上で動く、ソフトウェア開発を助けるAIです。

「AIエージェント」とは、まるで人間のアシスタントのように、自分で考えて行動し、与えられた目標を達成しようとするAIのことです。従来の、決まったコードを提案するだけのツールとは異なり、JAPAN AI Codeは以下のようなことができます。

  • 課題の理解:何が問題なのかを把握する

  • 調査:問題を解決するための情報を集める

  • 実装:実際にプログラムコードを書く

  • 検証:書いたコードが正しく動くかを確認する

このように、一連のソフトウェア開発のプロセスをAIが自律的に実行できます。コードを書くだけでなく、バグの原因を探したり、コードの改善点を提案したり、テストを作ったり、さらにはアプリケーション全体の開発まで、幅広い業務をサポートします。

JAPAN AI Codeは、同社が提供するAIプラットフォーム「JAPAN AI STUDIO」と連携しており、企業が持つ様々な情報(資料やプロジェクトの記録など)を活用しながら作業を進められます。単なるコーディングツールではなく、企業の状況や背景を理解した上で開発を支援する、企業向けのAIエージェントと言えるでしょう。

世界トップクラスの解決率を達成

JAPAN AI Codeは、ソフトウェア開発AIの能力を測る国際的なテスト「SWE-bench Verified」で80.2%の解決率を達成しました。

SWE-bench Verifiedとは、AIがどれだけ実際のソフトウェア開発の課題を解決できるかを評価する国際的なベンチマーク(性能比較基準)です。

SWE-bench Verified

このテストでは、世界中で使われているDjangoやMatplotlibといったオープンソースのプログラムで、実際に報告されたバグや機能の要望の中から、専門家が選んだ500問が使われます。AIエージェントは、問題の説明とプログラムのコードだけを頼りに、自分でコードを調べ、原因を見つけ、修正を行い、テストが通ることを確認するまでの一連の作業を自律的にこなす必要があります。人間から答えのヒントは一切与えられません。

JAPAN AI Codeは、この500問のうち401問を解決し、解決率80.2%という結果を出しました。

AIエージェントの性能比較(SWE-bench Verified基準)

コーディングAIエージェント 解答率
JAPAN AI Code 80.20%
TRAE + Doubao-Seed-Code 78.80%
live-SWE-agent + Gemini 3 Pro Preview (2025-11-18) 77.40%
TRAE 75.20%
Lingxi-v1.5_claude-4-sonnet-20250514 74.60%
JoyCode 74.60%

※ 2026年2月時点のSWE-bench公式リーダーボード掲載数値に基づきます。

各AIモデル提供元が報告するSWE-bench Verifiedスコア(参考)

AIモデル名 解答率
Claude Opus 4.5 80.9%
JAPAN AI Code 80.2%
GPT5.2 80.0%
Gemini 3 Flash 78.0%

※ これらの数値は、各AIモデルの開発元が自社のモデルに最適なAIエージェントの構成で評価した結果であり、JAPAN AI Codeとは評価の条件が異なります。

JAPAN AI Codeは、独自に開発したAIエージェント基盤を使うことで、AIモデルの開発元が自社モデル向けに最適化した結果とほぼ同じスコアを出しています。これは、AIエージェント基盤そのものの技術力が高いことを客観的に示しています。

JAPAN AI独自のAIエージェント基盤のすごい技術

JAPAN AI Codeの大きな特徴は、JAPAN AIがゼロから独自に開発したAIエージェント基盤の上で動いている点にあります。

多くのAIコーディングツールが、AIモデルの機能(API)を呼び出すだけのシンプルな作りであるのに対し、JAPAN AIのエージェント基盤は、AIモデルの上に独自の技術を積み重ねることで、AIモデル単体では達成できない高い精度と安定性を実現しています。

主な技術要素は以下の通りです。

  1. マルチAIエージェント連携:複雑な作業を複数の専門AIエージェントに分け、それぞれが協力して問題解決にあたります。例えば、コードの構造を分析するAI、テストの要件を見つけ出すAI、修正したコードが正しいか確認するAIなどが連携します。
  2. 動作ツールの最適な選択:100種類以上のツールの中から、その時に必要な最適なツールをAIが自動で選び、実行します。ファイルの操作、コードの検索、テストの実行、他のシステムとの連携など、開発に必要な様々な操作をAIが判断して行います。
  3. コンテキスト管理:長時間の作業でも、関連する情報を忘れずに覚え続ける技術です。「コンテキスト」とは、状況や背景、文脈といった意味で、AIがこれまでの会話や作業内容を理解し、一貫した作業を続けることを可能にします。
  4. マルチAIモデル対応:Claude、GPT、Gemini、Kimiなどの主要なAIモデルだけでなく、オープンソースのAIモデルにも対応しています。これにより、作業の種類や予算に合わせて最適なAIモデルを選んで利用できます。今回の評価では、主にClaude 4.5 OpusというAIモデルを使い、GPT-5.2 Codexを補助的に組み合わせることで高い成果を出しました。

これらの技術は、SWE-benchのような国際的なテストで高い成果を出すだけでなく、実際の開発現場で複雑な作業を安定してこなすための土台となっています。

JAPAN AI Codeの強みと活用例

JAPAN AI Codeは、以下のような強みを持っています。

  1. 組織の状況を理解する:JAPAN AI STUDIOと連携しているため、プロジェクトの資料、過去のやり取り、社内の知識ベースなどを参照しながら作業できます。チームの一員として、組織の状況を理解した上で開発を支援します。
  2. エンジニアリングの民主化:「エンジニアリングの民主化」とは、エンジニアではない人でも、AIを使って技術的な作業ができるようになることです。JAPAN AIのユーザーであれば、エンジニアでなくても、簡単な言葉で指示を出すだけで、業務の自動化、ファイルの操作、簡単なアプリの作成などができます。これにより、技術部門と非技術部門の橋渡しとなり、組織全体の生産性向上に貢献します。
  3. コストと品質のバランスを柔軟に選択:複数のAIモデルに対応しているため、重要な作業には高性能で高価なAIモデルを、日常的な調査やレビューにはコスト効率の良いAIモデルを選ぶなど、品質と費用のバランスを最適に調整できます。

JAPAN AI Codeの活用例

エンジニアの方の場合

  • 古いコードの解析と最新化:ドキュメントが少ない古いプログラムの仕組みを分析し、最新の形に作り変える提案をします。これにより、ブラックボックス化していたシステムの維持費用を大幅に削減できます。

  • テストコードの自動生成と品質向上:既存のコードを分析して、様々な状況に対応できるテストコードを自動で作ります。エンジニアが新しい機能の開発に集中している間に、AIが裏側でテストの範囲を広げ、プログラム全体の品質を高めます。

  • 問題発生時の初期対応・原因特定:システムで異常が発生した際に、大量の記録(ログ)とプログラムのコードを調べて、「どの変更が原因か」「どのデータベースの処理が遅いのか」といった仮説をすぐに提示します。これにより、システムが復旧するまでの時間を短くできます。

エンジニアではない方の場合

  • データ抽出・分析のセルフサービス化:「先月の売上データを地域別に集計したい」と指示するだけで、必要なデータベースの命令文(SQL)を作成・実行し、結果をグラフにしてくれます。エンジニアに依頼して待つ必要がなくなります。

  • 業務効率化ツールの即時開発:毎日行っている定型業務を自動化する簡単なプログラムや、社内で使う管理画面を、その場ですぐに作ることができます。アイデアを思いついたその日に、実際に使えるツールを手に入れられるでしょう。

  • 「作りたい」を技術的な仕様に変換:漠然としたビジネス上の要望を伝えるだけで、それを実現するための具体的な機能やデータの構造案をAIが提示します。開発チームに相談する前に「要件の具体性」を高め、後から手直しが必要になることを防ぎます。

さらに、JAPAN AIが提供する「JAPAN AI STUDIO」という、コードを書かずにアプリを開発できる環境と組み合わせることで、JAPAN AI Codeが作ったコードやアプリをSTUDIOのページとしてすぐに公開し、業務で活用することも可能です。

今後の展望

JAPAN AIは、JAPAN AI Codeのさらなる進化を続けていく予定です。

今後は、エンジニアが普段使っているターミナル(コマンド入力画面)からJAPAN AI Codeを直接使えるCLIツール(コマンドラインインターフェースツール)の提供も計画されています。これにより、ローカル環境でのコード編集からJAPAN AI STUDIOでの公開まで、一連の開発作業をスムーズに行えるようになります。企業のお客様のセキュリティ基準や仕事の進め方に合わせた、最適なAIコーディング環境を目指していくとのことです。

また、世界水準の技術力を維持し、さらに向上させるため、同じ目標を持つ優秀な技術者の採用を積極的に進めています。

採用情報はこちら:
https://japan-ai.co.jp/recruit

JAPAN AI株式会社について

JAPAN AI株式会社は「AIで持続可能な未来の社会を創る」というビジョンを掲げ、AIに関する製品やサービスの開発を行い、様々な業界や産業の発展に貢献しています。

  • 社名:JAPAN AI株式会社

  • 代表者:代表取締役社長 工藤 智昭

  • 本社:東京都新宿区西新宿6-8-1 住友不動産新宿オークタワー5/6階

  • 設立:2023年4月

  • 事業内容:人工知能の研究開発、人工知能に関するコンサルティングサービス

  • URLhttps://japan-ai.co.jp/

タイトルとURLをコピーしました