最近面白いニュースが飛び込んできた。決済会社Stripeが、完全に自動でコードを書いてプルリクエストまで作ってくれるAI「Minions」を公開したんです。週に1,000個以上のPRを出すって、もう人間の開発者より働いてるじゃん。
Copilotの次の段階は「完全おまかせ」
GitHub CopilotやCursorのようなAIコーディングツールって、いまや当たり前になった。でも結局、開発者が横についてプロンプトを書いて、AIの作業を見守る必要がある。
Stripeの「Minions」は全然違う。エンジニアがSlackで「〇〇の機能を作って」って投げたら、あとは放置。コーヒーでも飲んで戻ってきたら、完成したPRが待ってるという「fire and forget」な世界。
実際に動作する流れはこんな感じだ。エンジニアがSlackでMinionsをタグ付けして依頼する。AIが動き出す前に、自動的に関連するJiraチケットや仕様書を収集。そのあとAIがコードを書いて、自動でテストを実行し、問題があれば修正を繰り返して、最終的に人間がレビューできる状態のPRを作成する。
Stripeが解決した「AIコーディングの3つの課題」
普通のAIエージェントって、途中でリンターを忘れたり、テストをスキップしたりする。Stripeは「創造的な部分」と「決まりきった作業」をうまく分けた。
AIがコードを書く→必ずリンターを実行(AIは省略できない)→エラーがあればAIが修正→自動でGitコミット、みたいに、決定論的な「ゲート」を挟み込んでいる。
それから、巨大なコードベースに対してルール全部を渡すとコンテキストウィンドウがあふれる問題。Stripeは作業場所に応じてルールを切り替える。決済関連のディレクトリで作業してれば決済のルールだけ適用する、という具合に。
フィードバックループも3段階で設計されてる。5秒以内に終わるローカルリンター、選択的に実行されるCI、そして300万個のテストがあるフルCIと、段階的にチェックが厳しくなっていく仕組み。
「道具より、道具を支えるインフラ」が勝負
面白いのは、StripeのMinionsって使ってるAIモデル自体は「ほぼ商用品」だということ。オープンソースツールのフォークベースなんだそう。勝負の分かれ目は、そのAIをどう既存の開発フローに組み込むかのインフラ設計にあった。
実際、MicrosoftやGoogleでも、すでにコードの25〜30%はAIが書いているらしい。でもStripeのアプローチで興味深いのは、「人間がやってること」を分析して、AIにも同じフローを踏ませる発想。
RESONIXでも、最近のプロジェクトでGitHub Copilotを使う機会が増えてきてるけど、まだまだ「横についてる」感じ。でもこういう完全自動化の波がWeb制作の現場にも来るとしたら、人間の開発者に求められるスキルも変わっていくんじゃないかな。
開発者の仕事は「タスクデザイン」に
実際のStripeエンジニアの仕事を見ると、もうコード自体は書いてない。タスクの説明を書いて、AI の出力をレビューして、それを支えるインフラを設計する。それが新しい「開発者の仕事」になってる。
中小企業のWeb制作でも、いずれこういうAIエージェントがWordPressのカスタマイズやフロントエンドの実装をやってくれる日が来るかもしれない。そのとき人間に求められるのは、「どういう機能が必要か」を正確に伝える能力と、AIが作ったものをちゃんと評価できる目じゃないかと思う。
ちょっと先の話に聞こえるかもしれないけど、Stripeみたいな技術集団がすでに週1,000個のPRを AI に任せてる事実を見ると、この変化は思ってるより早く来そう。開発者として生き残るなら、今のうちにCI/CDやテスト設計、システム全体の理解を深めておくのが良さそうです。













