Claude Superpowersとは

Claude Superpowersは、Jesse Vincent(GitHub: obra)が開発したAIコーディングエージェント向けのスキルフレームワークだ。 2026年1月にAnthropic公式プラグインマーケットプレイスに登録され、5月時点でGitHubスター数177,000超、フォーク15,700。 この5週間で6,000以上の新規スターを獲得しており、AI開発ツール界隈で異例の伸びを見せている。

Superpowersの正体は14個前後のMarkdownファイル(SKILL.md)と1つのセッション開始フックでしかない。 プロプライエタリなSDKもファインチューニング済みモデルも使わない。 ただのテキストファイルが、Claude CodeをはじめCursor・Codex CLI・Gemini CLI・OpenCode・GitHub Copilot CLIといった異なるホスト全てで同じ開発規律を発火させる

解こうとしている問題 — 能力ではなく「規律」の欠如

Superpowersの設計思想は、Jesse Vincentの次の洞察に集約される。

AIエージェントに足りないのは知識ではない。
「TDDについて講義してくれ」と言えば完璧な講義をしてくれる。
欠けているのは、近道が見えた瞬間にそのTDDをやり続けさせる仕組みだ。

この観察は、現代のAIコーディングが直面する具体的な失敗パターンを正確に言い当てている。 「テストは実装の後に書きます」「とりあえずモックで動かしてから本実装に進みます」「コンパイルが通ったので大丈夫です」—— これらは全て、エージェントが合理的な理由をつけて規律を破る瞬間だ。 能力の問題ではなく、自己欺瞞をどう防ぐかという問題である。

Superpowersのアプローチは明快だ。規律を「プレーンテキストで配布可能な文化」として実装する。 教育ではなく、構造的な制約として。各スキルは大文字で書かれた「Iron Law(鉄則)」から始まり、 続いてエージェントが規則を破る際に典型的に使う言い訳がRed Flags(赤旗)リストとして明文化されている。

Iron Laws — 自己欺瞞防止の構造

Superpowersにおいて最も象徴的なIron Lawは、TDDスキルの冒頭にあるこの一文だ。

Iron Law of TDD

NO PRODUCTION CODE
WITHOUT A FAILING TEST FIRST.

失敗するテストなしに、プロダクションコードを書いてはならない。

この鉄則の下には、エージェントが「いま、ちょっとだけテストを後回しにしたい」と思った瞬間に使う典型的な言い訳がリスト化されている。

この設計の本質は、「自己欺瞞を構造で防ぐ」という考え方にある。 人間のシニアエンジニアが暗黙的に持っているコードレビュー時の「これは怪しい」というセンスを、 Markdownで明示的に列挙することで、AIエージェントにも同じ警戒網を持たせる。

主要スキル一覧

Superpowersのスキル群は、開発のライフサイクル全体をカバーする。 各スキルは独立したSKILL.mdとして配布され、関連する状況で自動的に発火する。

スキル 役割 発火タイミング
brainstorming ソクラテス式の質問で仕様と設計を精緻化。
受諾されるまでコードを書かない
新規機能の依頼時
writing-plans 機能を「2〜5分で完了するタスク」単位に分解。
ファイルパスとテストを実装前に明文化
ブレインストーミング完了後
test-driven-development RED-GREEN-REFACTORサイクルを強制。
「テストは後で」を実装削除の根拠とする
実装フェーズ
systematic-debugging 4段階の根本原因追跡プロセス。
「理解していないものを直すこと」を明示的に禁止
バグ報告時
subagent-driven-development 実装と検証を別の新規サブエージェントに分離。
計画とテストだけを渡して並列実行
計画策定後
requesting-code-review レビュー前チェックリストを通過させる。
品質ゲートとしてのレビュー
実装完了時
verification-before-completion 「完了」を宣言する前の必須検証手順を強制 タスク終了直前
using-git-worktrees git worktreeで並列ブランチ作業を物理的に分離 マルチタスク発生時
dispatching-parallel-agents 独立した作業を並列サブエージェントに分散 大規模タスク開始時

典型的なワークフロー

Superpowersが導入されたエージェントは、ユーザーが機能を依頼した瞬間から、 以下のような「不可逆なフロー」を辿ることになる。各段階を完了するまで次に進めない。

flowchart TD
    A[ユーザー依頼] --> B[brainstorming<br/>質問で仕様精緻化]
    B --> C{設計が<br/>受諾されたか}
    C -->|No| B
    C -->|Yes| D[writing-plans<br/>タスク分解 + テスト明文化]
    D --> E[using-git-worktrees<br/>作業ブランチ分離]
    E --> F[subagent-driven-development<br/>実装サブエージェント派遣]
    F --> G[test-driven-development<br/>RED-GREEN-REFACTOR]
    G --> H{Iron Law<br/>違反検出?}
    H -->|Yes| I[実装削除 + 再開]
    I --> G
    H -->|No| J[requesting-code-review<br/>レビューエージェント派遣]
    J --> K{品質ゲート<br/>通過?}
    K -->|No| G
    K -->|Yes| L[verification-before-completion<br/>最終検証]
    L --> M[完了報告]

    style A fill:#1e3a8a,stroke:#3b82f6,color:#fff
    style B fill:#3730a3,stroke:#6366f1,color:#fff
    style D fill:#3730a3,stroke:#6366f1,color:#fff
    style G fill:#7c2d12,stroke:#f97316,color:#fff
    style H fill:#7f1d1d,stroke:#ef4444,color:#fff
    style J fill:#581c87,stroke:#a855f7,color:#fff
    style M fill:#14532d,stroke:#22c55e,color:#fff
Superpowersが強制する開発フロー — 各段階は前段階の完了が前提

ポイントはSubagent駆動開発のステップにある。実装は親エージェントが直接行うのではなく、 「計画とテストだけを持った、コンテキストの汚れていない新しいサブエージェント」が実装する。 さらに別のサブエージェントが2段階レビュー(仕様適合性 → コード品質)を実施する。 これは人間のチームにおける「実装者とレビュアーの分離」を、エージェント世界でも再現する仕組みだ。

Systematic Debugging — 「わかったつもり」を構造で禁じる

バグ対応の場面でSuperpowersが発火させるsystematic-debuggingスキルは、特に示唆深い。 このスキルのIron Lawは「You may not fix what you do not understand(理解していないものを直してはならない)」。

4段階の追跡プロセスは概ね次のようになっている。

  1. 再現: バグを最小ケースで再現させる。再現できないバグは「報告」と「修正」を分けて扱う
  2. 仮説: 根本原因の仮説を複数立てる。1つだけだと確証バイアスが入る
  3. 検証: 各仮説について、その仮説が正しければ観察できるはずの追加証拠を集める
  4. 修正: 検証された仮説に基づいてのみ修正する。「とりあえず直してみる」は禁止

この設計は、人間のシニアエンジニアが暗黙的に行っているデバッグの作法そのものだ。 「console.logを散らして勘で直す」アンチパターンを構造的に封じている。

Markdown配布という戦略的選択

なぜプロプライエタリなSDKや専用プラグインではなく、Markdownなのか。 この設計判断にはSuperpowersの哲学が凝縮されている。

側面 従来のエージェント拡張 Superpowers (Markdown)
配布形式 SDK / プラグインバイナリ / API プレーンテキストのSKILL.md
ホスト依存 ホスト固有実装が必要 ホスト非依存(テキスト解釈可能なら動く)
カスタマイズ API経由・限定的 ファイル編集で自由に変更可
監査性 ブラックボックス 全て可読(Git管理可能)
移植性 ベンダーロックイン Claude / Cursor / Codex / Gemini で同一動作
セッション開始 専用ローダー 2,000トークン以下のブートストラップフック

Jesse Vincentが繰り返し強調するのが、「portable engineering culture(移植可能なエンジニアリング文化)」というビジョンだ。 特定ベンダーの特定モデルに紐づいた規律ではなく、テキストとして配布可能で、誰でもフォークし、カスタマイズし、共有できる「文化」を作る。 AI開発標準が乱立する時代において、これは戦略的に賢い選択でもある。

インストール方法

2026年5月時点で、Superpowersは主要なAIコーディングホストすべてに公式対応している。

インストール後は明示的なコマンドは不要だ。セッション開始時にフックがブートストラップ文書を注入し、 以降は状況に応じて関連スキルが自動発火する。 「ブレインストーミングを始めて」と言わなくても、新機能の依頼を受けたエージェントは勝手にbrainstormingスキルを呼び出す。

Superpowersの歩み

プロトタイプ公開

Jesse Vincentが個人プロジェクトとしてGitHubに公開。Claude Code単独対応。スター数は数百程度。

マルチホスト対応

CursorとCodex CLIへの対応を追加。「ポータブルな文化」というビジョンが明文化される。スター数1万超え。

Anthropic公式マーケットプレイス登録

Claude Codeの公式プラグインとして配信開始。Iron Law / Red Flagsの体系が完成。

Subagent駆動開発スキル追加

実装とレビューを別エージェントに分離する仕組みを正式スキル化。並列開発の標準が確立。

177,000スター達成

5週間で6,000スター増。AI開発ツール史上稀に見る成長速度。フォーク15,700+。

使ってみてわかるトレードオフ

Superpowersは銀の弾丸ではない。導入前に理解しておくべきトレードオフがいくつかある。

なぜこれが「次の標準」になりつつあるのか

Superpowersの急速な普及は、AIコーディングが「コード生成器」から「規律あるエンジニアリングパートナー」へと進化する転換点を示している。 ここから読み取れる潮流は3つある。

  1. 能力競争から規律競争へ: モデルの基礎能力は各社収束しつつある。差別化はモデルそのものではなく、 「いかに自己欺瞞を防いで一貫した品質を出すか」というメタレイヤーに移っている。
  2. テキストとしての文化: エンジニアリング文化が暗黙知ではなく明示テキストとして配布される。 シニアの判断基準をMarkdownに書き出すこと自体が、組織知の資産化として機能する。
  3. ホスト非依存のメタフレームワーク: どのAIホストでも動くMarkdownスキルは、ベンダーロックインを回避する唯一の現実解。 Claude/GPT/Geminiの覇権争いとは別の階層で、ユーザーが文化を所有できる。

人間のシニアエンジニアがチームに新人を迎える時、最初に教えるのは構文ではなく「うちのやり方」だ。 Superpowersがやっているのは、まさにこの「うちのやり方」をテキストとして書き出し、 AIエージェントに対しても同じオンボーディングを行えるようにすること。 AI開発が「個人技」から「文化を持つチーム作業」へと変わる瞬間を、この177,000スターは記録している。

理解度チェック

理解度チェック

問題 0 / 50%
Q1

Superpowersにおける「規律を破る際の典型的な言い訳リスト」を指す用語は、_____ Flagsである。