第5章で「アクティベーションを15%改善する」というアウトカムを掲げました。 では、それをどう測るのでしょうか。本章のテーマは指標(メトリクス)です。 ただし「何を測るか」だけでなく、「なぜ測るか」——測定が意思決定につながるかどうか——を一貫して問います。 North Star Metric、AARRR、HEART、PMFの測定、A/Bテストの落とし穴、そしてグロースループまでを扱います。
North Star Metric — 全社を結束させる単一指標
North Star Metric(北極星指標、NSM)は、"グロースハッキング"の名づけ親Sean Ellisが広めた概念です。 バラバラなKPIを個別に最適化するのではなく、製品が顧客に届ける「must have(なくては困る)価値」の拡大を捉える、 たった1つの指標を持つべきだという主張です。NSMは長期成長の先行指標(leading indicator)であり、 全部門が「自分の仕事との因果線」を引ける指標であるべきとされます。
| 企業 | North Star Metric | 選定理由 |
|---|---|---|
| Airbnb | Nights booked(予約宿泊数) | ホスト・ゲスト双方が価値を得る瞬間を1つの数字に凝縮 |
| Spotify | Time spent listening(聴取時間) | 聴取時間が長いほどチャーンしにくく、有料転換も起きやすい |
| Uber | Weekly trips(週間乗車回数) | ライダーとドライバー双方(双方向マーケット)の成長を反映 |
| Daily Active Users(DAU) | Ellis本人がNSMの代表例として挙げる |
AARRR — 海賊指標
AARRRは、Dave McClure(500 Startups創業者)が2007年に提唱した、顧客ジャーニーの5段階フレームです。 頭字語が海賊の掛け声「アー!」に似ていることから「Pirate Metrics(海賊指標)」と呼ばれます。
graph LR A1[Acquisition\n獲得] --> A2[Activation\n活性化] A2 --> R1[Retention\n継続] R1 --> R2[Referral\n紹介] R2 --> R3[Revenue\n収益] style A1 fill:#8b5cf6,stroke:#6d28d9,color:#fff style A2 fill:#7c5cda,stroke:#6d28d9,color:#fff style R1 fill:#3b82f6,stroke:#2563eb,color:#fff style R2 fill:#14b8a6,stroke:#0d9488,color:#fff style R3 fill:#10b981,stroke:#059669,color:#fff
各段階の意味は、Acquisition(獲得:どこから来るか)→ Activation(活性化:初回の良い体験=アハ体験)→ Retention(継続:戻ってくるか)→ Referral(紹介:他者に薦めるか)→ Revenue(収益:マネタイズ)。 McClure自身はRetention(継続)こそ最も重要だが見過ごされがちだと強調しています。 各段階をファネルとして可視化し、ボトルネックを特定するのが使い方です。
HEART — UX品質を測るGoogleのフレーム
Googleの定量UXリサーチャーKerry Roddenらが2010年のACM CHIで発表したのがHEARTフレームワークです。 ユーザー体験の品質を5次元で測ります。
| 次元 | 意味 | 例となる指標 |
|---|---|---|
| Happiness(満足) | ユーザーの態度・満足度(主観的) | CSAT、NPS、満足度調査 |
| Engagement(関与) | どれだけ頻繁に・深く関わるか | 視聴時間、週あたり作成ドキュメント数 |
| Adoption(採用) | 新規ユーザー数、新機能の受け入れ速度 | 無料トライアル転換率、Time to Value |
| Retention(継続) | どれだけユーザーを維持できるか | 期間別アクティブユーザー率 |
| Task success(タスク成功) | タスクをどれだけ効果的に完了できるか | タスク完了率、エラー率、完了時間 |
HEARTはGoals-Signals-Metrics(GSM)プロセスとセットで使います—— ゴールを定義し、成功/失敗を示すユーザー行動(シグナル)を特定し、それを具体的なHEART指標にマッピングする。 重要な注意点として、5次元すべてを同時に使う必要はありません。直近のゴールに合うものに絞ります。
リテンションとPMF — Sean Ellisの40%ルール
グロースの大前提がPMF(Product-Market Fit、製品と市場の適合)です。 PMFが無いまま成長に投資しても、穴の空いたバケツに水を注ぐようなもの。では、PMFはどう測るのか。
リテンション分析の本質は、ヘッドラインの「○%」ではなくカーブの形を読むことにあります。
| カーブの形 | 意味 |
|---|---|
| Declining(減少型) | 急落しゼロまで落ち続ける。習慣を形成できていない(試して捨てられる)製品のサイン |
| Flat / Plateau(平坦化型) | 落ちた後プラトーで安定。健全なパターン。価値を見出した中核ユーザー層を表す |
| Smile Curve(スマイルカーブ) | 急落→平坦化→後半で上昇に転じる。改善により休眠ユーザーが戻る理想形 |
バニティ指標 vs アクショナブル指標 — Eric Ries
「なぜ測るか」を問う本章の核心が、Eric Riesの区別です。
| バニティ指標(虚栄の指標) | アクショナブル指標 | |
|---|---|---|
| 定義 | 気分は良くなるが意思決定に役立たない | 特定の行動と観測結果を結びつけられる |
| 例 | ページビュー、累計登録者数、総ダウンロード数 | コホート別のリテンション率、転換率 |
| 因果 | 何が動かしたか分からず、功罪が意見の応酬に | 「Xを変えたらYが動いた」と言える |
累計登録ユーザー数は、上がり続けるだけで「なぜ」を説明せず、取るべき行動を指し示しません。これがバニティ指標です。 Riesは見分ける基準として「3つのA」を挙げます—— Actionable(行動可能)・Accessible(誰でもアクセス・理解可能)・Auditable(監査可能=データが信頼できる)。 この3つを満たす指標だけが、意思決定の燃料になります。
A/Bテストの落とし穴
アクショナブルな学びを得る代表的手段がA/Bテストです。しかし、ここには統計的な罠がいくつも潜んでいます。
| 落とし穴 | 内容 |
|---|---|
| Peeking(覗き見) | 事前設定したサンプルサイズ到達前に結果を見て、有意が出た瞬間に止める。偽陽性率が5%→最大30%に膨張する |
| 多重比較 | 同時に多数のテストを回すと偽陽性が増える。5%有意で20テストなら偶然1件の偽陽性が期待される |
| 実用的有意性の無視 | 統計的に有意でも、効果量が極小なら意味がない |
| SRM(Sample Ratio Mismatch) | 観測されたトラフィック分割が期待と一致しない。見かけ上有意でもテストを無効化しうる |
| Novelty Effect(新規性効果) | 新UIへの一時的な物珍しさで初期に上振れし、長期では元に戻る |
グロースループ vs ファネル
最後に、現代グロースの中心概念グロースループ(Growth Loop)を扱います。 ReforgeのBrian Balfourらが定式化したもので、従来のファネルとは成長の様式が根本的に異なります。
| 観点 | ファネル | グロースループ |
|---|---|---|
| 方向 | 一方向(上→下) | 循環・閉じた系 |
| 成長様式 | 線形(再投資の概念なし) | 複利的(compounding)。出力を入力へ再投資 |
| 仕組み | 入れた分だけ出る | 入力→処理→出力→再投資のループ |
グロースループは「入力 → 処理 → 出力 → 再投資」の閉じたシステムです。 たとえばDropboxの紹介ループ——ユーザーが友人を招待すると、その友人がまた別の友人を招待する。 出力(新規ユーザー)が次の入力に再投資され、複利的に成長します(Dropboxは15ヶ月で3900%成長、ピーク時単月280万件の紹介を記録)。 Balfourは「ファネルは良い出発点だが、最速で伸びる製品の成長を正確には表さない」と述べています。
指標ツリー — 北極星を運用レバーまで分解する
NSM、AARRR、HEARTは対立しません。実務では併用します。 その統合の鍵が指標ツリー(Metric Tree)です。北極星(output metric)を、それを駆動する input metrics(投入指標)へと分解し、最終的にチームが実際に動かせる運用レバーまで辿ります。
North Star Metric(例: 週間アクティブ利用)
├─ 新規ユーザーの活性化率
│ ├─ オンボーディング完了率 ← チームが動かせるレバー
│ └─ 初回アハ体験への到達時間
└─ 既存ユーザーのリテンション
├─ 機能採用の深さ ← チームが動かせるレバー
└─ 再訪問頻度
フラットなファネル → 「どこが弱いか」しか言えない
指標ツリー → 「なぜ弱いか」を運用レバーまで辿れる フラットなファネルは「どの段階が弱いか」を示しますが、「なぜ弱いか」までは示しません。 指標ツリーなら、「リテンションが弱いのは、有料チャネル経由ユーザーの機能採用が浅いから。 根本原因は汎用オンボーディングが広告の意図に合っていないから」というレベルまで因果を辿れます。 これが「なぜ測るか」への最終的な答えです。
まとめ — 測定は行動のためにある
本章では、指標とグロースを「何を、なぜ測るか」の視点で解剖しました。 North Star Metricで全社を結束させ、AARRRでジャーニーのボトルネックを見つけ、 HEARTでUX品質を測り、40%ルールでPMFを判定する。 そしてバニティ指標を避けてアクショナブル指標を追い、A/Bテストの覗き見やSRMを警戒し、 グロースループで複利的成長を設計し、指標ツリーで「なぜ」を運用レバーまで分解する。 測定はそれ自体が目的ではなく、常に行動のためにあります。
ここまでPMの「仕事」を見てきました。しかし、優れたPMが力を発揮できるかどうかは、 実は組織のあり方に大きく依存します。次章では、Empoweredチームやチームトポロジーといった、 プロダクト主導組織の設計を扱います。
理解度チェック
Sean Ellisの「North Star Metric」の選び方の要件として、誤っているものはどれですか?
キーボード: 1〜4 で選択、Enter で回答