第5章で「アクティベーションを15%改善する」というアウトカムを掲げました。 では、それをどう測るのでしょうか。本章のテーマは指標(メトリクス)です。 ただし「何を測るか」だけでなく、「なぜ測るか」——測定が意思決定につながるかどうか——を一貫して問います。 North Star Metric、AARRR、HEART、PMFの測定、A/Bテストの落とし穴、そしてグロースループまでを扱います。

North Star Metric — 全社を結束させる単一指標

North Star Metric(北極星指標、NSM)は、"グロースハッキング"の名づけ親Sean Ellisが広めた概念です。 バラバラなKPIを個別に最適化するのではなく、製品が顧客に届ける「must have(なくては困る)価値」の拡大を捉える、 たった1つの指標を持つべきだという主張です。NSMは長期成長の先行指標(leading indicator)であり、 全部門が「自分の仕事との因果線」を引ける指標であるべきとされます。

企業 North Star Metric 選定理由
Airbnb Nights booked(予約宿泊数) ホスト・ゲスト双方が価値を得る瞬間を1つの数字に凝縮
Spotify Time spent listening(聴取時間) 聴取時間が長いほどチャーンしにくく、有料転換も起きやすい
Uber Weekly trips(週間乗車回数) ライダーとドライバー双方(双方向マーケット)の成長を反映
Facebook Daily Active Users(DAU) Ellis本人がNSMの代表例として挙げる

AARRR — 海賊指標

AARRRは、Dave McClure(500 Startups創業者)が2007年に提唱した、顧客ジャーニーの5段階フレームです。 頭字語が海賊の掛け声「アー!」に似ていることから「Pirate Metrics(海賊指標)」と呼ばれます。

graph LR
  A1[Acquisition\n獲得] --> A2[Activation\n活性化]
  A2 --> R1[Retention\n継続]
  R1 --> R2[Referral\n紹介]
  R2 --> R3[Revenue\n収益]
  style A1 fill:#8b5cf6,stroke:#6d28d9,color:#fff
  style A2 fill:#7c5cda,stroke:#6d28d9,color:#fff
  style R1 fill:#3b82f6,stroke:#2563eb,color:#fff
  style R2 fill:#14b8a6,stroke:#0d9488,color:#fff
  style R3 fill:#10b981,stroke:#059669,color:#fff
AARRR(海賊指標)。獲得→活性化→継続→紹介→収益の5段階で、どこがボトルネックかを特定する

各段階の意味は、Acquisition(獲得:どこから来るか)→ Activation(活性化:初回の良い体験=アハ体験)→ Retention(継続:戻ってくるか)→ Referral(紹介:他者に薦めるか)→ Revenue(収益:マネタイズ)。 McClure自身はRetention(継続)こそ最も重要だが見過ごされがちだと強調しています。 各段階をファネルとして可視化し、ボトルネックを特定するのが使い方です。

HEART — UX品質を測るGoogleのフレーム

Googleの定量UXリサーチャーKerry Roddenらが2010年のACM CHIで発表したのがHEARTフレームワークです。 ユーザー体験の品質を5次元で測ります。

次元 意味 例となる指標
Happiness(満足) ユーザーの態度・満足度(主観的) CSAT、NPS、満足度調査
Engagement(関与) どれだけ頻繁に・深く関わるか 視聴時間、週あたり作成ドキュメント数
Adoption(採用) 新規ユーザー数、新機能の受け入れ速度 無料トライアル転換率、Time to Value
Retention(継続) どれだけユーザーを維持できるか 期間別アクティブユーザー率
Task success(タスク成功) タスクをどれだけ効果的に完了できるか タスク完了率、エラー率、完了時間

HEARTはGoals-Signals-Metrics(GSM)プロセスとセットで使います—— ゴールを定義し、成功/失敗を示すユーザー行動(シグナル)を特定し、それを具体的なHEART指標にマッピングする。 重要な注意点として、5次元すべてを同時に使う必要はありません。直近のゴールに合うものに絞ります。

リテンションとPMF — Sean Ellisの40%ルール

グロースの大前提がPMF(Product-Market Fit、製品と市場の適合)です。 PMFが無いまま成長に投資しても、穴の空いたバケツに水を注ぐようなもの。では、PMFはどう測るのか。

リテンション分析の本質は、ヘッドラインの「○%」ではなくカーブの形を読むことにあります。

カーブの形 意味
Declining(減少型) 急落しゼロまで落ち続ける。習慣を形成できていない(試して捨てられる)製品のサイン
Flat / Plateau(平坦化型) 落ちた後プラトーで安定。健全なパターン。価値を見出した中核ユーザー層を表す
Smile Curve(スマイルカーブ) 急落→平坦化→後半で上昇に転じる。改善により休眠ユーザーが戻る理想形

バニティ指標 vs アクショナブル指標 — Eric Ries

「なぜ測るか」を問う本章の核心が、Eric Riesの区別です。

バニティ指標(虚栄の指標) アクショナブル指標
定義 気分は良くなるが意思決定に役立たない 特定の行動と観測結果を結びつけられる
ページビュー、累計登録者数、総ダウンロード数 コホート別のリテンション率、転換率
因果 何が動かしたか分からず、功罪が意見の応酬に 「Xを変えたらYが動いた」と言える

累計登録ユーザー数は、上がり続けるだけで「なぜ」を説明せず、取るべき行動を指し示しません。これがバニティ指標です。 Riesは見分ける基準として「3つのA」を挙げます—— Actionable(行動可能)・Accessible(誰でもアクセス・理解可能)・Auditable(監査可能=データが信頼できる)。 この3つを満たす指標だけが、意思決定の燃料になります。

A/Bテストの落とし穴

アクショナブルな学びを得る代表的手段がA/Bテストです。しかし、ここには統計的な罠がいくつも潜んでいます。

落とし穴 内容
Peeking(覗き見) 事前設定したサンプルサイズ到達前に結果を見て、有意が出た瞬間に止める。偽陽性率が5%→最大30%に膨張する
多重比較 同時に多数のテストを回すと偽陽性が増える。5%有意で20テストなら偶然1件の偽陽性が期待される
実用的有意性の無視 統計的に有意でも、効果量が極小なら意味がない
SRM(Sample Ratio Mismatch) 観測されたトラフィック分割が期待と一致しない。見かけ上有意でもテストを無効化しうる
Novelty Effect(新規性効果) 新UIへの一時的な物珍しさで初期に上振れし、長期では元に戻る

グロースループ vs ファネル

最後に、現代グロースの中心概念グロースループ(Growth Loop)を扱います。 ReforgeのBrian Balfourらが定式化したもので、従来のファネルとは成長の様式が根本的に異なります。

観点 ファネル グロースループ
方向 一方向(上→下) 循環・閉じた系
成長様式 線形(再投資の概念なし) 複利的(compounding)。出力を入力へ再投資
仕組み 入れた分だけ出る 入力→処理→出力→再投資のループ

グロースループは「入力 → 処理 → 出力 → 再投資」の閉じたシステムです。 たとえばDropboxの紹介ループ——ユーザーが友人を招待すると、その友人がまた別の友人を招待する。 出力(新規ユーザー)が次の入力に再投資され、複利的に成長します(Dropboxは15ヶ月で3900%成長、ピーク時単月280万件の紹介を記録)。 Balfourは「ファネルは良い出発点だが、最速で伸びる製品の成長を正確には表さない」と述べています。

指標ツリー — 北極星を運用レバーまで分解する

NSM、AARRR、HEARTは対立しません。実務では併用します。 その統合の鍵が指標ツリー(Metric Tree)です。北極星(output metric)を、それを駆動する input metrics(投入指標)へと分解し、最終的にチームが実際に動かせる運用レバーまで辿ります。

North Star Metric(例: 週間アクティブ利用)
 ├─ 新規ユーザーの活性化率
 │   ├─ オンボーディング完了率  ← チームが動かせるレバー
 │   └─ 初回アハ体験への到達時間
 └─ 既存ユーザーのリテンション
     ├─ 機能採用の深さ          ← チームが動かせるレバー
     └─ 再訪問頻度

フラットなファネル → 「どこが弱いか」しか言えない
指標ツリー        → 「なぜ弱いか」を運用レバーまで辿れる

フラットなファネルは「どの段階が弱いか」を示しますが、「なぜ弱いか」までは示しません。 指標ツリーなら、「リテンションが弱いのは、有料チャネル経由ユーザーの機能採用が浅いから。 根本原因は汎用オンボーディングが広告の意図に合っていないから」というレベルまで因果を辿れます。 これが「なぜ測るか」への最終的な答えです。

まとめ — 測定は行動のためにある

本章では、指標とグロースを「何を、なぜ測るか」の視点で解剖しました。 North Star Metricで全社を結束させ、AARRRでジャーニーのボトルネックを見つけ、 HEARTでUX品質を測り、40%ルールでPMFを判定する。 そしてバニティ指標を避けてアクショナブル指標を追い、A/Bテストの覗き見やSRMを警戒し、 グロースループで複利的成長を設計し、指標ツリーで「なぜ」を運用レバーまで分解する。 測定はそれ自体が目的ではなく、常に行動のためにあります。

ここまでPMの「仕事」を見てきました。しかし、優れたPMが力を発揮できるかどうかは、 実は組織のあり方に大きく依存します。次章では、Empoweredチームやチームトポロジーといった、 プロダクト主導組織の設計を扱います。

理解度チェック

問題 0 / 50%
Q1

Sean Ellisの「North Star Metric」の選び方の要件として、誤っているものはどれですか?

キーボード: 1〜4 で選択、Enter で回答