第6章: プロダクト指標とグロース — 何を測り、なぜ測るか | プロダクトマネジメント Deep Dive

第5章で「アクティベーションを15%改善する」というアウトカムを掲げました。では、それをどう測るのでしょうか。本章のテーマは指標（メトリクス）です。ただし「何を測るか」だけでなく、「なぜ測るか」——測定が意思決定につながるかどうか——を一貫して問います。 North Star Metric、AARRR、HEART、PMFの測定、A/Bテストの落とし穴、そしてグロースループまでを扱います。

North Star Metric — 全社を結束させる単一指標

North Star Metric（北極星指標、NSM）は、"グロースハッキング"の名づけ親Sean Ellisが広めた概念です。バラバラなKPIを個別に最適化するのではなく、製品が顧客に届ける「must have（なくては困る）価値」の拡大を捉える、たった1つの指標を持つべきだという主張です。NSMは長期成長の先行指標（leading indicator）であり、全部門が「自分の仕事との因果線」を引ける指標であるべきとされます。

企業	North Star Metric	選定理由
Airbnb	Nights booked（予約宿泊数）	ホスト・ゲスト双方が価値を得る瞬間を1つの数字に凝縮
Spotify	Time spent listening（聴取時間）	聴取時間が長いほどチャーンしにくく、有料転換も起きやすい
Uber	Weekly trips（週間乗車回数）	ライダーとドライバー双方（双方向マーケット）の成長を反映
Facebook	Daily Active Users（DAU）	Ellis本人がNSMの代表例として挙げる

AARRR — 海賊指標

AARRRは、Dave McClure（500 Startups創業者）が2007年に提唱した、顧客ジャーニーの5段階フレームです。頭字語が海賊の掛け声「アー！」に似ていることから「Pirate Metrics（海賊指標）」と呼ばれます。

graph LR
  A1[Acquisition\n獲得] --> A2[Activation\n活性化]
  A2 --> R1[Retention\n継続]
  R1 --> R2[Referral\n紹介]
  R2 --> R3[Revenue\n収益]
  style A1 fill:#8b5cf6,stroke:#6d28d9,color:#fff
  style A2 fill:#7c5cda,stroke:#6d28d9,color:#fff
  style R1 fill:#3b82f6,stroke:#2563eb,color:#fff
  style R2 fill:#14b8a6,stroke:#0d9488,color:#fff
  style R3 fill:#10b981,stroke:#059669,color:#fff

AARRR（海賊指標）。獲得→活性化→継続→紹介→収益の5段階で、どこがボトルネックかを特定する

各段階の意味は、Acquisition（獲得：どこから来るか）→ Activation（活性化：初回の良い体験＝アハ体験）→ Retention（継続：戻ってくるか）→ Referral（紹介：他者に薦めるか）→ Revenue（収益：マネタイズ）。 McClure自身はRetention（継続）こそ最も重要だが見過ごされがちだと強調しています。各段階をファネルとして可視化し、ボトルネックを特定するのが使い方です。

HEART — UX品質を測るGoogleのフレーム

Googleの定量UXリサーチャーKerry Roddenらが2010年のACM CHIで発表したのがHEARTフレームワークです。ユーザー体験の品質を5次元で測ります。

次元	意味	例となる指標
Happiness（満足）	ユーザーの態度・満足度（主観的）	CSAT、NPS、満足度調査
Engagement（関与）	どれだけ頻繁に・深く関わるか	視聴時間、週あたり作成ドキュメント数
Adoption（採用）	新規ユーザー数、新機能の受け入れ速度	無料トライアル転換率、Time to Value
Retention（継続）	どれだけユーザーを維持できるか	期間別アクティブユーザー率
Task success（タスク成功）	タスクをどれだけ効果的に完了できるか	タスク完了率、エラー率、完了時間

HEARTはGoals-Signals-Metrics（GSM）プロセスとセットで使います—— ゴールを定義し、成功/失敗を示すユーザー行動（シグナル）を特定し、それを具体的なHEART指標にマッピングする。重要な注意点として、5次元すべてを同時に使う必要はありません。直近のゴールに合うものに絞ります。

リテンションとPMF — Sean Ellisの40%ルール

グロースの大前提がPMF（Product-Market Fit、製品と市場の適合）です。 PMFが無いまま成長に投資しても、穴の空いたバケツに水を注ぐようなもの。では、PMFはどう測るのか。

リテンション分析の本質は、ヘッドラインの「○%」ではなくカーブの形を読むことにあります。

カーブの形	意味
Declining（減少型）	急落しゼロまで落ち続ける。習慣を形成できていない（試して捨てられる）製品のサイン
Flat / Plateau（平坦化型）	落ちた後プラトーで安定。健全なパターン。価値を見出した中核ユーザー層を表す
Smile Curve（スマイルカーブ）	急落→平坦化→後半で上昇に転じる。改善により休眠ユーザーが戻る理想形

バニティ指標 vs アクショナブル指標 — Eric Ries

「なぜ測るか」を問う本章の核心が、Eric Riesの区別です。

	バニティ指標（虚栄の指標）	アクショナブル指標
定義	気分は良くなるが意思決定に役立たない	特定の行動と観測結果を結びつけられる
例	ページビュー、累計登録者数、総ダウンロード数	コホート別のリテンション率、転換率
因果	何が動かしたか分からず、功罪が意見の応酬に	「Xを変えたらYが動いた」と言える

累計登録ユーザー数は、上がり続けるだけで「なぜ」を説明せず、取るべき行動を指し示しません。これがバニティ指標です。 Riesは見分ける基準として「3つのA」を挙げます—— Actionable（行動可能）・Accessible（誰でもアクセス・理解可能）・Auditable（監査可能=データが信頼できる）。この3つを満たす指標だけが、意思決定の燃料になります。

A/Bテストの落とし穴

アクショナブルな学びを得る代表的手段がA/Bテストです。しかし、ここには統計的な罠がいくつも潜んでいます。

落とし穴	内容
Peeking（覗き見）	事前設定したサンプルサイズ到達前に結果を見て、有意が出た瞬間に止める。偽陽性率が5%→最大30%に膨張する
多重比較	同時に多数のテストを回すと偽陽性が増える。5%有意で20テストなら偶然1件の偽陽性が期待される
実用的有意性の無視	統計的に有意でも、効果量が極小なら意味がない
SRM（Sample Ratio Mismatch）	観測されたトラフィック分割が期待と一致しない。見かけ上有意でもテストを無効化しうる
Novelty Effect（新規性効果）	新UIへの一時的な物珍しさで初期に上振れし、長期では元に戻る

グロースループ vs ファネル

最後に、現代グロースの中心概念グロースループ（Growth Loop）を扱います。 ReforgeのBrian Balfourらが定式化したもので、従来のファネルとは成長の様式が根本的に異なります。

観点	ファネル	グロースループ
方向	一方向（上→下）	循環・閉じた系
成長様式	線形（再投資の概念なし）	複利的（compounding）。出力を入力へ再投資
仕組み	入れた分だけ出る	入力→処理→出力→再投資のループ

グロースループは「入力 → 処理 → 出力 → 再投資」の閉じたシステムです。たとえばDropboxの紹介ループ——ユーザーが友人を招待すると、その友人がまた別の友人を招待する。出力（新規ユーザー）が次の入力に再投資され、複利的に成長します（Dropboxは15ヶ月で3900%成長、ピーク時単月280万件の紹介を記録）。 Balfourは「ファネルは良い出発点だが、最速で伸びる製品の成長を正確には表さない」と述べています。

指標ツリー — 北極星を運用レバーまで分解する

NSM、AARRR、HEARTは対立しません。実務では併用します。その統合の鍵が指標ツリー（Metric Tree）です。北極星（output metric）を、それを駆動する input metrics（投入指標）へと分解し、最終的にチームが実際に動かせる運用レバーまで辿ります。

North Star Metric（例: 週間アクティブ利用）
 ├─ 新規ユーザーの活性化率
 │   ├─ オンボーディング完了率  ← チームが動かせるレバー
 │   └─ 初回アハ体験への到達時間
 └─ 既存ユーザーのリテンション
     ├─ 機能採用の深さ          ← チームが動かせるレバー
     └─ 再訪問頻度

フラットなファネル → 「どこが弱いか」しか言えない
指標ツリー        → 「なぜ弱いか」を運用レバーまで辿れる

フラットなファネルは「どの段階が弱いか」を示しますが、「なぜ弱いか」までは示しません。指標ツリーなら、「リテンションが弱いのは、有料チャネル経由ユーザーの機能採用が浅いから。根本原因は汎用オンボーディングが広告の意図に合っていないから」というレベルまで因果を辿れます。これが「なぜ測るか」への最終的な答えです。

まとめ — 測定は行動のためにある

本章では、指標とグロースを「何を、なぜ測るか」の視点で解剖しました。 North Star Metricで全社を結束させ、AARRRでジャーニーのボトルネックを見つけ、 HEARTでUX品質を測り、40%ルールでPMFを判定する。そしてバニティ指標を避けてアクショナブル指標を追い、A/Bテストの覗き見やSRMを警戒し、 グロースループで複利的成長を設計し、指標ツリーで「なぜ」を運用レバーまで分解する。測定はそれ自体が目的ではなく、常に行動のためにあります。

ここまでPMの「仕事」を見てきました。しかし、優れたPMが力を発揮できるかどうかは、実は組織のあり方に大きく依存します。次章では、Empoweredチームやチームトポロジーといった、プロダクト主導組織の設計を扱います。

理解度チェック

問題 0 / 50%

Sean Ellisの「North Star Metric」の選び方の要件として、誤っているものはどれですか？

キーボード: 1〜4 で選択、Enter で回答