← Deep Dive Technology

Langfuse Deep Dive

YC W23発、2026年1月にClickHouseへ$15B評価で合流したOSS LLMエンジニアリングプラットフォーム「Langfuse」を10章で徹底解剖。Trace/Observation/Scoreのデータモデル、Postgres+ClickHouse+Redis+S3のv3アーキテクチャ、OpenTelemetryネイティブSDK、Prompt Management、LLM-as-a-Judge評価、Merck・LayerX・ZOZOの採用事例まで、2026年時点の最新実装知見を網羅

#Langfuse#LLMOps#Observability#OpenTelemetry#LLM#AI#Prompt Management#Evaluation

目次

  1. 第1章
    第1章: Langfuseとは何か — LLM時代の観測・評価の新しい基準 LLMアプリ特有の3つの課題(ブラックボックス・非決定性・評価困難)、既存APMで足りない理由、Langfuseの4つの柱(Observability / Prompts / Evaluation / Datasets)、なぜ2026年の事実上の標準となったか
  2. 第2章
    第2章: 歴史と進化 — YC W23 から ClickHouse 買収 まで Finto創業(2022) → YC W23 → LLMへのピボット → OSSローンチ(2023/6) → $4Mシード → v2/v3 → 全機能OSS化(2025/6) → OTel刷新 → ClickHouse買収($15B評価, 2026/1)まで50ヶ月の軌跡
  3. 第3章
    第3章: 競合地図と選定フレーム — LangSmith・Phoenix・Helicone との違い LLMオブザーバビリティ市場5カテゴリ、LangSmith/Arize Phoenix/Helicone/Braintrust/Datadogとの詳細比較、選定フローチャート、Langfuseが不向きな状況
  4. 第4章
    第4章: データモデル徹底解剖 — Trace・Observation・Score・Prompt Trace/Session/Userの階層、Observation 3種(Span/Generation/Event)、Score 4種とEvaluator、Prompt versioningとLabels、Dataset/DatasetRun/Experiment、詰まりやすいTop 5
  5. 第5章
    第5章: v3アーキテクチャ — Postgres + ClickHouse + Redis + S3 への進化 v2のPostgres単一ボトルネック、3段ingestionパイプライン、Web/Workerの役割分担、OLTP/OLAP分離設計、S3生イベント永続化、スケーリングチューニング、2026/3のSimplify for Scale
  6. 第6章
    第6章: OpenTelemetry ネイティブ — SDKと自動計装の全貌 OTel採用戦略(10言語SDKを作らない)、Python SDK v3/v4(Observations-first)、TS SDK v4、@observeデコレーター、OpenInference/OpenLLMetry、LangChain/LlamaIndex/Vercel AI SDK統合、PIIマスキング
  7. 第7章
    第7章: Prompt Management 実践 — バージョニング・A/B・CI/CD Prompt Object、Labels(production/staging/latest)とProtected Label、取得・コンパイル・Linked Generation、GitHub Webhook → repository_dispatch、Playgroundとの往復、MCP Server連携
  8. 第8章
    第8章: Evaluation と Experiment — LLM-as-a-Judge から Dataset Runs まで Scoreの種類とsource、Managed Evaluatorテンプレート、Custom Evaluator、Ragas/UpTrain/DeepEval連携、Dataset/DatasetRun、Experiment Runner SDK + pytest、Promptfoo + GitHub Actions
  9. 第9章
    第9章: Self-hosted 本番運用 — Docker Compose から Kubernetes まで デプロイオプション(Docker Compose/Helm/Terraform/Railway)、Headless Initialization、水平スケール、UTC必須、ClickHouse 24.3+、シークレット・HTTPS・監視・バックアップ、v2→v3マイグレーション
  10. 第10章
    第10章: 事例と未来 — Merck・LayerX・ZOZO、ClickHouse 合流後の展望 Merck myGPT Suite(27,000ユーザー) / Khan Academy Khanmigo / Canva / Samsara / LayerX バクラク / ZOZO VLM / セブン-イレブン・ジャパン、Fortune 500の63社採用、ClickHouse合流後の展望、学習ロードマップ