第1章: LLMとは何か — 定義・全体像・なぜ今注目されるのか | LLM Deep Dive

LLMとは何か — 「次のトークンを予測する」という原理

LLM（Large Language Model、大規模言語モデル）とは、膨大なテキストデータで訓練された巨大なニューラルネットワークモデルです。その動作原理は驚くほどシンプルで、「与えられたテキストの続きとして、次に来る可能性が最も高いトークン（単語や文字の断片）を予測する」ということに尽きます。

たとえば「今日の天気は」という入力を受け取ると、LLMは学習データから「晴れ」「曇り」「雨」などの候補を確率的に算出し、最も自然な続きを生成します。この「次トークン予測」を繰り返すことで、文章全体が生成されるのです。

「次の単語を当てるだけ」と聞くと単純に思えますが、この予測を高い精度で行うためには、文法、論理、常識、さらには暗黙の文脈理解まで必要になります。 LLMが「知的」に見える振る舞いをするのは、大量のテキストから言語のパターンを深く学習した結果なのです。

graph LR
  A[入力テキスト\n今日の天気は] --> B[LLM\n数千億パラメータ]
  B --> C[確率分布\n晴れ: 35%\n曇り: 25%\n雨: 20%\n...]
  C --> D[次トークン生成\n晴れ]
  D --> E[繰り返し\n今日の天気は晴れです]

  style A fill:#3b82f6,stroke:#1d4ed8,color:#fff
  style B fill:#8b5cf6,stroke:#6d28d9,color:#fff
  style C fill:#f97316,stroke:#ea580c,color:#fff
  style D fill:#14b8a6,stroke:#0d9488,color:#fff
  style E fill:#3b82f6,stroke:#1d4ed8,color:#fff

LLMの基本動作: 入力テキストから次トークンの確率分布を計算し、逐次的に文章を生成する

なぜ「大規模」が重要なのか — スケーリングと創発

LLMの「L」は Large、つまり大規模を意味します。ここで言う大規模とは、主にパラメータ数のことです。パラメータとはニューラルネットワーク内の調整可能な数値（重み）であり、モデルが学習した「知識」が格納される場所です。

GPT-2（2019年）は15億パラメータでしたが、GPT-3（2020年）は1750億パラメータと100倍以上に拡大しました。 GPT-4（2023年）の正確なパラメータ数は公表されていませんが、推定で1兆パラメータを超えるとされています。

モデル	公開年	パラメータ数	特徴的な能力
GPT-2	2019年	15億	短い文章の生成が可能
GPT-3	2020年	1,750億	Few-shot学習、翻訳、要約
GPT-4	2023年	推定1兆超	高度な推論、マルチモーダル
Claude 3.5	2024年	非公開	長文理解、コード生成
Gemini Ultra	2024年	非公開	マルチモーダル、多言語対応

注目すべきは、パラメータ数の増加が単なる量的改善ではなく、質的な変化（創発的能力）をもたらすという点です。一定の規模を超えると、明示的に訓練していない能力が突如として出現します。たとえばGPT-3は、数例を提示するだけで新しいタスクを実行する「Few-shot学習」を見せました。これは小規模モデルでは見られなかった能力であり、スケーリングがもたらす創発現象の典型例です。

ChatGPTの衝撃 — 2ヶ月で1億ユーザー

2022年11月30日、OpenAIがChatGPTを公開しました。この瞬間が、LLMを研究者のツールから社会現象へと変えた転換点です。

ChatGPTは公開からわずか5日で100万ユーザー、2ヶ月で1億ユーザーを達成しました。 Instagramが1億ユーザーに達するまでに2.5年、TikTokでも9ヶ月かかったことを考えると、この成長速度がいかに異例であるかがわかります。

ChatGPTの革新性は技術そのものよりも、「誰でも使える対話インターフェース」を提供したことにあります。 GPT-3は2020年にすでに存在していましたが、APIを通じた利用は開発者に限られていました。 ChatGPTは、ブラウザを開いて質問を入力するだけでAIと対話できる体験を実現し、AI技術を一般の人々の手に届けたのです。

この衝撃は連鎖反応を起こしました。GoogleはBard（現Gemini）を急遽発表し、MetaはLLaMAをオープンソースで公開。 Microsoftは100億ドル規模の投資でOpenAIとの提携を深め、Bing検索にAIを統合しました。テック業界全体がLLM開発競争に突入し、「AI軍拡競争」とも呼ばれる状況が生まれたのです。

LLM市場の全体像 — 急拡大する巨大市場

ChatGPTの登場以降、LLM市場は爆発的な成長を遂げています。 2025年のLLM市場規模は77.7億ドル（約1.2兆円）と推定されており、 2035年には1498.9億ドル（約22.5兆円）に達すると予測されています。年平均成長率（CAGR）は約34.8%という驚異的な数字です。

投資の規模も桁違いです。2024年のAI関連投資額は2023億ドルに達し、前年比で約60%増加しました。特にLLMの学習に必要なGPU（グラフィック処理装置）への需要は、NVIDIA社の時価総額を世界トップクラスに押し上げるほどのインパクトをもたらしています。

指標	数値	出典・時点
LLM市場規模（2025年）	77.7億ドル	Precedence Research
LLM市場予測（2035年）	1,498.9億ドル	Precedence Research
年平均成長率（CAGR）	34.8%	2025〜2035年
AI関連投資額（2024年）	2,023億ドル	Stanford AI Index 2025
NVIDIA年間売上（FY2025）	1,305億ドル	前年比114%増

LLMの利用状況 — 企業から個人まで

2025年現在、ChatGPTの週間アクティブユーザーは5億人を突破しています。これは世界人口の約6%に相当し、もはや一部のテック愛好家のツールではなく、グローバルなインフラストラクチャに近い存在です。

企業における導入

McKinseyの調査によると、2024年時点で企業の67%がAI（主にLLM）を何らかの形で導入しています。前年の55%から大幅に増加し、導入ペースは加速しています。活用領域はカスタマーサポート、コード生成、文書作成、データ分析など多岐にわたります。

日本の状況

日本においても、LLMの普及は急速に進んでいます。総務省の「情報通信白書」（令和6年版）によると、日本企業の生成AI導入率は64.4%に達しています。一方、個人利用率は26.7%にとどまっており、米国（56.4%）やドイツ（42.1%）と比較すると慎重な姿勢が見られます。

この「企業導入率は高いが個人利用率は低い」という日本特有のギャップは、組織主導でのAI導入が進む一方、個人レベルでの活用方法の認知やリテラシーの普及に課題があることを示しています。

このシリーズで学ぶこと — 全10章の概要

本シリーズ「LLM Deep Dive」では、LLMの基礎から最先端の応用まで、10章にわたって体系的に解説していきます。

graph TD
  C1[第1章\nLLMとは何か] --> C2[第2章\nTransformerアーキテクチャ]
  C2 --> C3[第3章\nトークナイザと埋め込み]
  C3 --> C4[第4章\n事前学習と\nスケーリング則]
  C4 --> C5[第5章\nファインチューニングと\nRLHF]
  C5 --> C6[第6章\nプロンプト\nエンジニアリング]
  C6 --> C7[第7章\nRAGと\n外部知識統合]
  C7 --> C8[第8章\nAIエージェントと\nツール利用]
  C8 --> C9[第9章\nマルチモーダルLLM]
  C9 --> C10[第10章\nLLMの未来と\n社会的影響]

  style C1 fill:#3b82f6,stroke:#1d4ed8,color:#fff
  style C2 fill:#8b5cf6,stroke:#6d28d9,color:#fff
  style C3 fill:#8b5cf6,stroke:#6d28d9,color:#fff
  style C4 fill:#8b5cf6,stroke:#6d28d9,color:#fff
  style C5 fill:#f97316,stroke:#ea580c,color:#fff
  style C6 fill:#f97316,stroke:#ea580c,color:#fff
  style C7 fill:#f97316,stroke:#ea580c,color:#fff
  style C8 fill:#14b8a6,stroke:#0d9488,color:#fff
  style C9 fill:#14b8a6,stroke:#0d9488,color:#fff
  style C10 fill:#14b8a6,stroke:#0d9488,color:#fff

LLM Deep Dive 全10章のロードマップ: 基礎理論（青）→ 学習・活用手法（橙）→ 応用・未来（緑）

第1章〜第4章（基礎理論）では、LLMの定義からTransformerアーキテクチャ、トークナイザ、事前学習の仕組みまで、 LLMを支える技術的基盤を理解します。

第5章〜第7章（学習・活用手法）では、ファインチューニング、RLHF、プロンプトエンジニアリング、RAGなど、 LLMをタスクに適応させ、実用的に活用するための手法を学びます。

第8章〜第10章（応用・未来）では、AIエージェント、マルチモーダルLLM、そしてLLMがもたらす社会的影響と未来像について掘り下げます。

各章には理解を確認するためのクイズが用意されています。まずはこの第1章のクイズに挑戦してみましょう。

理解度チェック

問題 0 / 50%

LLMの基本的な動作原理として最も適切なものはどれですか？

キーボード: 1〜4 で選択、Enter で回答