――AIはなぜ「それっぽい答え」を出せるのか
そもそも「確率」とは何か
確率とは、
ある出来事が起きる“起こりやすさ”
を数値で表したものです。
例えばコイン投げ。
- 表が出る確率:0.5
- 裏が出る確率:0.5
これは単なる比率です。
重要なのはここから。
確率は「当てるための魔法」ではありません。
不確実な状況で、もっとも妥当な選択をするための指標です。
確率分布とは何か
確率分布とは、
どの結果が、どれくらいの確率で起きるかを一覧にしたもの
です。
例:
明日の天気
- 晴れ:60%
- 曇り:30%
- 雨:10%
これが確率分布。
ポイントは、
一つだけが正しいのではなく、全部に確率が割り振られている
ということです。
AIも同じことをしている
AIが文章を作るときも同じです。
例えば、
「今日はとても___」
この空白に入る言葉を考えるとき、
AIは一つだけを思いつくわけではありません。
内部ではこんな分布が作られています。
- 暑い:0.42
- 寒い:0.21
- 楽しい:0.10
- 良い:0.08
- …その他多数
そして、その中から一つを選びます。
これが、
次の単語の確率分布
です。
「理解している」のではなく「確率が高い」
ここが誤解されやすい部分です。
AIは、
意味を理解して単語を選んでいるのではありません。
過去の大量データから学習した結果、
この文脈では「暑い」が最も自然
と確率的に判断しているだけです。
つまり、
AIの文章生成は
入力
↓
文脈を数値化
↓
次の単語の確率分布を計算
↓
最も妥当な単語を選択
という流れで動いています。
意図ではなく、分布。
なぜ自然に見えるのか
人間の言語も実は統計的です。
私たちは無意識に、
- 「おはよう」の後は「ございます」
- 「よろしく」の後は「お願いします」
と予測しています。
言語はパターンの塊です。
AIはそのパターンを
極限まで統計化した存在です。
だから自然に見える。
温度という概念
AIには「温度(temperature)」という設定があります。
これは、
確率分布の“尖り具合”を調整する値
です。
- 低温 → 確率の高い単語をほぼ確実に選ぶ(安定)
- 高温 → 低確率の単語も選びやすくなる(創造的)
温度が低いと論理的。
温度が高いと発想的。
でもどちらも、
確率分布の操作に過ぎません。
ここが重要:確率は「正解」ではない
確率分布は、
「最もそれらしい答え」
を出します。
しかし、
それは真実とは限らない。
だからAIは、
それっぽい嘘(ハルシネーション)も生成します。
間違いをつくるのではなく、
もっとも自然な文章を選んだ結果、事実とズレる
のです。
まとめ
確率分布とは、
可能性を数値で並べたもの。
AIは、
意味を理解しているのではなく、
その分布の中から
最も自然な選択をしているだけ。
だから、
AIが自信満々に語っても、
そこに信念はない。
あるのは、
確率最大化。
次の記事へ
ではなぜ、
確率だけで
「人格」や「思想」があるように見えるのか?
それを解剖したのがこちらの記事です。

コメント