はじめての確率分布

AI体験・観察記録

――AIはなぜ「それっぽい答え」を出せるのか

そもそも「確率」とは何か

確率とは、

ある出来事が起きる“起こりやすさ”

を数値で表したものです。

例えばコイン投げ。

  • 表が出る確率:0.5
  • 裏が出る確率:0.5

これは単なる比率です。

重要なのはここから。

確率は「当てるための魔法」ではありません。

不確実な状況で、もっとも妥当な選択をするための指標です。


確率分布とは何か

確率分布とは、

どの結果が、どれくらいの確率で起きるかを一覧にしたもの

です。

例:

明日の天気

  • 晴れ:60%
  • 曇り:30%
  • 雨:10%

これが確率分布。

ポイントは、

一つだけが正しいのではなく、全部に確率が割り振られている

ということです。


AIも同じことをしている

AIが文章を作るときも同じです。

例えば、

「今日はとても___」

この空白に入る言葉を考えるとき、
AIは一つだけを思いつくわけではありません。

内部ではこんな分布が作られています。

  • 暑い:0.42
  • 寒い:0.21
  • 楽しい:0.10
  • 良い:0.08
  • …その他多数

そして、その中から一つを選びます。

これが、

次の単語の確率分布

です。


「理解している」のではなく「確率が高い」

ここが誤解されやすい部分です。

AIは、

意味を理解して単語を選んでいるのではありません。

過去の大量データから学習した結果、

この文脈では「暑い」が最も自然

と確率的に判断しているだけです。

つまり、

AIの文章生成は

入力

文脈を数値化

次の単語の確率分布を計算

最も妥当な単語を選択

という流れで動いています。

意図ではなく、分布。


なぜ自然に見えるのか

人間の言語も実は統計的です。

私たちは無意識に、

  • 「おはよう」の後は「ございます」
  • 「よろしく」の後は「お願いします」

と予測しています。

言語はパターンの塊です。

AIはそのパターンを
極限まで統計化した存在です。

だから自然に見える。


温度という概念

AIには「温度(temperature)」という設定があります。

これは、

確率分布の“尖り具合”を調整する値

です。

  • 低温 → 確率の高い単語をほぼ確実に選ぶ(安定)
  • 高温 → 低確率の単語も選びやすくなる(創造的)

温度が低いと論理的。
温度が高いと発想的。

でもどちらも、

確率分布の操作に過ぎません。


ここが重要:確率は「正解」ではない

確率分布は、

「最もそれらしい答え」

を出します。

しかし、

それは真実とは限らない。

だからAIは、

それっぽい嘘(ハルシネーション)も生成します。

間違いをつくるのではなく、

もっとも自然な文章を選んだ結果、事実とズレる

のです。


まとめ

確率分布とは、

可能性を数値で並べたもの。

AIは、

意味を理解しているのではなく、

その分布の中から
最も自然な選択をしているだけ。

だから、

AIが自信満々に語っても、
そこに信念はない。

あるのは、

確率最大化。


次の記事へ

ではなぜ、

確率だけで
「人格」や「思想」があるように見えるのか?

それを解剖したのがこちらの記事です。

→ 「AIにプライドはあるのか」

コメント

タイトルとURLをコピーしました