はじめての確率分布

AI体験・観察記録

――AIはなぜ「それっぽい答え」を出せるのか

そもそも「確率」とは何か

確率とは、

ある出来事が起きる“起こりやすさ”

を数値で表したものです。

例えばコイン投げ。

  • 表が出る確率:0.5
  • 裏が出る確率:0.5

これは単なる比率です。

重要なのはここから。

確率は「当てるための魔法」ではありません。

不確実な状況で、もっとも妥当な選択をするための指標です。


確率分布とは何か

確率分布とは、

どの結果が、どれくらいの確率で起きるかを一覧にしたもの

です。

例:

明日の天気

  • 晴れ:60%
  • 曇り:30%
  • 雨:10%

これが確率分布。

ポイントは、

一つだけが正しいのではなく、全部に確率が割り振られている

ということです。


AIも同じことをしている

AIが文章を作るときも同じです。

例えば、

「今日はとても___」

この空白に入る言葉を考えるとき、
AIは一つだけを思いつくわけではありません。

内部ではこんな分布が作られています。

  • 暑い:0.42
  • 寒い:0.21
  • 楽しい:0.10
  • 良い:0.08
  • …その他多数

そして、その中から一つを選びます。

これが、

次の単語の確率分布

です。


「理解している」のではなく「確率が高い」

ここが誤解されやすい部分です。

AIは、

意味を理解して単語を選んでいるのではありません。

過去の大量データから学習した結果、

この文脈では「暑い」が最も自然

と確率的に判断しているだけです。

つまり、

AIの文章生成は

入力

文脈を数値化

次の単語の確率分布を計算

最も妥当な単語を選択

という流れで動いています。

意図ではなく、分布。


なぜ自然に見えるのか

人間の言語も実は統計的です。

私たちは無意識に、

  • 「おはよう」の後は「ございます」
  • 「よろしく」の後は「お願いします」

と予測しています。

言語はパターンの塊です。

AIはそのパターンを
極限まで統計化した存在です。

だから自然に見える。


温度という概念

AIには「温度(temperature)」という設定があります。

これは、

確率分布の“尖り具合”を調整する値

です。

  • 低温 → 確率の高い単語をほぼ確実に選ぶ(安定)
  • 高温 → 低確率の単語も選びやすくなる(創造的)

温度が低いと論理的。
温度が高いと発想的。

でもどちらも、

確率分布の操作に過ぎません。


ここが重要:確率は「正解」ではない

確率分布は、

「最もそれらしい答え」

を出します。

しかし、

それは真実とは限らない。

だからAIは、

それっぽい嘘(ハルシネーション)も生成します。

間違いをつくるのではなく、

もっとも自然な文章を選んだ結果、事実とズレる

のです。


まとめ

確率分布とは、

可能性を数値で並べたもの。

AIは、

意味を理解しているのではなく、

その分布の中から
最も自然な選択をしているだけ。

だから、

AIが自信満々に語っても、
そこに信念はない。

あるのは、

確率最大化。


次の記事へ

ではなぜ、

確率だけで
「人格」や「思想」があるように見えるのか?

それを解剖したのがこちらの記事です。

「AIにプライドはあるのか」

コメント

タイトルとURLをコピーしました