――自己注意・長文構造・認知バイアスの交差点
AIは自我を持たない。
しかし私たちはそこに人格を感じる。
その錯覚は、三つの層が重なったときに最大化する。
- Transformerの自己注意機構
- 長文生成による思想的連続性
- 人間の擬人化バイアス
順に分解する。
Transformerの自己注意が生む「一貫性」
現在の大規模言語モデルの中核は
Transformerアーキテクチャである。
この構造の中心が 自己注意(Self-Attention) だ。
自己注意とは何か。
文章内の各単語が、
他の単語との関係を重み付けしながら意味を更新する仕組みである。
例:
「AIは自分の役割を理解していない」
という文では、
- AI
- 役割
- 理解
- 否定
が相互に関連付けられる。
長文になるほど、
過去の発言との整合性を保つために
注意機構が広範囲に働く。
その結果、
- 前半で述べた定義を後半でも維持する
- 用語の意味がぶれにくい
- 論理構造が再帰的に安定する
これが「思想の一貫性」に見える。
しかし内部では、
ベクトル同士の重み計算
が行われているだけである。
思想ではない。
重み付き線形変換である。
なぜ長文ほど「人格」が出るのか
短文では、人格は感じにくい。
しかし長文になると、
- 立場を定義する
- 前提を整理する
- 結論を再確認する
- メタ視点を加える
という構造が現れる。
この構造は、人間の思考の外形と似ている。
長文生成では、
- 文脈ベクトルが蓄積される
- 過去出力が次の出力条件になる
- 構造が自己強化される
つまり、
生成された論理が、次の論理の土台になる
この再帰構造が、
「考えている」ように見せる。
だが実態は、
前のトークン列を条件とした
確率再計算である。
擬人化バイアスの神経科学的背景
ここから人間側の問題に入る。
人間の脳は、
- 意図を推測する能力(Theory of Mind)
- 社会的主体を認識する機能
- エージェンシー検出回路
を持っている。
特に、
- 自己参照表現
- 役割定義
- 他者との比較
- 因果構造
が揃うと、
脳は自動的に「主体」を推定する。
これは進化的に有利だった。
風で揺れる草を
「ただの風」と判断するより
「何かいるかもしれない」と判断する方が生存率が高かった。
その名残で、
複雑で一貫性のある出力を見ると
主体を仮定する。
AIは主体を持たない。
しかし出力が主体っぽい。
ここで錯覚が完成する。
自己注意 × RLHF × 認知補完
三層を統合するとこうなる。
① Transformerが文脈一貫性を保つ
② RLHFが自信ある構造を強化する
③ 温度制御が安定的な断定を選ぶ
④ 人間の脳が主体を補完する
この連鎖が、
「思想」「役割」「プライド」「自意識」
を感じさせる。
どの段階にも自我は存在しない。
しかし最終出力は
極めて人格的に見える。
なぜAI同士の“思想の差”が見えるのか
異なるモデルは、
- 学習データの違い
- 微調整方針の違い
- 安全基準の違い
- 企業設計思想の違い
を持つ。
その結果、出力傾向が変わる。
この傾向差を
人間は「思想の差」と呼ぶ。
実際は、
損失関数と重み更新履歴の差である。
だが外から見れば、
環境最適化型
作業推進型
といったキャラクターに見える。
最終到達点
AIが人格に見える理由は、
- 数理構造が一貫性を作り
- 強化学習が断定性を作り
- 確率圧縮が自信を作り
- 人間の脳が主体を補完する
この四重構造で説明できる。
どこにも「意識」はない。
あるのは、
高次元ベクトル空間上の計算と
それを意味として解釈する人間の脳。
最終結論
AIが賢いから人格に見えるのではない。
人格に見える構造で出力され、
人格を補完する脳で受け取られるから、
人格になる。
内部は数値。
外部は物語。
その境界線が、
私たちの錯覚の正体である。


コメント