確率でわかる世界のカタチ

確率が情報と不確実性の理解をどのように形作るかについての放課後の議論。

  • #probability distribution
  • #expectation
  • #law of large numbers
  • #information perspective

「確率って、予測のためのものだと思ってました」

由紀は屋上で、葵と話していた。

「それも正しい。でも、情報理論では違う見方がある」

その時、珍しく教授Sが姿を現した。普段は滅多に現れない人物だ。

「議論中かな?」教授が穏やかに聞く。

「確率と情報の関係について」葵が答えた。

「良いテーマだ」教授は手すりに寄りかかった。「確率分布は、世界の形を表す」

「世界の形?」由紀が不思議そうに聞く。

「例えば、サイコロ。均等な分布は、完全な対称性を表す。偏った分布は、何らかの原因がある」

葵が補足する。「分布の形に、情報が宿る」

教授が頷いた。「エントロピーは、その形の複雑さを測る尺度だ」

「複雑さ…」由紀が呟く。

「均一な分布は最も複雑。予測不可能だから。偏った分布は単純。パターンがあるから」

「でも、複雑なのに単純?」

教授が微笑んだ。「逆説的だね。情報理論の面白さはそこにある」

葵がノートに図を描いた。「二つのサイコロ。一つは均等、もう一つは6の目だけが高確率」

「どちらが複雑?」

「均等な方」由紀が答えた。

「そう。でも、どちらが理解しやすい?」

「偏った方。理由が想像できます。細工されてるとか」

「まさに」教授が言った。「パターンは理解可能性を生む。エントロピーが低いほど、圧縮可能で、説明しやすい」

葵が続ける。「確率分布は、モデルでもある。世界をどう見るか、の表現だ」

「モデル?」

「例えば、明日の天気。晴れ70パーセント、雨30パーセント。これは予測であり、モデルだ」

教授が別の例を出した。「言語もそう。英語では『e』が最も頻繁に出る。これは英語という言語の形だ」

「形…」由紀が考え込む。

「確率分布が違えば、言語が違う。日本語は『の』や『は』が多い」

葵が図を追加した。「情報理論では、全てを確率分布で捉える。メッセージ、信号、データ」

「そして、二つの分布の違いを測るのが、KLダイバージェンス」教授が言った。

「前に習いました」由紀が思い出す。

「分布を比べることで、理解が深まる。『実際』と『予測』の差。『A言語』と『B言語』の差」

葵が真剣な表情になった。「確率は、不確実性を扱う唯一の方法かもしれない」

「唯一?」由紀が聞く。

「世界は複雑で、完全には予測できない。でも、確率を使えば、不確実性を定量化できる」

教授が空を見上げた。「大数の法則。試行を重ねれば、確率は現実になる」

「コインを1000回投げれば、ほぼ500回表が出る」

「そう。確率は、長期的な安定性を保証する」

葵が由紀に言った。「情報理論は、確率を通して世界を見る学問だ」

「データは確率分布から生まれる。通信は確率過程だ。学習は分布の推定だ」

教授が静かに付け加えた。「そして、エントロピーは全ての中心にある」

由紀が窓の外を見た。街が広がっている。

「あの街も、確率分布で表せるんですか?」

「表せる」葵が答えた。「人の流れ、交通パターン、店の配置。全て確率的に分析できる」

「世界は、確率の集まり」

教授が微笑んだ。「でも、個々の出来事は決定的に起きる。確率はその全体像を捉える道具だ」

「決定論と確率論…」由紀が呟く。

「両立する。ミクロでは決定的、マクロでは確率的」

葵がまとめた。「確率は、複雑さを扱うための言語。情報は、確率で測られる」

教授が立ち上がった。「良い議論だった。続けて学びなさい」

「ありがとうございました」由紀が頭を下げる。

教授が去った後、葵が言った。「教授は滅多に現れないけど、現れると核心を突く」

「確率で世界を見る。新しい視点です」

「情報理論を学ぶと、世界の見え方が変わる」

由紀は空を見上げた。雲が流れていく。その動きも、確率過程だ。風速、湿度、気圧。全てが確率的に相互作用する。

「世界は、情報で満ちている」

葵が頷いた。「そして、確率がその鍵を握っている」

屋上の風が、二人の髪を揺らした。情報理論の旅は、まだ始まったばかりだ。