ビットと確率の不思議な放課後

確率が情報と不確実性の理解をどのように形作るかについての放課後の議論。

  • #bits
  • #self-information
  • #probability
  • #surprise

「1ビットって、何なんですか?」

由紀は葵の説明を聞きながら、ずっと疑問だったことを尋ねた。

「データの最小単位、というのは知ってるよね?」葵が確認する。

「0か1、ですよね」

「それは表現方法の一つ。でも情報理論では、もっと深い意味がある」葵はノートに簡単な図を描いた。「1ビットは、2つの等しく確からしい選択肢から一つを選ぶ情報量だ」

「等しく確からしい?」

「50パーセントずつの確率、という意味。例えば、公平なコインを投げて『表だった』と伝えるメッセージは、ちょうど1ビットの情報を運ぶ」

その時、静かな足音とともに、ミラが部室に入ってきた。交換留学生の彼女は、いつも観察者のように無言で座る。

「ミラ、今日も来てくれたんだ」由紀が微笑む。

ミラは小さく頷き、ノートを取り出した。

葵が続けた。「では、もし由紀に『今日は火曜日です』と伝えたら、何ビットの情報?」

「えっと…7つの曜日から一つを選ぶから…」

「log₂(7)で、約2.8ビット。でも、もし今日が本当に火曜日だと由紀が既に知っていたら?」

「情報量は…ゼロ?」

「正解。情報量は、受信者の不確実性に依存する。これが主観的情報量という概念だ」

ミラがノートに何かを書いて、由紀に見せた。「Surprise = -log₂(p)」

「あ、ミラが式を…」由紀が驚く。

葵が説明を引き継ぐ。「その通り。イベントの確率pが低いほど、起こったときの驚き、つまり情報量は大きくなる」

「だから珍しいニュースほど、情報価値が高い…」由紀が理解する。

「そう。『太陽が東から昇った』というニュースは、確率がほぼ1だから、情報量はほぼゼロ。でも『巨大隕石が接近』なら、確率が低いから情報量は大きい」

ミラが再び書く。「Common events: low information. Rare events: high information.」

「でも」由紀が考え込んだ。「それだと、嘘をついた方が情報量が多くなりませんか?」

葵が感心した表情を見せた。「鋭い指摘だ。だから情報理論では、『真の確率分布』を仮定する。嘘は、受信者の確率モデルを狂わせる攻撃みたいなものだ」

「通信路攻撃」ミラが小さく呟いた。

「ミラは通信理論に詳しいね」葵が言った。

ミラは頷いたが、説明は続けなかった。いつものことだ。

由紀がノートに計算を書き込む。「じゃあ、サイコロを振って『6が出た』と伝えるのは、-log₂(1/6)で…約2.58ビット」

「完璧。それが自己情報量。一方、エントロピーは、その期待値なんだ」

「期待値?」

「全ての起こりうるイベントについて、確率で重み付けした平均情報量。だから、サイコロの全体的な不確実性は約2.58ビットになる」

ミラが静かに立ち上がり、ホワイトボードに書いた。

「H(X) = E[I(X)] = Σ p(x)・(-log₂ p(x))」

「エントロピーは、個々の自己情報量の期待値」葵が補足する。「ミラ、良いまとめだ」

ミラは微かに微笑んだ。

由紀が興奮気味に言った。「つまり、ビットって単なるデータの単位じゃなくて、驚きや不確実性を測る単位なんですね」

「そう。情報理論の美しさは、主観的な『驚き』を客観的な数値に変換できること」

「先輩たちと話すと、いつも新しい驚きがあります」

葵が笑った。「その驚きも、情報量で測れるかもね」

ミラがノートを閉じ、静かに席を立った。去り際、由紀に小さなメモを渡す。

「Next: conditional probability」

「条件付き確率…?」由紀が呟く。

「ミラは、いつも次のステップを示してくれる」葵が言った。「彼女の情報量は、いつも高いんだ」

由紀はメモを大切にしまった。今日もまた、新しい1ビットを得た気がした。