符号化された気持ちを解凍して

データ圧縮と解凍の仕組みを通じて、感情を伝えることの難しさと可能性を探る。

  • #compression
  • #decompression
  • #lossless
  • #lossy
  • #encoding

「この文章、短くできますか?」

由紀がレポートを見せた。文字数制限をオーバーしていた。

「圧縮が必要だね」葵が言った。

「圧縮?」

「データ圧縮。情報を失わずに、サイズを小さくする技術」

ミラが近づいてきて、ノートに書いた。「可逆圧縮と非可逆圧縮」

「二種類あるんですね」

葵が説明した。「可逆圧縮は、完全に元に戻せる。ZIP形式とか」

「非可逆圧縮は、多少情報を失うけど、大幅に小さくできる。JPEGとか」

由紀が考えた。「レポートは、どっちがいいんですか?」

「内容を保つなら可逆。でも、君の場合は非可逆も選択肢だ」

「非可逆?」

「重要じゃない装飾語を削る。冗長な説明を簡潔にする」

ミラが例を示した。由紀の文章を指さして、赤線を引く。

「この副詞、なくても意味は通る」葵が解説した。

「確かに...」

「圧縮の基本は、冗長性の除去だ」

由紀が質問した。「冗長性って、無駄ってこと?」

「必ずしもそうじゃない。エラー訂正のために必要な冗長性もある」

「でも、文字数制限があるなら、削るしかない」

葵が続けた。「圧縮は、データの統計的性質を利用する」

「統計的性質?」

「頻繁に出る言葉は短く、稀な言葉は長く符号化する。ハフマン符号化とか」

ミラがノートに木構造を描いた。二分木が広がっている。

「よく使う文字ほど、根に近い。だから符号が短い」

由紀が理解した。「効率的ですね」

「でも」葵が警告した。「圧縮しすぎると、意味が伝わらなくなる」

「非可逆圧縮の限界?」

「そう。JPEGも、圧縮率を上げすぎるとブロックノイズが出る」

由紀がレポートを見返した。「どこまで削っていいか、悩みますね」

「それは、情報量とのトレードオフだ」

ミラが新しいノートを取り出した。「感情の圧縮」と書いてある。

「感情の圧縮?」由紀が不思議そうに聞いた。

「人間も、感情を圧縮して伝える」葵が説明した。

「長い思いを、短い言葉に込める。『好き』という二文字に、どれだけの情報が圧縮されているか」

「確かに...」

「でも、受け取る側が正しく解凍できるとは限らない」

由紀が考えた。「解凍って、デコード?」

「そう。圧縮されたデータを元に戻す。でも、非可逆圧縮だから、完全には戻らない」

「誤解が生まれるんですね」

「言葉は常に非可逆圧縮だ。思考の全てを伝えることはできない」

ミラが頷いた。そして書いた。「だから補完が必要」

「補完?」

「受け手が、文脈から欠落した情報を補う。これも解凍の一部」

葵が補足した。「機械学習の超解像みたいなもの。低解像度の画像から、高解像度を推定する」

「想像力で補うんですね」

「そう。だから、同じ言葉でも、人によって受け取り方が違う」

由紀がレポートを見た。「じゃあ、私も圧縮しよう。読む人が解凍してくれると信じて」

「良い割り切りだ」

ミラがもう一度書いた。「完璧な圧縮は存在しない」

「シャノンのソースコーディング定理」葵が言った。「エントロピー以下には圧縮できない」

「限界があるんですね」

「でも、その限界に近づく努力はできる」

由紀が書き始めた。削って、削って、本質だけを残す。

「これで、どうですか?」

葵が読んだ。「良い圧縮だ。意味は保たれている」

ミラが微笑んで、親指を立てた。

「符号化された気持ちを、いつか誰かが解凍してくれる」

由紀がそう呟いた。

葵が答えた。「それが、コミュニケーションの希望だね」

圧縮と解凍。人は毎日、その繰り返しで生きている。