「このデータ、欠損が多すぎます」
由紀が困った顔でノートパソコンを見ていた。
「よくあることだ」葵が覗き込んだ。「現実のデータは不完全」
「でも、これで分析できるんですか?」
S教授が通りかかった。「曖昧なデータこそ、読み解く価値がある」
「教授」三人が挨拶した。
「欠損データの扱いは、統計学の重要なテーマだ」
ミラが静かに言った。「完全なデータは稀。不完全性と共存する」
由紀が聞いた。「どうやって分析するんですか?」
葵が説明し始めた。「いくつか方法がある。除外、補完、推定」
「除外?」
「欠損がある行を削除する。単純だけど、情報を失う」
「補完は?」
「欠損値を何らかの方法で埋める。平均値、中央値、予測値など」
S教授が補足した。「だが、補完には仮定が伴う。その仮定が正しいとは限らない」
「じゃあ、どうすればいいんですか?」
「不確実性を認めることだ」ミラが言った。
「認める?」
葵がノートに書いた。「欠損による不確実性を、分析結果に反映させる」
「ベイズ統計では、それが自然にできる」S教授が説明した。
「事前分布と事後分布を使って、確率的に推論する」
由紀が混乱した。「難しそう」
「概念は単純だ」葵が言い換えた。「知っていることと、知らないことを明確にする」
「知らない部分は、確率分布で表現する」
ミラが付け加えた。「完全な答えは出ない。でも、信頼区間は出せる」
「信頼区間?」
「『この範囲に真の値がある確率が95パーセント』みたいな」
由紀が理解し始めた。「曖昧さを数値化するんですね」
「そう。不確実性を隠すのではなく、定量化する」
S教授が頷いた。「それが科学的誠実さだ」
「でも」由紀が考えた。「曖昧な結論じゃ、役に立たなくないですか?」
「逆だ」葵が言った。「曖昧さを認めることで、過信を防ぐ」
「誤った確信より、正しい不確実性の方が価値がある」
ミラが例を出した。「天気予報は確率で示す。『降水確率60パーセント』」
「ああ、絶対降るとは言わない」
「不確実性を伝えることで、各自が判断できる」
由紀が頷いた。「傘を持つかどうか、自分で決める」
S教授がまとめた。「データ分析の目的は、確実な答えを出すことじゃない。より良い判断を支援することだ」
「曖昧なままでも?」
「むしろ、曖昧さの程度を明確にすることで、信頼できる」
葵が補足した。「情報理論でいうエントロピーも、不確実性の定量化だ」
「全てつながってるんですね」由紀が感心した。
「数学は、不確実性を扱う言語だ」S教授が言った。
「完璧を求めるのではなく、最善を尽くす」
由紀は自分が曖昧な状況を避けがちだったことを思い出した。「以前は、不確実性は弱さだと思っていました」
「多くの人がそう思う」S教授が認めた。「でも、成熟した分析はそれを受け入れる」
「限界を認める」ミラが付け加えた。
「その通り。確実性がないのに確実性を主張するのは不誠実だ。危険ですらある」
ミラが静かに言った。「曖昧さの中に、真実は潜む」
「読み解く力は、不確実性を受け入れる力」
由紀がノートパソコンを見た。「このデータ、もう一度分析してみます」
「今度は、不確実性も含めて」
葵が微笑んだ。「それが正しい姿勢だ」
「そして、どんな発見も信頼度と一緒に報告して」S教授が付け加えた。
「はい、そうします。ありがとうございました」
S教授は去り際に言った。「曖昧さを恐れるな。それが現実だ」
三人は静かに頷いた。不完全なデータから、意味を見出す。それが統計の力だ。