2019-05-01

統計思考の世界

三中信宏「統計思考の世界」を読んだ。

統計的手法というのは、人間がすべてを理由付けによって把握するにはあまりに大量なデータを、何とか理由を保持しながら扱うためのものだと思う。
An At a NOA 2017-05-05 “統計
大量のバラバラなデータのうち、それとなく揃っている部分を一つの塊とみなすことで、データサイズが小さくなり、データ処理にかかるコストは減少する。これはデータ圧縮の過程である。適切な圧縮ができれば処理能力の向上につながる一方で、不適切な圧縮をしてしまえば処理自体が破綻する。処理の破綻を可能な限り免れ続けるには、データの変化に合わせて圧縮方法の適切性を常に検証し、必要に応じて別の圧縮方法を試し続ける他ない。

この一連の試行錯誤はつまり「何をsignとするか」についての試行錯誤である。人間というのは、何かを見たり聞いたりする知覚のレベルでの「自然な」signだけでなく、言語、宗教、科学など、様々なかたちで結実している「不自然な=人工の」signによる圧縮を、半ば投機的に試みることで、他の存在に対する相対的な処理能力を向上させてきたのだと思われる。その様を伊藤計劃は「人間は無意味に耐えられない」と表現した。

不用意に行われればバグのようなものになるであろう投機的な圧縮に、「理由」を付けることで暫定的な適切性の検証とし、その成功率を上げるというのが、思考や意識と呼ばれるものの特徴なのだと思う。統計学は、「これをsignにすることができる」という意味でのsignificanceに理由を与える試みである点で、まさに意識的な分野である。

そのまま把握するにはあまりに膨大なデータである世界というものを「理解=理由付けて圧縮」するにあたり、数式もグラフも駆使しながら、どのようにして圧縮や理由付けできるのか、あるいはすべきかについて試行錯誤するプロセスである統計思考。その面白さの伝わってくる本であった。

No comments:

Post a Comment