長らくちゃんと読めていなかったシャノンの
「通信の数学的理論」を読んだ。
正直、数学的な取り扱いの部分はふわっとしか理解できていないので、
理解できた範囲はこの論文から得られる膨大な知見の1割にも
達していないだろう。
1つだけ、シャノンが忠実度の評価関数の例として挙げた耳と脳の
構造に関連して着想できたのが、脳が音を時間領域ではなく
周波数領域で認識しているのかもしれない、ということだった。
位相には鈍感で振幅や周波数には対数的に反応できる、というのは
フーリエスペクトルの形状への依存度が高いということだろう。
だとすると、聞き覚えのある曲の思い出し方について考えたことも
ちょっとずれていて、時系列的な記憶というよりもスペクトルとして
把握しているということなのかもしれない。
聴覚が一次元フーリエ変換、視覚が二次元フーリエ変換(あるいは
三次元かもしれない)。
触覚や味覚、嗅覚はどのくらいの次元をもっているのだろうか。
このあたりは次元数が高いあるいは不定であるために
再現が難しいのかもしれない。
2016-02-27 追記
上記の耳の構造の件については、wikipediaの周波数領域の項にも
話が出ていた。
"The Ear as a Frequency Analyzer"という論文でR.Plompが
発表しているようだ(wikipediaでは名前がRompとなっているんだが
間違いだろう)。
同項目にあるように、位相情報を切り捨てることでデータの圧縮が可能なので、
これがつまり認識に通じるのではないか。
そうなると、変換や圧縮がどこで行われているかという問題は結構興味深く、
耳や目等の受容体なのであれば脳には既に圧縮された情報しか来ないので、
VRでの完全な置換が技術的にも可能になると考えられる。
一方、脳に入ってから変換が行われるのであれば、切り捨てた位相情報も
バッファリング時に一旦は入力されているので、VRには無限の情報が
必要とされ、近似的な再現にしかならない。
No comments:
Post a Comment