Frontiers in Psychology誌に論文を発表しました

深層学習ネットワークによって「蛇の回転錯視」の知覚再現に成功しました。
https://www.frontiersin.org/articles/10.3389/fpsyg.2018.00345/

基礎生物学研究所 神経生理学研究室の渡辺英治准教授は、同研究所の八杉公基研究員と立命館大学の北岡明佳教授、生理学研究所の坂本貴和子助教、サクラリサーチオフィスの田中健太博士との共同研究によって、深層学習ネットワークが「蛇の回転錯視(注1)」が引き起こす運動知覚を再現することを、新たに発見しました。

深層学習ネットワークは、脳の神経ネットワーク構造や動作原理を参照して設計された人工知能のひとつであり、近年、画像分類や音声認識など、幅広い分野で画期的な成果を収めているだけでなく、脳の動作メカニズムを研究するためのツールとしても期待が高まっています。

今回研究グループは、大脳皮質の動作原理として有力な仮説のひとつである「予測符号化(注2)」を組み込んだ深層学習ネットワーク(PredNet)によって、錯視の再現ができるかどうかを検証しました。深層学習ネットワークに、我々の日常生活などの自然な情景を撮影した動画(約5時間)を繰り返し学習させたところ、学習した後の深層学習ネットワークは、実際に動いているプロペラが回転する動きを予測するだけでなく、「蛇の回転錯視」が引き起こす、あたかも画像が回転しているかのように見える回転運動様の錯覚すらも再現することがわかりました(図1)。

本成果は、錯視を深層学習ネットワークが再現した世界で初めての事例であり、錯視を引き起こすメカニズムのひとつとして予測符号化理論が有力な仮説であることを支持しています。今後、錯視を判断基準にした深層学習は、脳の動作原理の解明に貢献すると期待されます。本成果は2018年3月15日付けで学術誌 Frontiers in Psychologyに掲載されました。研究内容の詳細につきましては、基生研のプレスリリースにて。

【図1】蛇の回転錯視(左図は左回転、右図は無回転)の運動知覚が深層学習ネットワークによって再現されました。連続した二枚の予測画像からオプチカルフローを検出し、ベクトルとして表現した(黄色の点がベクトルの始点、赤い線がベクトルの方向と大きさを示しています。











#################################################################
Frontiers in Psychology (2018) Volume 9, Article 345.
“Illusory Motion Reproduced by Deep Neural Networks Trained for Prediction” 
Eiji Watanabe, Akiyoshi Kitaoka, Kiwako Sakamoto, Masaki Yasugi and Kenta Tanaka
DOI: 10.3389/fpsyg.2018.00345
#################################################################


注1)
蛇の回転錯視:立命館大学の北岡明佳博士が2003年に考案した錯視(「北岡明佳の錯視のページ」http://www.ritsumei.ac.jp/~akitaoka/)。静止画であるにもかかわらず強い運動知覚を生じさせる。人だけではなくサルやネコ、魚にも知覚されると考えられている錯視であり、生理学的な知見も集積している。北岡博士は、蛇の回転錯視以外にも多くの錯視を考案しているが、中でも特に2008年に発表されたシマシマガクガク錯視は、米国アーティストであるレディー・ガガのアルバムジャケットに採用されたことで有名。
http://www.ritsumei.jp/news/detail_j/topics/12336/year/2013/publish/1

注2)
予測符号化:RaoとBallardによって1999年(Nature Neuroscience)に提唱された視覚系大脳皮質の動作原理に関する仮説。大脳皮質は常に視覚世界の予測をしており、感覚入力と予測との誤差のみを学習しているとする。現在大脳皮質の動作原理を説明する仮説の中では最も有力なもののひとつ。
https://www.nature.com/articles/nn0199_79

追記)
本論文は、Frontiers in Psychology誌のPerception Science分野のチーフエディターであるRufin VanRullenのレビュー、
VanRullen, R. (2017). Perception science in the age of deep neural networks. Front. Psychol. 8:142. doi: 10.3389/fpsyg.2017.00142
https://www.frontiersin.org/articles/10.3389/fpsyg.2017.00142
の檄文を受けてFrontiers in Psychology誌に投稿されたものです。論文のエディターは、VanRullen、査読者のひとりはPredNetの開発者です。

私たちの研究グループは、錯視を生じさせる神経ネットワークは、予測学習による結果とではないかという仮説を2010年に提唱しています(錯視と予測符号化の関係を論じた最も初期の記述のひとつになります)。このときは予測符号化と呼ばずに、もっと汎用概念「デルタモデル」という名称で仮説を提案しています。
Watanabe, E., Matsunaga, W., and Kitaoka, A., Motion signals deflect relative positions of moving objects, Vision Research 50, 2381-2390 (2010)
今回の深層学習による研究は、このときの仮説を「より直接的」に検証したものになります。

本論文の最後の下りで「逆心理学(Reverse Psychology)」という手法を提案しています。逆遺伝学が構成最小単位である遺伝子から生物個体の表現型を解き明かしていったように、逆心理学では構成最小単位であるニューロンの働きから心の表現型を解き明かしていくことを期待しています。逆心理学(あるいは逆神経科学)が新しい神経科学の地平を切り拓いてくれるでしょう。

#################################################################
Frontiers Featured NEWS (2018) April 26
https://blog.frontiersin.org/2018/04/26/artificial-intelligence-tricked-by-optical-illusion-just-like-humans/


#################################################################
ニュートン 2018年6月号 フォーカス記事
http://www.newtonpress.co.jp/


#################################################################
A neural network trained to predict future video frames mimics critical properties of biological neuronal responses and perception (28 May 2018)
PredNetの考案者らによる続報です。主観的輪郭、フラッシュラグ効果などがPredNetによって再現されました。
https://arxiv.org/abs/1805.10734


#################################################################
動き錯視を再現する統計モデルによる挑戦(2018年6月9日)
統計モデルによって回転錯視を再現しようとする試み。深層学習モデルと統計モデルによる回転錯視の再現との対比が面白く展開しました。
https://qiita.com/stnk20/items/c36bef359a8f92d058b0 https://twitter.com/stnk20/status/1003963496050987008


#################################################################
別冊ニュートン「ゼロからわかる人工知能 増補第2版」(2020年3月5日)
https://www.newtonpress.co.jp/separate/back_engineering/mook_200305-2.html



コメント