Hiroki Naganuma

Part III [25 points]: Deep Neural Networks

1 [15 points] Convolutions

Q1 Equivariance of Circular Convolution

Screenshot 2022-03-28 at 10 37 12 PMScreenshot 2022-03-28 at 10 37 30 PM

Screenshot 2022-03-29 at 2 58 34 PMScreenshot 2022-03-29 at 3 56 53 PM

Screenshot 2022-03-28 at 10 37 12 PMScreenshot 2022-03-28 at 10 37 12 PM

Screenshot 2022-03-31 at 2 54 58 PM

Q2 Now prove that a (circular) convolution is the only linear operation with shift equivariance. (Hint: how do you prove a bidirectional implication?)

ここで、(円)畳み込みがシフト等価を持つ唯一の線形演算であることを証明せよ。(ヒント:双方向の含意はどのように証明するのか?)

Screenshot 2022-03-31 at 4 08 59 PM

Q3 What does this tell you about designing deep learning architectures for processing spatial or spatio-temporal data like images and videos?

画像や動画のような空間・時空間データを処理するための深層学習アーキテクチャの設計について、どのようなことが言えるのでしょうか。

Screen Shot 2022-04-03 at 23 49 03

畳み込み演算は、そのシフト普遍性から、検出されうる特徴量が、画像のどの位置で現れても、有効な特徴量を学習できる利点がある。 また、動画においても、その計測時間などの違いに代表される、サイズ可変の入力を処理するために畳み込みが有効である。(全結合ネットワークでは空間的な大きさの異なる入力を処理できない)

2 [10 points] Recurrent Neural Networks

Main References

Screenshot 2022-03-31 at 4 08 59 PMScreenshot 2022-03-31 at 4 08 59 PMScreenshot 2022-03-31 at 4 08 59 PM

Screenshot 2022-03-31 at 4 08 59 PMScreenshot 2022-03-31 at 4 08 59 PMScreenshot 2022-03-31 at 4 08 59 PM

References

Seq2seq で使ってるモデルが Encoder と Decoder