-
Notifications
You must be signed in to change notification settings - Fork 0
AI memo
Wenhao Ni edited this page Feb 28, 2019
·
7 revisions
-
f(u)では、基準になっている関数。
-
g(x-u)では、関数の形を移動する、両関数の結果を相互影響することを集計(積分)すること。
-
画像認識における意味は、画像を部分的に取り出し、パターン的に認識する。取り出す部分は少しずつ移動する。下記の関数をgとして取る場合の結果と似ているから言葉を借りる。
g = (x) => a < x < b ? 1 : 0;
Conv2D(32, (3, 3), ....)
このレイヤーは3X3のサブ画像を取り出し、P(9, 32)と掛け算して、出力する。biasあるかわからない。
- 画像解析に用いられる。
- 畳み込みでパタンを認識する。認識用パラメータを同じようにで学習する。
- 何階層で変換パターン認識して、結果を出る。
- パディング(Padding)
- ストライド(strided)
単語をN次元空間的な座標に変換する操作。
- 長い入力情報を複数入力データに分けって処理する。
- 入力の関連性を考慮する。
- ネットワークの出力を次の入力にマージしてから再処理される。
- 処理は
- ステートを用意する。
- 次の入力をネットワークAで処理して、結果になる。
- 現在ステートをネットワークBで処理して、結果になる。
- 両結果をマージして次のステートになる。
- マージと言って、単純のプラス、ビアスもプラスかもしれない。
わからない。
CNNでは画像の部分の特徴を抽出する仕組み。
レイヤー毎、特徴抽出対象画像の部分が大きくなる。
一般的に、細部では、被写体が違っても特徴が一緒である。学習済みのCNNは最後の幾つのレイヤーを再学習することで、違う領域に適用できる考え。
f(x) = max(0, x)
複数レイヤのネットワークをやめ、層は独自の変換と考え、入力から、層ごとで学習する。 学習した層の出力を次の層の入力として、次の層を学習する。その繰り返す。
最後にロジスティック回帰層、シグモイド/ソフトマップで重み調整
全結合レイアを追加。
提供される出力シャープと活性化関数を利用する。
過学習を防止するため、ランダムで入力データに0を入れる。