๐MLP์์ ์งํํ๋ ML, DL Study์ ๋๋ค.๐
Classification(๋ถ๋ฅ) - Loss function : Cross-Entropy, Evaluation metrics : Accuracy (๋ค๋ฅธ ๊ฒ ํจ์ฌ ๋ง์)
- k-NN
- ์ด๋ค ๋ฐ์ดํฐ์ ๋ํ ๋ต์ ๊ตฌํ ๋, ์ฃผ๋ณ์ k๊ฐ์ ๊ฐ์ฅ ๊ฐ๊น์ด ๋ฐ์ดํฐ๋ฅผ ๋ณด๊ณ ๋ค์๋ฅผ ์ฐจ์งํ๋ ๊ฒ์ ์ ๋ต์ผ๋ก ํ๋จ
- Logistic Regression(๊ธฐ๋ณธ L2 Regularization)
- Binary Classification(์ด์ง ๋ถ๋ฅ)
- feature๋ฅผ ๊ฐ์ฅ ์ ๋ํ๋ผ ์ ์๋ ์ ํ ๋ฐฉ์ ์์ ์์ฑ class์ ๋ํด์๋ง ํ์ต -> ์๋ก์ด ๋ฐ์ดํฐ๋ฅผ ๋ฃ์ผ๋ฉด, ์ ์์ ๊ฐ์ ๋ฐํ(z) -> z๊ฐ์ ์์ฑ class ํ๋ฅ ๋ก ๋ณํ(1์์ ๋บ ๋๋จธ์ง๋ ์์ฑ class ํ๋ฅ )(sigmoid function)
- Multiclass Classification(๋ค์ค ๋ถ๋ฅ)
- feature๋ฅผ ๊ฐ์ฅ ์ ๋ํ๋ผ ์ ์๋ ์ ํ ๋ฐฉ์ ์์ ๊ฐ class๋ณ๋ก ํ์ต -> ์๋ก์ด ๋ฐ์ดํฐ๋ฅผ ๋ฃ์ผ๋ฉด, ์ ์์ ๊ฐ์ ๋ฐํ(z) -> z๊ฐ์ class๋ณ ํ๋ฅ ๋ก ๋ณํ(softmax function)
- Decision Tree(Normalization ํ์X)
- ์/์๋์ค์ ๋ํ ์ง๋ฌธ์ ์ด์ด๋๊ฐ๋ฉด์ ์ ๋ต์ ์ฐพ์ ํ์ต -> Leaf Node์์ ๊ฐ์ฅ ๋ง์ class๊ฐ ์์ธก class
- Ensemble Learning(๋๋ถ๋ถ Decesion Tree ๊ธฐ๋ฐ)
- ๋ ์ข์ ์์ธก ๊ฒฐ๊ณผ๋ฅผ ๋ง๋ค๊ธฐ ์ํด ์ฌ๋ฌ ๊ฐ์ model ํ๋ จ
- Random Forest, Extra Trees, Gradient Boosting, Histogram-based Gradient Boosting, (XGBoost) (Gradient Boosting ๋ฐฉ๋ฒ์ Gradient Descent๋ฅผ ์ด์ฉํ ๊ฒ)
Regression(ํ๊ท) - Loss function : Mean Squared Error(MSE), Evaluation metrics : R-squared (๋ค๋ฅธ ๊ฒ ํจ์ฌ ๋ง์)
- k-NN
- ์ด๋ค ๋ฐ์ดํฐ์ ๋ํ ๋ต์ ๊ตฌํ ๋, ์ฃผ๋ณ์ k๊ฐ์ ๊ฐ์ฅ ๊ฐ๊น์ด ๋ฐ์ดํฐ์ ๊ฐ์ ํ๊ท ๋ธ ๊ฒ์ ์ ๋ต์ผ๋ก ํ๋จ
- Linear Regression
- feature๋ฅผ ๊ฐ์ฅ ์ ๋ํ๋ผ ์ ์๋ ์ ํ ๋ฐฉ์ ์์ ํ์ต -> ์๋ก์ด ๋ฐ์ดํฐ๋ฅผ ๋ฃ์ผ๋ฉด, ์ ์์ ๊ฐ์ ๋ฐํ(์์ธก ๊ฐ)
- Ridge Regression
- Linear Regression + L2 Regularization
- Lasso Regression
- Linear Regression + L1 Regularization
- Decision Tree(Normalization ํ์X)
- ์/์๋์ค์ ๋ํ ์ง๋ฌธ์ ์ด์ด๋๊ฐ๋ฉด์ ์ ๋ต์ ์ฐพ์ ํ์ต -> Leaf Node์ ๋๋ฌํ ์ํ์ target์ ํ๊ท ํ ๊ฐ์ด ์์ธก๊ฐ
- Ensemble Learning(๋๋ถ๋ถ Decesion Tree ๊ธฐ๋ฐ)
- ๋ ์ข์ ์์ธก ๊ฒฐ๊ณผ๋ฅผ ๋ง๋ค๊ธฐ ์ํด ์ฌ๋ฌ ๊ฐ์ model ํ๋ จ
- Random Forest, Extra Trees, Gradient Boosting, Histogram-based Gradient Boosting, (XGBoost) (Gradient Boosting ๋ฐฉ๋ฒ์ Gradient Descent๋ฅผ ์ด์ฉํ ๊ฒ)
Clustering(๊ตฐ์ง)
- k-Means
- cluster์ ํ๊ท ๊ฐ(cluster center/centroid)์ ๋๋ค์ผ๋ก k๊ฐ ์ ํจ -> [๊ฐ ์ํ์ด ๊ฐ์ฅ ๊ฐ๊น์ด centroid์ ๊ฐ์ cluster๋ฅผ ์ด๋ฃธ -> ๋ค์ centroid๋ฅผ ๊ตฌํจ] -> centroid์ ๋ณํ๊ฐ ์์ ๋๊น์ง []๊ตฌ๊ฐ ๋ฐ๋ณต -> k๊ฐ์ cluster๋ก ๋ถ๋ฅ๋จ
- elbow ๋ฐฉ๋ฒ์ผ๋ก ์ต์ ์ k๊ฐ์ ์ฐพ์ ์ ์์
Dimensionality Reduction(์ฐจ์์ถ์)
- Principal Component Analysis = PCA - Principal Component(์ฃผ์ฑ๋ถ) : ๋ฐ์ดํฐ์ ํน์ง์ ์ ํํํ๋ ์ด๋ค ๋ฒกํฐ
- ์ฌ๋ฌ ์ฃผ์ฑ๋ถ ์ค ์ผ๋ถ ์ฃผ์ฑ๋ถ๋ง์ ์ ํํด์ ๋ฐ์ดํฐ์ dimension(feature)๋ฅผ ์ค์
- RL Study์์ ์งํ
- ๋ฐ๋์ Normalization์ ํ๊ณ Regularization ์ ์ฉ
- Model parameter : model์ด feature์์ ํ์ตํ parameter
- Hyperparameter : ์ฌ๋์ด ์ง์ ํ๋ parameter
- ์ ์ง์ ํ์ต : Loss function ๊ฐ์ ์ ์ ์ค์ด๋ ๋ฐฉํฅ์ผ๋ก ํ๋ จํ๋ ํ์ต๋ฒ
- Gradient Descent
- Stochastic Gradient Descent
- Minibatch Gradient Descent
- Batch Gradient Descent
- Gradient Descent
- Validation Set : hyperparameter ํ๋์ ์ํด model์ ํ๊ฐํ ๋, test set๋ฅผ ์ฌ์ฉํ์ง ์๊ธฐ ์ํด train set์์ ๋ค์ ๋ผ์ด ๋ธ data set
- Test Set๋ model ์์ฑ ํ ๋ง์ง๋ง์ ํ ๋ฒ๋ง ์ฌ์ฉ(์ฌ๋ฌ๋ฒ ์ฌ์ฉ ์, model์ test set์ ๋ง์ถ๋ ๊ฒ์ด๊ธฐ ๋๋ฌธ)
- k-fold Cross Validtaion : train set๋ฅผ k๊ฐ์ fold๋ก ๋๋ ๋ค์ ํ fold๊ฐ validation set์ ์ญํ , ๋๋จธ์ง fold๋ model ํ๋ จ -> k๋ฒ ๋ฐ๋ณตํ์ฌ ์ป์ ๋ชจ๋ validation score๋ฅผ ํ๊ท ๋
- Hyperparameter tuning with AutoML
- Grid Search : hyperparameter ํ์(๊ฐ์ ๋ชฉ๋ก ์ ๋ฌ) + cross validation
- Random Search : hyperparameter ํ์(๊ฐ์ ๋ฒ์ ์ ๋ฌ) + cross validation
- Dimensionality Reduction์ ํ์ฌ ๋ฐ์ดํฐ์ dimension(feature)๋ฅผ ์ค์ธ ๋ค, ๋ค๋ฅธ ML ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํ์ฌ ํ๋ จํ ์ ์์
- ๋ฐ์ดํฐ์ dimension(feature)์ 3๊ฐ ์ดํ๋ก ์ค์ด๋ฉด, ์๊ฐํํ๊ธฐ ์ข์(3D or 2D๋ก ํํ ๊ฐ๋ฅ)
- DL์ ๋ชฉํ : loss function์ ์ต์๊ฐ ์ฐพ๊ธฐ = Optimization(์ต์ ํ)
- ANN : Artificial Neural Network(์ธ๊ณต ์ ๊ฒฝ๋ง)
- DNN : Deep Neural Network(์ฌ์ธต ์ ๊ฒฝ๋ง)
- SLP : Single Layer Perceptron(๋จ์ธต ํผ์ ํธ๋ก )
- MLP : Multi Layer Perceptron(๋ค์ธต ํผ์ ํธ๋ก )
- Node : ANN์ ๊ตฌ์ฑํ๋ ๋ชจ๋ feature๋ฅผ node๋ผ๊ณ ๋ถ๋ฆ
- ANN โ DNN
- ANN = { SLP, {DNN} }
- DNN = { MLP, CNN, RNN }
- Input Layer(์ ๋ ฅ์ธต)
- Hidden Layer(์๋์ธต) โ FC(Fully Connected) Layer = Dense Layer(๋ฐ์ง์ธต)
- Output Layer(์ถ๋ ฅ์ธต)
- Activation Function(ํ์ฑํ ํจ์) : ๊ฐ node์ ์ ํ๋ฐฉ์ ์ ๊ณ์ฐ ๊ฒฐ๊ณผ์ ์ ์ฉ๋๋ ํจ์
- sigmoid function(์๊ทธ๋ชจ์ด๋ ํจ์)
- softmax function(์ํํธ๋งฅ์ค ํจ์)
- ReLU(๋ ๋ฃจ ํจ์)
- tanh(ํ์ดํผ๋ณผ๋ฆญ ํ์ ํธ ํจ์)
- Optimizer : ์ต์์ loss๊ฐ์ ์ฐพ๋ ์ต์ ํ ์๊ณ ๋ฆฌ์ฆ
- SGD
- Adaptive Learning Rate(์ ์์ ํ์ต๋ฅ ) ์ฌ์ฉํ๋ optimizer - ๋ชจ๋ธ์ด ์ต์ ์ ์ ๊ฐ๊น์ด ๊ฐ์๋ก ํ์ต๋ฅ ์ ๋ฎ์ถ ์ ์์
- Adagrad
- RMSprop
- Adam : Momentum optimization + RMSprop
- Dropout : hidden layer์ ์๋ ์ผ๋ถ node๋ฅผ ๋๊ณ ํ๋ จ์ํค๋ ๊ฒ - overfitting ๋ฐฉ์ง
- ์ผ๋ฐ Data : ์์์ ์๋ฏธ๊ฐ ์๋ data, ์) Image
- Sequential Data(์์ฐจ ๋ฐ์ดํฐ) : ์์์ ์๋ฏธ๊ฐ ์๋ data, ์) Text, Time Series(์๊ณ์ด)(์ผ์ ํ ์๊ฐ ๊ฐ๊ฒฉ์ผ๋ก ๊ธฐ๋ก๋ ๋ฐ์ดํฐ)
- sequence : ํ๋์ ์ํ
- Text Data
- token : ๋ถ๋ฆฌ๋ ๋จ์ด
- ์ดํ ์ฌ์ : train set์์ ๊ณ ์ ํ ๋จ์ด๋ฅผ ๋ฝ์ ๋ง๋ ๋ชฉ๋ก
- ๋จ์ด๋ง๋ค ๊ณ ์ ํ ์ ์๋ฅผ ๋ถ์ฌํด ์ซ์ ๋ฐ์ดํฐ๋ก ๋ฐ๊ฟ(0 : padding, 1 : ๋ฌธ์ฅ์ ์์, 2 : ์ดํ ์ฌ์ ์ ์๋ toekn)
- ์ ์๊ฐ ์ฌ์ด์๋ ์ด๋ ํ ๊ด๊ณ๋ ์์ - One-hot encoding, Word embedding ์ด์ฉ
- CNN(Convolution Neural Network)(ํฉ์ฑ๊ณฑ ์ ๊ฒฝ๋ง) - image data ์ฒ๋ฆฌ์ ํนํ๋์ด ์์
- convolution layer์ ๊ฐ์ง๊ณ ์๋ NN
- filter = kernel => convolution layer์์ feature map ์์ฑ
- same padding : convolution ๊ณผ์ ์ ๊ฑฐ์น๊ณ ๋ output ํฌ๊ธฐ๋ฅผ input๊ณผ ๋์ผํ๊ฒ ํ๊ธฐ ์ํจ
- stride : convolution ์ฐ์ฐ ๊ณผ์ ์์ filter์ ์ด๋ ํฌ๊ธฐ
- pooling : convolution layer์์ ์์ฑ๋ feature map์ ๊ฐ๋ก์ธ๋ก ํฌ๊ธฐ๋ฅผ ์ค์
- max pooling : filter๋ฅผ ์ฐ์ ์์ญ์์ ๊ฐ์ฅ ํฐ ๊ฐ ๊ณ ๋ฅด๊ธฐ
- average pooling : filter๋ฅผ ์ฐ์ ์์ญ์์ ํ๊ท ๊ฐ ๊ณ์ฐํ๊ธฐ
- RNN(Recurrent Neural Network)(์ํ ์ ๊ฒฝ๋ง) - sequential data ์ฒ๋ฆฌ์ ํนํ๋์ด ์์
- recurrent layer์ ๊ฐ์ง๊ณ ์๋ NN
- rucurrent layer = cell
- cell์ ์ถ๋ ฅ = hidden state
- timestep : ์ํ์ ์ฒ๋ฆฌํ๋ ํ ๋จ๊ณ, text data - 1๊ฐ์ token์ด ํ๋์ timestep
- NLP(Natural Language Processing)(์์ฐ์ด ์ฒ๋ฆฌ)์์ ์ด์ฉ - ์์ฑ ์ธ์, ๊ธฐ๊ณ ๋ฒ์ญ, ๊ฐ์ฑ ๋ถ์ ๋ฑ
- ์ฃผ์ Model
- LSTM(Long Short-Term Memory)
- GRU(Gated Recurrent Unit)
- ์ด๋ฏธ์ง ํฝ์
์ 0
255 ์ฌ์ด์ ์ ์๊ฐ์ ๊ฐ์ง -> 255๋ก ๋๋์ด 01 ์ฌ์ด์ ๊ฐ์ผ๋ก normalization - DL์์๋ cross validation ๋์ validation set์ ๋ณ๋๋ก ๋์ด๋ด์ด ์ฌ์ฉ
- ๋ชจ๋ hidden layer์ output layer์๋ bias(์ ํธ)๊ณผ activation function์ด ์์(๋จ, Regression์ ๊ฒฝ์ฐ์๋ output layer์ activation function์ด ์์)
- Binary Classification์ ํ ๋ output layer์์๋ sigmoid function ์ฌ์ฉ
- Multiclass Classification์ ํ ๋ output layer์์๋ softmax function ์ฌ์ฉ
- ๋ณดํต convolution layer์ pooling layer์ ๊ฑฐ์ ํญ์ ํจ๊ป ์ฌ์ฉ