์ต๊ทผ์ ์ด์ ๋ถ๋ฅ๊ธฐ
- ๋ ์ด๋ธ์ด ์๋ ์์๋ฅผ ๋ ์ด๋ธ๋ ์ ์ฌํ ์์์ ํด๋์ค๋ก ํ ๋นํด ๋ถ๋ฅํ๋ ํน์ง
- ํน์ง๊ณผ ํ๊ฒ ํด๋์ค ๊ฐ์ ๊ด๊ณ๊ฐ ๋ง๊ณ ๋ณต์กํ๊ฑฐ๋ ์ดํดํ๊ธฐ๊ฐ ๋งค์ฐ ์ด๋ ต์ง๋ง, ์ ์ฌํ ํด๋์ค ์ ํ์ ์์ดํ ์ด ์๋นํ ๋ใ ์ง์ ์ธ ๊ฒฝํฅ์ ๋ ๋ ๋ถ๋ฅ ์์ ์ ์ ํฉ
์ฅ์
- ๋จ์ํ๊ณ ํจ์จ์
- ๊ธฐ์ ๋ฐ์ดํฐ ๋ถํฌ์ ๋ํ ๊ฐ์ ์ ํ์ง ์์
- ํ๋ จ ๋จ๊ณ๊ฐ ๋น ๋ฆ
๋จ์
- ๋ชจ๋ธ์ ์์ฑํ์ง ์์ ํน์ง๊ณผ ํด๋์ค ๊ฐ์ ๊ด๊ณ๋ฅผ ์ดํดํ๋ ๋ฅ๋ ฅ์ด ์ ์ฝ์ ๋ฐ์
- ์ ์ ํ k์ ์ ํ ํ์
- ๋ถ๋ฅ ๋จ๊ณ๊ฐ ๋๋ฆผ
- ๋ช ๋ชฉ ํน์ง๊ณผ ๋๋ฝ ๋ฐ์ดํฐ์ฉ ์ถ๊ฐ ์ฒ๋ฆฌ๊ฐ ํ์
- ์ต๊ทผ์ ์ด์์ ์ฐพ์ผ๋ ค๋ฉด ๊ฑฐ๋ฆฌ ํจ์๋ ๋ ์ธ์คํด์ค ๊ฐ์ ์ ์ฌ๋๋ฅผ ์ธก์ ํ๋ ๊ณต์์ด ํ์
- ์ ํต์ ์ผ๋ก K-NN ์๊ณ ๋ฆฌ์ฆ์ ์ ํด๋ฆฌ๋ ๊ฑฐ๋ฆฌ๋ฅผ ์ฌ์ฉ
- k์ ๊ฐ์ ๋ชจ๋ธ์ด ๋ฏธ๋ ๋ฐ์ดํฐ์ ๋ํด ์ผ๋ฐํ๋๋ ๋ฅ๋ ฅ์ ๊ฒฐ์
- ํ๋ จ ๋ฐ์ดํฐ์ ๋ํ ๊ณผ์ ํฉ๊ณผ ๊ณผ์์ ํฉ ์ฌ์ด์ ๊ท ํ์ ํธํฅ ๋ถ์ฐ ํธ๋ ์ด๋์คํ๋ก ์๋ ค์ง ๋ฌธ์
- k๊ฐ ํฌ๋ฉด ๋ ธ์ด์ฆ๊ฐ ๋ง์ ๋ฐ์ดํฐ๋ก ์ธํ ์ํฅ์ด๋ ๋ถ์ฐ์ ๊ฐ์ํ์ง๋ง ์๋๋ผ๋ ์ค์ํ ํจํด์ ๋ฌด์ํ๋ ์ํ์ ๊ฐ์ํ๋ ํ์ต์๋ก ํธํฅ๋ ์ ์์
- k๊ฐ ์์ผ๋ฉด ๋ ธ์ด์ฆ๊ฐ ์๋ ๋ฐ์ดํฐ๋ ์ด์์น๊ฐ ์์์ ๋ถ๋ฅ์ ๊ณผ๋ํ ์ํฅ์ ๋ฏธ์นจ
- k๋ ๋ณดํต ํ๋ จ ์์ ๊ฐ์์ ์ ๊ณฑ๊ทผ์ผ๋ก ์ค์ ํ๊ณ ์์ํด์ ๋ค์์ k ๊ฐ์ ํ ์คํธํด ๋ถ๋ฅ ์ฑ๋ฅ์ด ๊ฐ์ฅ ์ข์ ๊ฒ์ ์ ํ
- ๋ฐ์ดํฐ์ ๋ ธ์ด์ฆ๊ฐ ๋ง์ง ์๊ณ ํ๋ จ ๋ฐ์ดํฐ์ ์ด ํด ๊ฒฝ์ฐ k๋ ๋ ์ค์ํด์ง
- ์ผ๋ฐ์ ์ผ๋ก ํน์ง์ ์๊ณ ๋ฆฌ์ฆ์ ์ ์ฉํ๊ธฐ ์ ์ ํ์ค ๋ฒ์๋ก ๋ณํ
- ๊ฑฐ๋ฆฌ ๊ณต์์ด ํน์ ํ ์ธก์ ๋ฐฉ๋ฒ์ ๋งค์ฐ ์์กด์ ์ด๊ธฐ ๋๋ฌธ
- ์ ํต์ ์ผ๋ก ์ต์-์ต๋ ์ ๊ทํ๋ฅผ ์ฌ์ฉ
์ต์-์ต๋ ์ ๊ทํ
- ๋ชจ๋ ๊ฐ์ด 0์์ 1 ์ฌ์ด ๋ฒ์์ ์๋๋ก ํน์ง์ ๋ณํ
Xnew = (X - min(X)) / (max(X) - min(X))
z-์ ์ ํ์คํ
- ํน์ง X์์ ํ๊ท ๊ฐ์ ๋นผ๊ณ ๊ทธ ๊ฒฐ๊ณผ๋ฅผ X์ ํ์ค ํธ์ฐจ๋ก ๋๋
Xnew = (X - Mean(X)) / StdDev(X)
- ๊ฐ ํน์ง ๊ฐ์ด ํ๊ท ์ ์๋ ์๋๋ก ๋ช ํ์ค ํธ์ฐจ๋งํผ ๋จ์ด์ ธ ์๋์ง์ ๊ด์ ์ผ๋ก ๊ฐ ํน์ง ๊ฐ์ ํ๋ ์ถ์
- ๊ฒฐ๊ณผ ๊ฐ์ z-์ ์
- z-์ ์๋ ์ ๊ทํ ๊ฐ๊ณผ ๋ฌ๋ฆฌ ๋ฏธ๋ฆฌ ์ ์๋ ์ต์๊ฐ๊ณผ ์ต๋๊ฐ์ด ์์
์ ํด๋ฆฌ๋ ๊ฑฐ๋ฆฌ ๊ณต์
- ๋ช ๋ชฉ ๋ฐ์ดํฐ์๋ ์ ์๋์ง ์์
- ๋ช ๋ชฉ ํน์ง ๊ฐ์ ๊ฑฐ๋ฆฌ๋ฅผ ๊ณ์ฐํ๊ณ ์ ํน์ง์ ์์น ํ์์ผ๋ก ๋ณํํ ํ์๊ฐ ์์
- ๋๋ฏธ ์ฝ๋ฉ์ ํ์ฉํ๋ ๊ฒ์ด ๋ํ์
- ๋๋ฏธ ์ฝ๋ฉ์์ ๊ฐ 1์ ํด๋น ๋ฒ์ฃผ๋ฅผ ๋ํ๋ด๊ณ , 0์ ๋ค๋ฅธ ๋ฒ์ฃผ๋ฅผ ๋ํ๋
- n-๋ฒ์ฃผ ๋ช ๋ชฉ ํน์ง์ ํน์ง์ (n-1) ๋ ๋ฒจ์ ์ด์ง ์ง์ ๋ณ์๋ฅผ ์์ฑํด์ ๋๋ฏธ ์ฝ๋ํํ ์ ์์
- ์ต๊ทผ์ ์ด์ ๋ฐฉ๋ฒ์ ๊ธฐ๋ฐ์ ๋ ๋ถ๋ฅ ์๊ณ ๋ฆฌ์ฆ์ ๊ฒ์ผ๋ฅธ ํ์ต์ด๋ผ๊ณ ํจ
- ์ถ์ํ๊ฐ ์ผ์ด๋์ง ์๊ธฐ ๋๋ฌธ
- ์ฆ, ํ๋ จ ๋จ๊ณ์์๋ ํ๋ จ ๋ฐ์ดํฐ๋ฅผ ์ ์ฅํ๊ธฐ๋ง ํ์ฌ ๋น ๋ฅด์ง๋ง, ์๋ฌด๊ฒ๋ ํ๋ จํ์ง ์์
- ์์ธก ๋จ๊ณ๊ฐ ํ๋ จ ๋จ๊ณ์ ๋นํด ์๋์ ์ผ๋ก ๋๋ฆฐ ๊ฒฝํฅ์ด ์์
- ์ถ์ํ๋ ๋ชจ๋ธ๋ณด๋ค ํ๋ จ ์ธ์คํด์ค์ ๋ง์ด ์์กดํ์ฌ ๊ฒ์ผ๋ฅธ ํ์ต์ ์ธ์คํด์ค ๊ธฐ๋ฐ ํ์ต, ์๊ธฐ ํ์ต์ด๋ผ๊ณ ๋ ํจ
- ๋ชจ๋ธ์ ๋ง๋ค์ง ์๊ธฐ ๋๋ฌธ์ ๋น๋ชจ์ ํ์ต ๋ฐฉ๋ฒ์ ๋ถ๋ฅ๋ผ๊ณ ํ ์ ์์
๋ฐ์ดํฐ
- UCI ๋จธ์ ๋ฌ๋ repository์ Wisconsin Breast Cancer Diagnostic dataset
wbcd <- read.csv("wisc_bc_data.csv", stringsAsFactors=F)
str(wbcd)
> str(wbcd)
'data.frame': 569 obs. of 32 variables:
$ id : int 87139402 8910251 905520 868871 9012568 906539 925291 87880 862989 89827 ...
$ diagnosis : chr "B" "B" "B" "B" ...
$ radius_mean : num 12.3 10.6 11 11.3 15.2 ...
$ texture_mean : num 12.4 18.9 16.8 13.4 13.2 ...
$ perimeter_mean : num 78.8 69.3 70.9 73 97.7 ...
$ area_mean : num 464 346 373 385 712 ...
$ smoothness_mean : num 0.1028 0.0969 0.1077 0.1164 0.0796 ...
$ compactness_mean : num 0.0698 0.1147 0.078 0.1136 0.0693 ...
$ concavity_mean : num 0.0399 0.0639 0.0305 0.0464 0.0339 ...
$ points_mean : num 0.037 0.0264 0.0248 0.048 0.0266 ...
$ symmetry_mean : num 0.196 0.192 0.171 0.177 0.172 ...
$ dimension_mean : num 0.0595 0.0649 0.0634 0.0607 0.0554 ...
$ radius_se : num 0.236 0.451 0.197 0.338 0.178 ...
$ texture_se : num 0.666 1.197 1.387 1.343 0.412 ...
$ perimeter_se : num 1.67 3.43 1.34 1.85 1.34 ...
$ area_se : num 17.4 27.1 13.5 26.3 17.7 ...
$ smoothness_se : num 0.00805 0.00747 0.00516 0.01127 0.00501 ...
$ compactness_se : num 0.0118 0.03581 0.00936 0.03498 0.01485 ...
$ concavity_se : num 0.0168 0.0335 0.0106 0.0219 0.0155 ...
$ points_se : num 0.01241 0.01365 0.00748 0.01965 0.00915 ...
$ symmetry_se : num 0.0192 0.035 0.0172 0.0158 0.0165 ...
$ dimension_se : num 0.00225 0.00332 0.0022 0.00344 0.00177 ...
$ radius_worst : num 13.5 11.9 12.4 11.9 16.2 ...
$ texture_worst : num 15.6 22.9 26.4 15.8 15.7 ...
$ perimeter_worst : num 87 78.3 79.9 76.5 104.5 ...
$ area_worst : num 549 425 471 434 819 ...
$ smoothness_worst : num 0.139 0.121 0.137 0.137 0.113 ...
$ compactness_worst: num 0.127 0.252 0.148 0.182 0.174 ...
$ concavity_worst : num 0.1242 0.1916 0.1067 0.0867 0.1362 ...
$ points_worst : num 0.0939 0.0793 0.0743 0.0861 0.0818 ...
$ symmetry_worst : num 0.283 0.294 0.3 0.21 0.249 ...
$ dimension_worst : num 0.0677 0.0759 0.0788 0.0678 0.0677 ...
- 569๊ฐ์ ์ ์กฐ์ง๊ฒ์ฌ ์์
- 32๊ฐ์ ํน์ง
- ์ฒซ ๋ณ์๋ ํ์ ID๋ก ์ ์ฉํ ์ ๋ณด๋ฅผ ์ ๊ณตํ์ง ์์ผ๋ ์ ์ธํ ํ์๊ฐ ์์
- ์๋ฏธ ์๋ ID์ chr์ธ diagnosis๋ฅผ ์ ์ธํ ๋ค๋ฅธ ํน์ง๋ค์ ์ซ์
wbcd <- wbcd[-1] # ํ์ id๋ ์ ์ฉํ ์ ๋ณด๋ฅผ ์ ๊ณตํ์ง ์์ ์ ์ธ
table(wbcd$diagnosis)
> table(wbcd$diagnosis)
B M
357 212
- ๋ณ์ diagnosis๋ ์์ธกํ๋ ค๋ ๊ฒฐ๊ณผ
- ์์ฑ ์ข ์์ธ์ง ์์ฑ ์ข ์์ธ์ง ์ฌ๋ถ๋ฅผ ๋ํ๋
- ์์ฑ์ด 357๊ฐ, ์์ฑ์ด 212๊ฐ
- ํฉํฐ๋ก ๋ณํํ ํ์ ์์
- ์ถ๊ฐ๋ก ์ ๋ณด๋ฅผ ์ฃผ๋ ๋ ์ด๋ธ ์ ๊ณต ํ์
wbcd$diagnosis <- factor(wbcd$diagnosis, levels=c("B","M"),
labels=c("Benign","Malignant"))
round(prop.table(table(wbcd$diagnosis)) * 100, digits=1)
> round(prop.table(table(wbcd$diagnosis)) * 100, digits=1)
Benign Malignant
62.7 37.3
- ์์ฑ์ด 62.7%, ์์ฑ์ด 37.3%
summary(wbcd[c("radius_mean","area_mean","smoothness_mean")])
> summary(wbcd[c("radius_mean","area_mean","smoothness_mean")])
radius_mean area_mean smoothness_mean
Min. : 6.981 Min. : 143.5 Min. :0.05263
1st Qu.:11.700 1st Qu.: 420.3 1st Qu.:0.08637
Median :13.370 Median : 551.1 Median :0.09587
Mean :14.127 Mean : 654.9 Mean :0.09636
3rd Qu.:15.780 3rd Qu.: 782.7 3rd Qu.:0.10530
Max. :28.110 Max. :2501.0 Max. :0.16340
- ๋งค๋๋ฌ์์ ๋ฒ์๋ 0.05~0.16์ธ ๋ฐ๋ฉด, ๋ฉด์ ์ ๋ฒ์๋ 143.5์์ 250.10์ด๊ธฐ ๋๋ฌธ์ ๊ฑฐ๋ฆฌ ๊ณ์ฐ์์ ๋ฉด์ ์ ์ํฅ์ด ์ปค์ง๊ฒ ๋จ
- ์ ๊ทํ ์ ์ฉ์ด ํ์
min-max ์ ๊ทํ ํจ์ ์์ฑ
normalize <- function(x) {
return ((x - min(x)) / (max(x) - min(x)))
}
normalize(c(1, 2, 3, 4, 5))
normalize(c(10, 20, 30, 40, 50))
> normalize(c(1, 2, 3, 4, 5))
[1] 0.00 0.25 0.50 0.75 1.00
> normalize(c(10, 20, 30, 40, 50))
[1] 0.00 0.25 0.50 0.75 1.00
lapply()
- ๋ฆฌ์คํธ๋ฅผ ์ทจํด ๊ฐ ๋ฆฌ์คํธ ํญ๋ชฉ์ ์ง์ ๋ ํจ์๋ฅผ ์ ์ฉ
- ๋ฐ์ดํฐ ํ๋ ์์ ๋์ผํ ๊ธธ์ด๋ฅผ ๊ฐ๋ ๋ฒกํฐ๋ค์ ๋ฆฌ์คํธ
- lapply()๋ ๋ฆฌ์คํธ๋ฅผ ๋ฐํํ๋ฏ๋ก ๊ฒฐ๊ณผ๊ฐ์ ๋ฐ์ดํฐํ๋ ์์ผ๋ก ๋ณํํ๋ ๊ฒ์ด ํ์
wbcd_n <- as.data.frame(lapply(wbcd[2:31], normalize))
summary(wbcd_n$area_mean)
> summary(wbcd_n$area_mean)
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.0000 0.1174 0.1729 0.2169 0.2711 1.0000
- ์๋ 143.5~2501.0์ ๋ฒ์๋ฅผ ๊ฐ์ก์ง๋ง ์ง๊ธ์ 0์์ 1๊น์ง ๋ฒ์์ ์๋ ๊ฒ์ ํ์ธํ ์ ์์
train, test ๋ถ๋ฆฌ
- 469๊ฐ๋ฅผ train, 100๊ฐ๋ฅผ test๋ก ๋ถ๋ฆฌํจ
wbcd_train <- wbcd_n[1:469, ]
wbcd_test <- wbcd_n[470:569, ]
diagnosis ํฉํฐ๋ฅผ ๊ฐ์ ธ์์ ๋ ์ด๋ธ ๋ฒกํฐ๋ฅผ ์์ฑ
wbcd_train_label <- wbcd[1:469, 1]
wbcd_test_label <- wbcd[470:569, 1]
- k์ ๊ฐ์ ํ๋ จ ๋ฐ์ดํฐ๊ฐ 469๊ฐ ์ด๋ฏ๋ก 469์ ์ ๊ณฑ๊ทผ๊ณผ ๋์ผํ ํ์์ธ 21๋ก ์๋
- 2-๋ฒ์ฃผ ๊ฒฐ๊ณผ์ด๋ฏ๋ก ํ์๋ฅผ ์ฌ์ฉํด ๋์ ํ๋ก ๋๋ ๊ฐ๋ฅ์ฑ์ ์ ๊ฑฐ
library(class)
wbcd_test_pred <- knn(train=wbcd_train, test=wbcd_test,
cl=wbcd_train_label, k=21)
library(gmodels)
CrossTable(x=wbcd_test_label, y=wbcd_test_pred, prop.chisq=F)
> CrossTable(x=wbcd_test_label, y=wbcd_test_pred, prop.chisq=F)
Cell Contents
|-------------------------|
| N |
| N / Row Total |
| N / Col Total |
| N / Table Total |
|-------------------------|
Total Observations in Table: 100
| wbcd_test_pred
wbcd_test_label | Benign | Malignant | Row Total |
----------------|-----------|-----------|-----------|
Benign | 61 | 0 | 61 |
| 1.000 | 0.000 | 0.610 |
| 0.968 | 0.000 | |
| 0.610 | 0.000 | |
----------------|-----------|-----------|-----------|
Malignant | 2 | 37 | 39 |
| 0.051 | 0.949 | 0.390 |
| 0.032 | 1.000 | |
| 0.020 | 0.370 | |
----------------|-----------|-----------|-----------|
Column Total | 63 | 37 | 100 |
| 0.630 | 0.370 | |
----------------|-----------|-----------|-----------|
- ์ข์ธก ์๋จ ์ ์ TN ๊ฒฐ๊ณผ๋ฅผ ๋ํ๋
- 100๊ฐ์ ๊ฐ ์ค 61๊ฐ๋ ์ข ์์ด ์์ฑ์ด๊ณ , k-NN ์๊ณ ๋ฆฌ์ฆ์ด ์ ํํ ์์ฑ์ผ๋ก ์๋ณํ ๊ฒฝ์ฐ
- ์ฐ์ธก ํ๋จ ์ ์ TP ๊ฒฐ๊ณผ๋ฅผ ๋ํ๋
- ์ ์ฑ ์ข ์์ ์ ํํ ์ ์ฑ ์ข ์์ด๋ผ๊ณ ๋ถ๋ฅ๊ธฐ๊ฐ ๋ง์ถ ๊ฒฐ๊ณผ
- ์ข์ธก ํ๋จ์ FN, ์ฐ์ธก ์๋จ์ FP๋ก ์ค๋ฅ๋ค์
- ์ข ์ 100๊ฐ ์ค 2๊ฐ๋ฅผ ์๋ชป ๋ถ๋ฅ
- ์ ํ๋๊ฐ ๋์ง๋ง ์ค๋ฅ๊ฐ FN์ด๊ธฐ ๋๋ฌธ์ ์ฑ๋ฅ ํฅ์์ด ํ์
- ์์น ํน์ง ์ฌ์กฐ์ ํ ๋ค๋ฅธ ๋ฐฉ๋ฒ ์ฌ์ฉ
- k์ ๋ช ๊ฐ์ง ๋ค๋ฅธ ๊ฐ์ ์๋
- scale() ์ฌ์ฉ
- scale()์ ๋ฐ์ดํฐ ํ๋ ์์ ์ง์ ์ ์ฉ ๊ฐ๋ฅ
wbcd_z <- as.data.frame(scale(wbcd[-1]))
summary(wbcd_z$area_mean)
> summary(wbcd_z$area_mean)
Min. 1st Qu. Median Mean 3rd Qu. Max.
-1.4532 -0.6666 -0.2949 0.0000 0.3632 5.2459
- ์ฒซ ๋ฒ์งธ ์ด์ diagnosis๋ฅผ ์ ์ธํ๊ณ ๋ชจ๋ ํน์ง์ ์ฌ์กฐ์
- z-์ ์๋ก ํ์คํ๋ ๋ณ์์ ํ๊ท ์ ํญ์ 0, ๋ฒ์๋ ์๋นํ ์์์ผ ํจ
- 3๋ณด๋ค ํฌ๊ฑฐ๋ -3๋ณด๋ค ์์ z-์ ์๋ ๋งค์ฐ ํฌ์ํ ๊ฐ์ ๋ํ๋
wbcd_train <- wbcd_z[1:469, ]
wbcd_test <- wbcd_z[470:569, ]
wbcd_train_label <- wbcd[1:469, 1]
wbcd_test_label <- wbcd[470:569, 1]
wbcd_test_pred <- knn(train=wbcd_train, test=wbcd_test,
cl=wbcd_train_label, k=21)
CrossTable(x=wbcd_test_label, y=wbcd_test_pred,
prop.chisq=F)
> CrossTable(x=wbcd_test_label, y=wbcd_test_pred,
+ prop.chisq=F)
Cell Contents
|-------------------------|
| N |
| N / Row Total |
| N / Col Total |
| N / Table Total |
|-------------------------|
Total Observations in Table: 100
| wbcd_test_pred
wbcd_test_label | Benign | Malignant | Row Total |
----------------|-----------|-----------|-----------|
Benign | 61 | 0 | 61 |
| 1.000 | 0.000 | 0.610 |
| 0.924 | 0.000 | |
| 0.610 | 0.000 | |
----------------|-----------|-----------|-----------|
Malignant | 5 | 34 | 39 |
| 0.128 | 0.872 | 0.390 |
| 0.076 | 1.000 | |
| 0.050 | 0.340 | |
----------------|-----------|-----------|-----------|
Column Total | 66 | 34 | 100 |
| 0.660 | 0.340 | |
----------------|-----------|-----------|-----------|
- ์ ํ๋ ๊ฐ์
- FN์ด ์ฆ๊ฐํ๋ ๋ ์ข์ง ๋ชปํ ๊ฒฐ๊ณผ๋ฅผ ์ป์
k์ ๊ฐ์ 1, 5, 11, 15, 21, 27๋ก ๋ณ๊ฒฝํ์ฌ ์๋
# k ๊ฐ ๋ณํ
k.val <- c(1, 5, 11, 15, 21, 27)
wbcd_n <- as.data.frame(lapply(wbcd[2:31], normalize))
wbcd_train <- wbcd_n[1:469, ]
wbcd_test <- wbcd_n[470:569, ]
wbcd_train_label <- wbcd[1:469, 1]
wbcd_test_label <- wbcd[470:569, 1]
for (i in k.val) {
wbcd_test_pred <- knn(train=wbcd_train, test=wbcd_test,
cl=wbcd_train_label, k=i)
print(CrossTable(x=wbcd_test_label, y=wbcd_test_pred,
prop.chisq=F))
}
> for (i in k.val) {
+ wbcd_test_pred <- knn(train=wbcd_train, test=wbcd_test,
+ cl=wbcd_train_label, k=i)
+ print(CrossTable(x=wbcd_test_label, y=wbcd_test_pred,
+ prop.chisq=F)$t)
+ }
Cell Contents
|-------------------------|
| N |
| N / Row Total |
| N / Col Total |
| N / Table Total |
|-------------------------|
Total Observations in Table: 100
| wbcd_test_pred
wbcd_test_label | Benign | Malignant | Row Total |
----------------|-----------|-----------|-----------|
Benign | 59 | 2 | 61 |
| 0.967 | 0.033 | 0.610 |
| 0.952 | 0.053 | |
| 0.590 | 0.020 | |
----------------|-----------|-----------|-----------|
Malignant | 3 | 36 | 39 |
| 0.077 | 0.923 | 0.390 |
| 0.048 | 0.947 | |
| 0.030 | 0.360 | |
----------------|-----------|-----------|-----------|
Column Total | 62 | 38 | 100 |
| 0.620 | 0.380 | |
----------------|-----------|-----------|-----------|
y
x Benign Malignant
Benign 59 2
Malignant 3 36
Cell Contents
|-------------------------|
| N |
| N / Row Total |
| N / Col Total |
| N / Table Total |
|-------------------------|
Total Observations in Table: 100
| wbcd_test_pred
wbcd_test_label | Benign | Malignant | Row Total |
----------------|-----------|-----------|-----------|
Benign | 60 | 1 | 61 |
| 0.984 | 0.016 | 0.610 |
| 0.968 | 0.026 | |
| 0.600 | 0.010 | |
----------------|-----------|-----------|-----------|
Malignant | 2 | 37 | 39 |
| 0.051 | 0.949 | 0.390 |
| 0.032 | 0.974 | |
| 0.020 | 0.370 | |
----------------|-----------|-----------|-----------|
Column Total | 62 | 38 | 100 |
| 0.620 | 0.380 | |
----------------|-----------|-----------|-----------|
y
x Benign Malignant
Benign 60 1
Malignant 2 37
Cell Contents
|-------------------------|
| N |
| N / Row Total |
| N / Col Total |
| N / Table Total |
|-------------------------|
Total Observations in Table: 100
| wbcd_test_pred
wbcd_test_label | Benign | Malignant | Row Total |
----------------|-----------|-----------|-----------|
Benign | 60 | 1 | 61 |
| 0.984 | 0.016 | 0.610 |
| 0.952 | 0.027 | |
| 0.600 | 0.010 | |
----------------|-----------|-----------|-----------|
Malignant | 3 | 36 | 39 |
| 0.077 | 0.923 | 0.390 |
| 0.048 | 0.973 | |
| 0.030 | 0.360 | |
----------------|-----------|-----------|-----------|
Column Total | 63 | 37 | 100 |
| 0.630 | 0.370 | |
----------------|-----------|-----------|-----------|
y
x Benign Malignant
Benign 60 1
Malignant 3 36
Cell Contents
|-------------------------|
| N |
| N / Row Total |
| N / Col Total |
| N / Table Total |
|-------------------------|
Total Observations in Table: 100
| wbcd_test_pred
wbcd_test_label | Benign | Malignant | Row Total |
----------------|-----------|-----------|-----------|
Benign | 61 | 0 | 61 |
| 1.000 | 0.000 | 0.610 |
| 0.953 | 0.000 | |
| 0.610 | 0.000 | |
----------------|-----------|-----------|-----------|
Malignant | 3 | 36 | 39 |
| 0.077 | 0.923 | 0.390 |
| 0.047 | 1.000 | |
| 0.030 | 0.360 | |
----------------|-----------|-----------|-----------|
Column Total | 64 | 36 | 100 |
| 0.640 | 0.360 | |
----------------|-----------|-----------|-----------|
y
x Benign Malignant
Benign 61 0
Malignant 3 36
Cell Contents
|-------------------------|
| N |
| N / Row Total |
| N / Col Total |
| N / Table Total |
|-------------------------|
Total Observations in Table: 100
| wbcd_test_pred
wbcd_test_label | Benign | Malignant | Row Total |
----------------|-----------|-----------|-----------|
Benign | 61 | 0 | 61 |
| 1.000 | 0.000 | 0.610 |
| 0.924 | 0.000 | |
| 0.610 | 0.000 | |
----------------|-----------|-----------|-----------|
Malignant | 5 | 34 | 39 |
| 0.128 | 0.872 | 0.390 |
| 0.076 | 1.000 | |
| 0.050 | 0.340 | |
----------------|-----------|-----------|-----------|
Column Total | 66 | 34 | 100 |
| 0.660 | 0.340 | |
----------------|-----------|-----------|-----------|
y
x Benign Malignant
Benign 61 0
Malignant 5 34
Cell Contents
|-------------------------|
| N |
| N / Row Total |
| N / Col Total |
| N / Table Total |
|-------------------------|
Total Observations in Table: 100
| wbcd_test_pred
wbcd_test_label | Benign | Malignant | Row Total |
----------------|-----------|-----------|-----------|
Benign | 61 | 0 | 61 |
| 1.000 | 0.000 | 0.610 |
| 0.924 | 0.000 | |
| 0.610 | 0.000 | |
----------------|-----------|-----------|-----------|
Malignant | 5 | 34 | 39 |
| 0.128 | 0.872 | 0.390 |
| 0.076 | 1.000 | |
| 0.050 | 0.340 | |
----------------|-----------|-----------|-----------|
Column Total | 66 | 34 | 100 |
| 0.660 | 0.340 | |
----------------|-----------|-----------|-----------|
y
x Benign Malignant
Benign 61 0
Malignant 5 34
์ ๋ฆฌ
k ๊ฐ | FN | FP | ์๋ฌ์จ |
---|---|---|---|
1 | 3 | 2 | 5% |
5 | 2 | 1 | 3% |
11 | 3 | 1 | 4% |
15 | 3 | 0 | 3% |
21 | 5 | 0 | 5% |
27 | 5 | 0 | 5% |