Simple text classifier written in Julia for final project of Text Mining Course in Fakultas Ilmu Komputer Universitas Brawijaya.
- Run src/testclassification.jl
- Input your directory of data train and data test.
Example of directory structure.
├── Data latih
│ ├── class1
│ │ └── *.txt
│ ├── class2
│ │ └── *.txt
│ ├── class3
│ │ └── *.txt
│ └── class*
│ └── *.txt
└── Data uji
├── class1
│ └── *.txt
├── class2
│ └── *.txt
├── class3
│ └── *.txt
└─── class*
└── *.txt
- Naive-bayes with Laplace smoothing
- Rocchio
- KNN
- Inconsistent char index when data contains character besides UTF-8