Code für das Seminar “Information Retrieval” (siehe Seminarplan )
package | Inhalt | Ressourcen/Dependencies | Literatur |
basic | Korpus, Lineare Suche | Shakespeare | |
boole | Term-Dokument-Matrix, Invertierter Index | IIR Kap. 1 | |
preprocess | Vorverarbeitung | snowball stemmer | IIR Kap. 2 |
tolerant | Tolerant Retrieval | Apache Commons Lang, Apache Commons Codec | IIR Kap. 3 |
ranked | Ranked Retrieval: Termgewichtung, Vector Space Model | IIR Kap. 6 + 7 | |
evaluation | Evaluation: Precision, Recall, F-Maß | IIR Kap. 8 | |
lucene | Lucene: Indexer und Searcher | lucene-core, lucene-queryparser, lucene-analyzers-common | Lucene in Action |