Skip to content

annaska/wiki-author-sum

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

19 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

wikiAuthorEdits

Übung mit Apache Flink und Wikipedia XML Dump Files

Testinputs von: https://dumps.wikimedia.org/backup-index.html

Liest aus Wikipedia XML Dump Files (Format wird dabei noch nicht geprüft!) die Namen der Autoren ein und gibt sie mit der Summe ihrer Edits für Pages in Namespace 0 aus. Dabei werden die XML-Files aus dem Input-Ordner eingelesen. Getestet wurde mit kleinen XML-Files.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages