This repository contains the human-readable representation of the HateSpeech Corpus. As the original dataset is provided as the export of MySQL tables in the MyISAM format, it is hardly parseable by any tool. This repository contains the same data, but converted to CSV, so it can be easily utilized.
Source: http://zil.ipipan.waw.pl/HateSpeech
Original dataset: http://zil.ipipan.waw.pl/HateSpeech?action=AttachFile&do=get&target=hatespeech.tar.bz2
Troszyński Marek, Wawer Aleksander (2017) Czy komputer rozpozna hejtera? Wykorzystanie uczenia maszynowego (ML) w jakościowej analizie danych.„Przegląd Socjologii Jakościowej”, t. 13, nr 2, s. 62‒80 [dostęp 6, 12, 2020]. Dostępny w Internecie: www.przegladsocjologiijakosciowej.org