Создает базу данных и заполняет ее данными из задания VKDumper
Скачивает посты из вконтакте по заданному городу. Файл с дампом постов пользователей из города Унеча прилагается.
Преобразование корпуса XML в PRS и обратно
Краулер для автоматического сбора корпуса по "Унечской газете" с использованием lxml и регулярных выражений.
Парсинг китайского словаря и автоматическая разметка китайского текста с построением XML-документа через lxml.
Построение частотного словаря по дампу википедии.
Транскрибирование текстов на грузинском
Транскрибирование текстов на амхарском
Дампер ирландского словаря с парсингом в json