Skip to content

Latest commit

 

History

History
27 lines (19 loc) · 1.26 KB

README.md

File metadata and controls

27 lines (19 loc) · 1.26 KB

HSE_Programming_Hometasks

PyDatabase

Создает базу данных и заполняет ее данными из задания VKDumper

VKDumper

Скачивает посты из вконтакте по заданному городу. Файл с дампом постов пользователей из города Унеча прилагается.

XML2PRS

Преобразование корпуса XML в PRS и обратно

NewspaperCorpora

Краулер для автоматического сбора корпуса по "Унечской газете" с использованием lxml и регулярных выражений.

Chinese Parser

Парсинг китайского словаря и автоматическая разметка китайского текста с построением XML-документа через lxml.

WikipediaExtractor

Построение частотного словаря по дампу википедии.

GeorgianIPA

Транскрибирование текстов на грузинском

AmkharianIPA

Транскрибирование текстов на амхарском

IrishDict

Дампер ирландского словаря с парсингом в json