Срок выполнения работы: по 25 апреля
В данной работе нужно разработать три класса, каждый из которых представляет собой генератор текста, работающий по определенному алгоритму. Входные данные для алгоритмов скачиваются по адресам, указанным в задании.
Метод Main должен последовательно вызывать методы генерации из 3-х классов и создавать 3 выходных файла с текстом, объемом не менее 1000 единиц. Эти файлы прикладываются к заданию.
Разработать генератор текста на основе пар букв (биграмм). Используются вероятностные свойства сочетаний пар символов.
Данные по биграммам можно взять отсюда: http://statistica.ru/local-portals/data-mining/analiz-tekstov/
Они представлены в виде таблицы и сведены к весам, что облегчает обработку для случайного генерирования.
Разработать генератор текста на основе частотных свойств слов
Данные о частотах (топ-100) можно взять отсюда:
https://ruscorpora.ru/new/1grams.top.html
Разработать генератор текста на основе частотных свойств пар слов
Данные о частотах (топ-100) можно взять отсюда:
https://ruscorpora.ru/new/2grams.top.html
см. репозиторий mod-branches
Для выполнения работы необходимо:
- Выполнить fork репозитария в свой аккаунт.
- Выполнить клонирование репозитария из своего аккаунта к себе на локальную машину (
git clone
). - Создать ветку git с индивидуальным номером (
git branch имя_ветки
). - Сделать ветку активной (
git checkout имя
). - Необходимо разместить как исходные файлы с решениями задач, поместив cpp файлы в src, а заголовочные - в include.
- Добавить файлы в хранилище (
git add
). - Выполнить фиксацию изменений (
git commit -m "комментарий"
). - Отправить содержимое ветки в свой удаленный репозитарий (
git push origin имя_ветки
). - Создать пул-запрос в репозитарий группы и ждать результата от GitHub Actions.