-
Notifications
You must be signed in to change notification settings - Fork 1
/
versions.txt
11 lines (8 loc) · 2.77 KB
/
versions.txt
1
2
3
4
5
6
7
8
9
10
11
Словарь lexx существует в следующих версиях:
1. файл TTS.lexx
Это основной и наиболее полный словарь, постоянно пополняемый. Если при его использовании не наблюдается проблем с производительнойстью, рекомендуется использовать именно его. Другие версии ниже - производные от основного словаря. Эти версии следует использовать, если есть проблемы с производительностью при использвании основного словаря. Все производные словари могут обновляться редко или не обновляться вообще и не содержат шаблоны regex. Практическая пользя от этих версий невелика, т.к. есть возмжность получить "частные" словари для одной или нескольких книг.
2. OLD/lecron-yymmdd-n.lexx, где yymmdd - дата, n - версия файла внутри указанной даты.
Словарь, который содержит только шаблоны, которые сработали на слова из списка из этого сообщения на формуме https://4pda.to/forum/index.php?s=&showtopic=200728&view=findpost&p=111371974. Предполагается, что данный словарь содержит в основном реально встречающиеся в текстах слова.
Из исходного файла была предварительно удалена часть словоформ: слова, включающие что-либо кроме букв русского алфавита, слова с дефисами и слова с 3 и более гласными подряд. Частотный анализ исходника в данном случае НЕ проводился.
3. OLD/mini-yymmdd-n.lexx, где yymmdd - дата, n - версия файла внутри указанной даты.
Частотный сводный словарь. Включенные шаблоны: (1) срабатывают на слова, из файла Lecron с частотностью более 50; (2) слова из файла http://speakrus.ru/dict2/hagen_freq_desc.rar; (3) слова из списка подтвержденных ошибок; (4) также включены все шаблоны из основного словаря, где левая часть шаблона не равна правой (при удаленном ударении).