-
Notifications
You must be signed in to change notification settings - Fork 0
/
readme-freq
26 lines (19 loc) · 1.39 KB
/
readme-freq
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
Информация о файле freqrnc2011.csv (кодировка UTF8, разрыв строк UNIX, разделитель полей табуляция).
Электронная версия издания:
О. Н. Ляшевская, С. А. Шаров, Частотный словарь современного русского языка (на материалах Национального корпуса русского языка). М.: Азбуковник, 2009. http://dict.ruslang.ru/freq.php
Алфавитный список лемм (общая лекика; имена собственные и аббревиатуры)
Список приводится в алфавитном порядке. Указаны:
Lemma – лемма (исходная форма слова),
PoS – часть речи,
Freq(ipm) – частота леммы на 1 миллион употреблений,
R (range) – число сегментов корпуса, в которых встретилась лемма (из 100 возможных),
D – коэффициент Жуйана,
Doc – число текстов, в которых встретилась лемма.
Словарь создан на основе современного подкорпуса Основного корпуса и Устного корпуса НКРЯ (1950-2007), общий объем 92 млн. словоупотреблений.
Более подробная информация - во "Введении к словарю" http://dict.ruslang.ru/freq.pdf.
При использовании ресурса просьба ссылаться на первоисточник:
О. Н. Ляшевская, С. А. Шаров, Частотный словарь современного русского языка (на материалах Национального корпуса русского языка). М.: Азбуковник, 2009.
(c) О. Н. Ляшевская, С. А. Шаров, 2009-2011.
(c) Национальный корпус русского языка, 2009-2011.
(c) Издательство "Азбуковник" (печатная версия словаря), 2009.
(с) А. В. Санников (создание сайта dict.ruslang.ru, техническая поддержка), 2008–2011.