Skip to content

Latest commit

 

History

History
41 lines (38 loc) · 4.13 KB

README.md

File metadata and controls

41 lines (38 loc) · 4.13 KB

Робоче репо золотого корпусу. Звідси скриптами будуються українські Universal Dependencies.
Використовуйте 👉збудовану версію, викладену на UD: вона має стандартний стабільний формат. Працюйте над створенням золота — тутечки.


екосистема

  1. машинка (морфо-анотатор)
    1. статистика (наперед треба увійти в анотатор)
  2. NoSketch Engine (корпусний рушій)
  3. синт
    1. brat (синтакс-анотатор)
    2. можливо-помилки в робочій версії
    3. дірки в робочій версії
    4. conllu робочої версії
    5. Turku (синтакс-пошук):
      1. наш
      2. фінський
    6. UD
      1. гітхаб-репо нашого трібанку
        1. стабільна гілка
        2. робоча гілка
      2. що нового
      3. наші питання в UD
        1. відкриті
        2. закриті
      4. репорт валідатора всіх мов
      5. репорт валідатора наш
      6. архів розсилки
  4. Intertext (вирівнювач паралельних корпусів)
  5. документація
    1. специфікація позначок
  6. іш’юзи
  7. гуглдоки
    1. протокол морфологічного розмічування
    2. підручник зі синтакс розмічування
    3. роботи над помилками / старі „як це позначати“
    4. інструкція з кореференції
  8. mova.institute (титульний сайт)
    1. сторінка про цей корпус
    2. демо аналізатора