-
Notifications
You must be signed in to change notification settings - Fork 12
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
PRON or DET lacks the PronType feature #365
Comments
Considerar o resultado da query http://match.grew.fr/?corpus=UD_Portuguese-Bosque@dev&custom=6183caa64d364&clustering=A.upos caso relacionado ao UniversalDependencies/UD_Portuguese-GSD#28 |
Em PT, não me parece que "o|a|os|as" possa ser pronome demonstrativo. Mas http://match.grew.fr/?corpus=UD_Portuguese-Bosque@dev&custom=618541eba8674 retorna 37 casos. Muitos casos de Aqui eu esperava um resultado muito menor:
|
Temos 39 casos pendentes neste issue de falta da feature PronType, os casos aqui cobertos tem intercessão com outros issues, podemos separar os casos deste issue da seguinte forma que devem ser tratados a parte com certo cuidado:
|
De fato, temos que rever varios pontos deste output, tokens com apenas uma feature me parecem um bom começo. btw, não me parece necessário manter um output desse tamanho aqui. |
@wellington36, o problema de fazer queries muito específicas focando apenas no problema 'sem PronType' é que não prestamos atenção aos outros casos do corpus e podemos introduzir mais inconsistência. Veja o caso de e ainda, se focamos apenas no par
investigando as relações, curioso ter um DET como nsubj. Então se olharmos a sintaxe mais confusão ainda.
|
Essa query mostra algumas possíveis questões a tratar, como cada com upos PROPN e ADV e lemma |
Interresante olhe http://match.grew.fr/?corpus=UD_Portuguese-Bosque@dev&custom=618fb8404d365&clustering=M.upos, esses casos deveriam ter sido tratados antes, no contexto dos issues #299 e #300 (casos concordancia), consideramos a concordancia entre ADJ com NOUN e DET com NOUN, porêm não consideramos os casos entre ADJ com PROPN e DET com PROPN. |
Seria bom se @leoalenc pudesse dar uma olhada em algumas destas queries. Eu corrigi 1-2 apenas para termos como sugestão de análise. Quase todas estas inconsistências ocorreram por conta de relações fixed usadas excessivamente (IMHO). |
Os (257) casos da query http://match.grew.fr/?corpus=UD_Portuguese-Bosque@dev&custom=6195210c8cfe6 estão contidos nesses 263, me parece interresante atacar esses casos. |
Corrigindo alguns casos do comentário acima provavelmente podemos corrigir via script adicionando Gender e Number, mas é interressante aproveitar e verificar de o PROPN deveria ser NOUN. |
We have many DET and PRON cases without the PronType feature (initially 49 cases), documented in https://universaldependencies.org/svalidation.html#pron-or-det-lacks-the-prontype-feature, found by command:
The text was updated successfully, but these errors were encountered: