Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

lemma -tag checks #4

Open
Irishx opened this issue Feb 1, 2019 · 3 comments
Open

lemma -tag checks #4

Irishx opened this issue Feb 1, 2019 · 3 comments
Assignees

Comments

@Irishx
Copy link

Irishx commented Feb 1, 2019

iets om te checken:

Er is een probleem met lemma van 'erg' dat als 'heel' gelabeled wordt.

blijkbaar gaat 'zijn' ook vaak fout: werkwoord versus possesive.

@kosloot
Copy link
Contributor

kosloot commented Feb 1, 2019

@Irishx het 'heel'-'erg- probleem is alleen zichtbaar in (Open-)Sonar doordat <alt> nodes daar ook geïndexeerd worden. Dat gaat zowel in OpenSonar als in Frog aangepast worden.

@Irishx treedt dat probleem met 'zijn' ook op in Sonar? Of staat het los ervan? En heb je dan voorbeelden?

@kosloot
Copy link
Contributor

kosloot commented Feb 1, 2019

Ok ik heb een voorbeeld gevonden in Sonar:

"hij beweegt heel erg zijn armen"
Hierin is 'zijn' als WW getagt.

Dat is inderdaad ook precies wat Frog, en dus MBT doet met die zin.
Ik vrees dat dit dus niet simpel op te lossen is, tenzij iemand de tagger hertrained met dit soort voorbeelden.

@kosloot
Copy link
Contributor

kosloot commented Feb 4, 2019

Ik heb nog wat gevallen opgezocht in OpenSonar+. (zie attachment )
In bijna alle gevallen doet ook de huidige MBT precies hetzelfde. Dus 'zijn' als WW taggen ipv. VNW.
Ik zie niet echt systematiek.
Waarom de huidige MBT er een paar nu WEL goed doet weet ik niet. Er is weinig veranderd aan de POS tagger de laatste jaren.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants