Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Expand part selection for query by example #247

Open
oktaal opened this issue Sep 24, 2021 · 0 comments
Open

Expand part selection for query by example #247

oktaal opened this issue Sep 24, 2021 · 0 comments

Comments

@oktaal
Copy link
Member

oktaal commented Sep 24, 2021

We breiden de keuzemogelijkheden voor het maken van de query parse op basis van een voorbeeldzin uit. Dat is ook om andere redenen wenselijk. Momenteel moet je als je een woord selecteert minimaal de pos kiezen en krijg je er altijd de relatie bij als er ook andere woorden in de query boom staan. Maar je zou de optie moeten hebben om wel de relatie maar niet de pos te kiezen, of wel de pos maar niet de relatie. Dit alles in de advanced opties.

De advanced opties sluiten elkaar allemaal uit (m.u.v. case sensitive dat alleen gekozen kan worden in combinatie met de keuze word:

  • Word: The exact word form (also known as token)
  • case sensitive: If the word option is selected, you can choose to look for case-sensitive occurrences
  • Lemma: Word form that generalizes over inflected forms. For example: gaan is the lemma of ga, gaat, gaan, ging, gingen, and gegaan
  • word class: classShort Dutch part-of-speech tag. The different tags are: n (noun), ww (verb), adj (adjective), lid (article), vnw (pronoun), vg (conjunction), bw (adverb), tw (numeral), vz (preposition), tsw (interjection), spec (special token), and let (punctuation)
  • detailed word class
  • optional in search
  • not in search

het zou moeten worden (met de betekenis ervan in XPath uitgedrukt:

  • REL: elkaar uitsluitend:
    • this relation (default) : @rel=relval
    • not this relation: not(@rel=relval)
    • any relation: @rel
  • Word Class:
    • This pos (default): @pt=ptval
    • Not this pos: not(@pt=ptval)
    • Any pos: @pt
  • Detailed word class:
    • These details: all other values
    • Not these details: not (all other values)
    • Any details (default)
  • Lemma
    • This lemma: @lemma=lemmaval
    • Not this lemma: not(@lemma=lemmaval)
    • Any lemma (default):
  • Word
    • Word itself
      • This word: lower-case(@word)=lower-case(wordval)
      • Not this word: not(@word=wordval)
      • Any word (default):
    • Case sensitive (can only be selected if this word or not this word has been selected):
      • Case sensitive: true or false
  • Optional
    • If selected, do not include the node in the query tree

Voor de io-do query selecteren we dan in de voorbeeldzin Zij gaf het hem

  • Zij: optional
  • Gaf: this word class
  • Het: this rel and any word class
  • Hem: this rel and any word class

//node[@cat and node[@rel="hd" and @pt="ww"] and node[@rel="obj2"] and node[@rel="obj1"]]

We kunnen nu ook:

  • Any rel np complement to a verb: //node[@cat and node[@rel="hd" and @pt="ww"] and node[@cat="np"]]
  • Any obj1 to a verb: //node[@cat and node[@rel="hd" and @pt="ww"] and node[@rel="obj1"]]
  • Any np to a verb that is not a specific rel: //node[@cat and node[@rel="hd" and @pt="ww"] and node[@cat=”np” and not(@rel="obj1")]]
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant