Skip to content

kagnes/prevcons

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

37 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

PrevCons – igekötős igei hapaxok adatbázisa

A PrevCons (Preverb Constructions) egy nyílt hozzáférésű adatbázis, amely 21 038 igekötős hapaxot tartalmaz azok lehetséges vonzatkeretével együtt. Ezen felül számos metaadat érhető el benne a hapaxok morfológiai szerkezetéről, szemantikájáról és konkrét szövegbeli előfordulásáról. Az adatbázisról az oldal alján feltüntetett publikációk nyújtanak részletes tájékoztatást.

A PrevCons webes keresőfelület segítségével is böngészhető: https://aszalo.herokuapp.com/

A keresőfelületet Indig Balázs készítette.

Az erőforrás szerkezete

A PrevCons elérhető TSV fájlként (PrevCons.tsv) és SQLite adatbázisként is (PrevCons.sqlite3). Ezek pusztán a formátumukat tekintve térnek el egymástól, tartalmilag megegyeznek. A két formátumot az indokolja, hogy a számítógépes feldolgozáshoz praktikusabb lehet a TSV, a kézi adatelemzéshez pedig az SQLite-alapú megoldás. Az erőforrás 16 oszlopból áll, amelyek a következők:

  1. id: az igekötős ige egyedi azonosítója

  2. prev: igekötő

  3. verb: igelemma

  4. actform: az igekötős ige szóalakja

  5. argframe: az igekötős ige lehetséges (automatikus módszerrel kinyert) vonzatkerete

  6. prev_prod: az igekötő terjeszkedő produktivitása (a PrevLex 2019/06/17-i verziója alapján)

  7. prev_hapaxes: az igekötőt tartalmazó hapaxok darabszáma (a PrevLex 2019/06/17-i verziója alapján)

  8. inputtype: az ige esetében azonosított szóalkotási mód

  9. suffixtype: a képző vagy hangzásséma típusa

  10. phonotype: amennyiben hangzássémába illeszkedik az ige, itt látható a teljes CV-séma

  11. style: a forrásmondat stílusregisztere

  12. region: a régió, amelyből a forrásmondat származik

  13. w2v_input: az automatikus klaszterezés bemeneti szava (ide szóképzéssel létrejött ige esetében az alapszó kerül, pl. trollkodiktroll, hangzássémás ige esetében ugyanaz, mint az igelemma)

  14. w2v_cluster: annak a klaszternek az azonosító száma, amelybe a w2v_input mező szava került a szóbeágyazás során

  15. clause: az a tagmondat, amely az igekötős igét tartalmazza

  16. sent: a teljes mondat, amely az igekötős igét tartalmazza

Kiegészítő anyag

A PrevCons.sqlite3 fájl böngészéséhez az SQLite_útmutató.pdf nyújt technikai segítséget.

Licensz

A PrevCons a GPL-3.0 licensz alá tartozik. Amennyiben felhasználja az adatbázist, kérem, hogy hivatkozza az alábbi publikációk egyikét:

Kalivoda Ágnes (2021). Az igekötők produktív kapcsolódási mintái. Argumentum 17. p. 56-82. https://doi.org/10.34103/ARGUMENTUM/2021/4

@article{kalivoda2021,
    title = {Az igekötők produktív kapcsolódási mintái},
    journal = {Argumentum},
    volume = {17},
    year = {2021},
    pages = {56--82},
    author = {Kalivoda, {\'A}gnes},
    DOI = {https://doi.org/10.34103/ARGUMENTUM/2021/4}
}

Kalivoda Ágnes (2021). Igekötős szerkezetek a magyarban. Doktori értekezés. Pázmány Péter Katolikus Egyetem, Bölcsészet- és Társadalomtudományi Kar, Nyelvtudományi Doktori Iskola. Budapest. Megjelenés alatt.

@phdthesis{kalivoda2021,
	address = {Budapest},
	type = {Doktori értekezés},
	title = {Igekötős szerkezetek a magyarban},
	school = {Pázmány Péter Katolikus Egyetem, Bölcsészet- és Társadalomtudományi Kar, Nyelvtudományi Doktori Iskola},
	author = {Kalivoda, {\'A}gnes},
	year = {2021}
}

About

PrevCons – igekötős igei hapaxok adatbázisa

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published