Automatic data augmentation for Korean AMR
cr-dep-el-ner-pos-srl-wsd-za
: 150,082 items (Target of Annotation Synthesis)cr-dep-wsd-za
: 221,489 itemsel-ner
: 1,741,546 itemsel-ner-pos
: 223,962 itemswsd
: 123,636 items
- DEP로
penman
으로 인코딩 - 두 어절 이상에 걸친 우언적 구성을 기준으로 어절 군집화
- POS + WSD 활용하여 node 내부에 내용어와 기능어 분리
- NER + EL 적용
- SRL 적용
- ZA, CR 적용