-
Notifications
You must be signed in to change notification settings - Fork 0
lennes/puheen-annotaatio
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
Tässä arkistossa sijaitsevat "Puheen annotaatio eli nimikointi" -oppaan työtiedostot. Oppaan ovat yhteistyönä kirjoittaneet Mietta Lennes ja Sanna Ahjoniemi. Opas on tarkoitettu kaikille, jotka käsittelevät puheaineistoa ja haluavat nimikoida eli annotoida sitä. Oppaan ohjeita noudattamalla omat annotaatioperiaatteet ja annotaatiossa käytetyt yksiköt ja luokittelut tulevat selkeästi määritellyiksi ja dokumentoiduiksi, jolloin puheaineistoa on myös mahdollista jakaa muiden tutkijoiden kanssa. Opasta voi lukea sekä html-muotoisena verkkoversiona osoitteessa https://lennes.github.io/puheen-annotaatio/, että pdf-dokumenttina (https://github.com/lennes/puheen-annotaatio/blob/master/annotation_guide.pdf). Oppaan tuottaminen kuului osana Suomen Akatemian rahoittamaan SA-Puhe-konsortiohankkeeseen (Integrated resources for speech technology and spoken language research, vv. 2002-2004). Oppaan ensimmäinen versio julkaistiin vuonna 2004 ja viimeisin julkaistu versio on 1.01, joka on ollut verkossa saatavilla vuodesta 2005 alkaen. Pieniä merkistökorjauksia lukuunottamatta materiaali on siirretty GitHubiin 22.3.2018 lähes sellaisenaan. Opas on jäänyt osittain keskeneräiseksi. Se oli alun perin tarkoitettu käytettäväksi sekä SA-Puhe-hankkeessa kehitetyn Puh-editorin että esim. Praatin ja muiden vastaavien ohjelmien kanssa. Perusajatuksena on ollut, että eri ohjelmissa tuetaan ja vahvistetaan samoja annotaatiokäytänteitä. Puh-editori poistettiin valitettavasti käytöstä pari vuotta hankkeen päättymisen jälkeen, mutta oppaassa esitetyt perusideat lienevät edelleen puheaineistojen tutkijoille hyödyllisiä.
About
Lennes, Mietta & Ahjoniemi, Sanna (2005). Puheen annotaatio eli nimikointi.
Topics
Resources
Stars
Watchers
Forks
Packages 0
No packages published