(Summary in english below)
Kod och material relaterat till seminariet #SOUhack i KB:s serie Kulturarvet som ettor och nollor. Dataset: https://data.kb.se/datasets/2015/02/sou/
Seminariet genomfördes 20 oktober på Kungl. biblioteket i Stockholm. På förmiddagen hölls öppna föreläsningar av forskare som arbetat med SOU-materialet.
-
Kort info om dagen av Peter Krantz, CIO på Kungl. biblioteket
-
Pelle Snickars, Umeå universitet
-
Gustav Holmberg: Expertis och intervention: Statens offentliga utredningar och 1900-talets vetenskapshistoria
-
Christopher Kullenberg: Statens röst digitaliserad (PDF)
-
Anders Fåk, Linköpings universitetsbibliotek: Fritextsökning för historiskt SOU-material
-
Hillevi Hägglöf, Textual Relations: Kvantitativ samhällsanalys med språkteknologiska metoder
På eftermiddagen genomfördes en open space-övning runt tre teman:
- Topic modeling / begrepp
- Temporal analys av teman
- Möjligheter att sammankoppla materialet med annat material
Ett 40-tal deltagare samarbetade runt olika analyser av Statens offentliga utredningar som text.
- Samtliga SOU:er (även de moderna) som textdumpar
https://www.dropbox.com/sh/fxtle6ie0zpd5x7/AAAeHOrPMRYqACoBpinoPIx4a?dl=0 http://scientometrics.flov.gu.se/files/SOU19222015.zip
-
Ordmoln över tid av Oivvio Polite/Liberationtech och ordvektorer per år
-
Topic modeling: http://github.com/michiexile/sou-hack-word2vec
The National Library of Sweden hosted the event #souhack to explore a specific document collection. Around 40 practitioners gathered to analyze bureaucratic texts through visualization and text analytics. The type of document - Statens offentliga utredningar - is a report published by government inquiry committees. The dataset used: https://data.kb.se/datasets/2015/02/sou/