Ultimo aggiornamento: 8 Aprile 2020
Questo documento presenta un elenco di strumenti digitali di linguistica che offrono applicazioni interessanti in ambito didattico e in linea con le attuali Indicazioni Nazionali per il curricolo scolastico. Il documento viene aggiornato costantemente, e descrive gli strumenti attualmente in uso nelle attività FEM.
Doccano | Annotazione di testi
Voyant Tools | Analisi quantitativa e visualizzazione di testi
Sistema operativo | Tutti: piattaforma web accessibile da qualsiasi browser. |
Supporto cellulare/tablet | |
Formati supportati (import) | .txt , json |
Lingue supportate | Qualsiasi |
Software per l’annotazione di testi: è possibile caricare testi a scelta, e creare etichette personalizzate per svolgere attività didattiche mirate.
Permette di lavorare su qualunque tipologia di analisi linguistica se si usano dataset targettizzati al livello linguistico della classe.
Grazie alla sua interfaccia semplice e dal funzionamento intuitivo, è possibile utilizzarlo per attività che spaziano dalla scuola primaria alla scuola secondaria di secondo grado (dunque da un livello basilare a uno più avanzato).
analisi grammaticale
analisi logica
analisi del periodo
analisi della violenza verbale sui social media
analisi di evidenzialità (autorevolezza delle fonti in un testo) su testi argomentativi
analisi di metafore concettuali
analisi di figure retoriche
varietà linguistiche dell’italiano
Possibilità di caricare testi in qualsiasi lingua, ed in diversi formati, tra cui .txt
(testo semplice) e json
.
Creazione di un numero illimitato di etichette personalizzate, e diverse per progetti diversi.
**Visualizzazione delle annotazioni **per ogni singolo utente.
Due modalità di annotazione:** individuale** o collaborativa.
Non è possibile assegnare più di un'etichetta alla stessa parola/frase annotata.
Il registro delle annotazioni non consente di visualizzare l'ordine o la cronologia delle operazioni.
Non supporta l'accesso da smartphone.
Software open source.
Gli unici dati raccolti sono quelli inseriti al momento della creazione dell'account.
Tutti i dati (informazioni dell'account; annotazioni) sono conservate su un server privato - nel nostro caso, in un server gestito da FEM.
Sistema operativo | Versione web: tutti, accessibile da qualsiasi browser Versione standalone: Windows, MacOS, Linux |
Supporto cellulare/tablet | |
Formati supportati (import) | .txt , docx , xml |
Lingue supportate | Qualsiasi |
E’ un software per l’analisi testuale e letteraria in chiave quantitativa, che offre diversi strumenti di analisi e visualizzazione.
Creato da Stéfan Sinclair (McGill University) e Geoffrey Rockwell (University of Alberta), a partire dalla teoria del Distant Reading sviluppata da Franco Moretti per l’esplorazione quantitativa e “distante” (ovvero, senza leggere i testi) della letteratura.
Alla base del Distant Reading c’è l’idea (provocatoria) di studiare la letteratura senza leggere libri. L’approccio quantitativo proposto da Moretti (e realizzabile attraverso Voyant) si basa sull’analisi di aspetti (frequenza delle parole, rappresentazioni grafiche delle relazioni tra personaggi, etc…) che solo una visione digitale d’insieme può fornire. Questi dettagli, strutturati in reti e grafi, permettono di scoprire dettagli non altrimenti identificabili attraverso una lettura “tradizionale”. Lo Stanford Literary Lab prosegue il lavoro sulla teoria e la metodologia del distant reading anche attraverso la pubblicazione di brevi pamphlet che raccontano - in maniera divulgativa - i risultati delle ricerche condotte. Una breve descrizione (in Inglese) dell’approccio Distant Reading è stata pubblicata dal New York Times; un articolo di approfondimento è invece disponibile a questo link.
A questo link è possibile accedere alla versione web dello strumento, che supporta anche l'accesso da smartphone. In alternativa è possibile scaricare una versione da eseguire sul proprio computer (Windows, MacOS, Linux) da questa pagina; selezionare l'ultima versione in formato zip. L'attuale versione (consultata il 25/03/2020) si chiama VoyantServer2_4-M36.zip
ed è disponibile da questo link diretto.
permette di caricare sia un testo completo sia il link a URL esterno, ad esempio una rivista online contenente articoli; anche qui, sono molteplici le caratteristiche testuali e linguistiche su cui si può operare (collocations, analisi quantitativa delle parole presenti nel testo/word frequency, visualizzazioni grafiche etc.)
Lo strumento fornisce molteplici funzionalità attraverso un'interfaccia intuitiva, supportata da una dettagliata documentazione. Offre la possibilità di approcciare testi (di qualsiasi tipologia e/o lingua) attraverso una visione quantitativa, lasciando quindi al docente e alla classe lo spazio per attività di interpretazione, comprensione, e riflessione sul testo.
analisi lessicale (in qualsiasi lingua)
antologia, letteratura italiana, o letteratura straniera a confronto
macro-analisi di testi e di correnti letterarie; ad esempio attraverso l'approccio Distant Reading, focalizzato sulla creazione di schemi per mettere in relazione concetti chiave ricorrenti come i personaggi e i luoghi citati in un testo o in diversi testi dello stesso autore.
Possibilità di caricare testi in qualsiasi lingua, ed in diversi formati - tra cui .txt
(testo semplice).
Possibilità di caricare testi già online, quindi tramite URL - ad esempio, attraverso link diretti dal Progetto Gutenberg.
Sviluppato e manutenuto dalla Stanford University.
I risultati possono essere facilmente condivisi tramite link diretto.
Disponibile in due "formati": da browser web, o come programma da installare localmente sul proprio PC.
È possibile caricare testi attraverso un link diretto ad un file di testo, rendendo lo strumento facilmente integrabile con testi presi dal sito Project Gutenberg (o altri siti che offrono opere letterarie in formato txt). Se si desidera caricare un testo da Project Gutenberg è necessario fornire a Voyant il link diretto al formato denominato Plain Text UTF-8.
Tutte le analisi e le relative visualizzazioni possono essere facilmente esportate in formato immagine, o è possibile generare un link per accedere direttamente alla visualizzazione scelta, rendendo la condivisione all’interno e all’esterno della classe molto semplice.
Nella home ci sono 5 box principali con le seguenti funzioni:
Cirrus
Crea un word cloud, cioè una rappresentazione grafica in cui le parole più frequenti in un corpus o documento sono al centro e più grandi.
Di seguito un esempio usando il dataset sul Climate Change di doccano (qui la versione fullscreen)
<iframe style='width: 60%; height: 600px;' src='https://voyant-tools.org/tool/Cirrus/?view=Cirrus&corpus=e849a58bda0069ef96ecd72dbe862e65'></iframe>Termini
Fornisce la lista delle parole con conteggio di frequenza. Possibili attività: dato un word cloud, riconoscere il testo e l’autore. Oppure confrontare due passaggi di un testo per ragionare sui collegamenti (similitudini e differenze) tra le due visualizzazioni (es. descrizioni di personaggi e luoghi)
Link
Grafo delle collocazioni a rete che mostra le parole con frequenza maggiore che appaiono vicino alla parola data. Possibili attività: far indovinare una poesia a partire dal grafo, come negli esempi seguenti con poesie di Leopardi; qui la versione fullscreen del primo esempio; qui la versione fullscreen del secondo esempio
<iframe style='width: 60%; height: 600px;' src='https://voyant-tools.org/tool/CollocatesGraph/?query=pensier&query=caro&query=colle&mode=corpus&corpus=835d7e392455d29e6bb7060b81eeefef'></iframe> <iframe style='width: 60%; height: 600px;' src='https://voyant-tools.org/tool/CollocatesGraph/?query=festa&query=giorno&query=d%C3%AD&mode=corpus&corpus=414f8f39b2700d5b19e9af9efd1bfcc8'></iframe>Lettore
Permette di consultare i testi presenti nel corpus, graficamente rappresentati con barre in fondo al box. Cliccando su una parola vengono fornite informazioni sulla frequenza e la loro distribuzione all’interno del testo (linea in fondo al box).
TermsBerry
È come Cirrus ma più preciso perchè oltre alla frequenza considera i collocati (parole che occorrono nel contesto). Possibili attività: scomporre un’opera in capitoli, osservare come cambia il contesto di alcune parole nello svolgersi della trama.
Andamenti
Presenta un grafico dell'andamento della frequenza relativa delle parole nel documento.
Possibili attività: confrontare concetti (es. matrimonio, soldi) per scoprire che relazione c’è e come si caratterizza. Il trend è come ci si aspettava? C’è un motivo perché devia? A seguire una proposta di analisi della parola “occhi” nella Divina Commedia qui la versione fullscreen
<iframe style='width: 60%; height: 600px;' src='https://voyant-tools.org/tool/Trends/?query=occhi&mode=document&corpus=0cda884ed26443243873a8479b10925b'></iframe>Contesti
Mostra ciascuna occorrenza di una parola chiave con una porzione di testo che lo circonda (contesto). Di seguito due esempi con il dataset Coronavirus presente su doccano. Il primo mostra come si parlava della Cina durante lo scoppio dell’epidemia attraverso le occorrenze della parola Cina (qui la versione fullscreen)
<iframe style='width: 60%; height: 600px;' src='https://voyant-tools.org/tool/Contexts/?query=cina&corpus=50d8266fc9a14a615f028ce5bf240e78'></iframe>Nel secondo si può osservare come si parla della Cina dopo lo scoppio dell’epidemia in Europa (qui la versione fullscreen)
<iframe style='width: 60%; height: 600px;' src='https://voyant-tools.org/tool/Contexts/?query=cina*&corpus=7f874731d8b644a836e26a6ea818266c'></iframe>Bubblelines
Visualizza ogni termine come una bolla, la cui dimensione indica la frequenza del termine.
RezoViz
Permette di rappresentare graficamente i collegamenti tra persone, organizzazioni e luoghi (sotto forma di nodi in un network graph) che vengono menzionati in documenti diversi. Possibili attività: creare collegamenti all’interno di opere di uno stesso autore allo scopo di verificare eventuali luoghi o personaggi che compaiono in modo ricorrente.
Mandala
È un tool di visualizzazione che permette, a partire da un termine chiave o magnete (scelto dall’utente) di attrarre a sé tutti i documenti che contengono quel termine in base alla sua frequenza relativa. A seguire due esempi:
Jane Austen (qui la versione fullscreen)
<iframe style='width: 60%; height: 600px;' src='https://www.voyant-tools.org/tool/Mandala/?query=mr&query=mrs&query=said&query=miss&query=think&query=know&query=good&query=time&query=little&query=soon&corpus=austen&subtitle=The%20Works%20of%20Jane%20Austen'></iframe>Dataset Brexit (qui la versione fullscreen)
<iframe style='width: 60%; height: 600px;' src='https://voyant-tools.org/tool/Mandala/?query=brexit&query=regno&query=johnson&query=unito&query=corbyn&query=labour&query=leader&query=anni&query=britannici&query=partito&corpus=44bbe58e3869c7071071cc58b46584a8'></iframe>Topics
Questo tool utilizza un algoritmo di topic modelling per creare dei cluster di parole (dei topic, temi) presenti nei testi. Gli esiti usando testi di fiction sono complessi da analizzare, e in generale il suo utilizzo è più apprezzato con non-fiction. Possibili attività: cercare di ricondurre i topics trovati dal tool a temi presenti nel romanzo secondo l’antologia. Oppure analizzare articoli di cronaca, come nell’esempio seguente sul Covid-19 (qui la versione fullscreen)
<iframe style='width: 60%; height: 600px;' src='https://voyant-tools.org/tool/Topics/?view=Topics&stopList=stop.it.italian.txt&corpus=d973efb95eb9f56881ee034bb91fac43'></iframe>Dreamscape - Visualizzare i luoghi menzionati nei testi per un viaggio virtuale
Questo strumento identifica i luoghi menzionati nel testo e suggerisce delle connessioni tra essi basandosi sulla sequenza con cui vengono menzionati nel testo. Data la semplicità dell’algoritmo, non è detto che ogni sequenza di luoghi sia significativa: perciò sarà ancora più interessante indagare se il collegamento creato dal tool identifichi un effettivo spostamento di persone, beni, idee, o altro e sia rilevante per l’analisi. Sarà anche possibile trovare errori (falsi positivi e negativi), quindi l’importante è non fidarsi al 100% dei dati ma far seguire sempre un’analisi critica. Possibili attività: studi interdisciplinari tra storia e letteratura.
Il seguente esempio mostra i luoghi menzionati nell’opera Olanda di Edmondo De Amicis, disponibile gratuitamente dall’apposita pagina su Project Gutenberg; (qui la versione fullscreen)
<iframe style='width: 957px; height: 317px;' src='https://voyant-tools.org/tool/DreamScape/?corpus=7e2a8c0f5b6bca79b6af1568c89fc0c2'></iframe>Possibile attività - extra
Voyant Tools si presta bene anche all’analisi dei propri testi. Si può proporre alla classe di creare un corpus con i testi di tutti gli studenti e poi analizzarli, per scoprire trend e difficoltà e promuovere autocorrezione e riflessione sui propri elaborati.