L’enorme quantità di informazioni contenuta nei progetti Wikimedia è una miniera pronta ad essere sfruttata in modo creativo e innovativo.
Dall’interesse verso l’etimologia e i progetti open source di Ester Pantaleo, freelance italiana specializzata in data science, è nato lo scorso anno Etytree (da ‘etymology’ + ‘tree’), un dizionario interattivo in forma grafica per la visualizzazione dell’etimologia delle parole, basato sui dati contenuti nel Wiktionary inglese. Wikimedia Foundation ha ritenuto il progetto interessante e lo ha supportato inizialmente con un grant.
Quando sento una nuova parola, in italiano o in un’altra lingua, mi chiedo sempre da dove derivi, per memorizzarla e per capirne il significato. – racconta Ester – Cerco la parola su un dizionario etimologico, spesso il Wikizionario, quindi visualizzo un albero con tutte le connessioni con altre parole che già conosco e che hanno la stessa radice: questo metodo mi aiuta ad imparare nuove parole e a memorizzarle con più velocità. Data la mia esperienza nella ricerca e nella programmazione ho pensato di realizzare io stessa uno strumento per la visualizzazione dell’etimologia in grado di creare un albero genealogico delle parole. L’etimologia nel Wiktionary inglese è scritta in modo tale per cui un algoritmo può estrarre abbastanza facilmente le relazioni etimologiche dalle sezioni dedicate. In 6 mesi ho lavorato alla realizzazione di una prima versione di Etytree, che è disponibile online (in versione BETA) sul sito Wikimedia Labs.
Sulla piattaforma l’utente può inserire nella barra di ricerca la parola di cui vuole ricercare l’etimologia. Una volta premuto il tasto invio, si accede a una pagina di disambiguazione in forma visuale; una volta individuata la parola esatta a cui è interessato, con un doppio click sul nodo accanto alla parola l’utente può visualizzare tutti i lemmi che sono etimologicamente connessi.
Al momento il database di Etytree contiene più di 6 milioni di parole in quasi 3500 lingue; la maggior parte dei lemmi disponibili sono inglesi, ma sono già presenti oltre 50000 parole italiane.
Il tool è funzionante, ma va certamente migliorato, perché la visualizzazione contiene molti dati e alcune imperfezioni nell’algoritmo di estrazione – aggiunge Ester – Per questo sto chiedendo a Wikimedia Foundation un rinnovo del ‘grant’ per poter lavorare ancora 8 mesi sul progetto, in modo tale da raggiungere un risultato finale simile a quello visualizzato in questa demo”.
I progetti vengono finanziati dalla Wikimedia Foundation se ricevono il supporto della comunità. Se pensate che Etytree possa essere un ausilio per l’apprendimento delle lingue o anche semplicemente per ampliare in modo piacevole le vostre conoscenze, potete supportare il progetto di Ester a questo link, effettuando il login alla piattaforma e aggiungendo un commento alla fine della pagina.