Si chiama ‘il Mago della Ghigliottina’ il risolutore automatico del gioco finale proposto nella trasmissione televisiva Rai “L’Eredità”, in onda ogni sera su Rai 1. Il gioco consiste, come si sa, nel trovare la parola chiave che possa fungere da nesso comune ai cinque indizi. E se un sistema d’intelligenza artificiale potesse riuscire a indovinare la parola corretta? È la sfida che ha ispirato il lavoro del gruppo di ricerca di ‘Linguistica Computazionale e Trattamento Automatico del Linguaggio Naturale’ de L’Orientale, l’Unior NLP Reasearch Group, di cui è referente la prof.ssa Johanna Monti. Sviluppato dalla docente insieme a Federico Sangati e Antonio Pascucci, il sistema – inizialmente denominato ‘UNIOR4NLP’ – ha già partecipato due volte alle sfide lanciate dalla campagna di valutazione biennale EVALITA, nel 2018 e poi nel 2020, concorrendo la seconda volta per il task Ghigliottin-AI. Ed è stato in quest’ultima occasione che l’applicazione Unior si è rivelata essere la più efficace nella sfida con i competitor, riuscendo inoltre a ottenere prestazioni migliori rispetto ai veri campioni del quiz televisivo.
Un risultato notevole che è frutto delle ricerche nell’ambito della linguistica computazionale verso cui da molti anni si orienta il Dipartimento di Studi Letterari, Linguistici e Comparati, dove nel 2016 è nato il gruppo in cui studenti, dottorandi, postdoc e docenti si dedicano ad applicazioni in grado di comprendere il linguaggio naturale. È dal 2017, infatti, che questo progetto era in cantiere presso il Dipartimento, fin quando – spiega la docente – “non abbiamo capito di dover finalizzare il sistema su determinati dati linguistici”: le parole polirematiche. Ovvero le unità lessicali composte da almeno due parole e il cui significato non è dato dall’associazione dei significati delle singole parole, “come, ad esempio, ‘mandare dentro’ con il significato di imprigionare o espressioni idiomatiche del tipo ‘attaccare bottone’ per dire trattenere qualcuno con chiacchiere inutili”. Il lavoro collettivo è proseguito, quindi, estraendo i dati linguistici e i loro aspetti semantico-sintattici dal Dizionario De Mauro e da altre risorse linguistiche come i corpora, tra cui Wikipedia, per capire le concorrenze più frequenti che ricorrono tra le parole e mettere alla prova l’algoritmo con un compito statistico. “Date cinque opzioni che non sono in relazione tra loro, come disco, muro, casa, amico, colpo, la parola soluzione telefono è difatti quella che compare più spesso in riferimento al lemma indizio”.
In teoria, un sistema quasi infallibile se non fosse che “la maggior parte delle parole che computiamo sono sostantivi. Quando la soluzione del gioco è, per esempio, un verbo o un’altra parte del discorso oppure quando non ci sono collegamenti così intuitivi, le possibilità di associazione sono potenzialmente infinite e può non funzionare”.
Il Mago della Ghigliottina, che è disponibile oltre che molto seguito su Twitter e Telegram, è usato ormai quotidianamente all’interno di una famosa app chiamata ‘Ghigliottiniamo’. “Questa app consente al pubblico di risolvere il gioco in contemporanea al concorrente in gara nel programma. Finora abbiamo ottenuto la risposta corretta circa il 70% delle volte. Così, per divertimento, dall’inizio di quest’anno stiamo calcolando quanto avremmo vinto se avessimo partecipato con il Mago al gioco”. Il responso? “Siamo già a oltre 700.000 euro di vincite”.
Un risultato notevole che è frutto delle ricerche nell’ambito della linguistica computazionale verso cui da molti anni si orienta il Dipartimento di Studi Letterari, Linguistici e Comparati, dove nel 2016 è nato il gruppo in cui studenti, dottorandi, postdoc e docenti si dedicano ad applicazioni in grado di comprendere il linguaggio naturale. È dal 2017, infatti, che questo progetto era in cantiere presso il Dipartimento, fin quando – spiega la docente – “non abbiamo capito di dover finalizzare il sistema su determinati dati linguistici”: le parole polirematiche. Ovvero le unità lessicali composte da almeno due parole e il cui significato non è dato dall’associazione dei significati delle singole parole, “come, ad esempio, ‘mandare dentro’ con il significato di imprigionare o espressioni idiomatiche del tipo ‘attaccare bottone’ per dire trattenere qualcuno con chiacchiere inutili”. Il lavoro collettivo è proseguito, quindi, estraendo i dati linguistici e i loro aspetti semantico-sintattici dal Dizionario De Mauro e da altre risorse linguistiche come i corpora, tra cui Wikipedia, per capire le concorrenze più frequenti che ricorrono tra le parole e mettere alla prova l’algoritmo con un compito statistico. “Date cinque opzioni che non sono in relazione tra loro, come disco, muro, casa, amico, colpo, la parola soluzione telefono è difatti quella che compare più spesso in riferimento al lemma indizio”.
In teoria, un sistema quasi infallibile se non fosse che “la maggior parte delle parole che computiamo sono sostantivi. Quando la soluzione del gioco è, per esempio, un verbo o un’altra parte del discorso oppure quando non ci sono collegamenti così intuitivi, le possibilità di associazione sono potenzialmente infinite e può non funzionare”.
Il Mago della Ghigliottina, che è disponibile oltre che molto seguito su Twitter e Telegram, è usato ormai quotidianamente all’interno di una famosa app chiamata ‘Ghigliottiniamo’. “Questa app consente al pubblico di risolvere il gioco in contemporanea al concorrente in gara nel programma. Finora abbiamo ottenuto la risposta corretta circa il 70% delle volte. Così, per divertimento, dall’inizio di quest’anno stiamo calcolando quanto avremmo vinto se avessimo partecipato con il Mago al gioco”. Il responso? “Siamo già a oltre 700.000 euro di vincite”.
Sabrina Sabatino
Scarica gratis il nuovo numero di Ateneapoli su www.ateneapoli.it