ENEA a ECCV2022
Nell’ultima settimana di ottobre scorso si è tenuta a Tel Aviv la European Conference on Computer Vision (ECCV) 2022, una delle più importanti conferenze europee del settore che si tiene ogni due anni. ENEA è stata invitata a presentare una dimostrazione del lavoro di digitalizzazione semantica tramite algoritmi di machine learning degli archivi doganali del porto di Londra del XVII e XVIII secolo. Il sistema è stato progettato e sviluppato dagli assegnisti Claudio Ronchetti, Serena D’Onofrio, Nicola Quercioli e Marco Puccini in collaborazione con il gruppo di lavoro di intelligenza artificiale di TERIN-ICT, con l’Università di Rotterdam (NL), l’Università di Helsinki (FI) e l’Università do Minho (PT). Il lavoro si suddivide in una serie di step funzionali collegati tra loro, sviluppati ed implementati sull’infrastruttura CRESCO, basati principalmente sull’utilizzo delle architetture di reti più recenti, denominate “Transformers”.
Dopo una prima fase di preprocessamento delle immagini sorgenti, a valle di una fase di etichettatura delle immagini, un algoritmo è in grado di individuare le aree nelle quali si riscontra del testo calligrafico. Successivamente, questo testo è trasformato nel suo equivalente digitale e parallelamente viene riconosciuta la struttura tabellare del registro, per poi assegnare ogni testo calligrafico alla sua corretta cella digitale e quindi arrivare ad una rappresentazione semantica a grafo del contenuto del registro. Il risultato di quanto fatto non è semplicemente una banale trascrizione di un testo storico, ma qualcosa di più: si vuole mantenere la struttura tabellare originale del dato in modo che gli esperti di settore (storia dell’economia) possano accedere ed analizzare l’archivio nella sua forma digitale. L’output ottenuto può essere quindi facilmente analizzato e manipolato permettendo all’utente finale di poter estrarre con facilità informazioni ad alto livello di elaborazione per percorrere linee di ricerca cruciali nella disciplina di appartenenza.
Questo tipo di applicazione ha dimostrato la propria rilevanza anche per via dell’interesse suscitato da addetti ai lavori sia per quanto riguarda il campo di applicazione sia per quanto riguarda la parte algoritmica e sono già pervenute ad ENEA richieste per applicare le suddette tecnologie ad altri archivi di documenti storici.
L’evento si è dimostrato essere per ENEA un’ottima opportunità di apprendimento, di confronto a livello internazionale, di dimostrazione delle conoscenze e capacità acquisite e di definizione di nuove relazioni per future collaborazioni, in un ambito competitivo ed in continua evoluzione come quello della computer vision.