Software Heritage, l’Archivio Universale dei Codici. Digressioni sul tema

Mercoledì 16 Marzo 2022, presso l’Aula Giorgio Prodi,  dell’Università di Bologna, l’Università di Bologna e l’ENEA, in collaborazione con Software Heritage e col supporto della fondazione iFAB (International Foundation Big Data and Artificial Intelligence for Human Development), hanno organizzato il 16 marzo us un pomeriggio di incontri per parlare di codici sorgente, componente fondamentale delle nuove tecnologie, e di come sia importante conservarli come fa Software Heritage, l’Archivio Universale dei codici. https://bobcl.cs.unibo.it/
Un evento che si è rivolto a tutti, che ha voluto essere un contributo verso una maggiore digital awareness, la consapevolezza dell’impatto che la trasformazione digitale può avere sulla società e sulla nostra vita di ogni giorno. Con questa idea si è parlato di codice sorgente e del perché scrivere codice sia importante, per tutti; dell’importanza di conservarlo e condividerlo, come fa Software Heritage, e di come cambi l’idea di archivio passando dagli oggetti materiali alla immaterialità e al software.
Sono intervenuti, Simone Martini, ordinario di informatica all’Università di Bologna e Stefano Vitali, archivista con una lunga esperienza presso il Ministero dei Beni Culturali, oggi impegnato nel progetto Bologna Città degli Archivi. Ospiti della giornata sono stati, Liesbeth De Mol, ricercatrice del CNRS di Lille (Francia), esperta di epistemologia, storia e filosofia dell’informatica e il direttore e fondatore di Software Heritage, Roberto di Cosmo, che hanno portato un punto di vista originale e multidisciplinare per una riflessione approfondita e indipendente sull’informatica e la programmazione in una società dominata ormai dalle tecnologie digitali.
L’iniziativa è servita a dimostrare che possiamo avvicinarci a questi temi, anche se complessi. Per far questo è stato proposto un gioco a cui tutti sono stati invitati a partecipare seguendo il link https://bobcl.cs.unibo.it/. Qui, in otto semplici schede, sono stati presentati altrettanti codici che hanno cambiato il mondo. Per partecipare è bastato rispondere alla domanda: “Qual è il tuo codice preferito, quello che vorresti salvaguardare, e perché?”. Si è scelto tra Eliza, il codice che ha realizzato il primo dialogo tra uomo e computer, e quello che ha fatto nascere Wikipedia; tra il primo codice in grado di battere l’occhio umano nel riconoscimento di un’immagine fino agli algoritmi di “clustering” grazie ai quali oggi Google, Netflix o Spotify sanno ciò che preferiamo.
Un’attenzione particolare è stata riservata ai ragazzi. Quattro scuole superiori di Bologna hanno ospitato una lezione speciale tenuta da ricercatori coinvolti nel progetto che hanno incontrato quasi trecento studenti a cui hanno raccontato del Tecnopolo Big Data che si sta sviluppando in città, di codici e dell’importanza di preservarli, come si fa con l’Archivio Software Heritage, invitandoli a scegliere il “loro” codice: è infatti da loro, nativi digitali, che ci si aspettano le risposte più intriganti e originali. Hanno risposto all’invito dei promotori il Liceo Malpighi, il Liceo Fermi, l’Istituto Aldini Valeriani e l’Istituto Belluzzi Fioravanti.
Per maggiori informazioni:
– Maurizio Gabbrielli, Direttore Dipartimento DISI – Università di Bologna, maurizio.gabbrielli@unibo.it
– Simonetta Pagnutti, ENEA – Divisione ICT, simonetta.pagnutti@enea.it

https://www.ifabfoundation.org/it/, https://www.softwareheritage.org/, https://bobcl.cs.unibo.it/#programma

Qui gli streaming dell’evento, 1° parte: https://youtu.be/JmqK03KQZHQ; 2° parte: https://youtu.be/O_FJ3ftpl4E

Rassegna Stampa, Big Code LA 10-03-2022_23-03-2022

Il Messaggero, “Custodiamo dati come amanuensi dell’informatica”, 28 marzo, 2022

CorriereNazionale.it, In arrivo nuovi algoritmi ENEA, 2 aprile 2022

Zerounoweb.it, Bologna Big Code Lab, dove ricerca e scuola scrivono il futuro del software, 19 maggio 2022

RESEARCHITALY.MUR.GOV.IT, Dai Big Data ai Big Code. Nasce il Bologna Big Code Lab in collaborazione con l’ENEA, 24 maggio 2022

 

Cosa è un codice sorgente

Quanti di noi oggi inviano una mail da PC o da cellulare, postano foto su Instagram e mettono un like su quelle degli “amici” e quanti, usando un’app scaricata comodamente da internet, fanno un bonifico o verificano lo stato del loro conto? Azioni familiari che fanno ormai parte del nostro quotidiano, rese possibili da dispositivi come lo smartphone che teniamo sempre in tasca, il tablet o il portatile che fedeli ci seguono nei nostri spostamenti.

Potremmo essere indotti a pensare che siano solo questi accattivanti involucri che tocchiamo, soppesiamo, guardiamo con attenzione, pieni di sofisticati circuiti, a connetterci al mondo intero, a renderci accessibile qualsiasi informazione nel tempo di un battito di ciglia e a facilitarci tante operazioni altrimenti noiose.

Beh non è proprio così, vi è dell’altro. C’è qualcosa che sta nell’ombra, che non si mostra e che, anche se si mostrasse, apparirebbe misterioso alla maggior parte di noi, ma che è assolutamente indispensabile a far funzionare tutto. E’ il software o, se preferite, il “codice sorgente”, testi speciali, criptici ai più, che permettono all’uomo di comunicare con la macchina e “istruirla” affinché risponda alle sue richieste.

Hardware e Software, sono loro le due imprescindibili componenti di qualunque dispositivo digitale sia esso uno smartphone, il “telefono intelligente” con capacità di calcolo, memoria e connessione o un grande supercomputer in grado di fare milioni di miliardi di operazioni al secondo. Due “ware”, oggetti, uno solido e duro, “Hard”, l’altro impalpabile e leggero, “Soft”, due opposti combinati a formare il cuore delle tecnologie digitali, motori di una rivoluzione che sta velocissimamente trasformando il mondo e la nostra vita di ogni giorno. Alla parte più oscura e nascosta, al software o se preferite ai codici sorgente, è dedicata questa giornata rivolta anche, o meglio, soprattutto a chi non ha troppa dimestichezza col digitale, per provare a fare un po’ di luce su aspetti così cruciali e impattanti del mondo di oggi.

Perché parlare di “codici” ora, e proprio qui, a Bologna
Perché oggi la Regione Emilia Romagna, e Bologna in particolare, si propongono come leader a livello nazionale, ma anche europeo e internazionale nel Super Calcolo e nelle sue applicazioni più di frontiera come la modellistica avanzata, il trattamento dei Big Data e l’Intelligenza Artificiale, il cui utilizzo si dimostra sempre più importante non solo in ambito scientifico ma anche quale strumento a supporto delle imprese e della pubblica amministrazione.

Super Calcolo significa non solo Super Computer ma anche Super Codici, che qui in Regione sono di casa
ENEA e Università di Bologna infatti hanno una lunga tradizione nel calcolo scientifico, ovvero nello sviluppo di modelli e codici per indagare i fenomeni complessi della fisica, dell’ingegneria ma anche della medicina e delle scienze sociali. Il computer diventa uno strumento per riprodurre la realtà, per indagarla più a fondo e provare a capire come possa evolvere. Con i codici e il computer si possono fare non solo le previsioni del tempo ma si può studiare la struttura complessa dei materiali per crearne dei nuovi, o individuare molecole adatte alla preparazione di farmaci per la cura al coronavirus. E sarà proprio il Tecnopolo di Bologna a diventare punto di riferimento per il supercalcolo, i Big Data e l’Intelligenza Artificiale: qui, oltre al grande computer del Centro Meteo Europeo Ecmwf, sarà ospitato Leonardo uno dei cinque supercomputer più potenti al mondo, concepito e gestito dal CINECA, e il le infrastrutture di calcolo dell’INFN, insomma un vero concentrato di potenza di calcolo e di expertise di livello internazionale.

Infine, parliamo di codici proprio a Bologna, perché sarà il Centro ricerche dell’ENEA di Bologna a ospitare una copia del più grande archivio al mondo di codici sorgente, grazie ad una collaborazione con Software Heritage, l’Archivio universale dei Codici, un’iniziativa di portata internazionale lanciata da INRIA, in collaborazione con UNESCO e grazie all’intuizione di Roberto Di Cosmo, ordinario di Informatica all’Università Paris Diderot, che guida oggi questo ambizioso progetto. Il codice sorgente, che racchiude il sapere e l’ingegno di chi lo ha pensato e scritto, è a tutti gli effetti parte del nostro patrimonio culturale, quello più recente, prodotto negli ultimi settant’anni da quando cioè, con i primi computer, ha avuto inizio l’era digitale che tanti cambiamenti sta portando nella società, nella cultura e nella nostra vita di ogni giorno. Per questo è fondamentale conoscerlo, raccoglierlo, conservarlo e condividerlo.

 

Innovazione: dai big data ai big code, in arrivo nuovi algoritmi ENEA

Sviluppare nuovi codici informatici attraverso metodi innovativi, automatici e sicuri grazie all’archivio universale del codice sorgente Software Heritage.
È questo l’obiettivo di “Bologna Big Code Lab”, il laboratorio congiunto di conoscenza e sperimentazione nato grazie a una convezione tra ENEA e Università di Bologna, in collaborazione con Software Heritage  e il sostegno di iFAB, International Foundation Big Data and Artificial Intelligence for Human Development. Il progetto si basa sull’immensa biblioteca digitale di Software Heritage, realizzata sotto l’egida UNESCO dall’ente francese INRIA (Istituto nazionale per la ricerca nell’informatica e nell’automazione) e di cui il Centro Ricerche ENEA di Bologna ospita una copia. In tre anni saranno sviluppati sistemi automatici per produrre velocemente e in modo affidabile nuovi codici attingendo e aggregando i programmi sorgente già catalogati e memorizzati nell’archivio.

“I codici sorgente sono sequenze di istruzioni, comprensibili e modificabili dall’uomo ma eseguiti da calcolatori. Stanno dentro computer o cellulari, grazie a loro possiamo controllare satelliti ma anche far funzionare siti web e la maggior parte degli oggetti con i quali interagiamo ogni giorno”, spiega Simonetta Pagnutti della Divisione ICT dell’ENEA, che rappresenta l’Agenzia nell’Associazione Big Data.

Nel 2019, proprio grazie a una iniziativa ENEA, è stato siglato l’accordo con INRIA per mettere a punto il primo “mirror” istituzionale europeo dell’archivio Software Heritage, che dal 2016 raccoglie, conserva e rende accessibile il codice sorgente di tutti i software pubblicamente disponibili al mondo del mondo.

“Un progetto di grande rilevanza culturale, sociale e scientifica sponsorizzato anche da grandi big come Microsoft, Intel e Google. Navigando tra i quasi dodici miliardi di file conservati nell’archivio, ci si può imbattere nel codice di sessantamila linee che ha guidato il computer di bordo dell’Apollo11 portando 50 anni fa l’uomo sulla luna. Oppure si può curiosare dentro “TAUmus”, uno dei primi software al mondo realizzato negli anni Settanta alla base della computer music”, continua la ricercatrice. “Quello che abbiamo replicato presso il centro ENEA di Bologna è un backup vitale che rende accessibili tutti gli oltre 170 milioni di progetti archiviati. L’accesso a una simile libreria, una vera biblioteca di Alessandria del software, darà la possibilità ai ricercatori e agli scienziati dell’Agenzia e dell’Università di studiare e analizzare codici e algoritmi, sviluppando metodiche per ricavare informazioni e produrre nuova conoscenza. Così, in analogia a quanto avviene con i “Big Data” potremo parlare di “Big Code”. Si tratta di un filone attuale, ancora da esplorare, ma ricco di ricadute. Una linea di ricerca con un orizzonte di lungo respiro, destinata ad avere una valenza strategica rilevante che apre nuove opportunità per i giovani ricercatori: i codici sono l’imprescindibile componente dell’High Performance Computing, dell’Intelligenza Artificiale e di ogni applicazione digitale” conclude la Pagnutti.

Oltre al lavoro di ricerca, il progetto prevede anche diverse attività di formazione e alfabetizzazione digitale per riflettere su temi fondamentali legati allo sviluppo delle tecnologie informatiche con l’obiettivo di creare maggiore consapevolezza rispetto ai profondi cambiamenti in atto in campo economico, culturale e sociale legati all’utilizzo sempre più diffuso delle nuove tecnologie.

Il primo appuntamento divulgativo “Software Heritage, l’Archivio Universale dei Codici – Divagazioni sul tema” si è tenuto il 16 marzo presso l’Aula Giorgio Prodi  dell’Università di Bologna.
E’ stata una giornata dedicata all’open source, ai nuovi archivi digitali e ai codici, intesi sia come protagonisti della rivoluzione digitale che come parte del nostro patrimonio culturale e, come tali, da conservare e tutelare.

L’evento si è sviluppato in programma seminari e incontri destinati a un pubblico ampio ma in particolare ai più giovani attraverso il coinvolgimento attivo di quattro scuole. Si è parlato di cos’è un codice sorgente e del perché scrivere codice sia importante, per tutti. Sono stati presentati alcuni tra i codici che hanno cambiato il mondo e sono state premiate le motivazioni più spiritose, originali e brillanti fornite dai partecipanti al contest “Quale è il tuo codice preferito, quale vorresti salvaguardare per i posteri?” a cui è stato possibile aderire seguendo.

Il progetto Bologna Big Code Lab e l’iniziativa del 16 marzo, sono attività che nascono e si sviluppano nell’ambito del Tecnopolo di Bologna oggi sede del Data Center del Centro Europeo per le Previsioni Meteorologiche a Medio Termine (ECMWF) e che a breve ospiterà Leonardo, uno dei più potenti supercomputer al mondo gestito da Cineca. Qui troveranno anche spazio start up e laboratori di ricerca, creando un perfetto ambiente di raccordo tra ricerca e tessuto industriale.

Per maggiori informazioni: Simonetta Pagnutti, ENEA – Divisione ICT, simonetta.pagnutti@enea.it