Software Heritage: a contemporary archive for the future
The first Mirror of the Universal Archive of Codes at the ENEA Research Center of Bologna
On the 13rd December from 11.00 to 12.30, at ENEA Headquarter in Rome, Lungotevere Thaon di Revel 76
11:00 Dr. Giorgio Graditi, ENEA, General Director. Welcome and opening
11:05 Dr. Giulia Monteleone, ENEA, Director of TERIN Department. ENEA context and Technopole in Bologna
11:15 Dr. Giovanni Ponti, ENEA, Head of ICT Division. HPC e Software Heritage in ENEA
11:25 Dr. Simonetta Pagnutti, ENEA, Researcher. The history
11:35 Prof. Roberto Di Cosmo, INRIA, Director of Software Heritage.
Software Heritage: unified infrastructure to preserve knowledge and to explore the software development universe
12:00 Dr. Stefano Ferriani, ENEA, Researcher. The mirror in ENEA
12:10 Prof. Patrizio Bianchi, Economist. Digital Humanities
Software Heritage: a contemporary archive for the future
Software Heritage is a 2015 initiative by INRIA, the French National Institute for Research in Computer Science and Automation, which aims at creating a universal archive of software. The project stems from the reflection that a fastgrowing component of our scientific, technological and cultural knowledge is Software, indeed. In particular, such knowledge is embedded into the source code of software programs, which is the human artefact that is collected, stored and published by Software Heritage.
A project of this magnitude and with this ambitious aim has to count on the creation of a network of mirrors which ensure sustainability and the necessary safety and security standard.
ENEA, understanding the value of the project, applied to be the first institutional Italian mirror, and in 2019 signed a collaboration with INRIA.
Starting from 2019, it begins the activity of projecting and building the Software Heritage ENEA Mirror. Today, after the copy of the data from the Software Heritage central archive, ENEA Mirror is in production and is freely consultable online.
Meanwhile, ENEA established the objectives of extracting value from such Big Data, creating cutting-edge projects in the Artificial Intelligence field. In fact, the graph structure of the archive consents to the extraction of information both about the structure and the history of the source code. This is possible using the potentiality of clustering algorithms and large language models, like chatGPT.
Al Centro ENEA di Bologna nasce l’archivio informatico per il futuro
Dal prossimo 13 dicembre, al centro ricerche ENEA di Bologna entrerà in funzione e sarà disponibile al pubblico il primo Mirror italiano di Software Heritage, l’archivio che raccoglie, conserva e rende accessibile il codice sorgente di tutti i software pubblicamente disponibili al mondo; un’iniziativa internazionale, no-profit, di gran rilevanza culturale, sociale e scientifica, promossa da INRIA, l’istituto francese per la ricerca sull’informatica e l’automazione, in cooperazione con l’UNESCO. “Siamo orgogliosi di accogliere ENEA – dice il Professor Di Cosmo, direttore di Software Heritage – come primo mirror istituzionale europeo di Software Heritage, e siamo impazienti di esplorare insieme le opportunità aperte da questa collaborazione”
L’obiettivo di questa biblioteca digitale è di conservare un patrimonio espressione dell’ingegno, dell’intelligenza e della cultura del mondo moderno. Chiunque lo voglia, potrà curiosare all’interno di questo specialissimo archivio, tra codici e algoritmi che risolvono problemi matematici e riproducono modelli di sistemi complessi secondo il modo di procedere della scienza e della tecnologia dettato dall’avvento dei calcolatori. Ad esempio, navigando in questo mare di codici, ci si può imbattere nel codice che guidò il computer di bordo di Apollo11, che 50 anni fa portò l’uomo sulla luna o TAUmus, uno dei primi software al mondo per la computer music, realizzato negli anni Settanta grazie alla collaborazione tra un musicista, il maestro Pietro Grossi, pioniere della musica elettronica, e i ricercatori del Centro Nazionale Universitario di Calcolo Elettronico di Pisa.
Nello specifico, il Centro ENEA di Bologna conserverà un mirror, in italiano uno specchio, cioè una replica dell’intero archivio, che conta oggi più di 17 miliardi di programmi sorgente; l’intento è garantirne la sicurezza e la disponibilità continua. Non solo: l’accesso a una simile miniera di codici e algoritmi darà la possibilità di studiarli e analizzarli sviluppando metodi per ricavarne informazioni e nuova conoscenza; così in analogia con quanto avviene per i Big Data, si potrà parlare di “Big Code”, dove però la grande mole di codici sorgenti viene utilizzata per addestrare un’Intelligenza Artificiale alla generazione automatica di software. “È stato svolto un importante lavoro in termini di crescita di infrastruttura di storage e di innovazione tecnologica in ambito ICT – dichiara Giovanni Ponti, responsabile della Divisione per lo Sviluppo dei Sistemi per l’Informatica e l’ICT dell’ENEA – che ha guidato in questi anni la progettazione e l’implementazione del mirror di Software Heritage in ENEA”.
La collaborazione tra ENEA ed INRIA non nasce per caso se si pensa alla lunga tradizione che ENEA vanta nei campi della modellistica, del calcolo e dello sviluppo di codici, strumenti indispensabili per progredire in ogni campo del sapere e tecnologico. Fu proprio ENEA (allora CNEN Comitato Nazionale per l’Energia Nucleare) nel lontano 1958, a dar vita assieme all’Università di Bologna, al primo centro di calcolo scientifico in Italia e a fondare sempre a Bologna, due anni dopo, il proprio centro di calcolo, raccogliendo un gruppo di ottimi ingegneri, fisici e matematici attorno ad uno dei più potenti calcolatori dell’epoca, un IBM 740. Ancora oggi ENEA dispone con CRESCO6 di una delle infrastrutture di supercalcolo più potenti in Italia.
L’iniziativa si inserisce in un più ampio contesto che vede l’arrivo al Tecnopolo Bolognese del Centro Dati Meteo Europeo e di Leonardo, supercomputer destinato a posizionarsi tra i primi cinque al mondo che fanno di Bologna e della Regione Emilia-Romagna un polo internazionale dell’High Performance Computing e dei Big Data.