Wednesday, December 21, 2011

La Camera dei Deputati diventa Open: i dati aperti e la (probabile) rivoluzione del futuro.


Ieri la Camera dei Deputati ha pubblicato on line il proprio patrimonio storico ma la novità che mi interessa raccontare è “come l’ha fatto”.

Facciamo un passo indietro per inquadrare la situazione. Internet è luogo di libertà e rivoluzioni, come ho detto spesso (uno tra i tanti!) con la rete si è affiancato alla comunicazione broadcast, uno (possessore del media) a tanti (pubblico), il paradigma tanti a tanti, nel senso che le comunicazioni si intrecciano, diventano bidirezionali e ognuno è libero di scrivere, leggere e commentare ciò che vuole (purtroppo con qualche significativa restrizione in molti paesi del mondo).

Internet terra di rivoluzioni pacifiche

Questa capacità ci ha regalato anche la possibilità di cambiare, in molte situazioni, lo stato dei fatti, rompendo monopoli e oligarchie, vere e proprie rivoluzioni, un esempio su tutti è quello dell’Open Source.

Qualcuno tra i più tradizionalisti può anche guardare con sospetto alla banda di capelloni, Hacker e Hippies della Free Software Foundation, come Richard Stallman e John Sullivan ma sarebbe interessante anche se, con l’aiuto di qualche economista, provasse a dare un valore alla ricchezza prodotta dal software libero o se qualcuno si ponesse la domanda sulla distanza tra dove siamo arrivati e dove saremmo ancora (indietro) senza l’O.S.

Senza Linux, Mysql, Apache e le piattaforme di Blogging sarebbe nato il web 2.0? Sarebbe possibile un così basso livello di accesso alle tecnologie?

Forse oggi io non sarei qui a scrivere questo post (chissà se è un bene o male!!!) ma soprattutto quante altre applicazioni non sarebbero nate? Indubbiamente il defunto Steve Jobs è stato uomo di visioni molto avanzate nel campo digitale ma dove sarebbe potuto arrivare il mondo e la tecnologia se avesse, almeno in parte, condiviso pubblicamente i risultati del proprio lavoro? Se alla morte di “Steve” quasi tutto il mondo (tranne Stallman) gli ha tributato doveroso omaggio, quanti sanno cosa ha fatto il barbuto Richard e la sua banda per l’innovazione?

Nello stesso post che ho “linkato” prima viene riportata una lettera aperta di Bill Gates al mondo dell’Open Source che rivela oggi tutta la sua inconsistenza, alla luce di quale solidità abbiano raggiunto ormai molti software Open Source.

Le persone hanno imparato a condividere!

Cosa c’entri tutto questo con al Camera dei Deputati è, a questo punto, per chi legge un po’ misterioso, ma in realtà altrettanto semplice da spiegare.

Il movimento Open Source ha dimostrato che le persone hanno la capacità di privarsi di un presunto diritto, quello sullo sfruttamento economico diretto ed esclusivo del proprio lavoro (non ci si priva del diritto di proprietà intellettuale che per definizione è inalienabile, ma solo del diritto d’autore), rendendo un grande servizio a tutti coloro i quali fanno buon uso di ciò e che così non sono costretti a ricominciare sempre da zero. Il risultato finale migliora per tutti, questo accade nel software ma anche molti in altri campi, infatti sono nati per esempio siti di condivisione di immagini gratuite, di musica free e tanto altro.

Anche la semplice pubblicazione on line è in realtà una cessione dei propri diritti su ciò che si scrive e si racconta, lo sanno bene i giornali nella loro lunga lotta ai motori di ricerca, ma ancora questo è un passaggio intermedio, perché ciò che si rende pubblico è si pubblico ma in genere è un prodotto finito, poco riutilizzabile.

Gli Open Data per costruire la conoscenza diffusa

Da qualche anno è in atto la rivoluzione degli Open Data, ovvero dati che sono alla base di ciò che viene pubblicato ma che sono anche riutilizzabili in maniera libera, al fine di produrre ulteriore conoscenza da tutto ciò che viene reso pubblico.

La Camera dei Deputati ha aderito a questo approccio per rendere non solo pubblici i propri dati ma anche per renderli facilmente riutilizzabili, creando una propria ontologia OCD (Ontologia Camera dei Deputati), in formato OWL (Ontology Web Language) espressa in
triple RDF : una tripla è un’asserzione (statement), un’unità informativa minima, articolata in soggetto (subject), relazione (predicate) e oggetto (object). Tutti i dati del portale sono così disponibili come Linked Open Data, un patrimonio informativo costituito da oltre 13,4 milioni di triple.

Questo approccio semantico e libero ai dati rappresenta una grande innovazione perché se è vero che spoglia il detentore di contenuti della figura di quasi unico “interprete” dei medesimi, conferisce a chiunque altro la capacità di rielaborali e di integrarli con fonti e dati ulteriori, al fine di ottenere risultati sempre migliori e sempre maggiore conoscenza.

Un esempio dell’uno e dell’altro, ovvero del valore dell’Open Source e di quello dei dati aperti è costituita dalle app, pubblicate dall’archivio, che riutilizzando software del MIT permettono da un lato di realizzare pagine interattive in cui l’utente può creare le proprie personali viste, dall’altro rendono ulteriormente disponibili, in formato json, anche i dati sui quali queste stesse app insistono.

La conoscenza implicita nei dati

Provo quindi a fare qualche semplice elaborazione sul sito della Camera, utilizzando le alternative di ricerca offerte. Opzionando solo i periodi più recenti (gli ultimi 30 anni) scopro che la rappresentatività di una regione importante elettoralmente come la Sicilia si ferma, per queste 4 cariche dello Stato, al 1954, cosi come negli ultimi 30 accade a una larghissima parte del nord-est, che include l’intero Trentino, Friuli, Veneto e parti importanti della Lombardia. Di contro il peso della Sicilia era stato di gran lunga superiore a quello di tutte le altre regioni (non Sabaude) per tutta la durata del Regno d’Italia. In 150 anni inoltre Calabria, Friuli e Umbria non risultano essere state rappresentate da un proprio politico, dalla Puglia provengono solo Salandra e Aldo Moro e Cagliari e tutta la Sardegna centro meridionale non hanno avuto l’onore di un proprio concittadino eletto alle massime cariche dello Stato. Superfluo quasi sottolineare che solo due sono le donne.

L’informazione è parziale perché per un più esatto esame occorrerebbe aggiungere quella relativa ai ministri, in particolare quelli che dei ministeri più influenti, ma già da sola si presta a qualche interpretazione e molte altre elaborazioni potrebbero essere realizzate ulteriormente, direttamente dagli utenti, accedendo ai dati dei file json.

Innovazione tecnologica e sociale

Sotto un profilo più tecnologico la novità è duplice perché al di là degli aspetti “sociali” (evapora il concetto di proprietà) che contraddistinguono questo approccio in realtà lo studio e l’applicazione degli Open Data conducono generalmente ad una migliore strutturazione delle basi dati, al fine di garantire intelligibilità orizzontale, anche in una struttura aziendale complessa, e verticale, nel senso di miglior propagazione nel tempo della leggibilità della base informativa stessa. Non era raro nel passato (e ancora adesso) scontrarsi con database chiusi e complessi che impedivano il riutilizzo dei dati, addirittura all’interno stesso di una unica organizzazione. Questo effetto rischiava e rischia inoltre effetti catastrofici con il passare del tempo e con il venire meno delle competenze umane di chi quella applicazione l’ha costruita e dominata.

L’altra novità è costituita da query che si realizzano tutte lato client, suddividendo le risorse computazionali su tutti gli utenti che accedono e non le concentrano solo sull’unico server/sito che eroga il servizio, molto interessante quindi per dell’ottimizzazione di applicazioni in ottica cloud computing.

Per finire occorre sottolineare che probabilmente molte delle tecnologie utilizzate per realizzare questa applicazione andranno ad aggiungersi alla grande famiglia dell’Open Source, fornendo un contributo specializzato (e tutto italiano!!) all’innovazione tecnologica nel campo della gestione archivistica di informazioni digitali multimediali.

Anche questo un piccolo salto in avanti.

No comments:

Post a Comment