Wednesday, May 23, 2012

Google e la navigazione semantica... ma in Italia c'è Lodlive che naviga i Linked Open Data.

Google ha recentemente dato grande enfasi all'evoluzione del suo motore di ricerca che promette di risolvere meglio il concetto di "disambiguazione" ovvero di identificare meglio se nella mia ricerca "mercury" indica il cantante o il pianeta... Inoltre Google promette di pubblicare anche le relazioni ad altri "concetti" collegati e si parla di passaggio dalla ricerca per stringhe alle "Things" i concetti.

Ci sarebbe da dire... era ora!

Per far ciò Google sfrutta (anche) la conoscenza disponibile in rete ovvero quei grandi serbatori di informazione organizzata che milioni di persone hanno contribuito a costruire "To build this world of things, Google is tapping a variety of knowledge databases, including Freebase, which it bought in 2010, Wikipedia, Google Local, Google Maps and Google Shopping. Currently, Google’s Knowledge Graph has over 500 million people, places and things and those things have at least 3.5 billion attributes.".

Una piccola digressione si impone perchè DBpedia è stata costruita sul concetto che se ognuno mette a disposizione il contributo prodotto dal proprio intelletto, rinunciandone ai diritti di utilizzo, si crea un volano di crescita per l'umanità. Google sta un po' in mezzo al guado, contribuendo con molte iniziative alla condivisione di conoscenza ma rimanendo in ogni caso un azienda ancora fortemente basata sulla proprietà intellettuale.

Ma andiamo avanti... ho parlato di Google perchè viene riconosciuta  (giustamente) per essere una azienda fortemente innovativa e questa sua ultima iniziativa ne accresce il significato, ma per una volta, qui in Italia, c'è chi ha percorso una strada simile e per certi versi in maniera ancor più innovativa: LodLive.

Un motore costruito in diverse notti di lavoro da Diego Camarda, Silvia Mazzini e Alessandro Antonuccio che si è piazzato al secondo posto del concorso App4Italy, un grande risultato se si pensa che sono stati superati solo da Open Parlamento, un'iniziativa già matura, di un paio d'anni fa.

Lodlive permette di ricercare tra i Linked Open Data disponibili in rete, navigando tra i concetti e le relazioni tra di esse, in maniera grafica. Diego, Silvia e Alessandro, che per essere perfettamente trasparente sono colleghi e amici, hanno sfruttato le competenze maturate nel progetto RDF della Camera dei Deputati, ampliando il concetto di riutilizzo ad altre basi dati "semantiche". La navigazione per concetti ma soprattutto la tendenza a costruire ontologie e basi informative "machine readable" può cambiare significativamente il futuro del web come è ora concepito, più ancora che la recente innovazione googoliana.

Naturalmente L'interfaccia di LodLive richiede ancora una capacità di navigazione da esperti ma ovviamente in poco tempo non era possibile fare di meglio e soprattutto non era questo l'obiettivo, l'importante era arrivare all'esemplificazione dell'uso dei LOD e contribuire alla loro diffusione. Di seguito ho raccolto un breve scambio di opinioni con i LodLivers!!!

Intervista ai promotori di LodLive, il nuovo modo per ricercare nel Web of Data

LodLive è un'interfaccia nata per navigare la Linked Open Data Cloud, costruito da Diego Camarda, Silvia Mazzini e Alessandro Antonuccio che si è piazzato al secondo posto del concorso App4Italy, un grande risultato se si pensa che sono stati superati solo da Open Parlamento, un'iniziativa già matura.

Lod Live, che ovviamente potete trovare anche su Facebook, è un gran bell'esempio delle potenzialità future del web e ha dato spunto a una corposa prefazione. Dopo averla scritta però l'ho "traslata" in un post successivo per dare giusta evidenza a questa intervista

I LOD sono il primo passo nel Web of Data e di seguito vi racconto cosa sono grazie proprio al contributo di questi tre amici.

D. Cosa è LodLive?

Silvia. LodLive è un progetto sperimentale, uno strumento che consente a chiunque di navigare in modo semplice e immediato i Linked Open Data.

D. In che modo è utile ai Linked Open Data?

Silvia. LodLive si avvale di un innovativo approccio per la navigazione, non visualizza risorse statiche ma sfrutta in tutto e per tutto la potenza del linguaggio di ricerca SPARQL e degli altri standard del Web of Data: RDF e URI. LodLive mostra i dati linkati attraverso il grafo, ovvero attraverso la rappresentazione più efficace per questo tipo di risorse: i browser RDF standard presentano una scheda descrittiva basata sulle triple, LodLive si espande all’infinito senza mai perdere la visione d’insieme del grafo del dominio e mostra relazioni tra dati di diversi endpoint come prima non era possibile.

D. cosa è RDF?

Diego. RDF è lo strumento base proposto dal W3C per la codifica, lo scambio e il riutilizzo di metadati strutturati sul web. Si fonda sul concetto di “tripla” ovvero l’unità informativa minima che serve a descrivere una risorsa: soggetto, predicato e oggetto.

D. Come fa LodLive a costruire il grafo?

Diego. L'utente, guidato nella scelta di una URI, dà il via alla navigazione, LodLive riconosce l'endpoint pubblico più utile per gestire ogni singola richiesta. L’endpoint è un punto di accesso alle risorse RDF che vengono immagazzinate in un triplestore (ad esempio virtuoso) e rese interrogabili attraverso il linguaggio di query SPARQL. Al momento, sul lodlive.it sono configurati 15 endpoint pubblici che espongono dataset vari, da dbpedia a linkedgeodata, al new york times. Dopo aver scelto la risorsa da cui far partire la navigazione, si apre una pagina vuota con la prima sfera della risorsa prescelta: intorno alla sfera appariranno altri piccoli pallini (di forma e colori diversi a seconda della tipologia) che indicano le relazioni con le altre risorse. Ogni volta che si sceglie un pallino viene lanciata una query SPARQL che interroga l’endpoint e restituisce una nuova sfera con altre relazioni.

D. Posso navigare solo tra le risorse di un determinato endpoint?

Diego. LodLive per ogni richiesta verifica la presenza di un endpoint configurato per soddisfarla e, nel caso mancasse, cerca di soddisfarla lui stesso generando un endpoint on fly. Per ogni proprietà, tipicamente un owl:sameAs, è quindi possibile "saltare" da una risorsa all'altra indipendentemente dalla fonte rappresentando in un unico grafo tutti i dati collegati del dominio del mio interesse.

D. LodLive è finito?

Siamo soddisfatti perché riteniamo di aver creato uno strumento facile da usare, efficace e comprensibile, anche per i meno esperti,  ma non consideriamo LodLive completo. LodLive è stato pensato e sviluppato in perfetto stile Tim Berners Lee, in modo completamente aderente alle “5 stars” e con un approccio “bottom-up” aprendosi a progressive implementazioni e nuove features.

D. Perché LodLive?

Silvia. LodLive si propone come strumento di rappresentazione e divulgazione dei Linked Open Data; lavorando da diversi anni nel settore, avevamo notato la carenza di strumenti semplici, gradevoli, friendly nel contesto del web of data e, grazie all’occasione offertaci da apps4italy, abbiamo concretizzato questo sogno.

LodLive ed il suo team sono ben contenti di avere riscontri ed opinioni e sono pronti a collaborare per migliorare il progetto.