Costruire un' ontologia: perché e come farlo

Oreste Signore, <oreste@w3.org>
Responsabile Ufficio Italiano W3C
Area della Ricerca CNR - via Moruzzi, 1 - 56124 Pisa


KNOWLEDGE MANAGEMENT UNIVERSITY

Olbia, 18-22 giugno 2007


Presentazione: http://www.w3c.it/talks/2007/kmu2007/slides.html
Versione pdf: http://www.w3c.it/talks/2007/kmu2007/slides.pdf

Cover page W3C Office Logo Cover page Weblab Logo Valid XHTML 1.0! Valid CSS!

Ringraziamenti

Spesso non è facile intendersi…

Utente
  • Posso comprare la benzina per il tagliaerba portando una bottiglia da riempire?
  • Il mixer del robot da cucina LoChefPerfetto non funziona
Il CRM
  • È vietato cedere a terzi carburanti in recipienti non a norma
  • Il miscelatore del Mod. CR/XXX32-123 può presentare degli inconvenienti al sistema di accensione e regolazione della velocità

I limiti del Web attuale

Una versione semplificata di una libreria (Dataset "A")

Tabella Book
ID Author Title Publisher Year
ISBN 0-00-651409-X id_xyz The Glass Palace id_qpr 2000
Tabella Author
ID Name Home page
id_xyz Amitav Ghosh http://www.amitavghosh.com/
Tabella Publisher
ID Publisher Name City
id_qpr Harper Collins London

Rappresentata come grafo …

The previous table in an RDF format

Alcune osservazioni sull' esportazione dei dati

Un' altra libreria (dataset "F")

Tabella Livre
ID Titre Auteur Traducteur Original
ISBN 2020386682 Le Palais des miroirs i_abc i_qrs ISBN 0-00-651409-X
Tabella Auteur
ID Nom
i_abc Amitav Ghosh
i_qrs Christiane Besse

Secondo passo: esportare il secondo insieme di dati

The French data in RDF

Terzo passo: Merging dei dati

The French and English data side by side

Terzo passo: Merging dei dati (cont.)

The merged data with nodes with identical URI-s pointed out

Merging delle risorse identiche

The merged data with one of the nodes merged with common URI

Le Query più semplici…

The merged data with one of the nodes merged with common URI

…ma si può avere di più

Sorpresi?

In reltà cosa abbiamo fatto?

E il processo può essere anche più ricco

E il Semantic Web?

L' architettura del Semantic Web

immagine dei livelli del semantic web
Il Semantic Web ...
  • è un' infrastruttura basata su metadati per poter svolgere ragionamenti sul Web
  • estende, non sostituisce il web attuale

Cosa sono i metadati?

Perché i metadati?

Elementi di RDF

Cosa è RDF?

RDF è per il Semantic Web ciò che HTML è stato per il web

Triple RDF

Triple RDF (cont.)

(<http://…isbn 6682>, <http://…/original>, <http://…isbn 409X>)

Triple RDF (cont.)

Un esempio semplice di RDF (in RDF/XML)

A Simple RDF Graph with full URI-s
<rdf:Description rdf:about="http://…/isbn/2020386682">
    <f:titre xml:lang="fr">Le palais des mirroirs</f:titre>
    <f:original rdf:resource="http://…/isbn/000651409X"/>
</rdf:Description>

(Nota: per semplificare gli URI sono stati usati i namespace)

Un esempio semplice di RDF (in Turtle)

A Simple RDF Graph with full URI-s
<http://…/isbn/2020386682>
    f:titre "Le palais des mirroirs"@fr;
    f:original <http://…/isbn/000651409X>.

Quale sintassi?

Il ruolo fondamentale degli URI

Nodi "interni"

A graph with a blank node in the middle (labelled with "?")

Extra URI … oppure … blank nodes

RDFSchema

Perché RDF Schema?

Classi, Risorse, …

Classi, Risorse, … (cont.)

Classi, Risorse in RDF(S)

A slide showing the book with its own Schema and the RDFS entitites, all merged

Un esempio di RDFS in RDF/XML

<rdf:Description rdf:ID="Novel">
  <rdf:type rdf:resource= "http://www.w3.org/2000/01/rdf-schema#Class"/>
</rdf:Description>
<rdf:Description rdf:about="http://…/isbn/000651409X">
   <rdf:type rdf:resource="http://…/bookSchema.rdf#Novel"/>
</rdf:Description>

Inferenza delle proprietà

A slide showing an inferred property

Proprietà

Proprietà (cont.)

Anche un po' di RDFS può dare enormi vantaggi…

Alcune Classi e proprietà predefinite

Ontologie (OWL)

Ontologie

Ontologie (cont.)

"definisce i concetti e le relazioni usate per descrivere e rappresentare un dominio di conoscenza"

Cos'è un' ontologia? (1)

Neches et al. (1991)

An ontology defines the basic terms and relations comprising the vocabulary of a topic area as well as the rules for combining terms and relations to define extensions to the vocabulary.

Gruber (1993)

An ontology is an explicit representation of a conceptualization

Borst (1997)

Ontologies are defined as a formal specification of a shared conceptualization

Studer et al. (1998) (Merging and explaining Gruber and Borst)

An ontology is a formal, explicit specification of a shared conceptualisation. A 'conceptualisation' refers to an abstract model of some phenomenon in the world by having identified the relevant concepts of that phenomenon. 'Explicit' means that the type of concepts used, and the constraints on their use are explicitly defined. For example, in medical domains, the concepts are diseases and symptoms, the relations between them are causal and a constraint is that a disease cannot cause itself. 'Formal' refers to the fact that the ontology should be machine readable, which excludes natural language. 'Shared' reflects the notion that an ontology captures consensual knowledge, that is, it is not private to some individual, but accepted by a group.

Cos'è un' ontologia? (2)

Guarino

A logical theory which gives an explicit, partial account of a conceptualization

A set of logical axioms designed to account for the intended meaning of a vocabulary.

A specific artifact designed with the purpose of expressing the intended meaning of a vocabulary

Jim Hendler

A set of knowledge terms, including the vocabulary, the semantic interconnections and some simple rules of inference and logic for some particular topic

Disaccordo o accordo?

Il Semantic Web: la visione del W3C

Ipotesi e sfide
  • il Web è intrinsecamente distribuito
  • le macchine possono accedere ad un insieme strutturato di informazioni e a un insieme di regole di inferenza da utilizzare per il ragionamento automatico
  • per ragionare sui dati occorrono le ontologie
  • fornire un linguaggio per esprimere dati e regole per ragionare sui dati
  • esportare sul web delle regole da qualunque sistema di rappresentazione della conoscenza
Metadati
  • informazioni, comprensibili dalla macchina, relative a una risorsa web o a qualche altra cosa

Ontologie sul Web

Il Semantic Web: le tecnologie W3C

Resource Description Framework (RDF)
  • strumento base per la codifica, lo scambio e il riutilizzo di metadati strutturati
  • consente l'interoperabilità tra applicazioni che si scambiano sul web informazioni machine-understandable
Web Ontology Language (OWL)
  • linguaggio per descrivere proprietà, vincoli, cardinalità, etc.
  • permette di esportare ontologie in modo interoperabile

Le classi in OWL

OWL Resource and Thing

Caratterizzazione delle proprietà

The top level OWL property definitions

Un esempio di caratterizzazione delle proprietà

definition of inverse functional

Equivalenza e Relazioni tra termini

Esempio: equivalenza inglese-francese

Example of equivalence between English and Hungarian terms

OWL: tre sottolinguaggi

OWL Lite
per rappresentare classificazioni gerarchiche e vincoli semplici. Permette una migrazione rapida per thesauri e altre tassonomie.
OWL DL
per utenti che desiderano la massima potenza espressiva garantendo comunque la completezza computazionale (tutte le conclusioni sono computabili) e la decidibilità (tutte le computazioni terminano in un tempo finito)
OWL Full
per utenti che desiderano la massima potenza espressiva e la libertà sintattica di RDF.
Non fornisce garanzie sui tempi di computazione, e difficilmente sarà supportato nella sua interezza da software che implementano il ragionamento

Esempi pratici

Conclusioni

Grazie per l' attenzione

Domande?


Se non è sul Web non esiste ...

... troverete sul sito dell' Ufficio (http://www.w3c.it/)
le slide (http://www.w3c.it/talks/2007/kmu2007/)