icona decorativa

Cover page W3C Office Logo

Cover page Weblab Logo

Valid XHTML 1.0!

Valid CSS!

Qualità nella ricerca dell' informazione: il ruolo delle ontologie

Oreste Signore, <oreste@w3.org>
Responsabile Ufficio Italiano W3C
Area della Ricerca CNR
via Moruzzi, 1
56124 Pisa


11° KNOWLEDGE MANAGEMENT FORUM

Organizzata da Jekpot
23-24-25 Novembre 2006
Palazzo delle Stelline - C.so Magenta 61 - 20123 Milano


Presentazione: http://www.w3c.it/talks/2006/km11/
Documento: http://www.w3c.it/papers/km11.pdf

Cosa significa qualità dell' informazione?

Utente
  • Posso comprare la benzina per il tagliaerba portando una bottiglia da riempire?
  • Il mixer del robot da cucina LoChefPerfetto non funziona
Il CRM
  • È vietato cedere a terzi carburanti in recipienti non a norma
  • Il miscelatore del Mod. CR/XXX32-123 può presentare degli inconvenienti al sistema di accensione e regolazione della velocità

Information Retrieval: modello funzionale

Information Retrieval: efficacia

P (Precisione o Precision)
  • rapporto (numero compreso tra 0 e 1) tra il numero di documenti reperiti e pertinenti e il numero di documenti reperiti
  • esperienza comune ("effetto rumore")
R (Richiamo o Recall)
  • rapporto (numero compreso tra 0 e 1) tra il numero di documenti reperiti e pertinenti e il numero di documenti pertinenti esistenti
  • effetto spesso non percepito ("effetto silenzio") e difficile da individuare
Cause di una bassa efficacia
  • non difetti del sistema
  • caratteristiche del processo di indicizzazione (scelta di un "buon" termine indice)
  • l' utente cerca concetti, non parole (approccio semantico, non sintattico)

Per una maggiore efficacia …

Scelta dei termini indice
  • non troppo specifici (frequenza bassa)
  • non troppo generici (frequenza alta)
  • trasformazione di frase (da alta a bassa frequenza)
  • trasformazione di thesaurus(da bassa ad alta)
Base di conoscenza
  • di adeguato livello di complessità
  • deve essere condivisa tra indicizzatore e utente
  • con una rappresentazione formale

Ricerca di informazioni sul Web

Approccio attuale
  • basato sul term matching
  • ranking (tf/idf o Google PageRank)
  • approccio sintattico
Semantic Search
  • applicazione del Semantic Web alla ricerca di informazioni
  • gli utenti preferiscono formulare query utilizzando concetti semantici ad alto livello, più coerenti con la conoscenza tacita
  • navigational search: restituzione di documenti che contengono i termini specificati dall' utente
  • research search: restituzione dell' insieme di documenti che nel loro complesso sono in grado di fornire l' informazione desiderata

Semantic Search e ontologie

Cos'è un' ontologia? (1)

Neches et al. (1991)

An ontology defines the basic terms and relations comprising the vocabulary of a topic area as well as the rules for combining terms and relations to define extensions to the vocabulary.

Studer et al. (1998)

An ontology is a formal, explicit specification of a shared conceptualisation. A 'conceptualisation' refers to an abstract model of some phenomenon in the world by having identified the relevant concepts of that phenomenon. 'Explicit' means that the type of concepts used, and the constraints on their use are explicitly defined. For example, in medical domains, the concepts are diseases and symptoms, the relations between them are causal and a constraint is that a disease cannot cause itself. 'Formal' refers to the fact that the ontology should be machine readable, which excludes natural language. 'Shared' reflects the notion that an ontology captures consensual knowledge, that is, it is not private to some individual, but accepted by a group.

Guarino (1998)

A set of logical axioms designed to account for the intended meaning of a vocabulary.

Cos'è un' ontologia? (2)

Il Semantic Web: la visione del W3C

Ipotesi e sfide
  • il Web è intrinsecamente distribuito
  • le macchine possono accedere ad un insieme strutturato di informazioni e a un insieme di regole di inferenza da utilizzare per il ragionamento automatico
  • per ragionare sui dati occorrono le ontologie
  • fornire un linguaggio per esprimere dati e regole per ragionare sui dati
  • esportare sul web delle regole da qualunque sistema di rappresentazione della conoscenza
Metadati
  • informazioni, comprensibili dalla macchina, relative a una risorsa web o a qualche altra cosa

Il Semantic Web: le tecnologie W3C

Resource Description Framework (RDF)
  • strumento base per la codifica, lo scambio e il riutilizzo di metadati strutturati
  • consente l'interoperabilità tra applicazioni che si scambiano sul web informazioni machine-understandable
Web Ontology Language (OWL)
  • linguaggio per descrivere proprietà, vincoli, cardinalità, etc.
  • permette di esportare ontologie in modo interoperabile

Ontologie per …

Ricerca più efficace
  • ulteriori vantaggi rispetto a dizionari e thesauri
  • esempio GoPubMed: ampliamento dei termini per la ricerca, ordinamento dei risultati in base all' ontologia
  • condivisione della base di conoscenza tra indicizzatore e fruitore
Miglior qualità dell' informazione
  • arricchire la lista di documenti restituiti, sfruttando le relazioni definite a livello ontologico
Personalizzazione
  • si può definire un profilo utente che ne rappresenti ontologicamente gli interessi

Ontologie per …

Arricchimento delle informazioni esistenti
  • comprendere il significato dei documenti e corredarli di metadati
Data integration
  • ontologie espresse in OWL possono essere distribuite sul Web
  • condivisione di conoscenza
  • reperimento di informazioni espresse in lingue diverse o con riferimenti a ontologie diverse
Intelligent Semantic Search
  • spazio vettoriale dei concetti

Conclusioni

Grazie per l' attenzione

Domande?


Se non è sul Web non esiste ...

... troverete sul sito dell' Ufficio (http://www.w3c.it/)
le slide (http://www.w3c.it/talks/2006/km11/)
e il documento (http://www.w3c.it/papers/km11.pdf)