Dalle Literary Machines al Semantic Web
Oreste Signore
Ufficio Italiano W3C presso il C.N.R. - ISTI
Area della Ricerca di Pisa San Cataldo - Via G. Moruzzi, 1 -
56124 Pisa
Email:oreste@w3.org
Giornata di Studi
Confronti di metodo: saggi di interazione epistemologica
Varese - 19 marzo 2004
Contenuto
- Dall'ipertesto al Web
- Il Semantic Web
- Le caratteristiche delle applicazioni nel settore
culturale
- La qualità
- Una strategia
Ripensando agli ipertesti...
Una rivoluzione nell' accesso all' informazione
- più naturale
- privilegia l' aspetto associativo
- combina vari tipi di informazione
Elementi essenziali del modello
- nodi: i dati
- link: la componente associativa
I link
- La vera ricchezza dell' ipertesto: implementano l' aspetto
associativo
- Quanti link?
- se troppi, provocano disorientamento e sovraccarico
cognitivo
- se pochi, trasformano l' ipertesto in una banale
cascata di menù
- Come classificarli:
- estensionali: memorizzati esplicitamente nell'
ipertesto
- intensionali: derivati dal contesto, non memorizzati
esplicitamente
Il Web: la rivoluzione degli anni '90
 |
- Basato sui principi dell' ipertesto:
- universal information space
- navigabile
- Aperto all' evoluzione
- Interoperabile
- aspetto tecnologico
- aspetto semantico
- Decentralizzato
- architettura peer-to-peer
- non autorità, ma autorevolezza
- Universal Access
- nessuna discriminazione per sesso, razza, cultura,
mezzi materiali, capacità
|
La genesi del World Wide Web
Nel 1989 Tim Berners-Lee propose il World Wide Web

Evoluzione del World Wide Web

- Progettato originariamente per condividere l' informazione
(man-machine interaction)
- Oggi l' interesse è puntato sulla machine to
machine interaction
Contenuto
- Dall'ipertesto al Web
- Il Semantic Web
- Le caratteristiche delle applicazioni nel settore
culturale
- La qualità
- Una strategia
I have a dream ...
"The entertainment system was belting out the Beatles "We Can
Work It Out" when the phone rang. When Pete answered, his phone
turned the sound down by sending a message to all other
local devices that had a volume control.
...
His sister, Lucy, was on the line from the doctor’s
office At the doctor’s office, Lucy instructed her
Semantic Web agent through her handheld Web
browser. The agent promptly retrieved
information about ...”
(Da: The Semantic Web, by Tim Berners-Lee, James Hendler and
Ora Lassila, Scientific American, May 2001)
La filosofia del Semantic Web ...
- Web as Universal Information Space ...
- trovare qualunque cosa in qualunque posto
- navigabile
- mapping da URI (Universal Resource Identifier) a risorse
- Semantic Web
- semantic = machine processable (non prevede AI,
interpretazione linguaggio naturale)
Le macchine devono essere capaci di risolvere un
problema ben definito mediante operazioni ben
definite su dati ben definiti.
- ambiente dichiarativo: si specifica il significato
dei dati
- eventuali conversioni dei dati
- "semantic test": la macchina riceve i dati e li
utilizza in maniera corretta
- essenziale il fattore di scala
- viene rimosso il requisito della consistenza globale
L' architettura del Semantic Web
- semantic = machine processable
Le macchine devono essere capaci di risolvere un
problema ben definito mediante operazioni ben
definite su dati ben definiti.
- ambiente dichiarativo
 |
- Ruolo di base giocato da XML
- RDF e RDF Schema hanno un ruolo centrale
per descrivere le risorse e i loro tipi
- Livello ontologico:
- descrive le relazioni tra i tipi di elementi
- non fornisce informazioni su come utilizzare queste relazioni
dal punto di vista computazionale
- Livello logico:
- derivare nuova conoscenza dalle asserzioni esistenti
- i sistemi deduttivi non sono interoperabili
- un linguaggio universale per rappresentare le dimostrazioni,
esportabili con autenticazione di firma digitale?
- Digital signature:
- a "grana grossa"
- a grana più fine potrebbe autenticare ontologie,
deduzioni, dati
|
L' architettura del Semantic Web ...

I livelli del Semantic Web ...
- Ruolo di base giocato da XML
- RDF e RDF Schema hanno un ruolo centrale
per descrivere le risorse e i loro tipi
- Livello ontologico:
- descrive le relazioni tra i tipi di elementi
- non fornisce informazioni su come utilizzare queste relazioni
dal punto di vista computazionale
- Digital signature:
- a "grana grossa"
- a grana più fine potrebbe autenticare ontologie,
deduzioni, dati
- Livello logico:
- derivare nuova conoscenza dalle asserzioni esistenti
- i sistemi deduttivi non sono interoperabili
- un linguaggio universale per rappresentare le dimostrazioni,
esportabili con autenticazione di firma digitale?
I metadati
Perché?
- Nel Web di oggi tutte le informazioni sono "machine
readable"
- Nel Semantic Web le informazioni devono essere "machine
understandable"
Cosa sono?
- Informazioni, elaborabili automaticamente (machine
understandable), relative a una risorsa web o a qualche
altra cosa
- ... data about data
- ... informazioni che possono essere utilizzate da
intelligent software agents per fare un uso appropriato
delle risorse
- ... dati ...
- ... che possono essere descritti da altri metadati
...
Chi li definisce?
- Le singole comunità definiscono la
semantica
- Le proprietà vengono identificate univocamente
mediante il meccanismo dei namespace
(es. Dublin Core Initiative)
- L' architettura è peer to peer!
Il Web prima di RDF
Milioni di risorse collegate ...
... risorse e associazioni di tipo sconosciuto
Era così ...
 |
Il Web dopo RDF
Milioni di risorse collegate ...
... risorse e associazioni di tipo definito
... e adesso è
 |
RDF - un linguaggio per descrivere il significato delle
risorse
Il reperimento delle risorse può essere basato sulle loro
proprietà, piuttosto che indicizzando tutte le parole
presenti.
Il Semantic Web (ricapitolando)
- Interazione machine-to-machine
- Intelligent software agents
- Metadati
- Decentralizzazione
- Armonizzazione delle ontologie
- Reasoning
- Interoperabilità semantica
- Fiducia
- Searching the Web
Molte delle tecnologie necessarie sono già
disponibili
Contenuto
- Dall'ipertesto al Web
- Il Semantic Web
- Le caratteristiche delle applicazioni nel settore
culturale
- La qualità
- Una strategia
I problemi
- Multidisciplinarità
- Associatività
- Contesto spazio-temporale
- Dati imprecisi (es. date)
- Transnazionalità
- Tradizioni culturali diverse e solide
- Ricchezza semantica
- Differenze semantiche
- Conoscenza esplicita e implicita
- Adattabilità a diversi tipi di utenti
Il contesto specifico dei Beni Culturali
- Associatività
- es. per contesto geografico o culturale, per soggetto
raffigurato
- Differenti tipi di ricerche:
- molto specifiche (alta precisione)
- riferimenti anche marginali (alto richiamo)
- lo stesso utente può avere di volta in volta esigenze
contrastanti
- Diversi livelli di utenza:
- studioso
- cultore della materia
- turista colto o frettoloso
- ...
- Molte associazioni possibili tra i vari
documenti
- Desiderio di accedere all' "Universe of
Information"
- Alcuni link potrebbero condurre a nodi non significativi
- Rispuntano i vecchi problemi:
- lost in the hyperspace
- cognitive overhead
- Occorrono sistemi adattivi e
intelligenti
I problemi concettuali
- Strutturazione dei dati
- importanza del livello concettuale
- Normalizzazione del linguaggio
- Differenze di scuola, cultura e tradizione
- spesso accordo quasi completo sulla semantica dei singoli
campi informativi
- differenze nell' organizzazione delle informazioni
- Contesto temporale e contesto spaziale
- memorizzare informazioni dipendenti dal parametro tempo
- visualizzare mappe contenenti dati consistenti dal punto di
vista cronologico
I problemi implementativi (sommario)
- Link strutturali e associativi
- Dizionari e "authority files"
- Navigazione su thesaurus
- L' algebra temporale
- I paradigmi di interazione
- L' interfaccia utente
Link
- Strutturali
- sono inerenti allo specifico oggetto
- facili da implementare
- sono link estensionali
- Associativi
- valore aggiunto rilevante
- permettono di collocare le informazioni nel corretto
contesto storico e culturale
- possono essere moltissimi, e dettati dai più svariati
meccanismi associativi
- sono link intensionali
- possono essere implementati realizzando un "livello
concettuale"
- l' utente naviga dal "livello dati" al "livello
concettuale" e viceversa
- entrambi i livelli sono navigabili
Dizionari e "authority files"
Dizionari terminologici
- essenziali per la formulazione di query "precise"
- riducono il rischio del "silenzio"
- sforzo elevato da parte degli studiosi
- non costituiscono un reale problema implementativo
Authority files
- sono più complessi dei dizionari terminologici
- non sono una semplice lista di termini
- sono un insieme di informazioni da consultare per individuare
il termine corretto da utilizzare (es. il "Dizionario
Autori")
Navigazione su thesaurus
- Un thesaurus è una delle implementazioni più
semplici e immediate dello "spazio dei concetti", o, se
si vuole, del livello ontologico del Semantic Web
- Un thesaurus può essere strutturato ad albero
o multialbero
- Un thesaurus può essere rappresentato sotto forma di
grafo:
- nodi = termini del thesaurus
- archi = connessioni
- L' utente deve poter:
- visualizzare il grafo
- filtrarlo in base al tipo di connessioni di
interesse
- muoversi sul grafo (ottenendo spiegazioni
dettagliate sui termini, ed eventualmente immagini)
- estendere l' albero verso le foglie o la radice
- selezionare i termini di interesse per successivo
utilizzo nella formulazione della query
Algebra temporale
- Le informazioni vanno poste nel loro corretto contesto
spazio-temporale
- Le date sono spesso espresse con indeterminazione:
- inizio 1800
- metà secolo XIX
- tra il 1712 e il 1715
- circa 1827
- ...
- Vanno gestite sia le date puntuali (ancorché
indeterminate) che quelle durative (corrispondenti a intervalli
di tempo)
- Occorre un' algebra temporale per supportare operatori del
tipo:
- <Data1> antecedente a
<Data2>
- <Data1> parzialmente sovrapposta
a <Data2>
- <Data1> compresa in
<Data2>
e consenta di effettuare ordinamenti cronologici
- L' ordinamento di date non omogenee è un problema
semantico non banale.
A titolo di esempio, si consideri la seguente sequenza:
- 1° gennaio 1800
- probabilmente il 2 febbraio 1800 (comunque tra gennaio e
aprile 1800)
- inizio anno 1800
- metà anno 1800
- prima metà del XIX secolo
- probabilmente nel 1810 (comunque tra fine anno 1800 e fine
anno 1832)
- XIX secolo
Interfaccia utente
Quality factors:
- accessibilità
WAI (Web Accessibility Initiative)
- usabilità
- Deve essere considerata con attenzione nella fase di
progettazione delle interfacce Web
- Progettare tenendo conto delle esigenze di
accessibilità contribuisce a una progettazione
che tenga conto dell' usabilità
- occorre separare la presentazione dal resto dell'
applicazione
- interoperabilità semantica
L' interoperabilità semantica
- La strutturazione dei dati dipende da fattori personali,
culturali, da tradizioni di pensiero:
- La mia DTD è più giusta della tua
- Questa non è una ENTITY, deve essere vista come
ATTRIBUTE dell' ENTITY xxx
- Anche il contenuto di un semplice data item può non
essere chiaro a tutti:
- Cosa significa "9 Thermidore"?
- Mi sembra che "700 d.C." sia circa"70 anni dall'
Egira"
- Quanto più è sofisticata la struttura del
documento, tanto più improbabile è la
compatibilità
- Anche standard affermati, come Dublin Core o
Bib-1 non vengono utilizzati da tutti in maniera
consistente
- Struttura dei documenti e ontologie sono implicitamente
legati
- Vanno riconciliate sia le ontologie che le
strutture dei documenti, rispettando le tradizioni
culturali e scientifiche
Contenuto
- Dall'ipertesto al Web
- Il Semantic Web
- Le caratteristiche delle applicazioni nel settore
culturale
- La qualità
- Una strategia
La qualità
- Il progetto Minerva (MInisterial NEtwoRk
for Valorising Activities in
digitisation)
(trasparente - efficace - mantenuto
- accessibile - centrato sull'utente - reattivo - multilingue -
interoperabile - gestito - conservato)
- Usabilità
- Accessibilità
- Adattabilità
- Supporto di un livello concettuale
Paradigmi di interazione
Possono essere ricondotti a:
- mappa (geografica o topografica)
- tempo
- sistema di classificazione
- ricerca per punti di accesso
- e alle loro combinazioni
Possono essere implementati mediante la creazione di un
opportuno "livello concettuale" che permette di
supportare i link intensionali
Contenuto
- Dall'ipertesto al Web
- Il Semantic Web
- Le caratteristiche delle applicazioni nel settore
culturale
- La qualità
- Una strategia
Alcuni elementi di progettazione
- Tener sempre presenti i principi base del Web:
- Universal Information Space
- Universal Access
- No centralization
- Sistemi adattivi e intelligenti:
- agents
- information filtering
- user profiling
- Struttura del documento:
- light tagging
- weighted information items
- weighted and typed links
- L' interfaccia utente deve supportare:
- svariati paradigmi di interazione (mappa, tempo,
classificazione)
- formulazione e raffinamento della query
- riconfigurazione dinamica del contenuto
e, ovviamente:
Conclusioni
- L' accesso all' informazione distribuita viene proposta dal
Web ad un livello di scala mai visto
- I metadati portano un contributo fondamentale al
miglioramento dell' accesso all' informazione
- L' infrastruttura del Semantic Web consente l'
interoperabilità semantica tra applicazioni e culture
diverse
- Bisogna condividere i principi informatori del Web
Once the web has been sufficiently "populated" with rich
metadata, what can we expect? First, searching on the web will
become easier as search engines have more information available,
and thus searching can be more focused. Doors will also be opened
for automated software agents to roam the web, looking for
information for us or transacting business on our behalf. The web
of today, the vast unstructured mass of information, may in the
future be transformed into something more manageable - and thus
something far more useful.
Grazie per l' attenzione
?
Se non è sul web non esiste ...
... troverete sul sito dell' Ufficio (http://www.w3c.it/)
questa presentazione (http://www.w3c.it/talks/varese2004/)