Login

Tweet recenti ...

By A Web Design Company

dictionary200x150In questo breve articolo vengono presentate alcune ontologie in campo biomedico allo scopo di fornire un semplice schema descrittivo di cosa è oggi disponibile.

Essendo il settore ontologico in piena espansione ci si focalizzerà su due casi particolari da cui potranno essere estrapolate delle considerazioni di carattere generale.

Il primo progetto è quello della Open Biological and Biomedical Ontologies, meglio noto come OBO Foundry. Il secondo è il progetto GALEN.

Entrambi i progetti hanno l'obiettivo di mettere a disposizione delle ontologie biomediche, anche se con delle differenze che saranno più chiare nel seguito.

Open Biological and Biomedical Ontologies

Il progetto OBO Foundry consiste nella collaborazione di numerosi sviluppatori di ontologie con il fine di stabilire un insieme di principi per la loro costruzione con l'obiettivo di creare un insieme (libreria) di ontologie tra loro ortogonali e interoperabili in campo biologico e biomedico.

Al momento le ontologie che fanno parte della OBO Foundry sono le seguenti:processi biologici, componenti cellulari, entità chimiche di interesse biologico, funzioni molecolari, qualità fenotipica, proteine, anatomia e sviluppo di Xenopus e Zebrafish.Oltre a queste ontologie ve ne sono altre che potrebbero in futuro essere inserite nel progetto o, comunque, di interesse.

Tutte le ontologie sono in un formato specifico denominato OBO. Si tratta di un flat file in formato testuale, la cui versione attuale è la 1.2. Il formato di un documento OBO prevede un'intestazione e una o più "stanza" (ossia in una o più strofe, traducendo il termine dall'inglese). Ogni stanza è una sequenza (identificata da un'apposita etichetta) di coppie di tag. Essendo un formato destinato alla rappresentazione di ontologie prevede, ad esempio, dei meccanismi di definizione di sottoinsiemi, di sinonimi, di tipi di dati, operazioni di algebra relazionale e molto altro ancora.

Il formato è molto ricco e può essere convertito in OWL. Allo scopo di agevolare la conversione bidirezionale tra i due linguaggi per la rappresentazione di ontologie è nato un progetto specifico che permette la traduzione di ontologie scritte per uno nell'altro senza alcuna perdita. Grazie a questa conversione è possibile utilizzare le ontologie espresse in OBO per implementare "semplicemente" un Web semantico biomedico. I dettagli possono essere trovati in Syed Hamid Tirmizi, Stuart Aitken, Dilvan Moreira, Chris Mungall, Juan Sequeda, Nigam H. Shah and Daniel P. Miranker. OBO & OWL: Roundtrip Ontology Transformations. In Proceedings of Semantic Web Applications and Tools for Life Sciences Workshop, Amsterdam, The Netherlands, November 20, 2009.

In conclusione OBO Foundry può essere ritenuto un progetto che da esperimento si è trasformato in un framework per lo sviluppo di ontologie. Di conseguenza il risultato non è soltanto un "vocabolario controllato" di termini tecnici ma anche una metodologia per la creazione di ontologie.

GALEN

Il progetto GALEN, che ha dato vita al meglio noto Open GALEN, nasce in ambito europeo e punta alla realizzazione di un modello di conoscenza relativo a termini medici. Il progetto GALEN ha sviluppato un cospicuo insieme di concetti che sono stati organizzati mediante l'utilizzo del linguaggio (definito in GALEN) GRAIL. Oggi è possibile tradurre le ontologie GRAIL in ontologie OWL-RDF (OWL 2.0).

L'obiettivo di GALEN è quello di rendere il più possibile machine-friendly lo scibile e le informazioni in campo (bio)medico. Il risultato è un sistema computerizzato di codifica multilingue per l'utilizzo in campo medico.

Tale obiettivo punta a risolvere alcune questioni chiave quali il problema di avere sistemi multilingue che però siano in grado di preservare e condividere la conoscenza sottostante allo specifico linguaggio oppure la necessità di superare la barriera tra l'elevato livello di dettaglio informativo (prossimo al linguaggio naturale) necessario per la gestione dei dati clinici di un paziente e quello aggregato utile a fini statistici. I fronti su cui GALEN si propone sono molteplici e riguardano il superamento dei vincoli informativi legati alla semantica del dato.

Un primo risultato è il GALEN Common Reference Model, un insieme di concetti medici riutilizzabile e indipendente dal linguaggio impiegato. Il Common Reference Model è strutturato secondo quattro parti:

  • un'ontologia di aIto livello che rappresenta gli schemi e i concetti più astratti e di uso generale
  • il Common Reference Model stesso, ossia una raccolta di definizioni e parti di definizioni, facilmente riutilizzabili, di termini legati all'anatomia, alle patologie, ai sintomi e via dicendo
  • estensioni dettagliate per gestire concetti che necessitano di un livello di dettaglio molto spinto
  • un modello di concetti composti che utilizzano il Common Reference e le sue estensioni (ad esempio: procedure chirurgiche)

L'ontologia di alto livello di GALEN è indipendente dalla lingua utilizzata ed è uno schema di alto livello che consente di stabilire le regole fondamentali per la collaborazione e la condivisione dell'informazione.

GALEN si basa su un principio fondamentale che è quello della separazione tassonomica. In pratica, i concetti vengono descritti in termini di loro componenti che vengono raggruppati secondo gerarchie pure. Questi elementi di gerarchie pure vengono quindi ricombinati a formare tutti i concetti necessari. La classificazione di tali composizioni può essere completamente automatizzata.

Conclusioni

In questo articolo sono stati introdotti due approcci differenti alla realizzazione di una raccolta di termini medici elaborabili automaticamente. Entrambi i progetti hanno prodotto delle ontologie, sebbene abbiano avuto una genesi e una collocazione geografica differenti. Sono solo due esempi di come, oggi, la rappresentazione della conoscenza in modo da poter essere elaborata in maniera sempre più automatica e sempre più indipendente dal linguaggio sia diventata una necessità imprescindibile.

In altri articoli proseguiremo l'analisi dei due progetti con approfondimenti, in particolare sui linguaggi utilizzati e sul processo di traduzione da e verso OWL.

Logica dei Sistemi dell'ing. Luca Lezzerini è a disposizione di chi fosse interessato a sviluppare delle ontologie per poter elaborare automaticamente il significato delle informazioni in proprio possesso o cercarne in automatico sul web.