Wordnet è un’ontologia linguistica top-level che rappresenta in maniera esplicita e formale la conoscenza linguistica umana. Lo scopo di Wordnet è mettere a disposizione un database lessicale sotto forma di dizionario.
Il contenuto è la conoscenza linguistica di senso comune che può essere usata in qualsiasi dominio, infatti i sistemi per Information Retrieval e Text Categorization ricorrono a Wordnet per aggiungere semantica al processo di ritrovamento e categorizzazione mediante sia algoritmi di base per l’indicizzazione che per algoritmi avanzati di word-sense-disambiguation.

In Wordnet la parola viene considerata come un’associazione fra una word-form e una word-meaning. La word-form è l’espressione fisica della parola, la stringa come concatenazione di lettere, mentre la word-meaning è il concetto lessicale che la word-form esprime.
La matrice lessicale realizza il mapping tra word-form e word-meaning. Nei casi di parole con più significati, quindi polisemiche, avremo più word-meaning che corrisponderanno ad una stessa word-form, mentre nei casi opposti di parole sinonime avremo più word-form che corrisponderanno ad una stessa word-meaning.
Una word-meaning viene rappresentata dall’insieme di tutte le word-form che possono essere usate per esprimerla, questo insieme si chiama synset.
I synset sono quindi collezioni di sinonimi di word-form che aranno associati ad ogni word-meaning, le word-form quindi sono mappate tra loro grazie ai synset mentre le word-meaning sono mappate tra loro grazie alle relazioni tra i synset. L’utente quindi, conoscendo la semantica di almeno una delle word-form del synset, è in grado di ricavasi la word-meaning, ossia il significato della parola.
Sulla base della memoria lessicale umana, Wordnet si suddivide in quattro categorie lessicali: nomi, verbi, aggetivi ed avverbi. I nomi sono legati da due tipologie di relazioi: relazioni lessicali e relazioni semantiche. Le relazioni lessicali interessano le word-form, ad esempio sinonimi e contrari tra parole con stessa word-meaning, od opposta; mentre le relazioni semantiche interessano le word-meaning, ad esempio l’eponimia tra significati. L’eponimia stabilisce un nesso logico di tipo inclusivo tra word-meaning e può essere iperonimia, quando dati due word-meaning la seconda è inclusa nella prima, mentre iponimia quando si verifica l’opposto. I verbi sono legati da due tipologie di relazioni: implicazione e causa. La prima è simile all’iperonimia dei nomi ma riguarda gesti o attività, mentre la seconda è un’azione prodotta da un’altra.

© 2011 deelab.org Suffusion theme by Sayontan Sinha