WordNet è un database semantico-lessicale per la lingua inglese elaborato dal linguista George Armitage Miller presso l'Università di Princeton, che si propone di organizzare, definire e descrivere i concetti espressi dai vocaboli.
L'organizzazione del lessico si avvale di raggruppamenti di termini con significato affine, chiamati "synset" (dalla contrazione di synonym set), e del collegamento dei loro significati attraverso diversi tipi di relazioni chiaramente definite. All'interno dei synset le differenze di significato sono numerate e definite.
Il lessico è disponibile gratuitamente on-line e il medesimo metodo è stato applicato anche alle varie lingue europee nell'ambito del progetto EuroWordNet, finanziato dalla Comunità europea (1996-1999). Il lessico per la lingua italiana è stato sviluppato dall'Istituto di linguistica computazionale del CNR a Pisa (diversamente dal suo omologo da cui trae l'idea non è pubblicamente scaricabile).
Nel 2006 il database per la lingua inglese conteneva circa 150.000 parole organizzate in più di 115.000 synset, la maggior parte dei quali sono connessi ad altri synset da relazioni semantiche.
WordNet attualmente è usato nel ramo informatico (in particolar modo nelle università), per lo sviluppo di sistemi WSD Word sense disambiguation.
Classificazione
[modifica | modifica wikitesto]Le relazioni semantiche variano in funzione del tipo di parola e includono:
- per i sostantivi:
- iperonimia (hyperonyms): Y è un iperonimo di X se ogni X è "una specie di" Y;
- iponimia (hyponyms): Y è un iponimo di X se ogni Y è (una specie di) X;
- coordinazione: Y è un termine coordinato di X se X e Y hanno un iperonimo in comune;
- olonimia (holonym): Y è un olonimo di X se X è parte Y;
- meronimia (meronym): Y è un meronimo di X se Y è parte X;
- per i verbi:
- iperonimia (hypernyms): il verbo Y è un iperonimo del verbo X se l'attività X è (una specie di) Y (come viaggio rispetto a movimento);
- troponimia (troponyms): il verbo Y è un troponimo del verbo X se nel fare l'attività Y si fa anche la X (come mormorare rispetto a parlare);
- implicazione (entailment): il verbo Y è un'implicazione del verbo X se nel fare X uno deve per forza fare Y (come russare rispetto a dormire);
- coordinazione: Y è un termine coordinato di X se X e Y hanno un iperonimo in comune.
- Gli aggettivi sono classificati come:
- nomi relativi,
- simile a,
- participi dei verbi;
- Gli avverbi seguono la classificazione dell'aggettivo da cui derivano.
Voci correlate
[modifica | modifica wikitesto]Collegamenti esterni
[modifica | modifica wikitesto]- (EN) Sito ufficiale, su wordnet.princeton.edu.
- (EN) WordNet, su Enciclopedia Britannica, Encyclopædia Britannica, Inc.
- WordNet, su packages.debian.org.
- (EN) Denis Howe, WordNet, in Free On-line Dictionary of Computing. Disponibile con licenza GFDL
- (EN) BabelNet, su babelnet.org.
- (EN) Global Wordnet, su globalwordnet.org.
- MultiWordNet, su multiwordnet.itc.it. URL consultato il 7 agosto 2019 (archiviato dall'url originale il 28 febbraio 2009).
- ItalWordNet sul sito dell'Istituto di Linguistica Computazionale del CNR
- Scheda su WordNet sul sito dell'Istituto di teoria e tecniche dell'informazione giuridica.
- Christiane Fellbaum (a cura di), WordNet. An Electronic Lexical Database. The MIT Press, Cambridge (MA) 1998 - scheda di un volume sul progetto, dal sito dell'editore statunitense (pp. 445, ISBN 0-262-06197-X; ISBN 978-0-262-06197-1)
Controllo di autorità | VIAF (EN) 179937683 · LCCN (EN) n97120839 · GND (DE) 4392196-6 · J9U (EN, HE) 987007588640205171 |
---|