I lessici tratti da corpora strutturati in diverse tipologie testuali sono, normalmente, ordinati per indice d’uso. Esso, però, due limiti indesiderabili: diventa uguale a zero quando le occorrenze di un lemma sono concentrate, indipendentemente dalla sua frequenza, in una sola delle parti in cui il corpus è suddiviso; nel caso di corpora non bilanciati assume valori uguali nel caso in cui due o più lemmi hanno distribuzioni di frequenza simili, ma non sovrapponibili. Nel saggio viene proposto un indice che superi entrambi i limiti.
Dispersione ed Indipendenza: due parametri per il calcolo dell'Indice d'uso nei corpora
DE MASI, Salvatore
2012-01-01
Abstract
I lessici tratti da corpora strutturati in diverse tipologie testuali sono, normalmente, ordinati per indice d’uso. Esso, però, due limiti indesiderabili: diventa uguale a zero quando le occorrenze di un lemma sono concentrate, indipendentemente dalla sua frequenza, in una sola delle parti in cui il corpus è suddiviso; nel caso di corpora non bilanciati assume valori uguali nel caso in cui due o più lemmi hanno distribuzioni di frequenza simili, ma non sovrapponibili. Nel saggio viene proposto un indice che superi entrambi i limiti.File in questo prodotto:
Non ci sono file associati a questo prodotto.
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.