17. Test del \(\chi^2\) dell’indipendenza fra caratteri nominali /1
In un contesto inferenziale, in cui il totale della tabella \(n_{\cdot \cdot}\) rappresenta l’ampiezza del campione e la frequenza di ciascuna cella \(n_{ij}\) è la determinazione di una variabile casuale multinomiale, allora \(\chi^2\) è anche una statistica campionaria.
Si dimostra che la distribuzione della statistica campionaria \(\chi^2\) approssima la distribuzione della v.c. \(\chi^2\) con gradi di libertà pari al numero delle righe meno per il numero delle colonne meno uno: g.l. = \((r - 1) \times (c - 1)\).
Esiste una statistica, una statistica campionaria \(\chi^2\) ed una distribuzione \(\chi^2\). Poiché si tratta di entità differenti che hanno lo stessa denominazione, per motivi che adesso appaiono più che ovvi, bisogna fare molta attenzione a non fare confusione.
La bontà dell’approssimazione è condizionata dalla frequenza di ciascuna cella. Per garantire una approssimazione soddisfacente si richiede che la frequenza osservata di ciascuna cella sia almeno pari \(5\). Questa regola è dettata dall’esperienza e dal buon senso. La numerosità di una singola cella è solo uno degli elementi che condizionano la bontà dell’adattamento.