Correlazione
Siano \(X = \{x_1, x_2, \ldots, x_N \}\) e \(Y = \{y_1, y_2, \ldots y_N \}\) due variabili osservate su un collettivo di \(N\) unità e aventi media rispettivamente \(\bar{x}\) e \(\bar{y}\)
- si definisce codevianza la quantità
\[codev(X,Y) = \sum_{i=1}^N{(x_i - \bar{x})(y_i - \bar{y}}) \]
- dividendo la codevianza per la numerosità \(N\) si ottiene la covarianza
\[ COV(X,Y) = \frac{1}{N}\sum_{i=1}^N{(x_i - \bar{x})(y_i - \bar{y}}) \]
- dividendo la covarianza per la radice quadrata del prodotto delle deviazioni standard si ottiene il coefficiente di correlazione \(\rho\) compreso fra \(-1\) e \(1\)
\[ -1 \leq \rho(X,Y) = \frac{\frac{1}{N}\sum_{i=1}^N{(x_i - \bar{x})(y_i - \bar{y}})}{\sqrt{\sigma_X^2 \sigma_Y^2}} \leq 1 \]