Matrice delle covarianze

Niente fonti!
Questa voce o sezione sull'argomento statistica non cita le fonti necessarie o quelle presenti sono insufficienti.

In statistica multivariata e in probabilità, la matrice delle covarianze (o matrice di varianza e covarianza) si indica di solito con Σ {\displaystyle \Sigma } ed è una generalizzazione della covarianza al caso di dimensione maggiore di due. Essa è una matrice che rappresenta la variazione di ogni variabile rispetto alle altre (inclusa se stessa). È una matrice simmetrica.

Statistica

Sia data una popolazione di n {\displaystyle n} elementi su cui sono rilevati k {\displaystyle k} caratteri quantitativi X i {\displaystyle X_{i}} . Cioè ogni X i {\displaystyle X_{i}} con i = 1 , , k {\displaystyle i=1,\dots ,k} è un vettore di n {\displaystyle n} elementi, indicati con x h i {\displaystyle x_{hi}} con h = 1 , , n {\displaystyle h=1,\dots ,n} . L'elemento x h i {\displaystyle x_{hi}} rappresenta quindi la modalità dell' h {\displaystyle h} -esima unità statistica rispetto al carattere X i {\displaystyle X_{i}} . La matrice delle covarianze ha dimensione k × k {\displaystyle k\times k} e ogni elemento è definito come

σ i j 2 = 1 n h = 1 n ( x h i μ i ) ( x h j μ j ) , {\displaystyle \sigma _{ij}^{2}={\frac {1}{n}}\sum _{h=1}^{n}(x_{hi}-\mu _{i})(x_{hj}-\mu _{j}),}

dove μ i {\displaystyle \mu _{i}} indica la media del carattere X i {\displaystyle X_{i}} .

Significato dei valori

Ogni elemento sulla diagonale σ i i 2 {\displaystyle \sigma _{ii}^{2}} è la varianza del carattere X i {\displaystyle X_{i}} ed è quindi sempre un valore non negativo. Ogni elemento σ i j 2 {\displaystyle \sigma _{ij}^{2}} (con i j {\displaystyle i\neq j} ) è la covarianza tra i caratteri X i {\displaystyle X_{i}} e X j {\displaystyle X_{j}} . Nel caso in cui questo valore sia positivo, significa che al crescere di un carattere, cresce anche l'altro. Nel caso in cui questo valore sia negativo, accade il contrario. Se i caratteri sono statisticamente indipendenti, questo valore è 0 {\displaystyle 0} (l'implicazione inversa non è necessariamente verificata).

Applicazioni

Oltre al significato statistico che possiamo dedurre dai termini, la matrice delle covarianze è un parametro della funzione gaussiana, nella statistica multivariata. Spesso in sua vece si utilizza la sua inversa, detta matrice di precisione.

Può inoltre essere d'ausilio alla riduzione delle features, tramite l'analisi delle componenti principali (PCA).

Bibliografia

  • Richard O. Duda, Peter E. Hart, David G. Stork, Wiley Interscience - Pattern Classification (2nd ed.)

Voci correlate

  Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica