Correlazione di Pearson (r)

Capitolo III

CORRELAZIONE DI PEARSON (r)

Link all'indice completo



La correlazione è la relazione che esiste tra due fenomeni o variabili (Akoglu, 2018). Le misure più frequenti di correlazioni sono Pearson (r), Spearman (o) e l’intraclass correlation (ICC).

La correlazione di Pearson (r) permette di correlare tra di loro solo due insiemi di dati (es.: comparazione di due prove [pretest vs posttest, oppure massimale reale vs massimale stimato]). Il risultato è un numero che varia da -1 a +1. Più si avvicina all’unità positiva e più si ha una correlazione tendente alla perfezione e lineare, altrimenti è una correlazione tendente alla perfezione, ma inversa (negativa). Invece, quando si ottiene un valore di 0 o limitrofo si è in presenza di due variabili che non sono correlate (Lexell & Downham, 2005)(Bakdash, 2017). Pearson si applica su dati quantitativi e normalmente distribuiti (gaussiana), invece per le variabili nominali e non normalmente distribuite (outlier) o con una variabile discreta o ordinale (scala di ansia e/o stanchezza) si utilizza Spearman (rho, ).

Come si nota dal libro di Andy Field (Field A. Discovering Statistics Using IBM SPSS (4th ed). London, England: Sage, 20) per poter avere una correlazione significativa è necessario avere un numero di soggetti adeguato. Ad esempio, un r = 0,7 riscontrato solo in 6 atleti non è significativo, infatti ne servono minimo nove. Invece, al contrario più si hanno soggetti e più un r = 0,2 può essere significativo (Sedgwick & George, 2016).

Questo calcolo statistico serve per poter discriminare quale variabile quantitativa introdurre (o mantenere) nel sistema di monitoraggio della fitness-fatica. Si spiega con alcuni esempi.

I. La distanza in sprint (>6,5 m/s) percorsa durante l’allenamento di martedì ha una correlazione molto alta (r = 0,94) con la riduzione dell’altezza del salto (sintomo di fatica neuromuscolare) riscontrata di mercoledì durante il preallenamento. In questa situazione durante ogni sessione fisica è necessario monitorare la distanza percorsa a velocità >6,5 m/s in quanto riesce a discriminare la fatica.

II. Il tempo speso a intensità <80% FCmax ha una correlazione di r = 0,25 con il decremento dell’altezza del CMJ (fatica neuromuscolare) riscontrato nel giorno seguente. Questa variabile (tempo <80% FCmax) non è necessario monitorarla in quanto non fornisce un valore aggiunto allo screening generale dato che non discrimina l’affaticamento.

Questi sono due esempi esplicativi, ovviamente questa correlazione deve essere protratta per più volte e per tutti i soggetti prima di poter eliminare una variabile dal monitoraggio.

Attenzione. Quando si legge la correlazione è molto importante che non si derivi un rapporto di causa-effetto tra le due variabili. Esse sono relazionate (es. se aumenta una incrementa anche la seconda), ma non sono in una relazione di causalità.

Calcolare gli intervalli di confidenza dalla correlazione di Pearson (Bewick et al., 2003)

COEFFICIENTE DI DETERMINAZIONE (R2)

Il coefficiente di determinazione indica “la proporzione della variazione totale in una delle variabili che può essere spiegata o predetta sulla base della relazione lineare con l’altra variabile” (Richardson, 2011). Ad esempio, se si correla la forza e la velocità con un r = 0,7, si sa che il 49% della variabilità nella forza è spiegata dalla velocità.


R^2 = r x r x 100

Negli esempi grafici precedenti si può osservare i seguenti R2 = 0,998; 0,9882 e 0,0371.


RAPPORTO DI CORRELAZIONE (η)

Misura il grado di associazione tra due variabili (X, dipendente ed Y, indipendente). Il quadrato della correlazione (η2) misura l’effetto della singola varianza delle dimensioni rispetto alla varianza totale (Richardson, 2011).