Statistiques - Coefficient de corrélation

Coefficient de corrélation

Un coefficient de corrélation est une mesure statistique du degré auquel les changements de la valeur d'une variable prédisent le changement de la valeur d'une autre. Dans les variables à corrélation positive, la valeur augmente ou diminue en tandem. Dans les variables corrélées négativement, la valeur de l'une augmente à mesure que la valeur de l'autre diminue.

Les coefficients de corrélation sont exprimés sous forme de valeurs comprises entre +1 et -1.

Un coefficient de +1 indique une parfaite corrélation positive: un changement dans la valeur d'une variable prédira un changement dans la même direction dans la deuxième variable.

Un coefficient de -1 indique un négatif parfait: un changement dans la valeur d'une variable prédit un changement dans la direction opposée dans la deuxième variable. Les degrés de corrélation inférieurs sont exprimés en décimales non nulles. Un coefficient de zéro indique qu'il n'y a pas de relation discernable entre les fluctuations des variables.

Formule

$ {r = \ frac {N \ sum xy - (\ sum x) (\ sum y)} {\ sqrt {[N \ sum x ^ 2 - (\ sum x) ^ 2] [N \ sum y ^ 2 - (\ sum y) ^ 2]}}} $

Où -

  • $ {N} $ = Nombre de paires de scores

  • $ {\ sum xy} $ = Somme des produits des scores appariés.

  • $ {\ sum x} $ = Somme de x scores.

  • $ {\ sum y} $ = Somme des scores y.

  • $ {\ sum x ^ 2} $ = Somme des scores x au carré.

  • $ {\ sum y ^ 2} $ = Somme des scores y au carré.

Exemple

Énoncé du problème:

Calculez le coefficient de corrélation des éléments suivants:

X Oui
1 2
3 5
4 5
4 8

Solution:

$ {\ sum xy = (1) (2) + (3) (5) + (4) (5) + (4) (8) = 69 \\ [7pt] \ sum x = 1 + 3 + 4 + 4 = 12 \\ [7pt] \ sum y = 2 + 5 + 5 + 8 = 20 \\ [7pt] \ sum x ^ 2 = 1 ^ 2 + 3 ^ 2 + 4 ^ 2 + 4 ^ 2 = 42 \ \ [7pt] \ sum y ^ 2 = 2 ^ 2 + 5 ^ 2 + 5 ^ 2 + 8 ^ 2 = 118 \\ [7pt] r = \ frac {69 - \ frac {(12) (20)} { 4}} {\ sqrt {(42 - \ frac {(12) ^ 2} {4}) (118- \ frac {(20) ^ 2} {4}}} \\ [7pt] = .866} $