Statistiques - Kurtosis

Le degré de queue d'une distribution est mesuré par kurtosis. Il nous indique dans quelle mesure la distribution est plus ou moins sujette aux valeurs aberrantes (plus lourde ou à queue claire) que la distribution normale. Trois types de courbes différents, gracieuseté d'Investopedia, sont présentés comme suit -

kurtosis

Il est difficile de discerner différents types de kurtosis à partir des parcelles de densité (panneau de gauche) car les queues sont proches de zéro pour toutes les distributions. Mais les différences dans les queues sont faciles à voir dans les graphiques quantile-quantile normaux (panneau de droite).

La courbe normale est appelée courbe mésokurtique. Si la courbe d'une distribution est plus sujette aux valeurs aberrantes (ou à queue plus lourde) qu'une courbe normale ou méso-catalytique, elle est alors appelée courbe de Leptokurtic. Si une courbe est moins sujette aux valeurs aberrantes (ou à queue plus claire) qu'une courbe normale, elle est appelée une courbe platykurtic. Le kurtosis est mesuré par des moments et est donné par la formule suivante -

Formule

$ {\ beta_2 = \ frac {\ mu_4} {\ mu_2}} $

Où -

  • $ {\ mu_4 = \ frac {\ sum (x- \ bar x) ^ 4} {N}} $

Plus la valeur de \ beta_2 est élevée, plus la courbe est pointue ou leptokurtique. Une courbe normale a une valeur de 3, un leptokurtic a \ beta_2 supérieur à 3 et le platykurtic a \ beta_2 inférieur à 3.

Exemple

Énoncé du problème:

Les données sur les salaires journaliers de 45 travailleurs d'une usine sont données. Calculez \ beta_1 et \ beta_2 en utilisant moment sur la moyenne. Commentez les résultats.

Salaires (Rs.) Nombre de travailleurs
100-200 1
120-200 2
140-200 6
160-200 20
180-200 11
200-200 3
220-200 2

Solution:

Les salaires
(Rs.)
Nombre de travailleurs
(F)
Mid-pt
m
m - $ {\ frac {170} {20}} $
$ {fd} $ $ {fd ^ 2} $ $ {fd ^ 3} $ $ {fd ^ 4} $
100-200 1 110 -3 -3 9 -27 81
120-200 2 130 -2 -4 8 -16 32
140-200 6 150 -1 -6 6 -6 6
160-200 20 170 0 0 0 0 0
180-200 11 190 1 11 11 11 11
200-200 3 210 2 6 12 24 48
220-200 2 230 3 6 18 54 162
$ {N = 45} $ $ {\ sum fd = 10} $ $ {\ sum fd ^ 2 = 64} $ $ {\ sum fd ^ 3 = 40} $ $ {\ sum fd ^ 4 = 330} $

Puisque les écarts ont été pris à partir d'une moyenne supposée, nous calculons donc d'abord les moments sur l'origine arbitraire, puis les moments sur la moyenne. Moments sur l'origine arbitraire '170'

$ {\ mu_1 ^ 1 = \ frac {\ sum fd} {N} \ times i = \ frac {10} {45} \ times 20 = 4.44 \\ [7pt] \ mu_2 ^ 1 = \ frac {\ sum fd ^ 2} {N} \ fois i ^ 2 = \ frac {64} {45} \ fois 20 ^ 2 = 568,88 \\ [7pt] \ mu_3 ^ 1 = \ frac {\ sum fd ^ 2} {N} \ fois i ^ 3 = \ frac {40} {45} \ fois 20 ^ 3 = 7111.11 \\ [7pt] \ mu_4 ^ 1 = \ frac {\ sum fd ^ 4} {N} \ fois i ^ 4 = \ frac {330} {45} \ fois 20 ^ 4 = 1173333.33} $

Moments de méchanceté

$ {\ mu_2 = \ mu'_2 - (\ mu'_1) ^ 2 = 568.88- (4.44) ^ 2 = 549.16 \\ [7pt] \ mu_3 = \ mu'_3 - 3 (\ mu'_1) (\ mu'_2) + 2 (\ mu'_1) ^ 3 \\ [7pt] \, = 7111.11 - (4.44) (568.88) + 2 (4.44) ^ 3 \\ [7pt] \, = 7111.11 - 7577.48 + 175.05 = - 291,32 \\ [7pt] \\ [7pt] \ mu_4 = \ mu'_4 - 4 (\ mu'_1) (\ mu'_3) + 6 (\ mu_1) ^ 2 (\ mu'_2) -3 (\ mu'_1) ^ 4 \\ [7pt] \, = 1173333.33 - 4 (4.44) (7111.11) +6 (4.44) ^ 2 (568.88) - 3 (4.44) ^ 4 \\ [7pt] \, = 1173333.33 - 126293.31 + 67288.03-1165.87 \\ [7pt] \, = 1113162.18} $

À partir de la valeur du mouvement par rapport à la moyenne, nous pouvons maintenant calculer $ {\ beta_1} $ et $ {\ beta_2} $:

$ {\ beta_1 = \ mu ^ 2_3 = \ frac {(- 291.32) ^ 2} {(549.16) ^ 3} = 0,00051 \\ [7pt] \ beta_2 = \ frac {\ mu_4} {(\ mu_2) ^ 2 } = \ frac {1113162.18} {(546.16) ^ 2} = 3,69} $

D'après les calculs ci-dessus, on peut conclure que $ {\ beta_1} $, qui mesure l'asymétrie, est presque nul, indiquant ainsi que la distribution est presque symétrique. $ {\ beta_2} $ qui mesure le kurtosis, a une valeur supérieure à 3, ce qui implique que la distribution est leptokurtic.