Statistiques - Échantillonnage stratifié

Cette stratégie d'examen est utilisée dans le cadre de circonstances où la population peut être divisée sans effort en rassemblements ou strates qui ne sont pas particulièrement identiques les uns aux autres, mais les composants à l'intérieur d'un rassemblement sont homogènes en ce qui concerne quelques attributs, par exemple les sous-études de l'école peut être séparé en strates en fonction de l'orientation sexuelle, des cours proposés, de l'âge, etc. En cela, la population est initialement divisée en strates et ensuite un échantillon irrégulier de base est prélevé dans chaque strate. Les tests stratifiés sont de deux sortes: inspection stratifiée proportionnelle et examen stratifié disproportionné.

  • Échantillonnage stratifié proportionnel - Dans ce nombre, le nombre d'unités sélectionnées dans chaque strate est proportionnel à la part de la strate dans la population. Par exemple, dans un collège, il y a 2500 étudiants au total, dont 1500 étudiants sont inscrits à des cours de deuxième cycle et 1000 sont inscrits à des études supérieures cours. Si un échantillon de 100 devait être choisi à l'aide d'un échantillonnage stratifié proportionnel, le nombre d'étudiants de premier cycle dans l'échantillon serait de 60 et 40 seraient des étudiants de troisième cycle. Ainsi, les deux strates sont représentées dans la même proportion dans l'échantillon que leur représentation dans la population.

    Cette méthode est plus appropriée lorsque l'échantillonnage a pour but d'estimer la valeur de la population d'une caractéristique et qu'il n'y a pas de différence dans les variances intra-strate.

  • Échantillonnage stratifié disproportionné - Lorsque l'objectif de l'étude est de comparer les différences entre les strates, il devient alors nécessaire de tirer des unités égales de toutes les strates, quelle que soit leur part dans la population. Parfois, certaines strates sont plus variables par rapport à certaines caractéristiques que d'autres strates, dans un tel cas, un plus grand nombre d'unités peut être tiré des strates plus variables. Dans les deux cas, l'échantillon tiré est un échantillon stratifié disproportionné.

    La différence de taille de strate et de variabilité de strate peut être répartie de manière optimale en utilisant la formule suivante pour déterminer la taille de l'échantillon à partir de différentes strates

    Formule

    $ {n_i = \ frac {n.n_i \ sigma_i} {n_1 \ sigma_1 + n_2 \ sigma_2 + ... + n_k \ sigma_k} \ for \ i = 1,2 ... k} $

    Où -

    • $ {n_i} $ = la taille de l'échantillon de i strates.

    • $ {n} $ = la taille des strates.

    • $ {\ sigma_1} $ = l'écart-type de i strates.

    En plus de cela, il pourrait y avoir une situation où le coût de la collecte d'un échantillon pourrait être plus élevé dans une strate que dans d'autres. L'échantillonnage disproportionné optimal doit être effectué de manière à

    $ {\ frac {n_1} {n_1 \ sigma_1 \ sqrt {c_1}} = \ frac {n_2} {n_2 \ sigma_1 \ sqrt {c_2}} = ... = \ frac {n_k} {n_k \ sigma_k \ sqrt { c_k}}} $

    Où $ {c_1, c_2, ..., c_k} $ fait référence au coût d'échantillonnage dans k strates. La taille de l'échantillon de différentes strates peut être déterminée à l'aide de la formule suivante:

    $ {n_i = \ frac {\ frac {n.n_i \ sigma_i} {\ sqrt {c_i}}} {\ frac {n_1 \ sigma_1} {\ sqrt {c_i}} + \ frac {n_2 \ sigma_2} {\ sqrt {c_2}} + ... + \ frac {n_k \ sigma_k} {\ sqrt {c_k}}} \ for \ i = 1,2 ... k} $

Exemple

Énoncé du problème:

Une organisation compte 5000 employés répartis en trois niveaux.

  • Strate A: 50 cadres avec écart type = 9

  • Strate B: 1250 travailleurs non manuels avec écart type = 4

  • Strate C: 3700 travailleurs manuels avec écart type = 1

Comment un échantillon de 300 employés sera-t-il tiré sur une base disproportionnée avec une répartition optimale?

Solution:

Utilisation de la formule d'échantillonnage disproportionné pour une répartition optimale.

$ {n_i = \ frac {n.n_i \ sigma_i} {n_1 \ sigma_1 + n_2 \ sigma_2 + n_3 \ sigma_3}} \\ [7pt] \, pour le flux A, {n_1 = \ frac {300 (50) (9 )} {(50) (9) + (1250) (4) + (3700) (1)}} \\ [7pt] \, = {\ frac {135000} {1950} = {14.75} \ ou \ say \ {15}} \\ [7pt] \, pour le flux B, {n_1 = \ frac {300 (1250) (4)} {(50) (9) + (1250) (4) + (3700) (1 )}} \\ [7pt] \, = {\ frac {150000} {1950} = {163.93} \ ou \ say \ {167}} \\ [7pt] \, pour le flux C, {n_1 = \ frac { 300 (3700) (1)} {(50) (9) + (1250) (4) + (3700) (1)}} \\ [7pt] \, = {\ frac {110000} {1950} = { 121.3} \ ou \ say \ {121}} $