Statistiques - Taille d'échantillon requise

Une partie critique du test est le choix de la mesure du test, c'est-à-dire la quantité d'unités à choisir dans la population pour terminer l'exploration. Il n'y a pas de réponse sans équivoque ou de réponse pour caractériser la taille la plus appropriée. Il existe certainement des jugements erronés en ce qui concerne la durée du test, comme l'exemple devrait représenter 10% de la population ou la taille de l'échantillon est relative à l'étendue de l'univers. Cependant, comme indiqué précédemment, ce ne sont que des jugements malavisés. L'étendue d'un spécimen doit être la capacité de la variété dans les paramètres de population étudiés et l'évaluation de l'exactitude requise par le spécialiste.

La décision sur la taille optimale de l'échantillon peut être approchée sous deux angles: le subjectif et mathématique.

  1. Approche subjective pour déterminer la taille de l'échantillon

  2. Approche mathématique de la détermination de la taille de l'échantillon

Approche subjective pour déterminer la taille de l'échantillon

Le choix de la taille de l'échantillon est affecté par divers facteurs examinés ci-dessous:

  • La nature de la population - Le niveau d'homogénéité ou d'hétérogénéité influence l'étendue d'un spécimen. Si la population est homogène en ce qui concerne les qualités d'intérêt, même une petite taille de l'échantillon est suffisante. Cependant, dans le cas où la population est hétérogène, un plus grand exemple serait nécessaire pour garantir une représentativité suffisante.

  • Nature du répondant - Si les répondants sont facilement accessibles et disponibles, les données requises peuvent être obtenues à partir d'un petit exemple. Au cas où, malgré tout, les répondants ne coopéreraient pas et que la non-réaction serait élevée, un échantillon plus gros serait nécessaire.

  • Nature de l'étude - Une étude ponctuelle peut être menée en utilisant un exemple substantiel. S'il devait y avoir une occurrence d'études d'examen de nature constante et devant être sérieusement achevées, un petit spécimen est plus approprié car il est tout sauf difficile à superviser et à tenir un petit exemple sur une longue période.

  • Technique d'échantillonnage utilisée - Une variable essentielle affectant la durée du test est le système d'examen reçu. Tout d'abord, un système de non-vraisemblance nécessite un échantillon plus gros qu'une stratégie de vraisemblance. Outre le test de vraisemblance, si un examen irrégulier simple est utilisé, il nécessite un exemple plus grand que si une stratification est utilisée, où un petit échantillon est adéquat.

  • Complexité de la tabulation - Tout en se reposant sur l'estimation du spécimen, le spécialiste doit également considérer la quantité de classifications et de classes dans lesquelles les découvertes doivent être rassemblées et ventilées. On a vu que plus la quantité de classifications à produire est grande, plus la taille de l'exemple est grande. Étant donné que chaque classe doit être suffisamment parlée, un plus grand spécimen est nécessaire pour donner des mesures solides de la plus petite classification.

  • Disponibilité des ressources - Les ressources et le temps accessibles aux spécialistes ont un impact sur la durée du test. L'examen est une période et une affectation en espèces, avec des exercices comme la préparation de l'instrument, la passation de contrats et la préparation du personnel sur le terrain, les frais de transport, etc., occupant une quantité considérable d'actifs. Par la suite, si le scientifique ne dispose pas de suffisamment de temps et de supports accessibles, il se contentera d'un petit exemple.

  • Degré de précision et de précision requis -. Il est apparu clairement à partir de notre discours antérieur que la précision, qui est mesurée par une bévue standard, est élevée juste si SE est inférieure ou si la taille de l'exemple est substantielle.

Pour obtenir un haut niveau de précision, un plus grand spécimen est également requis. Outre ces efforts subjectifs, la taille de l'échantillon peut également être déterminée mathématiquement.

Approche mathématique de la détermination de la taille de l'échantillon

Dans l'approche mathématique de la détermination de la taille de l'échantillon, la précision de l'estimation requise est indiquée en premier, puis la taille de l'échantillon est déterminée. La précision peut être spécifiée comme $ {\ pm} $ 1 de la vraie moyenne avec un niveau de confiance de 99%. Cela signifie que si la moyenne de l'échantillon est 200, alors la vraie valeur de la moyenne sera comprise entre 199 et 201. Ce niveau de précision est désigné par le terme «c»

Détermination de la taille de l'échantillon pour les moyennes.

L'intervalle de confiance pour la moyenne de l'univers est donné par

$ {\ bar x \ pm Z \ frac {\ sigma_p} {\ sqrt N} \ ou \ \ bar x \ pm e} $

Où -

  • $ {\ bar x} $ = Exemple de moyenne

  • $ {e} $ = Erreur acceptable

  • $ {Z} $ = Valeur de la variable normale standard à un niveau de confiance donné

  • $ {\ sigma_p} $ = Écart type de la population

  • $ {n} $ = Taille de l'échantillon

L'erreur acceptable «e», c'est-à-dire la différence entre $ {\ mu} $ et $ {\ bar x} $ est donnée par

$ {Z. \ frac {\ sigma_p} {\ sqrt N}} $

Ainsi, la taille de l'échantillon est:

$ {n = \ frac {Z ^ 2 {\ sigma_p} ^ 2} {e ^ 2}} $

Ou

Dans le cas où la taille de l'échantillon est significative par rapport à la taille de la population, la formule ci-dessus sera corrigée par le multiplicateur de population finie.

$ {n = \ frac {Z ^ 2.N. {\ sigma_p} ^ 2} {(N-1) e ^ 2 + Z ^ 2. {\ sigma_p} ^ 2}} $

Où -

  • $ {N} $ = taille de la population

Détermination de la taille de l'échantillon pour les proportions

La méthode de détermination de la taille de l'échantillon lors de l'estimation d'une proportion reste la même que la méthode d'estimation de la moyenne. L'intervalle de confiance pour la proportion d'univers $ {\ hat p} $ est donné par

$ {p \ pm Z. \ sqrt {\ frac {pq} {n}}} $

Où -

  • $ {p} $ = proportion d'échantillon

  • $ {q = (1 - p)} $

  • $ {Z} $ = Valeur de la variable normale standard pour une proportion d'échantillon

  • $ {n} $ = Taille de l'échantillon

Étant donné que $ {\ hat p} $ doit être estimé, la valeur de p peut être déterminée en prenant la valeur de p = 0,5, une valeur acceptable, donnant une taille d'échantillon prudente. L'autre option est que la valeur de p est estimée soit par une étude pilote, soit sur la base d'un jugement personnel. Étant donné la valeur de p, l'erreur acceptable «e» est donnée par

$ {e = Z. \ sqrt {\ frac {pq} {n}} \\ [7pt] e ^ 2 = Z ^ 2 \ frac {pq} {n} \\ [7pt] n = \ frac {Z ^ 2.pq} {e ^ 2}} $

Dans le cas où la population est finie, la formule ci-dessus sera corrigée par le multiplicateur de population finie.

$ {n = \ frac {Z ^ 2.pqN} {e ^ 2 (N-1) + Z ^ 2.pq}} $

Exemple

Énoncé du problème:

Un magasin est intéressé à estimer la proportion de ménages possédant la carte de membre Privilège du magasin. Des études antérieures ont montré que 59% des ménages avaient une carte de crédit en magasin. À un niveau de confiance de 95% avec un niveau d'erreur tolérable de 05.

  1. Déterminez la taille de l'échantillon nécessaire pour mener l'étude.

  2. Quelle serait la taille de l'échantillon si le nombre de ménages cibles était de 1 000?

Solution:

Le magasin contient les informations suivantes

$ {p = .59 \\ [7pt] \ Rightarrow q = (1-p) = (1-.59) = .41 \\ [7pt] CL = .95 \\ [7pt] Et \ le \ Z \ standard \ variate \ for \ CL \ .95 \ is \ 1.96 \\ [7pt] e = \ pm .05} $

La taille de l'échantillon peut être déterminée en appliquant la formule suivante:

$ {n = \ frac {Z ^ 2.pq} {e ^ 2}} $
$ {n = \ frac {(1.96) ^ 2. (. 59). (. 41)} {(. 05) ^ 2} \\ [7pt] = \ frac {.9226} {. 0025} \\ [ 7pt] = 369} $

Un échantillon de 369 ménages est donc suffisant pour mener l'étude.

Étant donné que la population, c'est-à-dire les ménages cibles, est connue pour être de 1 000 et que l'échantillon ci-dessus représente une proportion significative de la population totale, la formule corrigée qui inclut un multiplicateur de population finie est utilisée.

$ {n = \ frac {Z ^ 2.pqN} {e ^ 2 (N-1) + Z ^ 2.pq} \\ [7pt] = \ frac {(1.96) ^ 2. (. 59). ( .41). (1000)} {(. 05) ^ 2 \ fois 999 + (1.96) ^ 2 (.59) (. 41)} \\ [7pt] = \ frac {922.6} {2.497 + .922} \\ [7pt] = 270} $

Ainsi, si la population est limitée à 1 000 ménages, la taille de l'échantillon nécessaire pour mener l'étude est de 270.

Il est évident d'après cette illustration que si la taille de la population est connue, alors la taille de l'échantillon déterminée a diminué en taille.