Déterminer la taille d’un échantillon

Published on the 29 October 2009

Disons que je veuille mener un sondage en ligne, pour recueillir l’opinion de mes visiteurs sur un sujet ou un autre. Quelle devrait être la taille de mon échantillon pour que celui-ci soit représentatif ? Ayant étudié en marketing, je me souviens avoir rempli des feuilles de ces formules statistiques. Évidemment, c’était il y a quelques temps, et toutes mes notes de cours sont dans un carton, dans le grenier de mes beaux-parents en France… La recherche de ces formules mathématiques sur Internet est incroyablement compliquée, et je n’ai réussi à trouver une explication que j’ai été capable de comprendre qu’au bout de quelques heures (les statistiques n’ont jamais été mon fort, alors je vous laisse imaginer le résultat 5 ans après mon diplôme !) Pour ne pas avoir à mener cette recherche à nouveau (et pour vous l’éviter tout court), la voici donc ci-après : Taille de l’échantillon = (1.96² * 0.5(1-0.5) / 0.05² = 384.16 individus (je vous invite fortement à lire la suite pour comprendre l’équation…)

taille-echantillon-sondage

»» Dans le cas d’une population illimitée

Dans le cas où la population est illimitée, le nombre de personne qui la composent n’intervient pas dans le calcul de l’échantillon. Ça peur paraître surprenant, mais c’est comme ça. À la place, celui-ci est déterminé en fonction :

  • du niveau de confiance
  • de l’écart-type de population
  • de la précision

Le niveau de confiance est un pourcentage indiquant la fiabilité des résultats obtenus. Traditionnellement, on prend toujours un niveau de confiance égal à 95% (ou 19 sur 20), qui est représenté dans l’équation ci-dessous par t=1.96.

L’écart-type de la population est le pourcentage de personnes qui vont choisir une réponse du sondage. (Par exemple, 50% sont des femmes.)  Il faut savoir que plus le pourcentage est proche de 50%, plus la taille de l’échantillon doit être importante pour départager les deux populations. Ainsi, on prend très souvent un écart-type de 50%, qui est représenté dans l’équation par p=0.5.

Enfin, la précision est la marge d’erreur acceptable. On prend la plupart du temps une précision de 95%, qui est représentée dans l’équation par m=5%=0.05.

Taille de l’échantillon = (1.96² * 0.5(1-0.5) / 0.05² = 384.16 individus.

»» Dans le cas d’une population limitée

Dans le cas où la population étudiée est limitée, il est nécessaire de redresser l’échantillon pour qu’il reste représentatif. Tout d’abord, il faut calculer le taux de d’échantillonnage. Si celui-ci est supérieur 5%, alors il est nécessaire de redresser l’échantillon.

Taux d’échantillonnage = Taille de l’échantillon / Population

Si taux d’échantillonnage > 5% :

Taille de l’échantillon redressée = taille du premier échantillon  / (1+(taille du premier échantillon/taille de la population))

Mais bon, si vous voulez vous éviter tous ces calculs, vous pouvez aussi utiliser un des nombreux outils sur Internet, comme le Sample Size Calculator de Survey System, qui calculeront pour vous, gratuitement, la taille de votre échantillon idéal…