Outil pour mesurer les bornes supérieurs et inférieurs de l'intervalle de confiance attribuable à un sondage. L'intervalle de confiance à 95% ou 99% permet de mieux qualifier la qualité d'un sondage.
Intervalle de Confiance d'un Sondage - dCode
Catégorie(s) : Statistiques
dCode est gratuit et ses outils sont une aide précieuse dans les jeux, les maths, les énigmes, les géocaches, et les problèmes à résoudre au quotidien !
Une suggestion ? un problème ? une idée ? Écrire à dCode !
Un intervalle de confiance est une borne inférieure et supérieure délimitant une marge d'erreur pour les résultats bruts d'un sondage. L'intervalle de confiance évalue la qualité et la précision de l'estimation obtenue avec l'échantillon interrogé.
Cet intervalle s'applique sur tous les types de sondage/échantillonnage (questionnaire, micro-trottoir, sondage en ligne) afin d'évaluer la marque de confiance qui lui est attribuable.
L'intervalle dépend surtout du nombre de personne intérrogé, si un sondage possède plusieurs questions et que le nombre de réponses obtenues diffère pour chaque question, alors l'intervalle de confiance devra se calculer pour chaque question. A l'inverse, si toutes les questions ont le même nombre de répondants, alors l'intervalle de confiance est le même pour toutes les questions, et donc pour la globalité du sondage.
La fréquence observée dans un échantillon est généralement notée $ f $ et la probabilité dans la population totale est notée $ p $, ces valeurs sont souvent confondues.
Pour un sondage de $ N $ personnes ayant pour résultat la fréquence $ f $ et la probabilité $ p $, alors l'intervalle de confiance à 95% est $$ \left[p-1.96\frac{\sqrt{f(1-p)}}{\sqrt n},p+1.96\frac{\sqrt{p(1-p)}}{\sqrt n}\right] $$
Avec 1.96 la valeur du 2.5 percentile de la distribution normale (pour 99%, la valeur serait 2.58).
Exemple : Pour un sondage avec un échantillon de 80 personnes dont 60 (75%) déclarent voter OUI, la fréquence mesurée est $ f = 60/80 $ soit une probabilité $ p = 0.75 $, l'intervalle de confiance est $ \left[0.75-1.96\frac{\sqrt{0.75(1-0.75)}}{\sqrt 80},0.75+1.96\frac{\sqrt{0.75(1-0.75)}}{\sqrt 80}\right] = \left[ 0.655, 0.845 \right] $. Cela signifie qu'il y a 95% de chance que lors du vote final le résultat OUI soit compris entre 65.5% et 84.5%.
La fiabilité d'un sondage (et son interprétation) dépend de plusieurs facteurs clés :
— Méthodologie de sélection : Un échantillon représentatif de la population cible doit être choisi (aléatoirement).
— Taille de l'échantillon : Plus il y a un grand nombre de participants, plus l'intervalle de confiance est réduit.
— Formulation des questions : Les questions peu claires ou maladroites peuvent conduire à des résultats déformés.
— Taux de réponse : les répondants peuvent diffèrer fortement des non-répondants (sollicités dans l'échantillon).
— Analyse statistique : les outils et méthodes ou même des erreurs de calcul ou d'interprétation peuvent affecter la validité des conclusions.
— Objectivité du commanditaire : de potentiels conflits d'intérêts peuvent influencer tout ou partie du sondage.
— Temporalité : les sondages ne fournissent qu'un instantané d'information qui peut évoluer avec le temps.
Afin de réduire/améliorer un intervalle de confiance, il convient d'augmenter $ N $ (le nombre d'éléments ou de personnes participant au sondage).
Le calcul de l'intervalle de confiance n'est pas conditionné sur le nombre de personnes totales dans la population.
Lorsque la taille de l'échantillon $ n $ est très grande par rapport à la taille de la population $ N $, il est possible d'utiliser un facteur de correction de population finie (FPC) pour ajuster la formule de la marge d'erreur.
$$ FPC = \sqrt{\frac{N-n}{N-1}} $$
En multipliant la marge d'erreur par ce facteur, celle-ci s'ajuste, surtout pour une grande fraction d'échantillonnage, car le facteur de correction réduit celle-ci.
La valeur 1.96 est approximative, mais généralement suffisante pour la majorité des calculs appliqués, cependant, une valeur plus précise serait 1.95996 (5 chiffres) ou 1.9599639845 (10 chiffres). Idem pour 2.58 qui est un arrondi pour 2.57583 (5 chiffres) ou 2.5758293035 (10 chiffres).
La valeur exacte est $ \sqrt{2} \operatorname{erf}^{-1}(95/100) $ pour 95%, avec la fonction d'erreur inverse $ \operatorname{erf}^{-1}(\operatorname{erf}(x)) = x $ et $ \operatorname{erf}(x) $ la fonction d'erreur.
Lorsque la probabilité est proche de 0, le calcul de l'intervalle de confiance peut mener à des probabilités hors de l'intervalle $ [0,1] $ ce qui est impossible. Une règle est d'utiliser comme limite la valeur $ 3 / N $.
Exemple : Un sondage de $ N = 100 $ personnes donne une probabilité de 0, alors l'intervalle de confiance est $ [0, 0.03] $ soit un pourcentage entre 0 et 3%.
L'intervalle de confiance s'applique à chaque question/mesure d'un sondage.
Il est alors possible de définir l'intervalle de confiance global du sondage (généralement une moyenne des intervalles de confiance de chaque question).
Mais si toutes les questions sont répondues par exactement les mêmes personnes, alors toutes les questions auront le même intervalle de confiance et l'intervalle de confiance global sera aussi identique.
dCode se réserve la propriété du code source pour "Intervalle de Confiance d'un Sondage". Sauf code licence open source explicite (indiqué Creative Commons / gratuit), l'algorithme pour "Intervalle de Confiance d'un Sondage", l'applet ou snippet (convertisseur, solveur, chiffrement / déchiffrement, encodage / décodage, encryptage / décryptage, traducteur) ou les fonctions liées à "Intervalle de Confiance d'un Sondage" (calculer, convertir, résoudre, décrypter / encrypter, déchiffrer / chiffrer, décoder / encoder, traduire) codés en langage informatique (Python, Java, C#, PHP, Javascript, Matlab, etc.) ou les données, en téléchargement, script, ou les accès API à "Intervalle de Confiance d'un Sondage" ne sont pas publics, idem pour un usage hors ligne, PC, mobile, tablette, appli iPhone ou Android !
Rappel : dCode est gratuit.
Le copier-coller de la page "Intervalle de Confiance d'un Sondage" ou de ses résultats est autorisée (même pour un usage commercial) tant que vous créditez dCode !
L'exportation des résultats sous forme de fichier .csv ou .txt est gratuite en cliquant sur l'icone export
Citer comme source bibliographique :
Intervalle de Confiance d'un Sondage sur dCode.fr [site web en ligne], consulté le 21/11/2024,