Outil pour mesurer les bornes supérieurs et inférieurs de l'intervalle de confiance attribuable à un sondage. L'intervalle de confiance à 95% ou 99% permet de mieux qualifier la qualité d'un sondage.
Intervalle de Confiance d'un Sondage - dCode
Catégorie(s) : Statistiques
dCode est gratuit et ses outils sont une aide précieuse dans les jeux, les maths, les énigmes, les géocaches, et les problèmes à résoudre au quotidien !
Une suggestion ? un problème ? une idée ? Écrire à dCode !
Un intervalle de confiance est une borne inférieure et supérieure délimitant une marge d'erreur pour les résultats bruts d'un sondage. L'intervalle de confiance évalue la qualité et la précision de l'estimation obtenue avec l'échantillon interrogé.
Cet intervalle s'applique sur tous les types de sondage/échantillonnage (questionnaire, micro-trottoir, sondage en ligne) afin d'évaluer la marque de confiance qui lui est attribuable.
L'intervalle dépend surtout du nombre de personne intérrogé, si un sondage possède plusieurs questions et que le nombre de réponses obtenues diffère pour chaque question, alors l'intervalle de confiance devra se calculer pour chaque question. A l'inverse, si toutes les questions ont le même nombre de répondants, alors l'intervalle de confiance est le même pour toutes les questions, et donc pour la globalité du sondage.
La fréquence observée dans un échantillon est généralement notée $ f $ et la probabilité dans la population totale est notée $ p $, ces valeurs sont souvent confondues.
Pour un sondage de $ N $ personnes ayant pour résultat la fréquence $ f $ et la probabilité $ p $, alors l'intervalle de confiance à 95% est $$ \left[p-1.96\frac{\sqrt{f(1-p)}}{\sqrt n},p+1.96\frac{\sqrt{p(1-p)}}{\sqrt n}\right] $$
Avec 1.96 la valeur du 2.5 percentile de la distribution normale (pour 99%, la valeur serait 2.58).
Exemple : Pour un sondage avec un échantillon de 80 personnes dont 60 (75%) déclarent voter OUI, la fréquence mesurée est $ f = 60/80 $ soit une probabilité $ p = 0.75 $, l'intervalle de confiance est $ \left[0.75-1.96\frac{\sqrt{0.75(1-0.75)}}{\sqrt 80},0.75+1.96\frac{\sqrt{0.75(1-0.75)}}{\sqrt 80}\right] = \left[ 0.655, 0.845 \right] $. Cela signifie qu'il y a 95% de chance que lors du vote final le résultat OUI soit compris entre 65.5% et 84.5%.
La fiabilité d'un sondage (et son interprétation) dépend de plusieurs facteurs clés :
— Méthodologie de sélection : Un échantillon représentatif de la population cible doit être choisi (aléatoirement).
— Taille de l'échantillon : Plus il y a un grand nombre de participants, plus l'intervalle de confiance est réduit.
— Formulation des questions : Les questions peu claires ou maladroites peuvent conduire à des résultats déformés.
— Taux de réponse : les répondants peuvent diffèrer fortement des non-répondants (sollicités dans l'échantillon).
— Analyse statistique : les outils et méthodes ou même des erreurs de calcul ou d'interprétation peuvent affecter la validité des conclusions.
— Objectivité du commanditaire : de potentiels conflits d'intérêts peuvent influencer tout ou partie du sondage.
— Temporalité : les sondages ne fournissent qu'un instantané d'information qui peut évoluer avec le temps.
Afin de réduire/améliorer un intervalle de confiance, il convient d'augmenter $ N $ (le nombre d'éléments ou de personnes participant au sondage).
Le calcul de l'intervalle de confiance n'est pas conditionné sur le nombre de personnes totales dans la population.
Lorsque la taille de l'échantillon $ n $ est très grande par rapport à la taille de la population $ N $, il est possible d'utiliser un facteur de correction de population finie (FPC) pour ajuster la formule de la marge d'erreur.
$$ FPC = \sqrt{\frac{N-n}{N-1}} $$
En multipliant la marge d'erreur par ce facteur, celle-ci s'ajuste, surtout pour une grande fraction d'échantillonnage, car le facteur de correction réduit celle-ci.
La valeur 1.96 est approximative, mais généralement suffisante pour la majorité des calculs appliqués, cependant, une valeur plus précise serait 1.95996 (5 chiffres) ou 1.9599639845 (10 chiffres). Idem pour 2.58 qui est un arrondi pour 2.57583 (5 chiffres) ou 2.5758293035 (10 chiffres).
La valeur exacte est $ \sqrt{2} \operatorname{erf}^{-1}(95/100) $ pour 95%, avec la fonction d'erreur inverse $ \operatorname{erf}^{-1}(\operatorname{erf}(x)) = x $ et $ \operatorname{erf}(x) $ la fonction d'erreur.
Lorsque la probabilité est proche de 0, le calcul de l'intervalle de confiance peut mener à des probabilités hors de l'intervalle $ [0,1] $ ce qui est impossible. Une règle est d'utiliser comme limite la valeur $ 3 / N $.
Exemple : Un sondage de $ N = 100 $ personnes donne une probabilité de 0, alors l'intervalle de confiance est $ [0, 0.03] $ soit un pourcentage entre 0 et 3%.
L'intervalle de confiance s'applique à chaque question/mesure d'un sondage.
Il est alors possible de définir l'intervalle de confiance global du sondage (généralement une moyenne des intervalles de confiance de chaque question).
Mais si toutes les questions sont répondues par exactement les mêmes personnes, alors toutes les questions auront le même intervalle de confiance et l'intervalle de confiance global sera aussi identique.
dCode se réserve la propriété du code source pour "Intervalle de Confiance d'un Sondage". Tout algorithme pour "Intervalle de Confiance d'un Sondage", applet ou snippet ou script (convertisseur, solveur, chiffrement / déchiffrement, encodage / décodage, encryptage / décryptage, traducteur) ou toutes fonctions liées à "Intervalle de Confiance d'un Sondage" (calculer, convertir, résoudre, décrypter / encrypter, déchiffrer / chiffrer, décoder / encoder, traduire) codés en langage informatique (Python, Java, C#, PHP, Javascript, Matlab, etc.) ou toute base de données, ou accès API à "Intervalle de Confiance d'un Sondage" ou tout autre élément ne sont pas publics (sauf licence open source explicite type Creative Commons). Idem avec le téléchargement pour un usage hors ligne sur PC, mobile, tablette, appli iPhone ou Android.
Rappel : dCode est une ressource éducative et pédagogique, accessible en ligne gratuitement et pour tous.
Le contenu de la page "Intervalle de Confiance d'un Sondage" ainsi que ses résultats peuvent être copiés et réutilisés librement, y compris à des fins commerciales, à condition de mentionner dCode.fr comme source.
L'export des résultats est gratuit et se fait simplement en cliquant sur les icônes d'export ⤓ (format .csv ou .txt) ou ⧉ copier-coller.
Pour citer dCode.fr sur un autre site Internet, utiliser le lien :
Dans un article scientifique ou un livre, la citation bibliographique recommandée est : Intervalle de Confiance d'un Sondage sur dCode.fr [site web en ligne], consulté le 17/04/2025,