Intervalle de Confiance d'un Sondage

Question 1

Qu'est ce qu'un intervalle de confiance ? (Définition)

Answer

Un intervalle de confiance est une borne inférieure et supérieure délimitant une marge d'erreur pour les résultats bruts d'un sondage. L'intervalle de confiance évalue la qualité et la précision de l'estimation obtenue avec l'échantillon interrogé.

Cet intervalle s'applique sur tous les types de sondage/échantillonnage (questionnaire, micro-trottoir, sondage en ligne) afin d'évaluer la marque de confiance qui lui est attribuable.

L'intervalle dépend surtout du nombre de personne intérrogé, si un sondage possède plusieurs questions et que le nombre de réponses obtenues diffère pour chaque question, alors l'intervalle de confiance devra se calculer pour chaque question. A l'inverse, si toutes les questions ont le même nombre de répondants, alors l'intervalle de confiance est le même pour toutes les questions, et donc pour la globalité du sondage.

La fréquence observée dans un échantillon est généralement notée $ f $ et la probabilité dans la population totale est notée $ p $, ces valeurs sont souvent confondues.

Question 2

Comment calculer un intervalle de confiance ?

Answer

Pour un sondage de $ N $ personnes ayant pour résultat la fréquence $ f $ et la probabilité $ p $, alors l'intervalle de confiance à 95% est $$ \left[p-1.96\frac{\sqrt{f(1-p)}}{\sqrt n},p+1.96\frac{\sqrt{p(1-p)}}{\sqrt n}\right] $$

Avec 1.96 la valeur du 2.5 percentile de la distribution normale (pour 99%, la valeur serait 2.58).

Exemple : Pour un sondage avec un échantillon de 80 personnes dont 60 (75%) déclarent voter OUI, la fréquence mesurée est $ f = 60/80 $ soit une probabilité $ p = 0.75 $, l'intervalle de confiance est $ \left[0.75-1.96\frac{\sqrt{0.75(1-0.75)}}{\sqrt 80},0.75+1.96\frac{\sqrt{0.75(1-0.75)}}{\sqrt 80}\right] = \left[ 0.655, 0.845 \right] $. Cela signifie qu'il y a 95% de chance que lors du vote final le résultat OUI soit compris entre 65.5% et 84.5%.

Question 3

Dans quelle mesure le résultat d'un sondage est il fiable ?

Answer

La fiabilité d'un sondage (et son interprétation) dépend de plusieurs facteurs clés :

— Méthodologie de sélection : Un échantillon représentatif de la population cible doit être choisi (aléatoirement).

— Taille de l'échantillon : Plus il y a un grand nombre de participants, plus l'intervalle de confiance est réduit.

— Formulation des questions : Les questions peu claires ou maladroites peuvent conduire à des résultats déformés.

— Taux de réponse : les répondants peuvent diffèrer fortement des non-répondants (sollicités dans l'échantillon).

— Analyse statistique : les outils et méthodes ou même des erreurs de calcul ou d'interprétation peuvent affecter la validité des conclusions.

— Objectivité du commanditaire : de potentiels conflits d'intérêts peuvent influencer tout ou partie du sondage.

— Temporalité : les sondages ne fournissent qu'un instantané d'information qui peut évoluer avec le temps.

Question 4

Comment réduire l'intervalle de confiance ?

Answer

Afin de réduire/améliorer un intervalle de confiance, il convient d'augmenter $ N $ (le nombre d'éléments ou de personnes participant au sondage).

Question 5

Comment prendre en compte le nombre total de la population ?

Answer

Le calcul de l'intervalle de confiance n'est pas conditionné sur le nombre de personnes totales dans la population.

Lorsque la taille de l'échantillon $ n $ est très grande par rapport à la taille de la population $ N $, il est possible d'utiliser un facteur de correction de population finie (FPC) pour ajuster la formule de la marge d'erreur.

$$ FPC = \sqrt{\frac{N-n}{N-1}} $$

En multipliant la marge d'erreur par ce facteur, celle-ci s'ajuste, surtout pour une grande fraction d'échantillonnage, car le facteur de correction réduit celle-ci.

Question 6

Existe-t-il des valeurs plus précises pour 1.96 et 2.58 ?

Answer

La valeur 1.96 est approximative, mais généralement suffisante pour la majorité des calculs appliqués, cependant, une valeur plus précise serait 1.95996 (5 chiffres) ou 1.9599639845 (10 chiffres). Idem pour 2.58 qui est un arrondi pour 2.57583 (5 chiffres) ou 2.5758293035 (10 chiffres).

La valeur exacte est $ \sqrt{2} \operatorname{erf}^{-1}(95/100) $ pour 95%, avec la fonction d'erreur inverse $ \operatorname{erf}^{-1}(\operatorname{erf}(x)) = x $ et $ \operatorname{erf}(x) $ la fonction d'erreur.

Question 7

Qu'est ce que la règle de trois ?

Answer

Lorsque la probabilité est proche de 0, le calcul de l'intervalle de confiance peut mener à des probabilités hors de l'intervalle $ [0,1] $ ce qui est impossible. Une règle est d'utiliser comme limite la valeur $ 3 / N $.

Exemple : Un sondage de $ N = 100 $ personnes donne une probabilité de 0, alors l'intervalle de confiance est $ [0, 0.03] $ soit un pourcentage entre 0 et 3%.

Question 8

L'intervalle de confiance s'applique-t-il sur chaque question d'un sondage ou pour la totalité ?

Answer

L'intervalle de confiance s'applique à chaque question/mesure d'un sondage.

Il est alors possible de définir l'intervalle de confiance global du sondage (généralement une moyenne des intervalles de confiance de chaque question).

Mais si toutes les questions sont répondues par exactement les mêmes personnes, alors toutes les questions auront le même intervalle de confiance et l'intervalle de confiance global sera aussi identique.

Intervalle de Confiance d'un Sondage

Calculateur d'Intervalle de Confiance d'un Sondage

Réponses aux Questions (FAQ)

Qu'est ce qu'un intervalle de confiance ? (Définition)

Comment calculer un intervalle de confiance ?

Dans quelle mesure le résultat d'un sondage est il fiable ?

Comment réduire l'intervalle de confiance ?

Comment prendre en compte le nombre total de la population ?

Existe-t-il des valeurs plus précises pour 1.96 et 2.58 ?

Qu'est ce que la règle de trois ?

L'intervalle de confiance s'applique-t-il sur chaque question d'un sondage ou pour la totalité ?

Code source

Citation

Besoin d'Aide ?

Questions / Commentaires