Le paradoxe de Simpson

Le paradoxe de Simpson

1- Définition du paradoxe de Simpson

Un bon paradoxe est un paradoxe dont on ne réussit jamais à se débarrasser. Quand vous croyez en avoir trouvé la clef, une remarque vous fait découvrir que rien n’est résolu.

Et le plus élémentaire de tous les paradoxes est bien celui de Simpson ! En effet, chaque année, on découvre de nouveaux exemples produisant étonnement et incrédulité.

C’est Edward Simpson, le statisticien, qui a décrit ce paradoxe pour la première fois en 1951.

Paradoxe Simpson

 

Je vous mets au fait de ce fameux paradoxe par cette simple constatation : ne peut-on pas dire que « Le lit est l’endroit le plus dangereux du monde car c’est là que la plupart des gens meurent » ?

De façon un peu plus précise, le paradoxe de Simpson apparaît de la façon suivante : si deux échantillons statistiques vérifient une caractéristique donnée ; alors en les rassemblant, il est possible d’avoir la caractéristique inverse.

Cette confusion mathématique peut s’avérer catastrophique pour prendre les bonnes décisions !

En résumé : méfiez-vous de ce phénomène statistique très contre-intuitif.

 

2- Exemples du paradoxe de Simpson

Il existe de nombreux exemples réels du paradoxe de Simpson, en voici quelques-uns parmi les plus connus.

 

  • Exemple 1 : Analyse des notes obtenues par des groupes d’élèves

Aux États-Unis, au cours des années de 1980 à 2000, la moyenne des notes obtenues par les élèves soumis à un test linguistique reste très stable avec un résultat toujours proche de 504 points. Pourtant, durant cette période, la moyenne pour ce test mesurée séparément par groupe ethnique augmente dans chaque groupe d’au moins huit points.

La clef de l’explication se trouve dans le fait que pendant la période considérée, la proportion d’élèves appartenant à des minorités ethniques (réussissant en général moins bien le test linguistique) a augmenté, conduisant au total à une stagnation des résultats globaux qui, pourtant, progressaient dans chaque catégorie.

Paradoxe Simpson

 

  • Exemple 2 : Analyse des taux de mortalité entre deux populations

En 1986, Joel Cohen, de l’Université Rockefeller à New York, s’est intéressé à comparer la mortalité au Costa Rica et en Suède, la Suède étant un pays connu pour son excellente espérance de vie.

Sans surprise, il a trouvé qu’en 1960, le taux de mortalité des femmes, dans toute tranche d’âge, était supérieur au Costa Rica, comparé au taux équivalent en Suède. Pourtant, le taux de mortalité général des femmes au Costa Rica était inférieur à celui de la Suède.

L’explication provient de la structure différente des populations. En effet, la population du Costa Rica est beaucoup plus jeune en moyenne que celle de la Suède.

Paradoxe Simpson

 

  • Exemple 3 : Influence de la vitesse sur le taux d’accidents

Gary Davis, de l’Université du Minnesota, étudiait en 2004 la relation entre le nombre d’accidents piéton / véhicule et la vitesse moyenne des véhicules en divers endroits d’une ville. De façon inattendue, son modèle montrait qu’en faisant passer la limite de 30 miles par heure à 25, le nombre d’accidents augmenterait. Mais là encore, une agrégation malheureuse des données a engendré une conclusion absurde. En effet, un paramètre n’avait pas été pris en compte : le fait que le nombre d’accidents était bien plus rare dans les zones résidentielles.

Paradoxe Simpson

 

3- Comment se prémunir du paradoxe de Simpson ?

Quand on vous présente des chiffres, il faut avoir l’œil critique, et être particulièrement méfiant quand ces chiffres sont issus de données analysées a posteriori, plutôt que sur un échantillon expérimental qu’on a construit soi-même.

Il faut surtout se rappeler que l’effet Simpson se produit quand il existe une variable cachée très influente, et que l’échantillon sur lequel on se base n’est pas homogène. 

Paradoxe Simpson

MOTS CLÉS : #Statistique #Paradoxe #Economie #Croissance #Strategie #Marché #BaseDeDonnees #Taux #Prevision #Gestion #Formule #formules

TAGS : principes economiques, cours économie et gestion, sciences économiques de gestion et commerciale, tout savoir sur les sciences économiques et sociales, théorie financière cours, recherche en économie, comportements financiers, les sciences économiques et sociales, gestion des entreprises option finance et comptabilité, paradoxe de Simpson, probabilité et statistique exercice, statistique et probabilité, paradoxe, statistique, variable statistique, feuille de prévision

Liens :

envoyer la réponse

HTML restreint

  • Balises HTML autorisées : <a href hreflang> <em> <strong> <cite> <blockquote cite> <code> <ul type> <ol start type> <li> <dl> <dt> <dd> <h2 id> <h3 id> <h4 id> <h5 id> <h6 id>
  • Les lignes et les paragraphes vont à la ligne automatiquement.
  • Les adresses de pages web et les adresses courriel se transforment en liens automatiquement.

articles similaires