Est-il temps de faire nos adieux à la significativité statistique ?

Supposons que l'on teste l'impact du café sur la productivité de deux groupes de travailleurs. On obtient alors des des données pour l'ensemble des travailleurs observés, traités et non traités, et on peut par exemple faire la moyenne de la productivité des travailleurs pour les deux groupes. Tout l'objet de l'étude sera alors de comparer la moyenne de chacun des deux groupes.

Il y a alors deux possibilités :
- Hypothèse nulle H0 : le café n'a pas d'impact sur la productivité des travailleurs,
- Hypothèse alternative H1 : le café a un impact (positif ou négatif) sur la productivité des travailleurs.

On définit alors la p-value comme la probabilité sous l'hypothèse H0 qu'on obtienne le résultat observé dans l'expérience. C'est à dire : si le café n'avait pas d'impact sur la productivité des travailleurs, quelle serait la probabilité d'observer ce qu'on a obtenu au terme de notre expérience avec nos deux groupes de travailleurs ?

Une manière d'interpréter le résultat assez répandu en sciences est alors de vérifier si la p-value est inférieure ou pas à 0.05, c'est à dire si la probabilité d'obtenir le résultat qu'on observait dans le cas où le café n'aurait pas d'effet sur la productivité est inférieure ou pas à 5%.
Si la p-value est inférieure à 0.05, on considère que le résultat est significatif, et ici que le café a un impact sur la productivité des travailleurs. On tire des résultats une inférence statistique, c'est-à-dire

Seulement voilà, cette méthode pose un certain nombre de problèmes (pas tant pour ce qu'elle dit mais pour la manière dont elle est utilisée par certains chercheurs), ce qui a amené pas mal de personnes à remettre en cause son utilisation systématique dans les papiers de recherche. Il y a au début de cet article plusieurs liens vers d'autres articles qui traitent de cette question, mais pour énoncer les principaux points soulevés par cet article seul :

- Nous traversons actuellement ce qui est perçu par pas mal de chercheurs comme un essoufflement de la méthodologie en sciences,

- L'utilisation systématique de la p-value pousse à manipuler les données de manière à obtenir une p-value satisfaisante,

- La place prise par la significativité statistique pousse à titrer en gros qu'on a établi un résultat extraordinaire sans prendre de recul sur celui-ci à chaque fois que celle-ci est atteinte.

De manière générale, la p-value ne capte qu'une part de l'expérience et souffre souvent de biais, de telle sorte qu'elle devrait être systématiquement prise avec des pincettes. Ce n'est pas un débat particulièrement nouveau, et il est fondamentalement lié à d'autres débats comme le financement de la recherche ou les conditions de publication, mais il y a eu ces dernières semaines un regain d'intérêt pour cette question.

L'article sur la base duquel est réalisée l'interview :
https://www.tandfonline.com/doi/full/10.1080/00031305.2019.1583913

Dans leurs recommandations, les auteurs mettent en avant un certain nombre de points pour les futurs papiers de recherche :

- Accepter l'incertitude
- Prendre plus de recul
- Rester ouvert
- Plus de modestie

Seulement comme dit plus haut, le problème est bien plus profond que celui de la significativité statistique et d'un certain nombre de bonnes pratiques, et les auteurs insistent donc sur la nécessité d'une réforme profonde des pratiques institutionnelles en sciences afin de pouvoir avancer.

retractionwatch.com - Time to say goodbye to ?statistically significant? and embrace uncertainty, say statisticians

Poster un commentaire

Mezut

5 ans

Je sais qu'on a tous les deux un ptit background en économétrie et pour le coup si je trouve l'utilisation de la p-value assez limitée, il existe pas mal d'autres modèles, tests qui permettent de prendre du recul sur ce résultat.

Du moins en Eco / Finance après le reste je pourrai pas dire