Description du cours
Dans ce chapitre, nous présenterons quelques questions de recherche et les tests statistiques correspondants, ainsi que les hypothèses des tests.
Sommaire:
Livre Apparenté
Pratique des Statistiques dans R II - Comparaison de Groupes: Variables NumériquesQuestions de recherche et statistiques
Les questions de recherche les plus populaires sont les suivantes:
- est-ce que deux variables (n = 2) sont corrélées (c.-à-d. associées)?
- est-ce que plusieurs variables (n > 2) sont corrélées?
- est-ce que deux groupes (n = 2) d’échantillons différent les uns des autres?
- est-ce que plusieurs groupes (n >= 2) d’échantillons différenciés les uns des autres?
- est-ce que la variabilité de deux échantillons ou plus diffère?
On peut répondre à chacune de ces questions à l’aide des tests statistiques suivants:
- Test de corrélation entre deux variables
- Matrice de corrélation entre plusieurs variables
- Comparaison des moyennes de deux groupes:
- Test t de Student (paramétrique)
- Test de Wilcoxon (non paramétrique)
- Comparaison des moyennes de plus de deux groupes
- Test ANOVA (analyse de variance, paramétrique) : extension du test t pour comparer plus de deux groupes.
- Test de Kruskal-Wallis (non paramétrique) : extension du test de Wilcoxon pour comparer plus de deux groupes
- Comparaison des variances:
- Comparaison des variances de deux groupes : Test F (paramétrique)
- Comparaison des variances de plus de deux groupes : Test de Bartlett (paramétrique), Test de Levene (paramétrique) et Test de Fligner-Killeen (non-paramétrique)
Hypothèses des tests statistiques
Bon nombre des méthodes statistiques, notamment la corrélation, la régression, le test t et l’analyse de la variance, supposent certaines caractéristiques des données. En général, ils supposent que:
- les données suivent une distribution normale
- et les variances des groupes à comparer sont homogènes (égales).
Ces hypothèses doivent être prises au sérieux pour tirer une interprétation et des conclusions fiables de la recherche.
Ces tests - corrélation, t-test et ANOVA - sont appelés tests paramétriques, car leur validité dépend de la distribution des données.
Avant d’utiliser les tests paramétriques, certains tests préliminaires doivent être effectués pour s’assurer que les hypothèses de test sont respectées. Dans les cas où les hypothèses ne sont pas respectées, il est recommandé d’utiliser des tests non paramétriques.
Évaluer la normalité
- Avec des échantillons suffisamment grands (n > 30), la violation de l’hypothèse de normalité ne devrait pas poser de problèmes majeurs (théorème central limite). Cela implique que nous pouvons ignorer la distribution des données et utiliser des tests paramétriques.
- Cependant, par souci de logique, nous pouvons utiliser le test statistique de Shapiro-Wilk comparant la distribution de l’échantillon à une distribution normale afin de déterminer si les données montrent ou non un écart important par rapport à la disribution normale (Ghasemi and Zahediasl 2012).
Évaluer l’égalité des variances
Le test t standard de Student (comparaison de deux échantillons indépendants) et le test ANOVA (comparaison de plusieurs échantillons) supposent également que les échantillons à comparer ont des variances égales.
Si les échantillons, à comparer, suivent une distribution normale, alors il est possible d’utiliser:
- Test F pour comparer les variances de deux échantillons
- Test de Bartlett ou Test de Levene pour comparer les variances de plusieurs échantillons.
Résumé
Ce chapitre présente les tests statistiques les plus couramment utilisés et leurs hypothèses.
References
Ghasemi, Asghar, and Saleh Zahediasl. 2012. “Normality Tests for Statistical Analysis: A Guide for Non-Statisticians.” Int J Endocrinol Metab 10 (2): 486–89. doi:10.5812/ijem.3505.
Version: English
Je désire obtenir les livres gratuits sur l’analyse de données