Cet article décrit comment calculer le test T par paire dans R entre les groupes avec des corrections pour les tests multiples. Le test t par paire consiste à calculer de multiple tests t entre toutes les combinaisons possibles de groupes.
Vous apprendrez à:
- Calculer le test t par paire pour les groupes non appariés et appariés
- Afficher les p-values sur un boxplot.
Sommaire:
Livre Apparenté
Pratique des Statistiques dans R II - Comparaison de Groupes: Variables NumériquesPrérequis
Assurez-vous d’avoir les paquets R suivants:
tidyverse
pour la manipulation et la visualisation des donnéesggpubr
pour créer facilement des graphiques prêts à la publicationrstatix
contient des fonctions R facilitant les analyses statistiquesdatarium
: contient les jeux de données requis pour ce chapitre
Charger les packages R requis:
library(tidyverse)
library(ggpubr)
library(rstatix)
Test t par paires pour les groupes indépendants
Cette section montre comment effectuer plusieurs tests t indépendants entre les groupes.
# Charger et inspecter les données de démo
data("PlantGrowth")
set.seed(1234)
PlantGrowth %>% sample_n_by(group, size = 2)
## # A tibble: 6 x 2
## weight group
## <dbl> <fct>
## 1 5.58 ctrl
## 2 4.61 ctrl
## 3 6.03 trt1
## 4 3.83 trt1
## 5 5.8 trt2
## 6 5.29 trt2
# Comparaisons par paires
pwc <- PlantGrowth %>%
pairwise_t_test(
weight ~ group, pool.sd = FALSE,
p.adjust.method = "bonferroni"
)
pwc
## # A tibble: 3 x 10
## .y. group1 group2 n1 n2 statistic df p p.adj p.adj.signif
## * <chr> <chr> <chr> <int> <int> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 weight ctrl trt1 10 10 1.19 16.5 0.25 0.75 ns
## 2 weight ctrl trt2 10 10 -2.13 16.8 0.048 0.144 ns
## 3 weight trt1 trt2 10 10 -3.01 14.1 0.009 0.028 *
# Visualisation : Boxplots avec p-values
pwc <- pwc %>% add_xy_position(x = "group", step.increase = 1)
ggboxplot(PlantGrowth, x = "group", y = "weight") +
stat_pvalue_manual(pwc, hide.ns = TRUE)
Test t par paires pour les groupes appariés
Cette section montre comment effectuer plusieurs tests t appariés entre les groupes. Nous utiliserons le jeu de données sur l’estime de soi mesuré sur trois points temporels. Les données sont disponibles dans le package datarium.
# Préparation des données : format large
data("selfesteem", package = "datarium")
head(selfesteem, 3)
## # A tibble: 3 x 4
## id t1 t2 t3
## <int> <dbl> <dbl> <dbl>
## 1 1 4.01 5.18 7.11
## 2 2 2.56 6.91 6.31
## 3 3 3.24 4.44 9.78
# Rassembler les colonnes t1, t2 et t3 en format long
# Convertir l'identifiant et le temps en facteurs
selfesteem <- selfesteem %>%
gather(key = "time", value = "score", t1, t2, t3) %>%
convert_as_factor(id, time)
head(selfesteem, 3)
## # A tibble: 3 x 3
## id time score
## <fct> <fct> <dbl>
## 1 1 t1 4.01
## 2 2 t1 2.56
## 3 3 t1 3.24
# Comparaisons par paires
pwc <- selfesteem %>%
pairwise_t_test(
score ~ time, paired = TRUE,
p.adjust.method = "bonferroni"
)
pwc
## # A tibble: 3 x 10
## .y. group1 group2 n1 n2 statistic df p p.adj p.adj.signif
## * <chr> <chr> <chr> <int> <int> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 score t1 t2 10 10 -4.97 9 0.000772 0.002 **
## 2 score t1 t3 10 10 -13.2 9 0.000000334 0.000001 ****
## 3 score t2 t3 10 10 -4.87 9 0.000886 0.003 **
# Visualisation : Boxplots avec p-values
pwc <- pwc %>% add_xy_position(x = "time")
ggboxplot(selfesteem, x = "time", y = "score", add = "point") +
stat_pvalue_manual(pwc)
Articles associés
Version: English
No Comments