R-Carré est une mesure statistique qui représente la proportion de la variance d’une variable dépendante expliquée par une ou plusieurs variables indépendantes dans un modèle de régression. Il varie de 0 à 1, indiquant la qualité de l’ajustement du modèle.
Comprendre R-Carré
Définition et Interprétation
- Plage de valeurs : Les valeurs de R-Carré varient de 0 à 1.
- Interprétation :
- Un R-Carré de 0 signifie que le modèle n’explique aucune des variabilités des données de réponse autour de sa moyenne.
- Un R-Carré de 1 indique que le modèle explique toute la variabilité des données de réponse autour de sa moyenne.
- Une valeur plus proche de 1 implique un meilleur ajustement, tandis qu’une valeur plus proche de 0 indique un mauvais ajustement.
Calcul de R-Carré
R-Carré peut être calculé en utilisant la formule suivante :
R² = 1 – (SSres / SStot)
- SSres : La somme des carrés des résidus (les différences entre les valeurs observées et prédites).
- SStot : La somme totale des carrés (la variance des données observées).
Exemple de R-Carré
Considérons une analyse de régression linéaire simple où nous voulons analyser la relation entre le nombre d’heures étudiées et les notes obtenues à un examen.
- Supposons que nous avons les données suivantes :
- Heures étudiées : [1, 2, 3, 4, 5]
- Notes obtenues : [50, 55, 65, 70, 80]
- Supposons que le modèle de régression linéaire nous donne les notes prédites équipées du modèle.
- La somme des carrés des résidus (SSres) peut être calculée comme suit :
– Notes prédites : [52, 57, 62, 67, 72] – Résidus : [50-52, 55-57, 65-62, 70-67, 80-72] = [-2, -2, 3, 3, 8] – SSres = (-2)² + (-2)² + (3)² + (3)² + (8)² = 4 + 4 + 9 + 9 + 64 = 90 - La somme totale des carrés (SStot) est calculée comme suit :
– Moyenne des notes = (50 + 55 + 65 + 70 + 80) / 5 = 62
– SStot = (50-62)² + (55-62)² + (65-62)² + (70-62)² + (80-62)² = 144 + 49 + 9 + 64 + 324 = 590 - En remplaçant les valeurs dans la formule R-Carré :
R² = 1 – (90 / 590) ≈ 0.846
Cela signifie qu’environ 84,6 % de la variabilité des notes à l’examen peut être expliquée par le nombre d’heures étudiées, indiquant une forte relation entre les deux variables.