R-Carré

« Back to Glossary Index

R-Carré est une mesure statistique qui représente la proportion de la variance d’une variable dépendante expliquée par une ou plusieurs variables indépendantes dans un modèle de régression. Il varie de 0 à 1, indiquant la qualité de l’ajustement du modèle.

Comprendre R-Carré

Définition et Interprétation

  • Plage de valeurs : Les valeurs de R-Carré varient de 0 à 1.
  • Interprétation :
    • Un R-Carré de 0 signifie que le modèle n’explique aucune des variabilités des données de réponse autour de sa moyenne.
    • Un R-Carré de 1 indique que le modèle explique toute la variabilité des données de réponse autour de sa moyenne.
    • Une valeur plus proche de 1 implique un meilleur ajustement, tandis qu’une valeur plus proche de 0 indique un mauvais ajustement.

Calcul de R-Carré

R-Carré peut être calculé en utilisant la formule suivante :

R² = 1 – (SSres / SStot)

  • SSres : La somme des carrés des résidus (les différences entre les valeurs observées et prédites).
  • SStot : La somme totale des carrés (la variance des données observées).

Exemple de R-Carré

Considérons une analyse de régression linéaire simple où nous voulons analyser la relation entre le nombre d’heures étudiées et les notes obtenues à un examen.

  • Supposons que nous avons les données suivantes :
    • Heures étudiées : [1, 2, 3, 4, 5]
    • Notes obtenues : [50, 55, 65, 70, 80]
  • Supposons que le modèle de régression linéaire nous donne les notes prédites équipées du modèle.
  • La somme des carrés des résidus (SSres) peut être calculée comme suit :
    – Notes prédites : [52, 57, 62, 67, 72] – Résidus : [50-52, 55-57, 65-62, 70-67, 80-72] = [-2, -2, 3, 3, 8] – SSres = (-2)² + (-2)² + (3)² + (3)² + (8)² = 4 + 4 + 9 + 9 + 64 = 90
  • La somme totale des carrés (SStot) est calculée comme suit :
    – Moyenne des notes = (50 + 55 + 65 + 70 + 80) / 5 = 62
    – SStot = (50-62)² + (55-62)² + (65-62)² + (70-62)² + (80-62)² = 144 + 49 + 9 + 64 + 324 = 590
  • En remplaçant les valeurs dans la formule R-Carré :
    R² = 1 – (90 / 590) ≈ 0.846

Cela signifie qu’environ 84,6 % de la variabilité des notes à l’examen peut être expliquée par le nombre d’heures étudiées, indiquant une forte relation entre les deux variables.