Cette commande lance le calcul du modèle linéaire prédictif entre une variable expliquée (Y) et plusieurs variables explicatives, toutes étant de nature quantitative.
Les paramètres du modèle seront calculés par la méthode des moindres carrés, comme pour le test de régression linéaire simple où la droite de régression qui minimise la distance avec l'ensemble des points est remplacée par un hyperplan de régression.
1 - Principes de la Régression Linéaire Multiple
Le principe des moindres carrés appliqué à l'hyperplan formé par l'ensemble des variables explicatives (chaque variable constitue un axe de l'hyperplan) est le même que pour le test de régression linéaire simple. Seules les méthodes de calcul changent car on fait ici appel aux calculs matriciels pour lesquels nous ne rentrerons pas dans les détails.
Toutefois, le calcul du vecteur colonne des paramètres du modèle se calcule de la façon suivante :

où "X" est la matrice (n x p) des données relatives aux variables explicatives avec une colonne de 1 pour le calcul de la constante, "y" est le vecteur colonne (p x 1) des données relatives à la variable expliquée, n est le nombre d'observations et p le nombre de paramètres du modèle.
Conditions d'utilisation du test :
- Distribution normale des mesures sur chaque variable étudiée
2 - Lancement de la Régression Linéaire Multiple
La boîte de dialogue à l'écran vous permet de préciser quelles sont les variables à l'étude :
Sélectionnez la variable à expliquer (Y) en cliquant sur le bouton "Sélectionnez Y". Pour procéder à la sélection, il vous suffit de cliquer sur la première cellule de la série de données et de faire glisser la souris jusqu'à la dernière valeur.
Nota bene : afin d'identifier au mieux les différents groupes de mesures, la première cellule de chaque sélection doit impérativement contenir le nom du groupe. Ce nom servira d'entête au groupe étudié sur la feuille des résultats.

De la même façon, sélectionnez chaque variable explicative en cliquant sur le bouton "Sélectionnez une variable X". Chaque validation d'une nouvelle sélection l'ajoutera dans la liste des variables explicatives.
Nota bene : dans un test de Régression linéaire multiple, le nombre de mesures est censé être le même pour chaque série. Toutefois, le test saura gérer les données manquantes à condition que pour chaque série, la sélection porte exactement sur le même nombre de cellules (vides ou non). La procédure de sélection tournera en boucle tant que vous n'aurez pas sélectionné autant de cellules qu'à la sélection précédente.
En cas d'erreur, refaîtes simplement votre sélection, celle-ci viendra effacer votre précédente sélection dans la boîte de dialogue sans que vous ayez à annuler quoi que ce soit.

Vous avez la possibilité d'étudier :
- un modèle prédictif incluant la totalité des variables explicatives que vous avez définies (option définie par défaut),
- un modèle prédictif n'incluant que les variables explicatives réellement influentes sur la variable à expliquer.
Dans ce dernier cas, le calcul suivra une procédure de sélection "pas à pas" par la méthode Stepwise : StatEL intègre successivement dans le modèle la variable la plus influente (grâce au calcul du coefficient de corrélation partiel, c'est à dire en fixant l'influence des autres variables sur le modèle), puis StatEL vérifie systématiquement si l'entrée d'une nouvelle variable dans le modèle entraine l'exclusion d'une autre variable entrée précédemment dans le modèle (pour des raison de colinéarité entre variables explicatives).
Les tests d'entrée et de sortie d'une variable dans le modèle sont fixés avec un risque d'erreur inférieur à 5%. Toutefois, il peut parfois être utile "d'assouplir" la procédure d'élimination de variables en accordant un risque d'erreur inférieur à 10%, ainsi on favorise l'entrée de nouvelles variables les plus significatives, mais on accepte de les maintenir si elles deviennent ensuite un petit peu moins significatives.
Cette possibilité vous est offerte en cliquant sur le bouton "Options du Stepwise", accessible si vous avez coché l'option de calcul du modèle par cette méthode.
Parmi les options qui vous sont offertes par la méthode "Stepwise", vous pouvez cocher la case vous permettant de disposer, sur la feuille des résultats, des détails de la procédure d'inclusion et d'exclusion des variables.
3 - Résultats de la Régression Linéaire Multiple
Ceux-ci sont affichés dans une nouvelle feuille qui vient se placer juste après celle contenant les données que vous avez sélectionnées pour procéder au test.
Juste après la ligne de titre, le nombre de variables incluses dans le modèle sera précisé.
- Sur la partie gauche de la feuille sont affichés, sous forme de tableau, les données relatives aux variables incluses dans le modèle, les valeurs de Y théoriques (calculées d'après le modèle de régression issu du test), les résidus, les résidus studentisés, les leviers de chaque couple de valeurs :
Les résidus sudentisés qui ont une valeur trop élevée (>2 ou <-2) sont affichés dans des cases jaunes et un commentaire y est associé ; il en est de même pour les leviers (en vert si le levier est 4 fois plus important que la moyenne des leviers)
- Sur la partie droite de la feuille sont affichés successivement :
- les informations de statistiques descriptives pour chaque variable (moyenne, écart-type, médiane, quartiles),
- la matrice des coefficients de corrélation entre les différentes variables,
- les détails de la procédure de sélection "pas à pas" si vous en avez fait le choix dans la boîte de dialogue initiale,
- le modèle de régression linéaire multiple calculé,
- les divers coefficients de corrélation et de détermination multiples,
- le tableau d'étude de significativité des différents paramètres du modèle,

- les éléments permettant d'étudier graphiquement la qualité du modèle de régression linéaire multiple : linéarité du modèle, constance de la variance des résidus (homoscédasticité), linéarité des résidus,
- une série de graphiques servant à illustrer la qualité du modèle de régression linaire : graphiques des Y, des résidus et des résidus studentisés en fonction des Y calculés, graphiques des Y, des résidus et des résidus studentisés en fonction de chaque variable explicative (à sélectionner en cliquant sur le bouton associé au graphique), et le graphique Q-plot.

|