Régression linéaire (STT-2400) Section 3 Préliminaires, Partie II, La loi multinormale Version: 8 février 2007
STT-2400; Régression linéaire 2 La loi normale La variable aléatoire Z, est dite de loi normale, que l’on note, si la fonction de densité de Z est: Si alors La fonction génératrice des moments (fgm) d’une variable normale est:
STT-2400; Régression linéaire 3 Vecteur aléatoire de normales centrées réduites Supposons maintenant que l’on dispose du vecteur aléatoire de dimension, où les composantes sont indépendantes et de loi normale: La loi conjointe est simplement le produit des marginales:
STT-2400; Régression linéaire 4 Définition d’une loi multinormale centrée en zéro et de variance I n Définition: On définit une vecteur aléatoire de loi multinormale si sa fonction de densité est donnée par:
STT-2400; Régression linéaire 5 Fonction génératrice des moments On sait déjà que la fonction génératrice des moments (fgm) caractérise la loi d’une variable aléatoire. Cette propriété demeure vraie dans le cas des vecteurs (on dit aussi le cas multivarié). Définition: La fgm d’un vecteur aléatoire est définie par:
STT-2400; Régression linéaire 6 Propriété 3.4: fgm d’une La fgm de est donnée par:
En effet:
STT-2400; Régression linéaire 8 Définition d’une variable aléatoire normale On rappelle que dans le cas univarié, c’est-à- dire lorsque, que la propriété suivante est satisfaite: On aimerait introduire la normale multivariée générale de la même façon: si, on aimerait disposer de la « racine carrée » d’une matrice:
STT-2400; Régression linéaire 9 Diagonalisation des matrices symétriques Soit une matrice V symétrique. On dit que est une valeur propre de V s’il existe un vecteur v non nul satisfaisant: Puisque v est non nul, il faut donc trouver les solutions de l’équation suivante:
STT-2400; Régression linéaire 10 Valeurs propres Les solutions de l’équation sont appelées les valeurs propres de V. Propriétés fondamentales: – Si V est symétrique alors toutes les valeurs propres sont réelles. – Si 1 et 2 sont deux valeurs propres distinctes, alors les vecteurs propres v 1 et v 2 sont orthogonaux, où v 1 est le vecteur propre associé à 1, et v 2 est le vecteur propre associé à 2.
Posons: On note que l’on a pris soin de normaliser les vecteurs propres pour qu’ils soient de longueur un. La matrice est une matrice orthogonale, c’est-à- dire que:
On remarque que la matrice diagonalise V, dans le sens que:
STT-2400; Régression linéaire 13 Définition d’une matrice semi- définie positive Définition: Une matrice définie semi-positive V satisfait la relation suivante: Exemple: Une matrice de variance est toujours définie semi-positive. En effet, soit a un vecteur constant et u un vecteur aléatoire satisfaisant :
STT-2400; Régression linéaire 14 Définition d’une matrice définie positive Définition: Une matrice définie positive V satisfait la relation suivante: On note souvent une matrice définie positive: On note que les valeurs propres d’une matrice définie positive sont strictement positives:
STT-2400; Régression linéaire 15 « Racine carrée » d’une matrice Les concepts précédents permettent de donner un sens à la « racine carrée » d’une matrice symétrique définie positive, à travers la décomposition spectrale. Posons Puisque les valeurs propres sont positives, on peut considérer: On pose alors
STT-2400; Régression linéaire 16 Définition d’une normale multivariée Définition: Soit. Considérons le vecteur aléatoire. Alors par définition le vecteur aléatoire: On remarque que:
STT-2400; Régression linéaire 17 Propriété 3.5 La fonction génératrice des moments (fgm) de est donnée par:
Pour montrer cela, on utilise la représentation: Ainsi:
STT-2400; Régression linéaire 19 Propriété 3.6 Considérons. Alors Remarque: c’est la Propriété 3.6 qui sera utilisée pour établir la distribution des coefficients de régression. Pour montrer ce résultat, on utilise le fait que la fgm caractérise la loi.
Ainsi, pour montrer cela on utilise la fgm: Puisque la fgm caractérise la loi:
STT-2400; Régression linéaire 21 Exemple 1 1. Soit. Quelle est la loi de? Solution 1: Solution 2:
STT-2400; Régression linéaire 22 Exemple 2 Considérons un échantillon aléatoire: Quelle est la loi de ? On note que l’on peut réécrire: avec Par la Propriété 3.6, notant que 1’1 = n: