M1 BBS ACP
From silico.biotoul.fr
(Difference between revisions)
m (Created page with '= Analyse en composantes principales = '''Objectif :''' Réduire le nombre de dimensions de l'espace d'observation = obtenir une projection en perdant un minimum d'informations.…') |
m |
||
Line 38: | Line 38: | ||
- | Centre de gravité : | + | Centre de gravité : <math>\Sigma^n_{i=1} p_i \overrightarrow{Gu_i} = \overrightarrow{0}</math> avec ''p<sub>i</sub>'' le poids de chaque dimension |
+ | |||
<math> | <math> | ||
Line 74: | Line 75: | ||
\end{bmatrix} | \end{bmatrix} | ||
</math> | </math> | ||
+ | |||
+ | == Mesure de dispersion = Inertie == | ||
+ | === Inertie par rapport à un point (le centre de gravité) === | ||
+ | |||
+ | <math>I_G = \frac{1}{n} \sum_{i=1}^n d^2(G, u_i) = \frac{1}{n}\sum_{i=1}^n \sum_{j=1}^p (x_{ij} - x_{\bullet j})^2 | ||
+ | = \sum_{j=1}^p \frac{1}{n}\sum_{i=1}^n (x_{ij} - x_{\bullet j})^2 | ||
+ | </math> | ||
+ | |||
+ | avec <math>\frac{1}{n}\sum_{i=1}^n (x_{ij} - x_{\bullet j})^2 = Var(v_j)</math> | ||
+ | |||
+ | on a <math>I_G = \sum_{j=1}^p Var(v_j)</math> | ||
+ | |||
+ | <math>\Rightarrow</math> L'inertie par rapport au centre de gravité revient à la somme des variances de chaque variable | ||
+ | |||
+ | === Inertie par rapport à un axe === | ||
+ | |||
+ | <math>I_\Delta = \frac{1}{n}\sum_{i=1}^n d^2(h_{\Delta i}, u_i) | ||
+ | </math> | ||
+ | |||
+ | <math>\rightarrow</math> mesure la proximité du nuage des individus à l'axe. | ||
+ | |||
+ | ici figure | ||
+ | |||
+ | === Inertie par rapport à un sous-espace vectoriel === | ||
+ | |||
+ | <math>I_V = \frac{1}{n} \sum_{i=1}^n d^2(h_{Vi}, u_i)</math> C'est pareil. |
Revision as of 15:40, 6 October 2016
Contents |
Analyse en composantes principales
Objectif : Réduire le nombre de dimensions de l'espace d'observation = obtenir une projection en perdant un minimum d'informations.
Applications :
- grand nombre de variables que l'on cherche à visualiser en 2 à 3 dimensions
- dessin de graphes
ici schéma changement de repère (2 dimensions)
Principe : trouver les axes sur lesquels on a un maximum de dispersion = plus de représentativité / moins de perte d'informations
Choix de l'origine
Prendre le centre de gravité du nuage.
Données :
- individus points dans l'espace à p dimensions.
- variables
Centre de gravité : avec pi le poids de chaque dimension
On prendra G comme nouvelle origine.
données centrées
Mesure de dispersion = Inertie
Inertie par rapport à un point (le centre de gravité)
avec
on a
L'inertie par rapport au centre de gravité revient à la somme des variances de chaque variable
Inertie par rapport à un axe
mesure la proximité du nuage des individus à l'axe.
ici figure
Inertie par rapport à un sous-espace vectoriel
C'est pareil.