Supprimer les valeurs aberrantes de coefficient de corrélation de calcul

Supposons que nous avons deux vecteurs numériques x et y. Le coefficient de corrélation de Pearson entre x et y est donnée par

cor(x, y)

Comment puis-je automatiquement ne considérer qu'un sous-ensemble de x et y dans le calcul (soit 90%) afin de maximiser le coefficient de corrélation?

Que considérez-vous comme une valeur aberrante ici? Déviation de la méthode des moindres carrés ajustement de la ligne (c'est à dire plus grand des résidus), ou des valeurs extrêmes de la distribution bivariée de x et y?
Ici, je considère que le plus gros des résidus à des valeurs aberrantes.

OriginalL'auteur Leo | 2011-01-12