Comment calculer la distance de Mahalanobis entre les deux séries de dimensions égales?
Je suis en train de faire quelques extraction de données sur les séries temporelles de données. J'ai besoin de calculer la distance ou de la similitude entre les deux séries de dimensions égales. J'ai été suggéré d'utiliser la distance Euclidienne, Cos de Similarité ou de distance de Mahalanobis. Les deux premiers de ne pas donner toutes les informations utiles. Je n'arrive pas à comprendre les différents tutoriels sur le web.
Donc,
Donné deux vecteurs(a1, a2, a3,...,an) et B(b1, b2, b3,...,bn) comment trouvez-vous la distance de Mahalanobis entre eux?
(J'ai reçu des conseils sur l'utilisation de ces mesures de distance sur DONC lui-même, et il y a un question sur la façon de calculer Cos similitude; veuillez donc considérer avant de clore cette question)
OriginalL'auteur Shailesh Tainwala | 2010-06-24
Vous devez vous connecter pour publier un commentaire.
Vous devez estimer la matrice de covariance.
Les articles relatifs à Wikipédia sont cette et cette.
Pour multivariée des vecteurs (n observations d'un p-dimensions variables), la formule de la distance de Mahalanobis est
Où le S est l'inverse de la matrice de covariance, qui peuvent être estimées comme suit:
où est la i-ème observation de l' (p-dimensionnel) variable aléatoire et
Faire attention à ce que l'aide de la distance de Mahalanobis entre vos vecteurs de sens que si tous les vecteurs de valeurs attendues sont les mêmes.
J'ai toujours pensé que la distance de Mahalanobis est seulement utilisé pour classer les données et de détecter les valeurs aberrantes, comme le rejet en mer des données expérimentales (sorte de vrai/faux tests). Jamais entendu parler de l'utiliser comme un "analogique" de la distance.
HTH!
OriginalL'auteur Dr. belisarius