Comment créer un cluster de la parcelle dans R?
Comment puis-je créer un cluster de la parcelle dans la R sans l'aide de clustplot?
Je suis en train d'essayer de se familiariser avec certains de clustering (à l'aide de R) et de visualisation (à l'aide de HTML5 Canvas).
Fondamentalement, je veux créer un cluster de la parcelle mais au lieu de la représentation des données, je veux obtenir un ensemble de points 2D ou les coordonnées que je peux tirer en toile et faire quelque chose de joli (mais je suis pas sûr de comment le faire). J'imagine que j':
- Créer une matrice de similarité pour l'ensemble du jeu de données (à l'aide de dist)
- Cluster de la matrice de similarité à l'aide de kmeans ou quelque chose de similaire (à l'aide de kmeans)
- Tracer le résultat à l'aide de médecins ou PCA - mais je ne suis pas certain de la façon dont les étapes 2 et 3 se rapportent (cmdscale).
J'ai vérifié questions ici, ici et ici (avec la dernière étant de plus utiliser).
OriginalL'auteur slotishtype | 2012-01-26
Vous devez vous connecter pour publier un commentaire.
Vouliez-vous dire quelque chose de ce genre?
Désolé, mais je ne sais rien à propos de HTML5 Canvas, R... Mais j'espère que cela aide...
J'ai d'abord regrouper les données à l'aide de kmeans (notez que je n'ai pas du cluster de la matrice de distance), que je calcule la distance matix et de la parcelle à l'aide de cmdscale. Puis-je ajouter des couleurs à la MDS-complot qui correspondent à des groupes identifiés par kmeans. Plus une belle supplémentaires caractéristiques graphiques.
Vous pouvez accéder aux coordonnées de l'objet créé par cmdscale.
voir mon edit. groupes est juste un objet qui contient les noms des groupes, uniquement utilisé pour la boucle for.
Ok, je vois votre modifier. Une dernière question, pouvez-vous cluster de la matrice de distance ou est-ce un fou déplacer? Désolé, l'apprentissage à l'instant et tout simplement de travailler mon chemin à travers les choses.
OriginalL'auteur
Ici vous pouvez trouver un graphique pour analyser cluster résultats, "coordonner parcelle", dans "clusplot".
Il n'est pas basée sur l'ACP. Il utilise la fonction de l'échelle de disposer de toutes les variables de moyens dans une gamme de 0 à 1, de sorte que vous pouvez comparer le groupe qui détient le max/min en moyenne pour chaque variable.
Ce post explique comment l'utiliser.
OriginalL'auteur