DBSCAN dans scikit-learn de Python: enregistrer les points du cluster dans un tableau
suivant l'exemple Démo de DBSCAN algorithme de clustering de Scikit Apprentissage que je suis en train de les stocker dans un tableau x, y de chaque clustering classe
import numpy as np
from sklearn.cluster import DBSCAN
from sklearn import metrics
from sklearn.datasets.samples_generator import make_blobs
from sklearn.preprocessing import StandardScaler
from pylab import *
# Generate sample data
centers = [[1, 1], [-1, -1], [1, -1]]
X, labels_true = make_blobs(n_samples=750, centers=centers, cluster_std=0.4, random_state=0)
X = StandardScaler().fit_transform(X)
xx, yy = zip(*X)
scatter(xx,yy)
show()
db = DBSCAN(eps=0.3, min_samples=10).fit(X)
core_samples = db.core_sample_indices_
labels = db.labels_
n_clusters_ = len(set(labels)) - (1 if -1 in labels else 0)
print n_clusters_
3
J'essaie de comprendre le DBSCAN mise en œuvre par scikit-learn, mais à partir de ce point, je vais avoir des ennuis. Le nombre de cluster est de 3 (n_clusters_) et je souhaite stocker les x, y de chaque cluster dans un tableau
source d'informationauteur Gianni Spear
Vous devez vous connecter pour publier un commentaire.
Le premier cluster est
X[labels == 0]
etc.:et les valeurs aberrantes sont
Qu'entendez-vous par "cluster"?
Dans DBSCAN, les clusters ne sont pas représentés comme des centroïdes comme k-means, donc il n'est pas évidente, la représentation de la grappe, à l'exception de ses membres. Vous avez déjà la position x et y de la les membres du cluster, comme ils sont les données d'entrée.
Donc je ne suis pas sûr de ce que la question est.