DBSCAN dans scikit-learn de Python: enregistrer les points du cluster dans un tableau

suivant l'exemple Démo de DBSCAN algorithme de clustering de Scikit Apprentissage que je suis en train de les stocker dans un tableau x, y de chaque clustering classe

import numpy as np
from sklearn.cluster import DBSCAN
from sklearn import metrics
from sklearn.datasets.samples_generator import make_blobs
from sklearn.preprocessing import StandardScaler
from pylab import *

# Generate sample data
centers = [[1, 1], [-1, -1], [1, -1]]
X, labels_true = make_blobs(n_samples=750, centers=centers, cluster_std=0.4, random_state=0)
X = StandardScaler().fit_transform(X) 

xx, yy = zip(*X)
scatter(xx,yy)
show()

db = DBSCAN(eps=0.3, min_samples=10).fit(X)
core_samples = db.core_sample_indices_
labels = db.labels_
n_clusters_ = len(set(labels)) - (1 if -1 in labels else 0)
print n_clusters_
3

DBSCAN dans scikit-learn de Python: enregistrer les points du cluster dans un tableau

J'essaie de comprendre le DBSCAN mise en œuvre par scikit-learn, mais à partir de ce point, je vais avoir des ennuis. Le nombre de cluster est de 3 (n_clusters_) et je souhaite stocker les x, y de chaque cluster dans un tableau

source d'informationauteur Gianni Spear

Le premier cluster est X[labels == 0]etc.:

clusters = [X[labels == i] for i in xrange(n_clusters_)]

et les valeurs aberrantes sont

outliers = X[labels == -1]

2

Qu'entendez-vous par "cluster"?

Dans DBSCAN, les clusters ne sont pas représentés comme des centroïdes comme k-means, donc il n'est pas évidente, la représentation de la grappe, à l'exception de ses membres. Vous avez déjà la position x et y de la les membres du cluster, comme ils sont les données d'entrée.

Donc je ne suis pas sûr de ce que la question est.

Vous devez vous connecter pour publier un commentaire.