Comment fonctionne exactement k-means++ travail?

J'ai du mal à comprendre pleinement la k-means++ de l'algorithme. Je suis intéressé, exactement comment la première k centroïdes sont cueillis (le reste, c'est comme dans l'original k-means).

  1. Est la fonction de probabilité utilisée en fonction de la distance ou de Gauss?
  2. Dans le même temps, la plus longue distance du point (à partir de l'autre centroïdes) est choisi pour un nouveau centre de gravité.

Je vais apprécier une explication étape par étape, et un exemple. L'un dans Wikipédia n'est pas assez clair. Également très bien commenté le code source serait également aider. Si vous êtes à l'aide de 6 tableaux alors s'il vous plaît dites-nous qui est pour ce.