Comment obtenir un échantillon avec une taille exacte de l'échantillon dans Spark RDD?

Pourquoi le rdd.sample() fonction Spark RDD retourner un nombre différent d'éléments, même si la fraction paramètre est le même? Par exemple, si mon code est comme ci-dessous:

val a = sc.parallelize(1 to 10000, 3)
a.sample(false, 0.1).count

Chaque fois que je lance la deuxième ligne de code, il renvoie un nombre différent de ne pas égal à 1000. En fait je m'attends à voir 1000 à chaque fois, bien que la 1000 éléments peuvent être différentes. Quelqu'un peut me dire comment je peux obtenir un échantillon avec la taille de l'échantillon exactement égal à 1000? Je vous remercie beaucoup.

InformationsquelleAutor Carter | 2015-09-29