Comment trouver la valeur max de la paire RDD?
J'ai une étincelle paire de RDD (clé, comte) comme ci-dessous
Array[(String, Int)] = Array((a,1), (b,2), (c,1), (d,3))
Comment trouver la clé avec plus compter à l'aide de l'étincelle scala API?
EDIT: type de données de la paire RDD est org.apache.spark.rdd.RDD[(String, Int)]
comment avez-vous trouver le type de données de la paire rdd?
OriginalL'auteur Vijay Innamuri | 2014-11-12
Vous devez vous connecter pour publier un commentaire.
Utilisation
Array.maxBy
méthode:ou
RDD.max
:OriginalL'auteur Sergey Lagutin
Utilisation
takeOrdered(1)(Ordering[Int].reverse.on(_._2))
:OriginalL'auteur Jacek Laskowski
Pour Pyspark:
Laisser
a
être la paire de RDD avec des touches comme une Chaîne de caractères et de valeurs entiers puisrenvoie la valeur de la clé de paire avec le maximum de valeur. Fondamentalement, la fonction max d'ordres de la valeur de retour de la fonction lambda.
Ici
a
est une paire de RDD avec des éléments tels que('key',int)
etx[1]
, renvoie la partie entière de l'élément.Noter que le
max
fonction par elle-même va de commande par clé et le retour de la valeur max.De la Documentation est disponible à https://spark.apache.org/docs/1.5.0/api/python/pyspark.html#pyspark.RDD.max
une idée de comment peut-on imprimer le n-uplet entier? La réponse ci-dessus donne la valeur maximum de x[1]. Je veux aussi que la valeur de x[0] x[1] est maximale
non, il renvoie deux valeurs.
OriginalL'auteur Mayank
Étincelle RDD sont plus efficaces timewise quand ils sont de gauche comme CA et pas tourné dans des Tableaux
OriginalL'auteur Rubber Duck