Se moquer d'une Étincelle RDD dans les tests unitaires

Est-il possible de simuler une RDD sans l'aide de sparkContext?

Je veux unité de test de la fonction d'utilité suivante:

 def myUtilityFunction(data1: org.apache.spark.rdd.RDD[myClass1], data2: org.apache.spark.rdd.RDD[myClass2]): org.apache.spark.rdd.RDD[myClass1] = {...}

Donc j'ai besoin de passer data1 et data2 à myUtilityFunction. Comment puis-je créer un données1 à partir d'une maquette org.apache.spark.rdd.RDD[myClass1], au lieu de créer un véritable RDD de SparkContext? Merci!!!!

Pourquoi ne pourriez-vous pas? Ce sont juste des objets de base, vous pouvez se moquer d'eux, bien que très probablement, il est généralement plus facile à utiliser sc.parallelize que de se moquer de l' map/flatMap/... méthodes de trop.

OriginalL'auteur Edamame | 2015-06-19