La création d'un simple 1-ligne Spark DataFrame avec l'API Java

En Scala, je peux créer une seule ligne DataFrame à partir d'une mémoire de la chaîne comme suit:

val stringAsList = List("buzz")
val df = sqlContext.sparkContext.parallelize(jsonValues).toDF("fizz")
df.show()

Quand df.show() s'exécute, il sorties:

+-----+
| fizz|
+-----+
| buzz|
+-----+

Maintenant, je suis en train de le faire à partir de l'intérieur d'une classe Java. Apparemment JavaRDDs n'avez pas de toDF(String) méthode. J'ai essayé:

List<String> stringAsList = new ArrayList<String>();
stringAsList.add("buzz");
SQLContext sqlContext = new SQLContext(sparkContext);
DataFrame df = sqlContext.createDataFrame(sparkContext
    .parallelize(stringAsList), StringType);
df.show();

...mais il semble toujours à venir à court. Maintenant, quand df.show(); exécute, j'obtiens:

++
||
++
||
++

(Vide DF.) Alors je vous le demande: à l'Aide de la API Java, comment puis-je lire un mémoire de chaîne dans un DataFrame qui a seulement 1 ligne et 1 colonne, et de spécifier le nom de cette colonne? (De sorte que le df.show() est identique à la Scala, l'un au-dessus)?

OriginalL'auteur smeeb | 2016-10-10