Convertir pyspark chaîne de format de date

J'ai une date pyspark dataframe avec une colonne de type chaîne dans le format de MM-dd-yyyy et je suis tenté de le convertir en une colonne de date.

J'ai essayé:

df.select(to_date(df.STRING_COLUMN).alias('new_date')).show()

et je reçois une chaîne de valeurs null. Quelqu'un peut-il aider?

  • Sauf si vous utilisez l'un des TimeSeriesRDD addons (voir l'Étincelle 2016 de la conférence pour discussion, il ya deux que je connais, mais les deux sont encore en développement), il n'y a pas beaucoup de grands outils pour le temps de la série. En conséquence, j'ai trouvé il y a rarement une raison à la peine de convertir des chaînes de type datetime objets, si votre objectif est verious types de groupBy ou rééchantillonnage des opérations. Il vous suffit de lancer sur les colonnes de la chaîne.
  • L'analyse sera réalisée en utilisant peu ou pas de groupBy mais plutôt des études longitudinales de dossiers médicaux. Donc être capable de manipuler la date est importante
  • Double Possible de Pourquoi je reçois des résultats nuls de date_format() PySpark fonction?
InformationsquelleAutor Jenks | 2016-06-28