Comment changer le type de la colonne de Chaîne à ce Jour dans DataFrames?
J'ai un dataframe qui ont deux colonnes (C, D) sont définies comme une chaîne de caractères de type de colonne, mais les données dans les colonnes sont en fait des dates. par exemple colonne C) a la date d' "01-AVR-2015" et la colonne D "20150401" je veux changer ces à la date de la colonne type, mais je n'ai pas trouvé une bonne façon de le faire. Je regarde le débordement de la pile j'ai besoin de convertir la chaîne de caractères de type de colonne à colonne de Date de type Spark SQL du DataFrame. le format de la date peut être "01-AVR-2015", et je regarde ce post mais il n'a pas eu d'info se rapportent à la date
OriginalL'auteur dbspace | 2016-04-29
Vous devez vous connecter pour publier un commentaire.
Spark >= 2.2
Vous pouvez utiliser
to_date
:ou
to_timestamp
:intermédiaire
unix_timestamp
appel.Spark < 2.2
Depuis Étincelle 1.5 vous pouvez utiliser
unix_timestamp
fonction pour analyser la chaîne de long, jette à l'horodatage et la tronquerto_date
:Note:
Selon une Étincelle version vous cela peut nécessiter quelques ajustements en raison de SPARK-11724:
Si vous utilisez la version non corrigée
unix_timestamp
de sortie nécessite une multiplication par 1000.OriginalL'auteur