Comment calculer la date de différence dans pyspark?

J'ai des données comme ceci:

df = sqlContext.createDataFrame([
    ('1986/10/15', 'z', 'null'), 
    ('1986/10/15', 'z', 'null'),
    ('1986/10/15', 'c', 'null'),
    ('1986/10/15', 'null', 'null'),
    ('1986/10/16', 'null', '4.0')],
    ('low', 'high', 'normal'))

Je veux calculer la date de différence entre low colonne et 2017-05-02 et remplacer low colonne avec la différence. J'ai essayé les solutions liées à la sur stackoverflow mais aucun des deux ne fonctionne.

OriginalL'auteur Mark Krystal | 2017-05-17