Supprimer les données d'étincelles du cache
Je suis en utilisant Étincelle 1.3.0 avec l'api python. Tout en transformant énorme dataframes, je cache beaucoup de DFs pour une exécution plus rapide;
df1.cache()
df2.cache()
Une fois l'utilisation de certains dataframe est plus et n'est plus nécessaire comment puis-je déposer DF à partir de la mémoire (ou de l'onu-cache??)?
Par exemple, df1
est utilisé à travers le code tout en df2
est utilisé pour le peu de transformations et d'après cela, il n'est jamais nécessaire. Je veux avec force drop df2
pour libérer plus d'espace mémoire.
source d'informationauteur ankit patel
Vous devez vous connecter pour publier un commentaire.
juste faire ce qui suit:
Si le dataframe enregistré comme une table pour les opérations SQLcomme
puis le cache peuvent être déposés avec les commandes suivantes, -cours étincelle aussi le fait automatiquement
Spark >= 2.x
Ici
spark
est un objet deSparkSession
Spark <= 1.6.x