Quelle est la différence entre memory_only et memory_and_disk la mise en cache de niveau spark?
Comment est le comportement de memory_only et memory_and_disk la mise en cache de niveau spark diffèrent-ils?
Vous devez vous connecter pour publier un commentaire.
Documentation dit ---
Cela signifie pour Mémoire SEULEMENT, étincelle va essayer de garder les partitions dans la mémoire pour toujours. Si certaines partitions ne peuvent pas être gardés en mémoire, ou pour le nœud perte de certaines partitions sont supprimées de la mémoire RAM, étincelle va recalculer en utilisant les informations de lignage. Dans la mémoire-et-disque niveau de la spark qui vous permettra de toujours garder les partitions calculé et mis en cache. Il va essayer de garder en mémoire vive, mais si elle ne rentre pas alors partitions sera renversé sur le disque.
Comme expliqué dans la la documentation, la Persistance de niveaux en termes d'efficacité:
MEMORY_AND_DISK
etMEMORY_AND_DISK_SER
déversement sur le disque si il y a trop de données pour tenir en mémoire.<pre>
format et à la main-alignés, les colonnes de la place. Le texte de l'Image ne peuvent pas être recherchés et n'est pas accessible.