Tag: hdfs

Hadoop Distributed File System (HDFS) est le principal système de stockage utilisé par les applications Hadoop. HDFS crée plusieurs répliques de blocs de données et les distribue sur les nœuds de calcul à travers un cluster pour activer fiable, extrêmement rapide des calculs.

Nombre de fichiers dans un répertoire HDFS

HDFS facteur de réplication

apache spark - vérifier si le fichier existe

Pourquoi ne spark-shell --master fil-client ne parviennent pas (encore pyspark --master fil semble fonctionner)?

Analyser CSV comme DataFrame/DataSet avec Apache Spark et Java

Meilleur splittable compression pour Hadoop entrée = bz2?

Split size vs taille de Bloc dans Hadoop

La lecture de SF et de fichiers locaux en Java

Est-il possible d'ajouter des nœuds dans un cluster Hadoop?

Comment obtenir hadoop mis à créer des répertoires s'ils n'existent pas

Comment Hadoop Namenode processus de basculement fonctionne?

Vérifier si le répertoire dans HDFS existe déjà ou pas

Configuration incorrecte: l'adresse de namenode dfs.namenode.rpc-address n'est pas configurée

HDFS: Comment lister les fichiers de manière récursive?

Exception fermée Hadoop FileSystem lors de l'exécution de BufferedReader.close ()

connexion hadoop refusée sur le port 9000

Accès HDFS depuis l'hôte distant via l'API Java, authentification de l'utilisateur

L'adresse dfs.namenode.servicerpc ou l'adresse dfs.namenode.rpc n'est pas configurée

LeaseExpiredException: Aucune erreur de bail sur HDFS

La carte hadoop réduit le travail avec l'entrée HDFS et la sortie HBASE