Tag: hadoop

Hadoop est un Apache projet open-source qui fournit des logiciels pour un service fiable et évolutive de calcul distribué. Le projet lui-même comprend une variété d’autres additions complémentaires.

Utilisez Spark pour lister tous les fichiers dans un répertoire Hadoop HDFS?

Transférer le fichier depuis HDFS

Sélectionnez les 2 premières lignes dans Hive

Comment lire des fichiers compressés Snappy sur HDFS sans utiliser Hadoop?

Pourquoi count (distinct) est-il plus lent que le groupe dans Hive?

La classe Hadoop JobConf est obsolète, nécessite un exemple mis à jour

Un point de départ pour apprendre à implémenter MapReduce / Hadoop en Python?

copyFromLocal: `/ user / hduser / gutenberg ': aucun fichier ou répertoire de ce type

Existe-t-il un équivalent à `pwd` dans hdfs?

http: // localhost: 50070 ne fonctionne pas HADOOP

Comment décompresser le hadoop réduire la fin du fichier de sortie avec snappy?

Est-il possible d'importer des données dans la table Hive sans copier les données

Comment connaître l'emplacement de la partition dans la ruche?

Grande taille de bloc dans HDFS! Comment l'espace inutilisé est-il pris en compte?

Qu'entend-on par données / datastore / base de données fragmentées?

Toujours obtenir "Impossible de charger les informations de domaine à partir de SCDynamicStore" après correction de bogue

Quelle est la différence fondamentale entre jobconf et job?

Grep sur plusieurs fichiers dans Hadoop Filesystem

Comment spécifier KeyValueTextInputFormat Separator dans Hadoop-.20 API?

Erreur: espace de tas Java

Recherche de répertoires de plus de N jours dans HDFS

Configuration du nœud client Hadoop

Causé par: ERROR XSDB6: Une autre instance de Derby peut avoir déjà démarré la base de données

Comment compter les lignes dans un fichier sur la commande hdfs?

Fichiers compressés Hadoop gzip

Comment exécuter une application Spark simple à partir d'Eclipse / Intellij IDE?

Problème avec -libjars à hadoop

Enregistrer la structure de données Spark en tant que table partitionnée dynamique dans Hive

Comment lister toutes les bases de données Hive en cours d'utilisation ou créées jusqu'à présent?

Exception dans le thread "principal" java.lang.NoClassDefFoundError: org / apache / hadoop / util / PlatformName

Le client Hbase ne peut pas se connecter au serveur Hbase distant

org.apache.hadoop.mapred.FileAlreadyExistsException

Ajouter une colonne dans une table dans HIVE QL

aucune erreur de nom de noeud en pseudo-mode

comment utiliser hadoop pour une application web?

Comment pratiquer la programmation Hadoop?

hadoop fs -ls aboutit à "aucun fichier ou répertoire"

Affichage du nombre de blocs pour un fichier dans hadoop

Installation de Hadoop sur Windows

Hadoop: la clé et la valeur sont séparées par des tabulations dans le fichier de sortie. comment le faire séparé par un point-virgule?

Spark Impossible de charger la bibliothèque native-hadoop pour votre plate-forme

Pyspark --py-files ne fonctionne pas

Filtrer les valeurs nulles avec le porc

Evolution du schéma en format parquet

Fusion de fichiers hdfs

Hadoop dans le changement de nom des fichiers

Hadoop et HBase

Quelle est l'utilisation de hcatalog dans hadoop?

Hadoop - Redémarrer le datanode et le tasktracker

Quelle est la différence entre un seul noeud & amp; mode pseudo-distribué dans Hadoop?