Tag: hadoop

Hadoop est un Apache projet open-source qui fournit des logiciels pour un service fiable et évolutive de calcul distribué. Le projet lui-même comprend une variété d’autres additions complémentaires.

Vérifier si le répertoire dans HDFS existe déjà ou pas

Hadoop et MySQL Intégration

Top N valeurs par Hadoop Map Reduce code

Calculer la médiane dans la carte réduire

Configuration incorrecte: l'adresse de namenode dfs.namenode.rpc-address n'est pas configurée

Remplacer log4j.properties dans hadoop

Est-ce que Hive a quelque chose d'équivalent à DUAL?

HDFS: Comment lister les fichiers de manière récursive?

get "ERREUR: Impossible d'obtenir l'adresse principale de ZooKeeper; znode data == null "lors de l'utilisation du shell Hbase

D'où hadoop obtient la valeur de variable JAVA_HOME?

Exception fermée Hadoop FileSystem lors de l'exécution de BufferedReader.close ()

Erreur de mémoire insuffisante dans la phase de mélange de Mapreduce

le combineur et le réducteur peuvent être différents?

connexion hadoop refusée sur le port 9000

Accès HDFS depuis l'hôte distant via l'API Java, authentification de l'utilisateur

L'adresse dfs.namenode.servicerpc ou l'adresse dfs.namenode.rpc n'est pas configurée

Qu'est-ce qu'un système de sérialisation de données?

LeaseExpiredException: Aucune erreur de bail sur HDFS

Comment redémarrer le fil sur AWS EMR

Comment éviter OutOfMemoryException lors de l'exécution de Hadoop?

Se connecter de Java à Hive en utilisant JDBC

Java: com.sun.tools.javac.Main introuvable lors de la tentative de compilation du programme Hadoop

Comment supprimer des fichiers du HDFS?

La carte hadoop réduit le travail avec l'entrée HDFS et la sortie HBASE

Analyses basées sur l'horodatage dans HBase?

Configuration de la journalisation Hadoop pour éviter trop de fichiers journaux

Utilisez Spark pour lister tous les fichiers dans un répertoire Hadoop HDFS?

Transférer le fichier depuis HDFS

Sélectionnez les 2 premières lignes dans Hive

Comment lire des fichiers compressés Snappy sur HDFS sans utiliser Hadoop?

Pourquoi count (distinct) est-il plus lent que le groupe dans Hive?

La classe Hadoop JobConf est obsolète, nécessite un exemple mis à jour

Un point de départ pour apprendre à implémenter MapReduce / Hadoop en Python?

copyFromLocal: `/ user / hduser / gutenberg ': aucun fichier ou répertoire de ce type

Existe-t-il un équivalent à `pwd` dans hdfs?

http: // localhost: 50070 ne fonctionne pas HADOOP

Comment décompresser le hadoop réduire la fin du fichier de sortie avec snappy?

Est-il possible d'importer des données dans la table Hive sans copier les données

Comment connaître l'emplacement de la partition dans la ruche?

Grande taille de bloc dans HDFS! Comment l'espace inutilisé est-il pris en compte?

Qu'entend-on par données / datastore / base de données fragmentées?

Toujours obtenir "Impossible de charger les informations de domaine à partir de SCDynamicStore" après correction de bogue

Quelle est la différence fondamentale entre jobconf et job?

Grep sur plusieurs fichiers dans Hadoop Filesystem

Comment spécifier KeyValueTextInputFormat Separator dans Hadoop-.20 API?

Erreur: espace de tas Java

Recherche de répertoires de plus de N jours dans HDFS

Configuration du nœud client Hadoop

Causé par: ERROR XSDB6: Une autre instance de Derby peut avoir déjà démarré la base de données

Comment compter les lignes dans un fichier sur la commande hdfs?