Tag: hadoop

Hadoop est un Apache projet open-source qui fournit des logiciels pour un service fiable et évolutive de calcul distribué. Le projet lui-même comprend une variété d’autres additions complémentaires.

Vérifier si le répertoire dans HDFS existe déjà ou pas

hadoop hdfs scripting shell

Hadoop et MySQL Intégration

hadoop integration mysql

Top N valeurs par Hadoop Map Reduce code

hadoop mapreduce

Calculer la médiane dans la carte réduire

apache-pig hadoop mapreduce median statistics

Configuration incorrecte: l'adresse de namenode dfs.namenode.rpc-address n'est pas configurée

cloudera-cdh hadoop hdfs

Remplacer log4j.properties dans hadoop

Est-ce que Hive a quelque chose d'équivalent à DUAL?

amazon-emr hadoop hive

HDFS: Comment lister les fichiers de manière récursive?

get "ERREUR: Impossible d'obtenir l'adresse principale de ZooKeeper; znode data == null "lors de l'utilisation du shell Hbase

hadoop hbase shell

D'où hadoop obtient la valeur de variable JAVA_HOME?

Exception fermée Hadoop FileSystem lors de l'exécution de BufferedReader.close ()

hadoop hdfs java mapreduce

Erreur de mémoire insuffisante dans la phase de mélange de Mapreduce

hadoop mapreduce

le combineur et le réducteur peuvent être différents?

combiners hadoop mapreduce

connexion hadoop refusée sur le port 9000

hadoop hdfs java ubuntu

Accès HDFS depuis l'hôte distant via l'API Java, authentification de l'utilisateur

authentication hadoop hdfs java security

L'adresse dfs.namenode.servicerpc ou l'adresse dfs.namenode.rpc n'est pas configurée

Qu'est-ce qu'un système de sérialisation de données?

data-serialization distributed-computing hadoop

LeaseExpiredException: Aucune erreur de bail sur HDFS

Comment redémarrer le fil sur AWS EMR

emr hadoop yarn

Comment éviter OutOfMemoryException lors de l'exécution de Hadoop?

hadoop java out-of-memory

Se connecter de Java à Hive en utilisant JDBC

hadoop hive java jdbc

Java: com.sun.tools.javac.Main introuvable lors de la tentative de compilation du programme Hadoop

Comment supprimer des fichiers du HDFS?

hadoop hortonworks-data-platform

La carte hadoop réduit le travail avec l'entrée HDFS et la sortie HBASE

hadoop hbase hdfs java mapreduce

Analyses basées sur l'horodatage dans HBase?

Configuration de la journalisation Hadoop pour éviter trop de fichiers journaux

hadoop java log4j mapreduce

Utilisez Spark pour lister tous les fichiers dans un répertoire Hadoop HDFS?

apache-spark hadoop

Transférer le fichier depuis HDFS

data-transfer hadoop hdfs

Sélectionnez les 2 premières lignes dans Hive

hadoop hive hiveql

Comment lire des fichiers compressés Snappy sur HDFS sans utiliser Hadoop?

compression hadoop hdfs snappy

Pourquoi count (distinct) est-il plus lent que le groupe dans Hive?

hadoop hive performance

La classe Hadoop JobConf est obsolète, nécessite un exemple mis à jour

cloudera hadoop mapreduce

Un point de départ pour apprendre à implémenter MapReduce / Hadoop en Python?

hadoop mapreduce python

copyFromLocal: `/ user / hduser / gutenberg ': aucun fichier ou répertoire de ce type

Existe-t-il un équivalent à `pwd` dans hdfs?

http: // localhost: 50070 ne fonctionne pas HADOOP

Comment décompresser le hadoop réduire la fin du fichier de sortie avec snappy?

Est-il possible d'importer des données dans la table Hive sans copier les données

hadoop hdfs hive

Comment connaître l'emplacement de la partition dans la ruche?

hadoop hive sql

Grande taille de bloc dans HDFS! Comment l'espace inutilisé est-il pris en compte?

hadoop hdfs mapreduce

Qu'entend-on par données / datastore / base de données fragmentées?

database database-schema hadoop hbase sparse-matrix

Toujours obtenir "Impossible de charger les informations de domaine à partir de SCDynamicStore" après correction de bogue

apache-pig hadoop homebrew

Quelle est la différence fondamentale entre jobconf et job?

bigdata hadoop mapreduce

Grep sur plusieurs fichiers dans Hadoop Filesystem

bash grep hadoop shell unix

Comment spécifier KeyValueTextInputFormat Separator dans Hadoop-.20 API?

hadoop java mapreduce

Erreur: espace de tas Java

Recherche de répertoires de plus de N jours dans HDFS

Configuration du nœud client Hadoop

Causé par: ERROR XSDB6: Une autre instance de Derby peut avoir déjà démarré la base de données

apache-spark derby hadoop

Comment compter les lignes dans un fichier sur la commande hdfs?