Tag: apache-pig

Apache Pig est une plate-forme pour l’analyse de grands ensembles de données qui se compose d’un langage de haut niveau pour exprimer les programmes d’analyse de données, couplé avec l’infrastructure pour l’évaluation de ces programmes. Le saillant de la propriété de Porc programmes, c’est que leur structure se prête à de substantielles de parallélisation qui leur permet de traiter de très grands ensembles de données.

pour obtenir la valeur max dans une ligne de cochon

Calculer la Moyenne à l'aide de PORC

strsplit question - Cochon

ce n' “Rencontrés: <EOF> après :”“, ” moyenne à l'aide de porc

Comment faire la jointure externe sur deux colonnes dans le Latin de Porc

L'exécution de Porc requête sur les données stockées dans la Ruche

Pig Latin: de Charger plusieurs fichiers à partir d'une plage de dates (une partie de la structure de répertoire)

Comment filtrer des enregistrements avec une valeur null dans le COCHON?

La copie de fichiers à partir de s3:// pour système de fichiers local

La déclaration d'une variable et le schéma de PORC

$HIVE_HOME/bin/ruche-service hiveserver

hadoop, pig retour top 5 lignes

Cochon Commande Par Requête

Le fractionnement de l'entrée en sous-chaînes dans le COCHON (Hadoop)

COCHON: ERREUR 1000: Erreur lors de l'analyse

Le formatage de la Date de Générer de la Déclaration

Apache Pig - les CORRESPONDANCES avec plusieurs critères de correspondance d'

Interface utilisateur graphique pour l'utilisation d'Hadoop

comment charger des fichiers sur hadoop cluster à l'aide de apache pig?

Cochon - la Chaîne de l'extraction à l'aide de regex

comment charger des fichiers avec différents séparateur à chaque fois dans piglatin

Ne peut pas lancer de bytearray à chararray dans le cochon

La fusion des deux ensembles de données dans le Cochon

Cochon JVM java heap space erreur

StrSplit de Porc fonctions

Quelle est la différence entre le GROUPE et la COGROUP dans le COCHON?

Cochon Filtre PAS les Matchs

Exécuter le cochon dans la java sans intégration de script pig

le stockage de porc de la production dans la table de la Ruche dans une seule instance

J'ai un Errno 13 Permission denied avec sous-processus en python

Comment puis-je extraire le premier tuple généré à partir d'un sac (dont la taille peut varier) dans le COCHON?

La suppression des doublons à l'aide de PigLatin

Groupe par de multiples champs et de sortie tuple

la façon de déployer et d'exécuter oozie travail?

à l'aide de PORC pour charger un fichier

Comment aplatir un groupe en un seul tuple dans le Cochon?

Calcule le nombre de valeurs distinctes d'un champ à l'aide de script pig

Exception dans le type coulée de Chararry de double dans le de PORC

Cochon Opérateurs Conditionnels

Puis-je générer imbriquées en utilisant des sacs FOREACH imbriquée états Pig Latin?

Génération de tous les domaines à partir d'un alias après une JOINTURE dans le Cochon

Comment puis-je obtenir schéma / les noms de colonnes de parquet fichier?

Cochon mode Batch: comment définir le niveau de journalisation pour masquer les INFOS du journal des messages?

Ne pouvait pas déduire fonction de COMPTAGE

ERREUR 1066: Impossible d'ouvrir itérateur pour alias - Cochon

Max/Min pour l'ensemble des jeux d'enregistrements dans le COCHON

Chargez uniquement du champ de COCHON?

Cochon: Obtenir des n premières valeurs par groupe

Est-il SI Conditionnel comme opérateur dans Apache PIG?

L'exportation de porc au format CSV