La fusion des deux ensembles de données dans le Cochon

J'ai un script pig dans lequel je suis le chargement d'un jeu de données, plongée dans deux bases de données distinctes et ensuite effectuer quelques calculs et enfin d'ajouter un autre champ calculé. Maintenant, je veux me joindre à ces deux ensembles de données.

A = LOAD '/user/hdfs/file1' AS (a:int, b:int);

A1 = FILTER A BY a > 100;
A2 = FILTER A BY a <= 100 AND b > 100;

-- Now I do some calculation on A1 and A2

Donc, essentiellement, d'après le calcul, voici le schéma pour les deux:

{A1 : {a:int, b:int, type:chararray}}
{A2:  {a:int, b:int, type:chararray}}

Maintenant, avant que je dump ce retour à la SF, je veux fusionner les deux ensembles de données de retour. Quelque chose comme UNION ALL en SQL. Comment puis-je le faire?

Sur une note différente, vous pouvez optimiser le script en utilisant SPLIT (pig.apache.org/docs/r0.7.0/piglatin_ref2.html#SPLIT) à la place du FILTRE.

OriginalL'auteur divinedragon | 2013-01-11