La sortie de commande HED INSERT OVERWRITE DIRECTORY n'est pas séparée par un délimiteur. Pourquoi?

Le fichier que je suis le chargement est séparé par des '' (espace blanc). Ci-dessous le fichier. Le fichier se trouve dans HDFS:-

001 000
001 000
002 001
003 002
004 003
005 004
006 005
007 006
008 007
099 007

1> je suis de la création d'une table externe et de charger le fichier en tapant la commande ci-dessous:-

CREATE EXTERNAL TABLE IF NOT EXISTS graph_edges (src_node_id STRING COMMENT 'Node ID of Source node', dest_node_id STRING COMMENT 'Node ID of Destination node') ROW FORMAT DELIMITED FIELDS TERMINATED BY ' ' STORED AS TEXTFILE LOCATION '/user/hadoop/input';

2> Après cela, je suis tout simplement d'insérer le tableau dans un autre fichier en exécutant la commande ci-dessous:-

INSERT OVERWRITE DIRECTORY '/user/hadoop/output' SELECT * FROM graph_edges;

3> Maintenant, quand je chat le fichier, les champs ne sont pas séparés par un délimiteur:-

hadoop dfs -cat /user/hadoop/output/000000_0

De sortie:-

001000
001000
002001
003002
004003
005004
006005
007006
008007
099007

Quelqu'un peut-il m'aider? Pourquoi est-ce que le séparateur étant retiré et la façon de délimiter le fichier de sortie?

Dans la commande CREATE TABLE, j'ai essayé DELIMITED BY '\t' mais alors je suis inutile colonne NULL.

Tous les pointeurs aider beaucoup apprécié. Je suis l'aide de la Ruche version 0.9.0.

source d'informationauteur Anuroop | 2013-05-09