La RUCHE de la Table Externe - Définir des Chaînes Vides à NULL
Actuellement, j'ai une RUCHE de 0,7 exemple sur Amazon EMR. Je suis en train de créer un double de cette instance sur un nouveau DME cluster à l'aide de la Ruche de 0,11.
Dans mon 0.7 exemple, j'ai une table externe qui permettra de définir des chaînes vides à NULL. Voici comment j'ai créer la table:
CREATE EXTERNAL TABLE IF NOT EXISTS tablename
(column1 string,
column2 string)
PARTITIONED BY (year STRING, month STRING, day STRING)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t'
LINES TERMINATED BY '\n'
TBLPROPERTIES ('serialization.null.format' = '');
De données est ajouté à la table comme ceci:
ALTER TABLE tablename
ADD PARTITION (year = '2013', month = '10', day='01')
LOCATION '/location_in_hdfs';
Cela fonctionne très bien dans de 0,7 mais dans 0.11 il ne semble pas à l'évaluation de mes chaînes vides que les valeurs NULL. Fait intéressant, la création d'une table normale avec les mêmes données et la définition de la table semble pour évaluer les cordes à vide que les valeurs Null comme prévu.
Est qu'il y a différentes façon de le faire avec une table externe dans 0.11?
Vous devez vous connecter pour publier un commentaire.
Ruche de partition par défaut des propriétés substituant les propriétés de la table. Inclure SERDE propriétés dans votre instruction alter: