Dans la Ruche, ne “Load data local inpath” écraser les données existantes ou ajouter?
J'espère pour exécuter une importation dans la Ruche dans un cron, et espérais juste en utilisant
"load data local inpath '/tmp/data/x' dans la table X" dans un tableau serait suffisant.
Va les commandes ultérieures remplacer ce qui est déjà dans la table? ou cela est-il ajout?
OriginalL'auteur CMaury | 2011-04-04
Vous devez vous connecter pour publier un commentaire.
Ce site http://wiki.apache.org/hadoop/Hive/LanguageManual est votre ami lorsque vous traitez avec de la Ruche. 🙂
La page qui traite le chargement des données dans la Ruche est http://wiki.apache.org/hadoop/Hive/LanguageManual/DML
Cette page indique que
Dans votre cas, vous n'êtes pas à l'aide de la
OVERWRITE
mot-clé, de sorte que les fichiers seront ajoutés à la table. (Sauf si ce sont les mêmes fichiers, dans ce cas, ils sont écrasés)Juste pour mettre à jour si vous êtes en utilisant le même fichier de la charge, encore et encore, qui va ajouter encore et encore dans la table, ce n'est pas que vous obtenez le remplacer le fichier est-ce que tu vas utiliser le même pour la prochaine charge. juste être méfiez-vous de cela.
OriginalL'auteur QuinnG
Si le fait de REMPLACER le mot clé est utilisé ensuite le contenu de la table cible (ou la partition) seront supprimés et remplacés par les fichiers visés par filepath; sinon les fichiers visés par le chemin d'accès du fichier sera ajouté à la table.
OriginalL'auteur Haimei