L'importation de données à partir de HDFS à la table de la Ruche
J'ai mes données dans les données/2011/01/13/0100/fichier HDFS, chacun des thes fichier contenant des données séparées par des tabulations, dire nom, ip , url.
Je veux créer une table dans la Ruche et importer les données à partir de hdfs, le tableau doit contenir le temps,le nom, l'ip et l'url.
Comment puis-je importer à l'aide de la Ruche ? r les données doivent être dans un autre format pour que je puisse importer le temps ?
Cochez cette question: stackoverflow.com/questions/9626789/...
OriginalL'auteur AlgoMan | 2011-04-22
Vous devez vous connecter pour publier un commentaire.
Pour ce faire, vous devez utiliser des partitions, lisez plus ici:
OriginalL'auteur wlk
Vous avez besoin pour créer la table pour charger les fichiers, puis utiliser les DONNÉES de CHARGEMENT de commande pour charger les fichiers dans les tables de la Ruche. Voir la La ruche de la documentation précis pour la syntaxe à utiliser.
Ce qui concerne,
Jeff
OriginalL'auteur Jeff Hammerbacher
Vous pouvez créer une table externe pour de telles données.
Quelque chose comme:
OriginalL'auteur Amar