extraire des données à partir de la table de la ruche dans spark et effectuer la jointure sur RDDs

J'ai deux tables dans la ruche/impala. Je veux extraire les données de la table dans spark comme rdd et dire effectuer une opération de jointure.

Je ne veux pas passer directement la requête de jointure dans ma ruche contexte. C'est juste un exemple.
J'ai plus de cas d'utilisation qui ne sont pas possible par une norme HiveQL.
Comment puis-je récupérer toutes les lignes, l'accès aux colonnes et effectuer la transformation.

Supposons que j'ai deux rdd:

val table1 =  hiveContext.hql("select * from tem1")

val table2 =  hiveContext.hql("select * from tem2")

Je veux faire une jointure sur la rdd sur une colonne appelée "account_id"

Idéalement, je veux faire quelque chose comme ceci en utilisant la rdd à l'aide de l'étincelle shell.

select * from tem1 join tem2 on tem1.account_id=tem2.account_id; 

OriginalL'auteur user1189851 | 2014-11-06