La lecture des données à partir de SQL Server à l'aide de Spark SQL

Est-il possible de lire les données à partir de Microsoft Sql Server (et oracle, mysql, etc.) dans un rdd dans une Étincelle de l'application? Ou avons-nous besoin pour créer un ensemble de mémoire et parallize que dans un RDD?

ça va être sans réponse pour vous 😛
semble si...quelle en est la raison? si l'on peut munge de données de tout, pourquoi pas le plus courant de magasins?
vous devrez attendre quelques jours pour obtenir cette réponse que la balise apache-spark est très solennellement utilisé. Attendre pour un couple de jours pour apache gars pour répondre à votre question.
Vous pouvez certainement lire les données dans le pilote et puis paralléliser que dans un EDR. Si vous êtes à la recherche d'une solution plus évolutive, vous voudrez probablement regarder dans l'aide de DBInputFormat avec les sparks "Hadoop API". Je n'ai pas fait cela avant, mais il semble que quelque chose de bon à regarder dans.

OriginalL'auteur ashic | 2014-10-07