Comment canaliser les données à partir d'AWS Postgres RDS S3 (alors Redshift)?
Je suis en utilisant le service AWS data pipeline pour canaliser les données à partir d'un RDS MySql
base de données de s3
et puis à Redshift
, qui fonctionne très bien.
Cependant, j'ai aussi des données qui vivent dans un RDS Postres
exemple que je voudrais tuyau de la même façon, mais je vais avoir un moment difficile de la configuration de l'jdbc-connexion. Si c'est pas pris en charge, est-il un travail?
"connectionString": "jdbc:postgresql://THE_RDS_INSTANCE:5432/THE_DB”
Vous devez vous connecter pour publier un commentaire.
cela ne fonctionne pas encore. aws n'en a pas construit /publié les fonctionnalités pour vous connecter bien pour postgres. vous pouvez le faire dans un shellcommandactivity bien. vous pouvez écrire un peu, ruby ou python, le code pour le faire et déposer dans un script sur s3 en utilisant scriptUri. vous pourriez tout aussi bien écrire un psql commande pour vidage de la table csv et ensuite de la pipe que pour OUTPUT1_STAGING_DIR avec "la mise en scène: true" dans l'activité du nœud.
quelque chose comme ceci:
je n'ai pas le lancer pour vérifier parce que c'est une douleur à rotation d'un pipeline 🙁 alors vérifiez le sauvant dans la commande.
regarder dans les nouveaux trucs aws vient d'être lancé sur paramétrée création de modèles de données pipelines: http://docs.aws.amazon.com/datapipeline/latest/DeveloperGuide/dp-custom-templates.html. on dirait qu'il va permettre le chiffrement des paramètres arbitraires.
Aujourd'hui, vous pouvez définir une copie de l'activité pour extraire des données à partir d'une Postgres RDS instance dans S3. Dans le Pipeline de Données de l'interface:
AWS maintenant permettre aux partenaires de faire en temps quasi-réel RDS -> Redshift inserts.
https://aws.amazon.com/blogs/aws/fast-easy-free-sync-rds-to-redshift/