Tag: amazon-emr

Amazon Elastic MapReduce (Amazon EMR) est un service web qui permet à des entreprises, des chercheurs, des analystes de données et aux développeurs de facilement et à moindre coût-efficace de traiter de grandes quantités de données. Il utilise un logiciel hébergé Hadoop en cours d’exécution sur le web à l’échelle de l’infrastructure d’Amazon Elastic Compute Cloud (Amazon EC2) et Amazon Simple Storage Service (Amazon S3).

Rapport d'Application pour application_ (état: ACCEPTÉ) n'en finit pas d'Étincelles Soumettre (avec Spark 1.2.0 sur le FIL)

amazon-emr amazon-kinesis apache-spark yarn

La RUCHE de la Table Externe - Définir des Chaînes Vides à NULL

amazon-emr external-tables hadoop hdfs hive

A ÉCHOUÉ: ParseException: ne peut pas reconnaître d'entrée de près de 'l'échange' 'string' ',' dans la colonne de spécification

amazon-emr amazon-web-services hadoop hadoop-partitioning hive

AWS DME performance HDFS vs S3

amazon-emr amazon-s3 hadoop hdfs mapreduce

Stimuler l'étincelle.de fil.exécuteur testamentaire.memoryOverhead

amazon-emr amazon-web-services apache-spark emr pyspark

L'ajout d'en-têtes de colonne de la ruche jeu de résultats

amazon-emr amazon-s3 hive

chemin d'accès au fichier dans hdfs

amazon-ec2 amazon-emr hadoop java mapreduce

Amazon EC2 vs Amazon EMR

amazon-ec2 amazon-emr amazon-web-services hive

Est-ce que Hive a quelque chose d'équivalent à DUAL?

amazon-emr hadoop hive

Le dossier ne sera pas supprimé sur Amazon S3

amazon-emr amazon-s3 amazon-web-services

Spark + EMR utilisant le paramètre "MaximResourceAllocation" d'Amazon n'utilise pas tous les cœurs / vcores

amazon-emr apache-spark elastic-map-reduce emr yarn

Comment sélectionner un fichier de aws s3 en utilisant le caractère sauvage

amazon-emr amazon-s3 amazon-web-services

"Conteneur tué par YARN pour avoir dépassé les limites de mémoire. 10,4 Go de mémoire physique 10,4 Go utilisés "sur un cluster EMR avec 75 Go de mémoire

amazon-emr apache-spark bigdata emr