SQLContext objet n'a pas d'attribut en lecture lors de la lecture de csv dans pyspark
Je suis le chargement d'un fichier csv dans pyspark comme suit (dans pyspark shell):
>>> from pyspark.sql import SQLContext
>>> sqlContext = SQLContext(sc)
>>> df = sqlContext.read.format('com.databricks.spark.csv').options(header='true').load('data.csv')
mais j'obtiens cette erreur:
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
AttributeError: 'SQLContext' object has no attribute 'read'
>>>
Je suis en utilisant étincelle 1.3.1 et je suis en train d'utilisateur spark-csv
Vous devez vous connecter pour publier un commentaire.
Que vous essayez d'utiliser
Spark 1.4+
syntaxe.Pour Spark 1.3
Spark 1.4+:
syntaxe