Comment accéder aux valeurs de colonne de tableau?

J'ai un Dataframe, avec une colonne. Chaque ligne de cette colonne est un Tableau de Chaîne de valeurs:

Valeurs dans mon Étincelle 2.2 Dataframe

["123", "abc", "2017", "ABC"]
["456", "def", "2001", "ABC"]
["789", "ghi", "2017", "DEF"]

org.apache.spark.sql.DataFrame = [col: array]

root
|-- col: array (nullable = true)
|    |-- element: string (containsNull = true)

Quelle est la meilleure façon d'accéder aux éléments du tableau? Par exemple, je voudrais extraire des valeurs distinctes dans la quatrième élément pour l'année 2017 (réponse "ABC", "DEF").

InformationsquelleAutor user3439308 | 2017-12-01