Limite de Kafka lots de taille lors de l'utilisation de Spark Streaming

Est-il possible de limiter la taille des lots retournés par le Kafka de consommation pour Spark en Streaming?

Je demande parce que le premier lot je reçois a des centaines de millions d'enregistrements et ça prend une éternité de processus et de point de contrôle entre eux.

  • Quel est votre traitement actuel de l'intervalle? si son plus essayer de réduire l'intervalle de lot, de sorte que vous pouvez obtenir moins de données.
  • Négliger votre question, que vous avez mentionné premier lot..
InformationsquelleAutor Samy Dindane | 2016-10-11