Dans Apache Kafka pourquoi ne peut-on pas être plus grand cas que les partitions?

Je suis en train d'apprendre à propos de Kafka, la lecture de l'introduction de l'article ici

https://kafka.apache.org/documentation.html#introduction

plus précisément à la partie sur les Consommateurs. Dans l'avant dernier paragraphe de l'Introduction, il lit

Kafka ne fait mieux. En ayant une notion de parallélisme—partition—dans le cadre des sujets, Kafka est
en mesure de fournir à la fois des garanties de classement et d'équilibrage de la charge sur un groupe de consommateurs processus. Cette
est obtenue en attribuant les partitions dans la rubrique pour les consommateurs dans le groupe de consommateurs, de sorte que
chaque partition est consommée par exactement un consommateur dans le groupe. En faisant cela, nous nous assurons que l'
le consommateur est le seul lecteur de la partition et consomme les données dans l'ordre. Comme il ya beaucoup de
partitions-ce encore l'équilibrage de la charge sur la plupart des instances. Notez cependant qu'il ne peut
être des consommateurs en cas de partitions.

Ma confusion vient de la dernière phrase, parce que dans l'image de droite ci-dessus que le paragraphe où l'auteur dépeint deux groupes de consommateurs et un 4-partition sujet, il y a plus de consommation d'instances de partitions!

Il ne fait pas de sens qu'il ne peut pas être plus consommateur en cas de partitions, parce que les partitions être incroyablement petit et il semble que la surcharge lors de la création d'une nouvelle partition pour chaque consommateur instance enliserait Kafka. Je comprends que les partitions sont utilisés pour la tolérance aux pannes et de réduire la charge sur un serveur, mais la phrase ci-dessus n'a pas de sens dans le contexte d'un système distribué qui est censé être capable de gérer des milliers de consommateurs à un moment.

InformationsquelleAutor almel | 2014-09-17