Coulissante Vs Tumbling Windows
Je suis en train de lire un long article sur les Flux de Données de Gestion, et je suis un peu confus par la différence entre Glissement et de Tumbling Windows. Jusqu'à présent je n'ai entendu que de tumbling windows peut être basée sur le temps et a fixe (début,fin)-points qui "tombe" lorsque cette fenêtre expire. E. g. Un temps de base de la fenêtre peut être de 1 minute. Donc, pour chaque minute de la fenêtre tombe à traiter les agrégations pour un ensemble de données.
C'est-fenêtres coulissantes qui s'embrouille moi. Est-fenêtres coulissantes comme count base telle qu'une fenêtre tombe quand x-nombre de tuples ont est entrée par la fenêtre. Ou est-ce que le x-récente tuples qui est entrée par la fenêtre sera de la partie de la fenêtre, et que les plus âgés de tuples seront expulsées de la fenêtre. I. e. une fenêtre qui est continuellement mise à jour de nouveaux tuples arrive?
OriginalL'auteur gronnbeck | 2012-09-26
Vous devez vous connecter pour publier un commentaire.
Ci-dessous est une représentation graphique montrant les différents types de Data Stream Mla direction Système (DSMS) fenêtre - tumbling, en sautillant, le calendrier politique de glissement, et l'expulsion de la politique(le comte), coulissant. J'ai utilisé l'exemple ci-dessus pour créer l'image (faire des hypothèses).
OriginalL'auteur vicport
Tumbling windows (TW)
Tous les tuples dans la fenêtre expire en même temps.
Fenêtres coulissantes (SW)
Seuls certains tuples expire à un moment donné
Exemple
Si vous avez une fenêtre contenant les entiers suivants entré (Notation entier (secondes depuis entré)), et disons que le TW a été créé 60 s il y a, et le délai pour windows est des années 60.
Dire que 20 secondes passes et puis la suite des entiers entre la fenêtre.
Maintenant, le TW aura expiré et ne contiendra que les valeurs ci-dessus. Alors que la SW va contenir les valeurs suivantes
OriginalL'auteur gronnbeck
Pensons le fenêtrage fonctions traditionnelles GROUPE PAR opération qui fonctionne sur la base des données d'entrée, s'applique une fonction d'agrégation et renvoie le résultat.
La différence essentielle entre une Tumbling Fenêtre (TW) de fonctionnement et d'un Fenêtre Coulissante (SW) consiste à l'intersection de l'ensemble des points de données, qui est vide dans le premier cas et probablement non-vide dans le dernier cas.
Un très bon la lecture à partir de Microsoft Azure Stream Analytics qui fait la différence avec des illustrations.
X = 1
etY = 10
puis à chaque seconde de la fonction de fenêtrage est à la recherche de retour à dix secondes de jeter systématiquement les données les plus anciennes.Regardons un exemple concret pour la série de temps suivante:
Considérant
SUM
comme fonction d'agrégation et de la banalité de la stratégie de SW qui est le en Espérant Fenêtre (HW):t0
SW = TW = 0
;t10
SW = TW = 24
;t11
il n'y a pas de TW maisSW = 23
et l'intersection entre les fenêtres successives est7 4 3 1 1 3
;t11
il n'y a pas de TW maisSW = 21
et l'intersection entre les fenêtres successives est4 3 1 1 3 4
;t20
TW = SW = 48
;t21
il n'y a pas de TW maisSW = 44
et l'intersection entre les fenêtres successives est5 8 1 2 3 3 3 5 7 7
t30
TW = SW = 0
;t31
il n'y a pas de TW maisSW = 3
et l'intersection entre les fenêtres successives est vide, aucun événement n'est survenu dans[t20, t30]
.Un autre bonne lecture par SoftwareMill CTO Adam Warski qui illustre, en utilisant les technologies de diffusion en continu, comme une Étincelle, Flink, Akka et Kafka.
OriginalL'auteur Paolo Maresca