Comment createDataPartition fonction de signe de découpage de paquet de données?

À partir de la documentation:

Pour des échantillons bootstrap, l'échantillonnage aléatoire simple est utilisé.

Pour les autres données de la scission, de l'échantillonnage aléatoire est effectué dans les niveaux de y
lorsque y est un facteur de tenter d'équilibrer la répartition par classe dans les
le grand écart.

Numérique (y, l'échantillon est divisé en groupes de sections basées sur les percentiles
et de l'échantillonnage est effectué à l'intérieur de ces sous-groupes.

Pour createDataPartition, le nombre de percentiles est définie par les groupes
argument.

Je ne comprends pas pourquoi cet "équilibre" chose est nécessaire. Je crois que je comprends il superficiellement, mais toute autre perspective serait vraiment utile.

OriginalL'auteur Sashank Aryal | 2016-11-20