La compréhension max_features paramètre dans RandomForestRegressor

Lors de la construction de chaque arbre dans la forêt aléatoire à l'aide de bootstrap échantillons, pour chaque nœud terminal, nous sélectionnons les m variables aléatoires à partir de p variables pour trouver la meilleure split (p est le nombre total de fonctions de vos données). Mes questions (pour RandomForestRegressor) sont:

1) Qu'est-max_features correspondent à (m ou p ou autre chose)?

2) Sont des m variables sélectionnées au hasard à partir de max_features variables (quelle est la valeur de m)?

3) Si max_features correspond à m, alors pourquoi voudrais-je définissez égal à p pour la régression (par défaut)? Où est le caractère aléatoire avec ce paramètre (c'est à dire, comment est-il différent d'ensachage)?

Grâce.

InformationsquelleAutor csankar69 | 2014-05-29