confus au sujet de random_state dans l'arbre de décision de scikit learn

Confus au sujet de random_state paramètre, ne sais pas pourquoi d'arbre de décision, les besoins de formation du hasard. Mes pensées, (1) est-il lié à la forêt au hasard? (2) est-il lié à la scission de formation jeu de données de test? Si oui, pourquoi ne pas utiliser la formation d'essais méthode de fractionnement directement (http://scikit-learn.org/stable/modules/generated/sklearn.cross_validation.train_test_split.html)?

http://scikit-learn.org/stable/modules/generated/sklearn.tree.DecisionTreeClassifier.html

>>> from sklearn.datasets import load_iris
>>> from sklearn.cross_validation import cross_val_score
>>> from sklearn.tree import DecisionTreeClassifier
>>> clf = DecisionTreeClassifier(random_state=0)
>>> iris = load_iris()
>>> cross_val_score(clf, iris.data, iris.target, cv=10)
...                             
...
array([ 1.     ,  0.93...,  0.86...,  0.93...,  0.93...,
        0.93...,  0.93...,  1.     ,  0.93...,  1.      ])

ce qui concerne,
Lin

Cette question appartient à stats.stackexchange.com
Merci @Merlin, pourquoi? 🙂
DONC, est de la programmation, de regarder de Près. raisons pour Hors-sujet..

OriginalL'auteur Lin Ma | 2016-08-26