Que signifie l'entier lors de la définition de la graine?
Je veux sélectionner de manière aléatoire à n lignes à partir de mon jeu de données à l'aide de la sample()
fonction dans R. J'ai été faire les différentes sorties à chaque fois et donc utilisé set.seed()
fonction permettant d'obtenir le même résultat. Je sais que chaque entier dans le set.seed()
me donnera un unique sortie et la sortie sera la même si elle est définie de la même graine. Mais je ne suis pas en mesure de faire ce que l'entier passé en paramètre à la set.seed()
fonction des moyens. Est-il juste un indice qui va dans le générateur aléatoire de l'algorithme ou une partie des données à partir de l'endroit où vous commencez l'échantillonnage? Par exemple, ce qui ne l' 2
dans set.seed(2)
veux dire?
source d'informationauteur Prateek Kulkarni
Vous devez vous connecter pour publier un commentaire.
-- wikipedia
Donc, la fonction de lecture aléatoire peut être mis en œuvre comme ceci:
(échantillon prélevé à partir de la glibc)
Dans les vieux jours, il y avait des livres qui contenaient des pages et des pages de chiffres aléatoires (dans un ordre aléatoire, bien sûr).
J'aime à penser que
set.seed(x)
que de raconter l'ordinateur pour lancer la lecture de nombres aléatoires à partir de la pagex
dans un énorme livre de nombres aléatoires.x
n'a rien à voir avec les données, mais comment l'algorithme permettant de choisir des nombres aléatoires devraient commencer.Cela peut être un peu facile, mais j'aime bien l'analogie.
C'est juste un numéro utilisé pour définir les graines pour le générateur de nombre aléatoire. Il n'a rien à faire avec vos données. Si vous n'avez pas explicitement de fournir une graine, un nouveau est créé à partir de l'heure actuelle.
Voir le
?set.seed
page d'aide pour beaucoup de détails à ce sujet.