Décider de seuil pour glm modèle de régression logistique dans la R

J'ai des données avec les prédicteurs et un binaire cible. Par exemple:

df <- data.frame(a=sort(sample(1:100,30)), b= sort(sample(1:100,30)), 
                 target=c(rep(0,11),rep(1,4),rep(0,4),rep(1,11)))

J'ai formé une logistique regresion modèle à l'aide de glm()

model1 <- glm(formula= target ~ a + b, data=df, family=binomial)

Maintenant, je vais essayer de prédire la sortie (pour l'exemple, les mêmes données devrait suffire)

predict(model1, newdata=df, type="response")

Cela génère un vecteur de probabilité des nombres. Mais je tiens à prédire la classe réelle. Je pourrais utiliser round() sur la probabilite de chiffres, mais cela suppose que quelque chose en dessous de 0,5, de la catégorie '0', et rien au-dessus de la catégorie '1'. Est-ce correct? Même lorsque la population de chaque classe ne peut pas être égal à (ou près de l'égalité)? Ou est-il un moyen d'estimation de ce seuil?

il y a des critères différents, l'un, par exemple, est le point où la somme de sensibilité et de spécificité est maximale, voir par exemple cette question: stackoverflow.com/questions/23131897/...
Merci! Mais il serait certainement incorrect d'utiliser le seuil de la fraction de la population, à droite? C'est, si dans la population, 30% des cas sont '0', et 70% '1, un naïf estimation serait d'utiliser 0,3 comme le seuil. Mais ce ne serait pas logique dans la façon d'aborder cette question?
Vous pouvez trouver un bon tutoriel sur le sujet ici: hopstat.wordpress.com/2014/12/19/...

OriginalL'auteur user2175594 | 2014-04-23