L'obtention de Densité de Probabilité des Données

J'ai besoin d'analyser des données sur internet pour des séances d'une Ligne DSL. Je voulais avoir un coup d'oeil à la façon dont les durées de séances sont distribués. J'ai pensé à une façon simple de le faire serait de commencer par une densité de probabilité de la parcelle de la durée de toutes les sessions.

J'ai chargé les données dans R et a utilisé le density() fonction. Donc, c'était quelque chose comme ce

plot(density(data$duration), type = "l", col = "blue", main = "Density Plot of Duration",
     xlab = "duration(h)", ylab = "probability density")

Je suis nouveau sur R et ce type d'analyse. C'est ce que j'ai trouvé de en passant par google. J'ai eu un complot, mais j'ai été laissé avec quelques questions. Est-ce la bonne fonction pour faire ce que je suis en train de faire, ou est-il autre chose?

Dans l'intrigue, j'ai trouvé que l'axe des Y de l'échelle est de 0...1.5. Je ne comprends pas comment il peut être de 1,5, ne devrait-elle pas être de 0...1?

Aussi, je voudrais obtenir une courbe plus lisse. Depuis, l'ensemble de données est vraiment les grandes lignes sont vraiment en dents de scie. Il serait plus agréable de les avoir lissé quand je suis présente. Comment pourrais-je aller sur le faire?

Vous misinterprete densité. La densité de X peut être considérée comme une valeur proportionnel à la la chance de dessin de la population, un nombre qui est couché dans la proximité immédiate de X. Maintenant, par définition, l'intégrale de la fonction de densité est égale à 1. Cela ne signifie pas que la valeur maximale de la fonction de densité de 1, il peut facilement être plus grand. En fait, pour une distribution F avec df= (1,1) , la valeur maximale de la densité (à 0) est de même de l'infini.
oui je me rends compte maintenant que je n'ai pas l'interpréter correctement. plutôt simpliste, je suppose que depuis sa une distribution de probabilités, il serait inférieur à 1 :).
lorsque la surface Totale sous la courbe est de 1, comment peut-PDF-être plus grand que 1? Si le fichier PDF est d'aller au-delà de 1, est est probable que la distribution n'est pas normale et qu'elle doit être normalisées?
parce que par exemple, un rectangle avec une hauteur de 10 et une largeur de 0,01 a une superficie de 0,1 tandis que la valeur de Y (d'où le PDF) serait de 10. Pour la zone que vous avez besoin pour prendre les deux axes X et Y en compte, non seulement de l'axe des Y.

OriginalL'auteur sfactor | 2010-11-18