Traçage de Densité de Probabilité / Fonction de Masse de données, dans la R
J'ai données et je veux l'analyse de ces données par la fonction de densité de probabilité ou de la masse de probabilité de la fonction de R ,j'ai utilisé une fonction de densité, mais il n'a pas donné de moi une probabilité.
mes données comme ceci:
"step","Time","energy"
1, 22469 , 392.96E-03
2, 22547 , 394.82E-03
3, 22828,400.72E-03
4, 21765, 383.51E-03
5, 21516, 379.85E-03
6, 21453, 379.89E-03
7, 22156, 387.47E-03
8, 21844, 384.09E-03
9 , 21250, 376.14E-03
10, 21703, 380.83E-03
Je veux obtenir PDF/CMR de vecteur d'énergie ,les données que nous prenons en compte sont discrets par nature, donc je n'ai pas de type particulier pour la distribution des données.
- Il "fonction de densité de probabilité" ne serait qu'une probabilité de données discrètes qui n'est pas ce que les fonctions de densité suppose.
- Donc, vous voulez empiriques CDF?
Vous devez vous connecter pour publier un commentaire.
Vos données semblent loin d'être discret pour moi. Attend une probabilité lorsque l'on travaille avec des données en continu est simplement faux.
density()
vous donne un empirique de la fonction de densité, qui se rapproche de la véritable fonction de densité. Pour le prouver, c'est une bonne densité, nous calculons l'aire sous la courbe :Compte tenu de certaines erreurs d'arrondi. l'aire sous la courbe résume à un seul, et donc le résultat de
density()
répond aux exigences d'un document PDF.Utiliser le
probability=TRUE
option dehist
ou la fonctiondensity()
(ou les deux)par exemple :
donne
Si vous avez vraiment besoin d'une probabilité pour une variable discrète, vous utilisez:
Edit : illustration pourquoi les naïfs
count(x)/sum(count(x))
n'est pas une solution. En effet, ce n'est pas parce que les valeurs de bacs somme, que l'aire sous la courbe est. Pour cela, vous devez multiplier la largeur de la "bins". Prendre de la distribution normale, pour laquelle on peut calculer le PDF à l'aidednorm()
. Constructions de code suivant une distribution normale, calcule la densité, et la compare avec la solution naïve :Donne :
La fonction de distribution cumulée
En cas @Itérateur est vrai qu'il est plutôt facile de construire la fonction de distribution cumulée de la densité. Le CDF est l'intégrale de la PDF. Dans le cas des valeurs discrètes, qui est simplement la somme des probabilités. Pour la continuité des valeurs, on peut utiliser le fait que les intervalles pour l'estimation de la densité empirique sont égaux, et calculer :
Donne :
type="s"
est, je pense, d'une manière plus intuitive pour le montrer à un empirique cdf (et non à partir d'une estimation de densité), car il donne un sentiment d'échantillonnage sur l'intervalle indiqué.