L'écart type d'une liste

Je veux trouver la moyenne et l'écart type de 1ère, 2ème,... les chiffres de plusieurs (Z) listes. Par exemple, j'ai

A_rank=[0.8,0.4,1.2,3.7,2.6,5.8]
B_rank=[0.1,2.8,3.7,2.6,5,3.4]
C_Rank=[1.2,3.4,0.5,0.1,2.5,6.1]
# etc (up to Z_rank )...

Maintenant je veux profiter de la moyenne et de la mst de *_Rank[0], la moyenne et la mst de *_Rank[1], etc.

(c'est à dire: la moyenne et de la mst de le 1er chiffre de tous les (A..Z)_rank listes;

la moyenne et de la mst de la 2ème chiffre de tous les (A..Z)_rank listes;

la moyenne et de la mst de la 3e chiffre...; etc).

Bonjour, virale. Un Débordement de pile qui fonctionne le mieux en tant que questionetréponse site. Vous posez une question, et tout le monde apporte des réponses. Votre post ne contient que des déclarations, pas de questions. Avez-vous une programmation spécifique à la question? Pour le dire d'une autre façon, ce que vous avez essayé jusqu'à présent, et où êtes-vous pris?
Pourquoi ne sont pas ces listes dans un dictionnaire ou quelque chose?
Désolé Si je ne donne pas question correctement. Je veux profiter de la moyenne de A_rank[0] (0.8),B_rank[0](0.1),C_rank[0](1.2),...Z_rank[0]. de même pour A_rank[1](0.4),B_rank[1](2.8),C_rank[1](3.4),...Z_rank[1].

InformationsquelleAutor physics_for_all | 2013-03-13

113

Depuis Python 3.4 /PEP450 il y a un module de statistiques dans la bibliothèque standard, qui a un la méthode ecartype pour le calcul de l'écart-type de iterables comme la vôtre:
```
>>> A_rank = [0.8, 0.4, 1.2, 3.7, 2.6, 5.8]
>>> import statistics
>>> statistics.stdev(A_rank)
2.0634114147853952
```
- Il est intéressant de souligner que pstddev devrait probablement être utilisé à la place si votre liste représente l'ensemble de la population (c'est à dire la liste n'est pas un échantillon d'une population). stddev est calculée à l'aide de variance de l'échantillon et surestime la moyenne de population.
- Les fonctions sont appelés stdev et pstdev, ne pas utiliser std pour standard que l'on pourrait attendre. Je ne pouvais pas éditer le post que des modifications besoin de modifier au moins 6 caractères...
InformationsquelleAutor Bengt
93

Je mettrais A_Rank et al en 2D NumPy tableau, et ensuite utiliser numpy.moyenne() et numpy.std() pour calculer les moyens et les écarts-type:
```
In [17]: import numpy

In [18]: arr = numpy.array([A_rank, B_rank, C_rank])

In [20]: numpy.mean(arr, axis=0)
Out[20]: 
array([ 0.7       ,  2.2       ,  1.8       ,  2.13333333,  3.36666667,
        5.1       ])

In [21]: numpy.std(arr, axis=0)
Out[21]: 
array([ 0.45460606,  1.29614814,  1.37355985,  1.50628314,  1.15566239,
        1.2083046 ])
```
- le résultat de numpy.std n'est pas correct. Compte tenu de ces valeurs: 20,31,50,69,80 et le mettre dans Excel à l'aide de la fonction ECARTYPE.S(A1:A5), le résultat est 25,109 PAS 22,45.
- C'est correct: numpy.std(arr, ddof=1)
- Il n'a rien à voir avec la justesse. Si oui ou non ddof=0 (par défaut, interpréter les données de la population) ou ddof=1 (interpréter comme des échantillons, c'est à dire l'estimation de la vraie variance) dépend de ce que vous faites.
- Pour clarifier davantage @runDOSrun point, la fonction Excel STDEV.P() et la fonction Numpy std(ddof=0) calculer le population sd, ou non corrigée de l'échantillon sd, tandis que la fonction Excel STDEV.S() et Numpy fonction std(ddof=1) calculer le (corrigé) de l'échantillon sd, ce qui équivaut à sqrt(N/(N-1)) fois la population sd, où N est le nombre de points. En savoir plus: en.m.wikipedia.org/wiki/...
InformationsquelleAutor NPE

Voici quelques pur-code Python que vous pouvez utiliser pour calculer la moyenne et l'écart-type.

Tout le code ci-dessous est basé sur le statistiques module en Python 3.4+.

def mean(data):
    """Return the sample arithmetic mean of data."""
    n = len(data)
    if n < 1:
        raise ValueError('mean requires at least one data point')
    return sum(data)/n # in Python 2 use sum(data)/float(n)

def _ss(data):
    """Return sum of square deviations of sequence data."""
    c = mean(data)
    ss = sum((x-c)**2 for x in data)
    return ss

def stddev(data, ddof=0):
    """Calculates the population standard deviation
    by default; specify ddof=1 to compute the sample
    standard deviation."""
    n = len(data)
    if n < 2:
        raise ValueError('variance requires at least two data points')
    ss = _ss(data)
    pvar = ss/(n-ddof)
    return pvar**0.5

Remarque: pour améliorer la précision lors du calcul des flotteurs, le statistics module utilise une fonction personnalisée _sum plutôt que dans le haut- sum que j'ai utilisé à sa place.

Maintenant, nous avons par exemple:

>>> mean([1, 2, 3])
2.0
>>> stddev([1, 2, 3]) # population standard deviation
0.816496580927726
>>> stddev([1, 2, 3], ddof=1) # sample standard deviation
0.1

Ne devrait-elle pas être pvar=ss/(n-1) ?
si vous souhaitez calculer le exemple de la variance (ou l'échantillon SD), vous pouvez utiliser n-1. Le code ci-dessus est pour la population SD (il y a donc n degrés de liberté).
Bonjour Alex, Pourriez-vous s'il vous plaît poster fonction pour le calcul de l'écart-type d'échantillon? Je suis limité avec Python2.6, donc je relais sur cette fonction.
Bonjour, j'ai édité le stddev fonction de sorte qu'il est possible de calculer à la fois de l'échantillon et de la population écarts-types.

InformationsquelleAutor Alex Riley

21

En Python 2.7.1, vous pouvez calculer l'écart type à l'aide de numpy.std() pour:
- Population std: il suffit d'utiliser numpy.std() avec aucun des arguments supplémentaires en plus de votre liste de données.
- Échantillon std: Vous devez passer ddof (c'est à dire Delta Degrés de Liberté) à 1, comme dans l'exemple suivant:
numpy.std(< de votre liste >, ddof=1)

Le diviseur utilisé dans les calculs est N - ddof, où N représente le nombre d'éléments. Par défaut ddof est zéro.

Il calcule échantillon std plutôt que de la population std.

InformationsquelleAutor Ome
9

En python 2.7 vous pouvez utiliser NumPy est numpy.std() donne la écart-type de population.

En Python 3.4 statistiques.ecartype() renvoie l'écart-type d'échantillon. Le pstdv() fonction est la même que numpy.std().

InformationsquelleAutor B.Kocis

pur code python:

from math import sqrt

def stddev(lst):
    mean = float(sum(lst)) / len(lst)
    return sqrt(float(reduce(lambda x, y: x + y, map(lambda x: (x - mean) ** 2, lst))) / len(lst))

Il n'y a rien "pure" à ce sujet 1-liner. Beurk. Voici plus pythonic version: sqrt(sum((x - mean)**2 for x in lst) / len(lst))

InformationsquelleAutor Elad Yehezkel

3

Autres réponses couvrir comment le faire std dev python suffisamment, mais personne n'explique comment faire de l'insolite traversée que vous avez décrit.

Je vais supposer A-Z est l'ensemble de la population. Si pas voir Ome's réponse sur la façon de l'inférence à partir d'un échantillon.

Afin d'obtenir l'écart-type/moyenne du premier chiffre de chaque liste, vous aurait besoin de quelque chose comme ceci:
```
#standard deviation
numpy.std([A_rank[0], B_rank[0], C_rank[0], ..., Z_rank[0]])

#mean
numpy.mean([A_rank[0], B_rank[0], C_rank[0], ..., Z_rank[0]])
```
Pour raccourcir le code et la généraliser à tout le nième chiffre d'utiliser la fonction suivante, j'ai généré pour vous:
```
def getAllNthRanks(n):
    return [A_rank[n], B_rank[n], C_rank[n], D_rank[n], E_rank[n], F_rank[n], G_rank[n], H_rank[n], I_rank[n], J_rank[n], K_rank[n], L_rank[n], M_rank[n], N_rank[n], O_rank[n], P_rank[n], Q_rank[n], R_rank[n], S_rank[n], T_rank[n], U_rank[n], V_rank[n], W_rank[n], X_rank[n], Y_rank[n], Z_rank[n]] 
```
Maintenant, vous pouvez simplement obtenir le stdd et la moyenne de tous les n-ième lieux de A à Z comme ceci:
```
#standard deviation
numpy.std(getAllNthRanks(n))

#mean
numpy.mean(getAllNthRanks(n))
```
- Pour toute personne intéressée, j'ai généré la fonction à l'aide de ce désordre one-liner: str([chr(x)+'_rank[n]' for x in range(65,65+26)]).replace("'", "")
InformationsquelleAutor Samy Bencherif
3

À l'aide de python, voici quelques méthodes:
```
import statistics as st

n = int(input())
data = list(map(int, input().split()))
```
Approach1 - à l'aide d'une fonction
```
stdev = st.pstdev(data)
```
De bookshare 2: calculer la variance et de prendre la racine carrée de
```
variance = st.pvariance(data)
devia = math.sqrt(variance)
```
Approach3: à l'aide de notions de mathématiques de base
```
mean = sum(data)/n
variance = sum([((x - mean) ** 2) for x in X]) / n
stddev = variance ** 0.5

print("{0:0.1f}".format(stddev))
```
Remarque:
- variance calcule la variance de l'échantillon de la population
- pvariance calcule la variance de l'ensemble de la population
- des différences similaires entre stdev et pstdev
InformationsquelleAutor pankaj

Vous devez vous connecter pour publier un commentaire.

Approach1 - à l'aide d'une fonction

De bookshare 2: calculer la variance et de prendre la racine carrée de

Approach3: à l'aide de notions de mathématiques de base

Remarque: