Comment écrire une fonction lambda qui dépend de deux variables (colonnes) en python

J'ai un ensemble de données, df, avec deux variables, x et y. Je veux écrire une fonction qui effectue les opérations suivantes:

x si x>100 et y<50 d'autre y

Je suis habituée à faire de l'analyse de données dans STATA, donc je suis relativement nouveau pour les pandas pour l'analyse des données. Si cela peut aider, dans stata, il devrait ressembler à:

remplacer x = cond(x>100 & y<50, x, y)

En d'autres termes, la fonction est subordonnée à deux colonnes dans le df et renvoie la valeur d'une variable ou de l'autre de chaque ligne selon que la condition est remplie.

Jusqu'à présent j'ai été la création de nouvelles variables par le biais de nouvelles fonctions comme:

df.dummyVar = df.x.appliquer(lambda x: 1 si x>100, 0 sinon)

À l'aide de StackOverflow et de la documentation, j'ai seulement été en mesure de trouver comment appliquer une fonction dépendant d'une seule variable à plus d'une colonne (à l'aide de l'option d'axe). S'il vous plaît aider.

InformationsquelleAutor seeiespi | 2014-07-16

12

Utilisation where:
```
df['dummyVar '] = df['x'].where((df['x'] > 100) & (df['y'] < 50), df['y'])
```
Ce sera beaucoup plus rapide que l'exécution d'une opération d'application comme il est vectorisée.
- C'est exactement ce dont j'avais besoin. Et c'est génial parce que je peux déjà voir comment je peux l'étendre à des conditions sur les 3 variables ou plus. Merci!!!!
- vous êtes les bienvenus, vous pouvez accepter cette réponse, il y aura une coche en dessous des boutons de vote. À l'aide d'appliquer et d'itération doit toujours être le dernier choix, si possible, trouver une méthode qui fonctionne sur l'ensemble du dataframe
InformationsquelleAutor EdChum - Reinstate Monica
6

Comme ceci:
```
f = lambda x, y: x if x>100 and y<50 else y
```
Lambda(s) en Python sont équivalentes à une définition de fonction normale.
```
def f(x, y):
    return x if x>100 and y<50 else y
```
NB: Le corps d'un Lambda doit être une expression valide. Cela signifie que vous ne pouvez pas utiliser des choses comme: return par exemple; un Lambda sera de retour de la dernière expression évaluée.

Pour la bonne lecture, voir:
- La Définition Des Fonctions
- Les Lambdas
- En fait, j'avais écrit une fonction comme ça, mais a été incapable de mettre en œuvre, de sorte qu'il serait courir à travers chaque ligne sans boucle. La réponse fournie par EdChum est exactement ce que fait. Si vous connaissez un moyen pour accomplir qu'à l'aide de cette fonction définie par l', je suis sûr que je pourrais l'utiliser dans l'avenir. Merci pour les commentaires 🙂
- Vous initialement demandé "Comment créer une fonction lambda qui prend deux arguments?" -- C'est comment 🙂 -- EdChum vous a fourni une réponse qui est plus en adéquation avec ce que vous êtes intentions sont/étaient avec votre dataset(s) et les pandas.
InformationsquelleAutor James Mills
0

Il y a maintenant une manière assez facile à faire. Utilisez simplement l'appliquer sur l'ensemble de données:
```
df['dummy'] = df.apply(lambda row: row['x'] if row['x'] > 100 and row['y'] < 50 else row['y'])
```
InformationsquelleAutor seeiespi

Vous devez vous connecter pour publier un commentaire.