Non-standard de l'évaluation (NSE) dans dplyr de filter_ & extraction de données de MySQL

Je voudrais tirer quelques données d'un serveur sql avec un filtre dynamique. Je suis l'aide de la grande package R dplyr de la manière suivante:

#Create the filter
filter_criteria = ~ column1 %in% some_vector
#Connect to the database
connection <- src_mysql(dbname <- "mydbname", 
             user <- "myusername", 
             password <- "mypwd", 
             host <- "myhost") 
#Get data
data <- connection %>%
 tbl("mytable") %>% #Specify which table
 filter_(.dots = filter_criteria) %>% #non standard evaluation filter
 collect() #Pull data

Ce bout de code fonctionne très bien, mais maintenant, je voudrais boucle en quelque sorte sur toutes les colonnes de ma table, donc je voudrais écrire le filtre:

#Dynamic filter
i <- 2 #With a loop on this i for instance
which_column <- paste0("column",i)
filter_criteria <- ~ which_column %in% some_vector

Et réappliquez le premier code avec le filtre de mise à jour.

Malheureusement, cette approche ne donne pas les résultats escomptés. En fait, il ne donne pas d'erreur mais n'a pas encore tirer aucun résultat dans R.
En particulier, j'ai regardé un peu dans la requête SQL générée par les deux morceaux de code et il y a une différence importante.

Tandis que le premier, le travail, le code génère une requête de la forme:

SELECT ... FROM ... WHERE 
`column1` IN ....

("signe dans la colonne nom), le second génère une requête de la forme:

SELECT ... FROM ... WHERE 
'column1' IN ....

("signe dans la colonne nom)

Quelqu'un a une suggestion sur la manière de formuler les conditions de filtrage pour le faire fonctionner?

InformationsquelleAutor Lorenzo Rossi | 2014-10-21

43

Ce n'est pas vraiment lié à SQL. Cet exemple ne fonctionne pas non plus:
```
df <- data.frame(
     v1 = sample(5, 10, replace = TRUE),
     v2 = sample(5,10, replace = TRUE)
)
df %>% filter_(~ "v1" == 1)
```
Il ne fonctionne pas parce que vous avez besoin pour passer à filter_ l'expression ~ v1 == 1 — pas l'expression ~ "v1" == 1.

Pour résoudre le problème, il suffit d'utiliser la citation de l'opérateur quo et la dequoting opérateur !!
```
library(dplyr)
which_column = quot(v1)
df %>% filter(!!which_column == 1)
```
- Hey Matthieu, merci beaucoup pour votre réponse. La première méthode proposée a résolu mon problème, merci!!!!! J'ai lu le nse vignette et s'est très proche de cette solution moi-même, mais j'ai oublié le comme.nom de/que.symbole d'appel. La deuxième méthode que vous proposez n'est pas possible dans le code que j'ai écris car il n'est pas dataframe en R encore, le filtre doit agir comme OÙ clasue dans la requête sql générée, puis extraire les données. C'est la raison pour laquelle j'ai inclus les mentions de SQL dans le titre et dans le texte de la question. Merci encore pour votre réponse!
- Content que ça a aidé!
- Pourriez-vous expliquer ce qui peut être fait si 1 est aussi encore une autre variable? quelque chose comme filter_criteria <- interp(~ which_column == val123, which_column = comme.nom("v1"), val123=???) Ici val123 est un entier
- filter_criteria <- interp(~ var1 == var2, var1 = comme.nom("v1"), var2 = comme.nom("v2"))
InformationsquelleAutor Matthew
8

Une solution alternative, avec dplyr version 0.5.0 (probablement mis en œuvre plus tôt), il est possible de passer d'un composé de la chaîne de la .points argument, que je trouve plus lisible que la lazyeval::interp solution:
```
df <- data.frame(
     v1 = sample(5, 10, replace = TRUE),
     v2 = sample(5,10, replace = TRUE)
)

which_col <- "v1"
which_val <- 1
df %>% filter_(.dots= paste0(which_col, "== ", which_val))

  v1 v2
1  1  1
2  1  2
3  1  4
```
Mise à JOUR pour dplyr 0,6 et plus tard:
```
packageVersion("dplyr")
# [1] ‘0.5.0.9004’

df %>% filter(UQ(rlang::sym(which_col))==which_val)
#OR
df %>% filter((!!rlang::sym(which_col))==which_val)
```
(Similaire à @Matthieu 's réponse pour dplyr 0.6, mais je suppose que which_col est une variable de chaîne.)

2e mise à JOUR: Edwin Thoen créé une belle triche pour ranger évaluation: https://edwinth.github.io/blog/dplyr-recipes/

InformationsquelleAutor LmW.
5

Ici est un peu moins verbeux solution et un qui utilise le comportement typique de l'extrait de fonction, '[' en sélectionnant une colonne par la valeur du caractère plutôt que de le convertir en un élément de langage:
```
df %>% filter(., '['(., which_column)==1 )

set.seed(123)
df <- data.frame(
      v1 = sample(5, 10, replace = TRUE),
      v2 = sample(5,10, replace = TRUE)
 )
which_column <- "v1"
df %>% filter(., '['(., which_column)==1)
#  v1 v2
#1  1  5
```
- cela fonctionne aussi: filter(df, '['(df, which_column) == 1)
InformationsquelleAutor 42-

Vous devez vous connecter pour publier un commentaire.