Ich verwende mtcars-Dataset, um meine Frage zu veranschaulichen.
Zum Beispiel möchte ich Daten in 4-Zyl-Autos unterteilen.
mtcars %>% filter(cyl == 4)
In meiner Arbeit muss ich eine String-Variable als Spaltennamen übergeben. Zum Beispiel:
var <- 'cyl'
mtcars %>% filter(var == 4)
Ich habe auch gemacht:
mtcars %>% filter(!!var == 4)
In beiden Fällen bekam ich einen leeren Datenrahmen.
!!
oder UQ
wertet die Variable aus, sodass mtcars %>% filter(!!var == 4)
dasselbe ist wie mtcars %>% filter('cyl' == 4)
, wobei die Bedingung immer als false ausgewertet wird. Sie können das beweisen, indem Sie !!var
in der Filterfunktion drucken:
mtcars %>% filter({ print(!!var); (!!var) == 4 })
# [1] "cyl"
# [1] mpg cyl disp hp drat wt qsec vs am gear carb
# <0 rows> (or 0-length row.names)
Um var
in die cyl
-Spalte auszuwerten, müssen Sie zuerst var
in ein Symbol von cyl
konvertieren und dann das Symbol cyl
in eine Spalte auswerten:
rlang
verwenden:
library(rlang)
var <- 'cyl'
mtcars %>% filter((!!sym(var)) == 4)
# mpg cyl disp hp drat wt qsec vs am gear carb
#1 22.8 4 108.0 93 3.85 2.320 18.61 1 1 4 1
#2 24.4 4 146.7 62 3.69 3.190 20.00 1 0 4 2
#3 22.8 4 140.8 95 3.92 3.150 22.90 1 0 4 2
# ...
Oder benutze as.symbol/as.name
von baseR:
mtcars %>% filter((!!as.symbol(var)) == 4)
mtcars %>% filter((!!as.name(var)) == 4)
Ich denke, @ Snorams Antwort ist elegant und hängt ausschließlich von dplyr
ab.
var <- c('cyl')
mtcars %>% filter(get(var) == 4)
Sie können dies auch mit einer Liste verwenden. Für ein einfaches Beispiel können Sie die Anzahl jeder gefilterten Spalte als neue Datenmenge ermitteln.
#adding car name
mtcars <- rownames_to_column(mtcars, "car_name")
#name your vectors
vector <- c("vs","am","carb")
df2 <- data.frame()
for (variable in vector) {
df1 <- mtcars %>% filter(get(variable) == 1) %>% summarise(variable = n_distinct(car_name)) %>% data.frame()
df2<- rbind(df2,df1)
}