a = c(1,2,3,4,5),
b = c(1,2,3,4,5),
c = c(1,2,3,4,5),
.name_repair = "minimal"
) %>%
filter(
a != b &
a != c &
b != c
)
нужно отсеять дубликаты, но хитрые, такие что (имеется в виду строка) вектор 1,2,3 = 3,2,1 = 1,3,2 = 3,1,2, т.е. мне нужно что бы осталась какая-то одна комбинация
как бы покрасивее это сделать?
предложу такой вариант df <- tidyr::crossing( a = c(1,2,3,4,5), b = c(1,2,3,4,5), c = c(1,2,3,4,5), .name_repair = "minimal" ) %>% filter( a != b & a != c & b != c ) out <- apply(df, 1, function(x) paste0(sort(x), collapse = "")) df[!duplicated(out), ] # A tibble: 10 x 3 a b c <dbl> <dbl> <dbl> 1 1 2 3 2 1 2 4 3 1 2 5 4 1 3 4 5 1 3 5 6 1 4 5 7 2 3 4 8 2 3 5 9 2 4 5 10 3 4 5
expand.grid уже не соответствует канонам православной tidy-веры?
конечно! он же не выдают tibble :)
Это лишь пара примеров на SO (в гугле есть ещё). https://stackoverflow.com/questions/17171148/non-redundant-version-of-expand-grid https://stackoverflow.com/questions/23945166/how-to-get-only-unique-combinations-of-variables-where-entries-can-be-in-either
да вопрос не в этом был
спасибо, попробую
да нет никакой веры, просто crossing созвучно с соотв. sql операциями, вот поиск когда то и выдал этот вариант )
Да понятно, что не в этом. Это просто моё старческое брюзжание на тему tidyverse-гм, когда учат tidy без base.
Обсуждают сегодня