неожиданным для меня образом?
dt <- data.table(a=rep(1:3,7), b=rep(1:7,3), c= rep(c('a', 'b','c'), 10))
dt[,ind:=a>=b]
вот это выдает неожиданный результат
dt[,.(iii=sum(a>=b)), by=.(a, b, c)]
а вот это-то, что я хотел: сколько раз в каждой группе выполняется условие соотношение элементов в данной группе
dt[,.(iii=sum(ind)), by=.(a, b, c)]
Мне казалось, что первое- это вариант второго, без промежуточной переменной. но нет.
dt[, .SD[a>=b, .N], by = .(a, b, c)]
смотрите, что получается > dt[a == 1 & b == 1 & c == 'a'] a b c ind 1: 1 1 a TRUE 2: 1 1 a TRUE > dt[a == 1 & b == 1 & c == 'a', sum(a >= b), by = .(a, b, c)] a b c V1 1: 1 1 a 1 > dt[a == 1 & b == 1 & c == 'a', sum(ind), by = .(a, b, c)] a b c V1 1: 1 1 a 2 на сочетание групп у нас две строки. во втором случае мы получаем сумму c(TRUE, TRUE) а в первом - судя по всему происходит сумма двух логических утверждений, sum(TRUE & TRUE)
если убрать суммирование, тоже не работает dt[a == 1 & b == 1 & c == 'a', a >= b, by = .(a, b, c)]
так что есть здесь a и b на самом деле подтягиваются из полной таблицы, а не из .SD
Обсуждают сегодня