Добрый вечер. Подскажите, пожалуйста, почему вдруг код с data.table отработал

Question

Добрый вечер. Подскажите, пожалуйста, почему вдруг код с data.table отработал

неожиданным для меня образом?

dt <- data.table(a=rep(1:3,7), b=rep(1:7,3), c= rep(c('a', 'b','c'), 10))
dt[,ind:=a>=b]
вот это выдает неожиданный результат
dt[,.(iii=sum(a>=b)), by=.(a, b, c)]
а вот это-то, что я хотел: сколько раз в каждой группе выполняется условие соотношение элементов в данной группе
dt[,.(iii=sum(ind)), by=.(a, b, c)]

Мне казалось, что первое- это вариант второго, без промежуточной переменной. но нет.

#programming #r #russian

0

10.02.2022

4 ответов

32 просмотра

Philipp Upravitelev

смотрите, что получается > dt[a == 1 & b == 1 & c == 'a'] a b c ind 1: 1 1 a TRUE 2: 1 1 a TRUE > dt[a == 1 & b == 1 & c == 'a', sum(a >= b), by = .(a, b, c)] a b c V1 1: 1 1 a 1 > dt[a == 1 & b == 1 & c == 'a', sum(ind), by = .(a, b, c)] a b c V1 1: 1 1 a 2 на сочетание групп у нас две строки. во втором случае мы получаем сумму c(TRUE, TRUE) а в первом - судя по всему происходит сумма двух логических утверждений, sum(TRUE & TRUE)

0

10.02.2022

Andrey

Philipp Upravitelev
смотрите, что получается > dt[a == 1 & b == 1 & c ...

если убрать суммирование, тоже не работает dt[a == 1 & b == 1 & c == 'a', a >= b, by = .(a, b, c)]

0

10.02.2022

Andrey

Andrey
dt[, .SD[a>=b, .N], by = .(a, b, c)]

так что есть здесь a и b на самом деле подтягиваются из полной таблицы, а не из .SD

0

10.02.2022