кто может помочь, помог.
Пожалуйста, помогите. Как-то я неверно формулирую запрос гуглу.
Мне нужно посчитать порядковые номера вхождений айдишников в пандосовский датафрейм. Гуглю как "serial number of occurrence of sequence of value for each id pandas". Формулирую и по-русски и по-английски. Находит ответ только как найти количество вхождений.
А мне нужна именно нумерация.
Если айдишник встречается первый раз, то поставить 1, если второй - два и так далее.
Подскажите, пожалуйста, как мне переформулировать запрос к гуглу, чтобы он меня понял?
Подробнее о данных.
Есть айдишники клиентов, которые совершают покупки. Одни и те же клиенты могут совершать покупки несколько раз, поэтому их айдишники повторяются. Надо посчитать, какая это по счёту покупка конкретного клиента.
Я дала Вам работающий ответ, но Вы не хотите его принимать) удачи в поисках!
развели переписку. это называется куммулятивной суммой. решается одной строкой
в нормальных языках это решается элементарно и без всяких закулисных манипуляций с индексами. library(data.table) nn <- 20 dt <- data.table(id = sample(1:5, nn, replace = TRUE), cost = runif(nn, 100, 200)) # решаем dt[, grp := .GRP, by = id][, n_in_grp := cumsum(grp), by = id] получаем id cost n_in_grp grp 1: 1 146.7396 1 1 2: 5 118.1775 2 2 3: 5 163.3105 4 2 4: 1 135.2388 2 1 5: 3 151.8276 3 3 6: 2 168.8849 4 4 7: 1 100.9818 3 1 8: 2 132.7624 8 4 9: 3 170.0698 6 3 10: 2 104.4228 12 4 11: 3 183.7884 9 3 12: 4 195.5779 5 5 13: 2 155.2286 16 4 14: 2 152.3373 20 4 15: 3 133.8072 12 3 16: 2 186.3302 24 4 17: 2 196.6399 28 4 18: 2 138.5000 32 4 19: 4 133.6913 10 5 20: 3 178.0701 15 3 но и это избыточно. потому что достаточно в каждой группе (после физической сортировки, там ведь еще даты могут быть) прогнать заполнение порядкового номера от 1 до длины группы с шагом 1
Обсуждают сегодня