dplyr::tibble(a = 1:10,
b = 11:20,
c = 1)
Я хочу получить разряженную матрицу вида:
11 12 13 14 15 16 17 18 19 20
1 1 0 0 0 0 0 0 0 0 0
2 0 1 0 0 0 0 0 0 0 0
3 0 0 1 0 0 0 0 0 0 0
4 0 0 0 1 0 0 0 0 0 0
5 0 0 0 0 1 0 0 0 0 0
6 0 0 0 0 0 1 0 0 0 0
7 0 0 0 0 0 0 1 0 0 0
8 0 0 0 0 0 0 0 1 0 0
9 0 0 0 0 0 0 0 0 1 0
10 0 0 0 0 0 0 0 0 0 1
Сейчас для этого использую dcast из reshape2
foo <- reshape2::dcast(bar,
a ~ b,
value.var = "c",
fill = 0)
Но в таком виде получается не совсем желаемая матрица. У неё есть первый столбец, равный a. Конечно столбец можно убрать:
foo[, 2:dim(foo)[2]]
Но это лишняя операция, которая на больших объёмах занимает некоторое время.
Подскажите, пожалуйста, есть ли более элегантный способ получить желаемое?
а есть же вообще отдельные классы для разреженных матриц, как-то так: https://slowkow.com/notes/sparse-matrix/
да, есть. Но у меня с дальнейшей обработкой этого формата проблемы. Поэтому хочу попробовать для сравнения и другой способ
а в чем смысл a? она болтается сама по себе.
в исходной задаче a — это айдишник пользователя, b — айдишник товара.
упс, а пример вообще не такой. вот вопрос с foo/bar решается на раз. library(Matrix) m <- sparseMatrix(i = bar$a, j = bar$b, x = bar$c) as.matrix(m)
что, рекомендательная система?
ну так это вообще все другое. мы для крупного ритейла делали на https://cran.r-project.org/web/packages/recosystem/index.html
обратно в матрицу потом, хм, вроде очевидно, но я не догадался) попробую и так, спасибо
Обсуждают сегодня