реальном времени? подходит ли вообще hadoop для этого? когда лучше не использовать hadoop? пытаюсь сделать что-то в связке hadoop, hbase, impala. Прка не понятно, оправданно ли это всё? Например есть абстрактный кейс, есть например 3миллиона пользователей соц сети, они каждый день продают друг другу товары, неограниченное количество раз, нужно по требованию брать и считать на какую сумму продал тот то, тот то за такой то месяц или группа лиц купила за такой то месяц
хадуп для батч обработки больше подходит
все что влезает в оперативку не бигдата, что такое 3 млн. пользователей, там гигабайт данных хотя бы наберется?
Обсуждают сегодня