мержей если данные в разные партиции попадут?
Инсерты будут создавать много партов это может замедлить вставку в сотни раз
Ну и конечно Кассандра или любой другой k/v быстрее как минимум в сотни раз. И намного проще в сопровождении.
я почитал про кассандру, получается она не покрывает 1% случаев когда запрос пойдет вида select * where anyField='xxx' limit 10; клик фулсканом (а может даже prewhere поможет) пройдет и соберет это все. Те худо бедно под этот кейс он расчитан, а вот кассандра - нужно делать новую таблицу и дублировать данные. В кассанде есть опция для фул скана тоже. Попробую клик, если все совсем медленно будет - то тогда да, буду кассандру или сциллу смотреть. А еще один вопрос. Если данные всегда идут вместе (например имя блоба, оффсет и размер) фильтрации по ним никогда не будет, их лучше хранить отдельными колонками или туплами?
по идее отдельные колонки будут лучше сжиматься и меньше занимать места
Вы старую доку читали. Современная Кассандра может даже индексировать
Колонками. Туплы всегда хуже чем отдельные колонки
Обсуждают сегодня