подходит ли Кликхаус для такого (вроде бы да). Надо хранить 100 млрд строк (ок), делать большие сканы (ок), и выгружать большие результаты сканов, допустим сотни миллионов записей. Есть ли какие-нибудь подводные камни с последним?
а чем не подходит S3 ? КХ про аггрегацию, а не про хранение / вытаскивание
Речь идет о сканах (фильтрации), которая порождает большие результаты.
Да, это один из вариантов. Но наверное эффективней это будет хранить в КХ.
Тут много нюансов, почему так или не этак, долго рассказывать. Просто интересно, может ли хранить КХ промежуточные результаты допустим в сотни мегабайт и отдавать их по сети. Может тут есть какой-нибудь подводный камень.
это сложный вопрос. КХ мержит. И все время насилует диск и cpu мержами, не имеет встроенного решардинга .... т.е. я плюсов КХ не вижу, хотя самый фанбой из всех фанбоев
может, просто еще можно гвозди забивать телескопом
Можно подумать хадуп никого не насилует... ;)
ну там нет мержей, зачем ему
Обсуждают сегодня