Ребят, несколько миллиардов ивентов в день - это слишком много для КХ? Наши BI хотят нормальный DW (без тормозов presto+hive/hdfs), но боятся переходить на облачные DW типа B...
Ещё вопрос, как лучше организовать импорт данных из кафки в КХ? Я читал в описании, что поддержка есть, но не читал о реализации. Как происходит десериализация из avro в nativ...
Как быть если есть данные из Snowflake, но неизвестны PK/FK? А мне нужно сделать CDC, который предполагает наличие полей с ключами.
Посоветуйте стратегию деплоймента hotfix? В настоящий момент у нас попадает в прод всё, что закоммитили в мастер бранч, включая то, что не до конца протестировано. Я предлага...
И ещё вопрос 😁 Как лучше организовать schema evolution (кафка), например если полгода вносились записи с одной схемой(например a, b, c), а затем понадобилось расширить схему д...
Как оценить расходы на хранение при миграции данных из хадупа в КХ? У меня где-то 300ТБ данных в хадупе, в будущем может вырасти в 5 раз. Сколько понадобится места для КХ, с у...
Как можно зашарить данные в aws glue catalog для клиентов, которые в GCP или Azure?
Коллеги, подскажите как лучше определить джобы в AWS Glue, которые потребляют больше всего долларов?
Есть ли уже книги или учебные пособия по ClickHouse?
Граждане, подскажите как можно избежать дырок в данных если вдруг чтение из postgres с помощью CDC и запись в кафку на какое-то время невозможно. Как определить недостающие ку...
Если нужно создать структуру данных по типу файловой системы с поддиректориями глубиной 2-3 уровня и сохранить как zip файл. Целесообразно ли это делать на скале?
Возможно ли разделить доступ к данным в КХ? Например маркетинг имеет доступ к своему набору таблиц, но не к финансовым таблицам и так далее.
Вопросы по Spark Scala здесь приветствуются?
Это правда, что избавились от zookeeper?