Подскажите, как для каждого id, найти 10 последних uid? SELECT id, uid FROM table ORDER BY time DESC LIMIT 10 BY id приводит к DB::Exception: Memory limit (total) exceeded.
Хочу уменьшить кол-во данных на диске. Сейчас в базу пишем "время, событие, название товара"... где название товара - длинная строка. Логично заменить на ID. В качестве ID мож...
Подскажите как в кликхаус вставить 100GB данных из файла log.csv? Пытался через cat dataset.csv | clickhouse-client --query="INSERT INTO dataset FORMAT CSV" Процесс выдает Kil...
Вставляем данные в КХ с 10разных серверов каждую минуту. Куски примерно по 200мб. Данные на каждом сервере отсортированы по времени, но записываются за одинаковый период (т.е....
Вопрос: есть 2 таблицы: 1. отсортированная по DateTime... 2. без сортировки но с партициями по YYYYMMDD Если сделать запрос по датам с ключом --force_data_skipping_indices, ...
Вопрос знатокам: LowCardinality эффективен если уникальных значений меньше 100к. А если у нас в одной партиции максимум 10к уникальных значений, но по всем партициям 250к уник...
Подскажите по компресиии/хранению места на диске... На диске закончилось места (шардинга/реплик нет) Делаю запрос... SELECT * FROM (select name, formatReadableSize(sum(data_co...
Как правильно сравнивать производительность разных схем таблиц? Взял одни и те же данные, и хотел проверить разные варианты: 1. Партишн toYYYYMM 2. Партишн toYYYYMMDD 3. Парти...
Посоветуйте варианты работы с ретеншном? Каждому юзеру увидевшему баннер (AD), присваиваем уникальный id (UID), в течении месяца он может совершить действие (ACTION). Нюанс...
Подскажите, можно ли как-то за один проход получить данные о максимальном количестве страниц просмотренных юзером за несколько разных интервалов.... Сейчас делаем несколько за...
Подскажите, использую настройки max_bytes_before_external_sort=7000000000, max_bytes_before_external_group_by=7000000000, max_memory_usage=0, distributed_aggregation_memory_e...
подскажите, как сохранить md5 hex string типа`222ffffeeea6468194f6466ef75bdc9c` в наиболее эффективном формате (к примеру как fixedString(16) или int64) , исключительно средст...
А можно ли при создании таблицы для определенного стобца сразу указать чтоб его данные сжимались? если использую ENGINE = MergeTree() или может стоит уменьшить кол-во, столбц...
Коллеги, напомните как сгенерить фейковый датасет для машинного обучения на основе реальных данных в КХ? Почему-то не могу найти этот функционал в доке (((
Правильно понимаю что SummingMergeTree + MATERIALIZED VIEW ... SELECT countDistinct(ip) as ipCount будет считать уникальные ip только в рамках атомарного инсерта? Т.е. если в...
Как эффективно использовать несколько жестких дисков на одном сервере в рамках одной базы данных/таблицы? К примеру можно ли вынести индексы или проекции на отдельный диск?
Подскажите: Есть два разных КХ сервера, никак между собой не связанных. На первом таблица db1 с колонками А,Б,С,Д На втором таблица db2 c колонками С,Д. Как перенести данные ...
Есть быстрый запрос, который позволяет узнать что сделал пользователь после логина: argMinIf(action,time,action!='login') А есть какие нибудь идеи как так же быстро и просто п...
Подскажите, может есть возможность при инсерте данных через HTTP клиент автоматически вставлять информацию о том с какого IP был запрос на инсерт? Т.е. добавить в таблицу что...
А есть способ в replaceAll(text, match, '*') в качестве match использовать значение колонки match, (а не константное значение) ?