формирую в нужном мне формате, сохраняю как csv, dictionary этот файл читает, всё вроде бы норм.
но делаю я это в контейнере, и он пухнет слой за слоем, по 650 мегабайт при каждом запуске скрипта.
как бы без этого обойтись? create temporary table, заполнять её данными, потом replace на какую-то постоянную таблицу, и уже из неё делать словарь? или уже вообще лучше отказаться от словаря, пусть таблица будет?
у меня таких словарей около десятка - hashed, flat и ip_trie, в зависимости от объёма и самих данных
Ну volume прокиньте в /var/lib/clickhouse
оно так и есть: volumes: - clickhouse-flow-data:/var/lib/clickhouse - enricher-data:/var/lib/clickhouse/user_files/lookup-data
Надо как то посмотреть какие именно файлы куда пишутся
пухнет контейнер не кх, а тот, который готовит ему данные: $ sudo find /data -name geoip.csv /data/docker/volumes/x_enricher-data/_data/geoip.csv /data/docker/overlay2/11af0a..a04bb4f3fbae42c8af570b55fa/diff/app/lookup/geoip.csv /data/docker/overlay2/bd2e6..e5a955a348981/diff/app/lookup/geoip.csv и дело ещё в том, что надо это всё счастье уводить в кубер, а кубероводы говорят, что мои csv им всю красоту портят, просят по возможности без файлов
Ну так сделайте volume туда куда ваш csv пишется
Обсуждают сегодня