184 похожих чатов

Какими параметрами для мерджтрии лучше сжать данные? Дата, инт64,инт64, флоат64,флоат64.

Использовать другие кодеки на столбцы? Сейчас таблица 40 гигов сжатая и 45 разжатая..

21 ответов

18 просмотров

Скорей всего у вас не правильный ORDER BY, покажите DDL таблицы ?

порядком колонок в sorting key от low-cardinality значений к higher-cardinality

Илья-Тищенко Автор вопроса
ivan
порядком колонок в sorting key от low-cardinality ...

Идёт дата и идентификатор. Идентификаторов уникальных больше чем уникальных дат

рандомы нельзя сжать, значения вообще могут повторяться в столбцах?? самое простое поставить в конфиге zstd по дефолту

Илья-Тищенко Автор вопроса
Denny [Altinity]
рандомы нельзя сжать, значения вообще могут повтор...

Только даты. Походу придётся менять сжатие. Спасибо

Илья Тищенко
Только даты. Походу придётся менять сжатие. Спасиб...

а int / float они коррелируют между собой в столбце? типа растут как датчики или колеблются вокруг чего-то?

Илья-Тищенко Автор вопроса
Denny [Altinity]
а int / float они коррелируют между собой в столбц...

Это актив и его коэффициент. По сути все уникально

Илья-Тищенко Автор вопроса
Denny [Altinity]
а int / float они коррелируют между собой в столбц...

-- analitics.fct_coefficient definition CREATE TABLE analitics.fct_coefficient ( dttm DateTime, pair_id UInt64, pair_rev_id UInt64, price_coef Nullable(Float64), price_coef_rev Nullable(Float64) ) ENGINE = MergeTree PARTITION BY toYYYYMMDD(dttm) PRIMARY KEY pair_id ORDER BY (pair_id, dttm) SETTINGS index_granularity = 8192;

Илья-Тищенко Автор вопроса
Denny [Altinity]
а int / float они коррелируют между собой в столбц...

-- analitics.fct_coefficient definition CREATE TABLE analitics.fct_coefficient ( dttm DateTime, pair_id UInt64, pair_rev_id UInt64, price_coef Nullable(Float64), price_coef_rev Nullable(Float64) ) ENGINE = MergeTree PARTITION BY toYYYYMMDD(dttm) PRIMARY KEY pair_id ORDER BY (pair_id, dttm) SETTINGS index_granularity = 8192;

Илья Тищенко
-- analitics.fct_coefficient definition CREATE TA...

занятно, вы отвечали, что у вас ключ "дата и идентификатор", т.е. я понял, что сначала идёт значение с меньшим числом уникальных значений а на самом деле у вас "идентификатор и timestamp" )

Илья-Тищенко Автор вопроса
ivan
занятно, вы отвечали, что у вас ключ "дата и идент...

это текущее состояние. я пробовал и и по другому ничего не поменялось

Илья Тищенко
-- analitics.fct_coefficient definition CREATE TA...

да просто ZSTD(1) или ZSTD(2) в конфиге, но если там просто числа рандомные, то естественно их не сжать и кодеки не помогут, если там есть что сжимать то ZSTD(2) жмет в среднем лучше чем Codec

Denny [Altinity]
рандомы нельзя сжать, значения вообще могут повтор...

философский вопрос про компрессию zstd, очевидно, лучше жмёт, чем lz4, но это же не бесплатно, и он должен быть более "cpu прожорлив". товарищи из databricks в свое время писали, что иногда лучше недожать — а всё потому что в облачных системах место на диске обходится потребителю дешевле, чем cpu time. не знаете, есть ли какие-нибудь тесты на тему, как полный переезд на zstd в клике влияет на использование (и итоговую стоимость) cpu?

Илья Тищенко
Спасибо протестирую

Для Float в новой версии завезли кодек, он хорош когда уникальные значения

ivan
философский вопрос про компрессию zstd, очевидно, ...

у меня в системе 90% CPU свободно, никак не влияет. влияет у пользователей с загруженым CPU и высоким QPS, типа если тысяча запросов в минуту и все реалтайм - 10 мс, то заметна разница между ZSTD(1) и LZ4

Константин
Для Float в новой версии завезли кодек, он хорош к...

хорош? кажется в тестах он всегда хуже чем ZSTD и чем Gorrila

Похожие вопросы

Обсуждают сегодня

Всем привет! Имеется функция: function IsValidChar(ch: UTF8Char): Boolean; var i: Integer; ValidChars: AnsiString; begin ValidChars := 'abcdefghijklmnopqrstuvwxyzABCDE...
Евгений
44
И никого не интересует какие пакеты кто использует. ((% Заходишь на сайт симфони и видишь поддержку Украины - по законам РФ это ж экстремизм. Только никто не отказывается от с...
Am Ambrion
11
лучше скажите, причём тут паскаль?
Alexey Kulakov
36
Чтобы перехватить все нажимания буков на форме, надо хук ставить? Пробовал на форме ОнКейДаун, оно ловит клаву если фокус не на компоненте с вводом текста
Serjone
15
Но, может, есть уже проверенная? Наши требования такие: 1. Сообщения должны приходить из Инста в CRM оду 2. Должна быть возможность подключить несколько экаунтов Инстаграм. Р...
Alexander Sharoiko MSE / Александр Шаройко
7
Народ! Впервые клиенту пришло письмо от РКН, у вас, дескать, есть яндекс метрика, а нигде не написано, что вы ее юзаете. Никто не сталкивался?
Sasha Beep
14
Всем привет! вывожу на общей стр дочерние ресурсыв каждом ресурсе галерея, и первая фотка должна выводиться на общей [!DocLister? &prepare=photo !]
Alekso
12
Я правильно понимаю что нет способов получить список ожидающих заявок на вступление в группу с помощью бота из mtproto?
Шамиль Прилов
7
А можно вопрос? Мне сегодня сказали что у меня функция (которая просто заполняет массив значениями) не правильная void Full(double * arr, int n) { for (int i = 0; i < n; i...
† C E †
7
Добрый вечер. Хочу чтобы у меня в классе поле было функцией, которая возвращает строку. Делаю так: interface ... TGetOutPath = function : String of object; ... protec...
Kirill Filippenok
12
Карта сайта