А по поводу FINAL'а. Я провел тесты на своих данных

Question

А по поводу FINAL'а. Я провел тесты на своих данных

(600 миллионов строк) и пришел к выводу что ни FINAL ни argMax ни другие варианты не дают адекватную скорость, ожидание по 4-8 секунды каждого запроса. На меньших объемах (<1кк строк) FINAL реально летает, а вот ближе к полу миллиарду все становится грустно.

Правильно ли я понимаю что это нормально, что с 600кк строк ни длинна order by ни настройки кх не помогут и надо менять бизнес логику?

#backend #clickhouse #database #devops #programming #russian

0

03.05.2023

10 ответов

36 просмотров

Stranger Автор вопроса

Denny [Altinity]
Почему у вас запросы с final работают против 600мл...

На 1кк строках FINAL практически не влияет на скорость. На 600кк строках - очень влияет

0

03.05.2023

Pavel

Stranger
На 1кк строках FINAL практически не влияет на скор...

Прям вот же: https://clickhouse.com/docs/ru/sql-reference/statements/select/from#select-from-final

0

03.05.2023

Denny [Altinity]

Обычно делают более интеллектуальное что-нибудь. Типа дневные партии. По ночам принудительно финализируют optimize. Запросы против старых данных гоняются без final. Против свежих сегодняшних с final. Но серьезные приложения типа метрики конечно не используют final для таблиц с ивентами. Все подобное делается в etl.

0

03.05.2023

Stranger Автор вопроса

Благодарю 🙏

0

03.05.2023

Константин

Stranger
Благодарю 🙏

Где то был доклад как в метрики делали дедубликацию на YDB :)

0

03.05.2023

Stranger Автор вопроса

Denny [Altinity]
Обычно делают более интеллектуальное что-нибудь. Т...

а с обновлением данных? Похоже что ждать асинхронные мутации это лучшее решение на текущий момент, если FINAL отметаем, и argMax и тому подобные тоже

0

03.05.2023

Константин

Нельзя делать UPDATE для одной строки

0

03.05.2023

Stranger Автор вопроса

Константин
Нельзя делать UPDATE для одной строки

А ведь для N строк UPDATE нельзя сделать? Допустим мне надо поменять значения колонок в 10-20 колонках за раз... попробую посмотреть в сторону CollapsingMT, если не поможет похоже надо будет смотреть в сторону DELETE+INSERT

0

03.05.2023

Boris

Stranger
А ведь для N строк UPDATE нельзя сделать? Допустим...

Можно, если предварительно запихнуть данные в словарь в памяти. Однако в ETL не нужно делать никаких мутаций. Только руками. Смотрите в сторону CollapsingMT и разных интересных схем сортировки и партиционирования таблицы, вместе с преобразованиями из одной таблицы в другую. Правильный путь где-то там. Но точно не в мутациях.

0

03.05.2023

Denny [Altinity] · Accepted Answer

Denny [Altinity]

Почему у вас запросы с final работают против 600млн? Так и задумано?

0

03.05.2023

184 похожих чатов

А по поводу FINAL'а. Я провел тесты на своих данных

10 ответов

Похожие вопросы