184 похожих чатов

Всем привет. Нормальной ли является практика optimize table deduplicate ~

раз в 10 минут на 5 объектах +- одновременно. Объекты относительно небольшие/различные от 50к записей до 100кк записей. Какие существуют workaround, в случае, если это плохая пратика?

7 ответов

6 просмотров

ну если 100кк это 100 000 000 записей. то нет если максимум 100k записей в таблице то есть на 5 таблиц 500k записей... то терпимо. но зависит от того какие у вас диски, какая еще при этмо нагрузка идет и какие требования к latency запросов в момент когда идет OPTIMIZE это нагрузка на диски + CPU + ram (потому что для дедупликации строится хеш таблица) нормальная практика это сделать нормальный ORDER BY и ReplacingMergeTree и делать SELECT ... FROM table FINAL ..

Zakhar-Leshnevsky Автор вопроса
Slach [altinity]
ну если 100кк это 100 000 000 записей. то нет если...

Спасибо за ответ. Final же все равно не гарантирует уникальности? Мы тестили и если в разных партициях (вроде как) лежит одинаковый ключ, то он никогда не смерджится. Но я могу ошибаться.

Zakhar Leshnevsky
Спасибо за ответ. Final же все равно не гарантируе...

FINAL как раз и ганартирует уникальность... жертвуя от 5 до 15% потерей скорости..

Zakhar Leshnevsky
Спасибо за ответ. Final же все равно не гарантируе...

про разные партиции. это регулируется специальной настройкой do_not_merge_across_partitions_select_final https://kb.altinity.com/altinity-kb-queries-and-syntax/altinity-kb-final-clause-speed/ https://kb.altinity.com/altinity-kb-queries-and-syntax/altinity-kb-optimize-vs-optimize-final/ https://kb.altinity.com/engines/mergetree-table-engine-family/merge-performance-final-optimize-by/ https://kb.altinity.com/altinity-kb-setup-and-maintenance/timeouts-during-optimize-final/ https://kb.altinity.com/engines/mergetree-table-engine-family/collapsing-vs-replacing/

Zakhar-Leshnevsky Автор вопроса
Zakhar Leshnevsky
Спасибо за ответ. Final же все равно не гарантируе...

Могу ещё предложить, что у вас ключи шардирования не настроены

Igor Voltaic
Могу ещё предложить, что у вас ключи шардирования ...

ключи шардирования вообще никакого отношения не имеют к SELECT ... FINAL ... это для Distributed таблицы... и они при SELECT вообще не используются, только при INSERT в engine=Distirbuted

Похожие вопросы

Обсуждают сегодня

А чем вам питонисты не угодили?😂
.
79
Язык Си можно выучить за день? По книжке ANSI C на 230 страниц
Vincent Vegan
29
Привет, запускаю werf в dind в k8s, получаю ошибку на этапе build/beforeSetup: /.werf/stapel/embedded/bin/bash: /.werf/scripts/5898bdfe5214357d3706b879cc8d3d78460fb379607cbd...
florius0
7
Всем привет, написал код ниже, но он выдает сегфолт, в чем причина? #include <stdio.h> #include <stdlib.h> #include <string.h> struct product { char *name; float price; };...
buzz базз
75
Dim Dim, [02.07.2024 11:07] DB 0x62 Dim Dim, [02.07.2024 11:07] DB 0x66 Dim Dim, [02.07.2024 11:07] кто пояснит что это?
Dim Dim
14
Ошибка: segmentation fault (core dumped) Код: pastebin.com/BEsNNSSV Сообщение от компилятора: отсутствует ОС: Arch Linux Ядро: x86_64 Linux 6.9.7-arch1-1 Процессор: Intel Cele...
sec
4
Ребят, а за скок можно впарить анон чат с апишкой и веб админкой ?
Eugene Неелов
15
Ещё такой вопрос. Мне необходимо хранить пароль пользователя локально. Для этого планирую использовать ini файл. Это для автозаполнения полей логин и пароль при авторизации. Е...
Евгений
19
Кстати, я тут еще с одной темой столкнулся, вот учу я C++, на таком то ресурсе, а остальные постоянно советуют практиковаться, что то писать, проекты, но как писать если вот т...
aaswq1
7
Добрый день, чат. Мне в очередь из других RabbitMQ по shovel валятся метрики в формате текста для Prometheus. Помогите пожалуйста подружить RabbitMQ и Prometheus, чтобы он (...
Aleksey
4
Карта сайта