184 похожих чатов

У меня 4 шардов - на кубернетесе. У всех шардах

есть distributed table. У одного из шардов папка для дистрибютед таблицы весит очень много. Например у других 700М а конкретно в этом шарде 103Гб . Нода очень долго пишет логи и не запускается

Как быть ?

11 ответов

23 просмотра

1. Указать в описании кластера, который использует ваша Distributed таблица, меньший вес тому шарду, в котором больше всего данных 2. Задуматься о том, почему так произошло. Какой у вас sharding_key? 3. Не использовать Distributed таблицу для вставки данных, вставлять их сразу на нужный шард.

Orkhan-Zeynalli Автор вопроса
Ilya Golshtein
1. Указать в описании кластера, который использует...

А если удалить папку дистрибютед таблицы что будет происходить с данными ?

Orkhan-Zeynalli Автор вопроса
Ilya Golshtein
1. Указать в описании кластера, который использует...

Спасибо за 3 пункт . Попробую балансировку кубера

Orkhan Zeynalli
А если удалить папку дистрибютед таблицы что будет...

На самом деле, я невнимательно прочитал вопрос, прошу прощения. В моем понимании, Distributed таблица не хранит данные вообще. За исключением временного хранения во время вставки. Поэтому то, что вы описываете, для меня странно. Вы уверены, что не путаете имена таблиц, например, и смотрите именно в Distributed, а не в ту таблицу, над которой она сделана?

Orkhan-Zeynalli Автор вопроса
Ilya Golshtein
На самом деле, я невнимательно прочитал вопрос, пр...

Сейчас смотрю в папку data . Там папки с именами моих таблиц. Вижу локальную и дистрибьютед таблицу . Дистрибьютед таблица очень много весит чем другие - мешает запуску КХ. Локальная таблица 14ГБ а его дистрибьютед таблица 102ГБ - странно очень. Долго искал что за данные там хранятся не нашел в форумах и в документации. Вопрос: если удалить данные в папке дистрибьютед таблицы что будет происходить ? И вообще что за данные там ?

Orkhan Zeynalli
Сейчас смотрю в папку data . Там папки с именами м...

Единственное, что приходит в голову - у вас Distributed таблица часто не может записать данные в нижележащую. И "там" именно такие данные. Сравните число строк в Distributed с суммарным числом строк на всех шардах. А это сравните с тем, что должно быть.

Orkhan-Zeynalli Автор вопроса
critskiy
вы смотрели что в логах?

Постоянно пишет что много партов

Orkhan-Zeynalli Автор вопроса
Ilya Golshtein
Единственное, что приходит в голову - у вас Distri...

Спасибо . Буду попробовать прямую вставку на локальные таблицы

Orkhan Zeynalli
Постоянно пишет что много партов

вы говорите о distributed таблице или о mergetree?

Orkhan Zeynalli
Постоянно пишет что много партов

too many parts? Так это ответ. Расскажите, как вы вставляете данные. Какими порциями и по сколько раз в секунду.

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта