184 похожих чатов

Добрый вечер. Из двухнодового кластера(distributed+replicatedmt) вывели из эксплуатации одну релпику,

хост также был удален из dns
* удалили ее из директивы <remote_servers> конфига config.xml
* перезагрузили сервер (на этом этапе она пропала из system.cluster)
* выполнили SYSTEM DROP REPLICA 'clickhouse-kd2'

Тем не менее, в журналах при старте кликхауза ошибка
"carbon_metrics.graphite_tree.DirectoryMonitor: Code: 210, e.displayText() = DB::NetException: Host not found: clickhouse-kd2 (clickhouse-kd2:9000), Stack trace (when copying this message, always include the lines below)"

Что-то пропустили, нужно еще почистить какие-нибудь очереди?

10 ответов

22 просмотра

У дистрибьютид таблицы в очереди надо удалить/переложить bin файлы. Это отложенные инсерты

Denny [Altinity]
У дистрибьютид таблицы в очереди надо удалить/пере...

Здравствуйте, у меня был кейс что накопилось bin файлов 30 миллионов. Я прописал user password в конфиге кластера. Сейчас инсерты пошли и число bin файлов уменьшается. Но встала репликация на других таблицах, которые не view.

Denny [Altinity]
Какие симптомы у "встала" и при чем тут вью?

с view проблемы начались, что там инсерты не отправлялись, это решили, появилась новая проблема. таблицы ENGINE = ReplicatedMergeTree сейчас отстают на ноде с которой инсерты пошли

Denny [Altinity]
Distributed таблица это не вью. Select * from syst...

я плохо объяснил. работали год, проблем с репликацией replicated таблиц не было. были ошибки авторизации между нодами и копились bin файлы, рестарт ноды занимал 8 часов. Как только я прописал авторизацию для distributed таблиц, появился лаг репликации по заббиксу.

Евгений Овчинников
я плохо объяснил. работали год, проблем с репликац...

SELECT database, table, type, any(last_exception), any(postpone_reason), max(last_attempt_time), max(last_postpone_time), max(num_postponed) AS max_postponed, max(num_tries) AS max_tries, min(num_tries) AS min_tries, countIf(last_exception != '') AS count_err, countIf(num_postponed > 0) AS count_postponed, countIf(is_currently_executing) AS count_executing, count() AS count_all FROM system.replication_queue GROUP BY database, table, type order by count_all desc

так проблема неделю назад началась? типа уже неделю парты качает │ data │ participants_log │ GET_PART | 2021-04-12 13:51:12 │ 1970-01-01 03:00:00 попробуйте рестартовать КХ, похоже фетч завис

Denny [Altinity]
так проблема неделю назад началась? типа уже неде...

ну да примерно неделя. сейчас не хочу рестартить, пусть закончит еще 15млн инсертов. Тогда рестартую. спасибо.

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта