сервера, сегодня один, завтра другой. Причем метрика TCPConnection взлетает до ~1500 и подключиться к серверу невозможно. Помогает только перезагрузка. В логах ничего определенного не нашли. Нагрузка в основном состоит из загрузки данных из кафки с помощью engine=Kafka. Может кто подскажет, куда смотреть?
а что остальное? проц\память? буфер есть какой?
Проц и память ровно, видимо никто подключиться не может и графики становятся сглаженными. Какой буфер? Engine? Да загрузка через него.
а что говорит SELECT * FROM system.processes LIMIT 100
Раз сервер висит, то выполнить этот запрос невозможно. Если только запускать по крону перенос этих данных в другую таблицу.
он сейчас висит?, ssh доступна?
Еще, важный момент. Вот эта метрика тоже взлетает до небес.
Привет! Удалось ли найти и победить причину зависания нод кластера?
Привет! Так же испытывали проблемы об Engine=Kafka, где то в тех же версиях, сдались не разобрались. Из наиболее интересного, клик как то пришел нам задудосил коннектами кафку. Грязно захачили через Engine=Executable + родной консоль-кафка-консумер. Затем понаписали на гонячке своих заливаторов. Так и живем, на Engine=Kafka рукой махнули. Хотя поговаривают что в более новых версиях работает лучше, но мы не проверяли. Можете попробовать обновиться дальше, поизучать issue трекер, вдруг эти проблемы давно не актуальны в новых версиях, поделиться опытом.
Обсуждают сегодня