идей нет просто уже куда копать
Есть rabbitmq в кластере - работал все ок.
Пару дней назад отвалился по причине
на одной ноде ошибка (rabbit03)Node rabbit@rabbit01 is down, deleting its listeners
На другой ноде ошибка (rabbit01)
We saw DOWN from rabbit@rabbit03
We can still see rabbit@rabbit02 which can see rabbit@rabbit03
на третьей ноде было
(rabbit02)
Received a 'DOWN' message from rabbit@rabbit03 but still can communicate with it
[error] <0.456.0> Partial partition disconnect from rabbit@rabbit01
в итоге - я ребутнул первую ноду - в статусе писалось что все ноды up и все ок - но когда приложение попыталось отослать данные в очередь - оно не смогло как будто вообще не было подключения
В чем может быть проблема - может кто с таким сталкивался?
1. сейчас уже все работает после рестарта или нет, я не понял? 2. через веб интерфейс что показывало в списке нод и списке очередей? 3. очереди кворум/классик репликация? 4. что значит приложение не смогло как будто не было подключения? оно пересоздло подключание? как балансировка перед кластером настроена?
Обсуждают сегодня