172 похожих чатов

Интересная проблема: Есть кластер поднятый ранчером. На двух воркерах - всё

ок
Поднимаю третий воркер - на нём ни в какую не работает днс, т.е. из подов не резолвится ни внешка, ни ресурсы кластера
Если редеплойнуть coredns - заводится на двух любых нодах, одна (не обязательно вновь созданная) остаётся за бортом, и на нерабочей ноде нет пода корднс
Попробовал сменить днс-автоскейлер на этот
https://github.com/kubernetes/kubernetes/blob/master/cluster/addons/dns-horizontal-autoscaler/dns-horizontal-autoscaler.yaml
Результат: корднс скейлится, на каждый ноде есть его под, но днс работает либо на двух рандомных нодах, либо на одной, теперь рабочие ноды могут стать нерабочими даже без перезапуска корднс
В логах: автоскейлера, корднс, их подов, сервиса корднс, всё чисто, никаких ошибок/варнингов
Пробовал разные версии корднс, другие ос на нодах, открыл все порты, отключил все фаерволы / селинуксы и тд

Может кто сталкивался или есть идеи, как так?

14 ответов

24 просмотра

Сеть какая? Версия? Какой ранчер? Очень много неизвестных

Wilderone- Автор вопроса
George Gaál
Сеть какая? Версия? Какой ранчер? Очень много неиз...

ранчер 1.19.6, сеть - flannel, всё в амазоне на ec2

2 воркера - это помимо мастеров ?

Wilderone- Автор вопроса
Wilderone
да, 3 мастера

А на мастерах все ок, как я понимаю ?

Wilderone- Автор вопроса

гмм а зачем core-dns прям на каждой ноде? ну и вот собственно https://kubernetes.io/docs/tasks/administer-cluster/dns-debugging-resolution/

Wilderone- Автор вопроса
vitex (Victor)
гмм а зачем core-dns прям на каждой ноде? ну и вот...

это как догадка. Не работает на той, где его нет. По этому ману уже прошелся

Wilderone
это как догадка. Не работает на той, где его нет. ...

core-dns достаточно двух экземпляров а вот если используется nodelocaldns, то да, они на каждой ноде должны быть

Wilderone
это как догадка. Не работает на той, где его нет. ...

ну так и что с диагностикой? nslookup kubernetes.default

Wilderone- Автор вопроса
vitex (Victor)
ну так и что с диагностикой? nslookup kubernetes.d...

вот на рабочей ноде: /var/www/public $ nslookup kubernetes.default Server: 10.43.0.10 Address: 10.43.0.10:53 /var/www/public $ cat /etc/resolv.conf nameserver 10.43.0.10 search default.svc.cluster.local svc.cluster.local cluster.local eu-central-1.compute.internal options ndots:5 На нерабочй - таймаут

Wilderone- Автор вопроса
Aleksey Lazarev
А кроме dns все работает?

да, если оставить 2 воркера - всё ок

Отсюда просто непонятно - он совсем не фурычит?

Похожие вопросы

Обсуждают сегодня

а через ESC-код ?
Alexey Kulakov
29
30500 за редактор? )
Владимир
47
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
13
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
в JclConsole объявлено так: function CtrlHandler(CtrlType: DWORD): BOOL; stdcall; - где ваше объявление с stdcall? у вас на картинке нет stdcall
Karagy
8
Как передать управляющий символ в открытую через CreateProcess консоль? Собсна, есть процедура: procedure TRedirectThread.WriteData(Data: OEMString); var Written: Cardinal;...
Serjone
6
Ребят в СИ можно реализовать ООП?
Николай
33
program test; {$mode delphi} procedure proc(v: int32); overload; begin end; procedure proc(v: int64); overload; begin end; var x: uint64; begin proc(x); end. Уж не знаю...
notme
6
у вас два процесса. один посылает другому сигнал. у вас есть код обоих процессов? если всё не так - расскажите как оно на самом деле. а именно кто кому чего, есть-ли консоли,...
Karagy
6
Карта сайта