40гигов и 8 ядер. NN на двух узлах и только на NN эти выделенные ресурсы используются! На остальных DataNode 8Гигов показывает и используется только 7Гигов. В чём проблема или просто и так достаточно ресурсов для обработок? У меня логов Терабайты и поиск 🔎 хочу ускорить (кстати получилось ускорить, но за счёт очистки journalnode в процессе форматирования одной из nn).
Вы точно уверены в назначении каждой роли из нод? Неймнода - нужно больше памяти так как весь имейдж в память запихивается, чем больше блоков (зачастую из-за мелких файлов), тем больше памяти надо Датанода - в памяти список обслуживаемых блоков и немного доп инфы. Чаше используют cpu для перекидывания с диска в сокет, особенно когда у вас включено шифрование соединений. К памяти менее критично
Обсуждают сегодня