Данные не огромные
А он запросы обрабатывает по 20мин
Или дело в Hive…
треддамп экзекутора гляньте - как правило тупняки это IO, cpu-intensive запросы на практике реже встречаются
Нужно посмотреть в UI, когда начался запрос, когда закончился, когда начались джобы, когда закончились Если где-то есть дырки по времени - значит долго строится запрос или допустим много партиций создаётся на выходе, и это проблема на драйвере
Обсуждают сегодня