это сильно зависит от того какая сеть, какие диски и много чего еще, включая файловый кеш, хотелось бы больше деталей почерпнуть
Гипотетически, чем больше данных, пользователей, и чем больше перекос в условной тепловой карте, тем больше проблем вызывает дата локалити.
Это работает только на очень узких случаях
Ну, может быть, но выглядит как оя сложный костыль, и я не вижу вот сходу каких-то причин, чтобы так заморачиваться.
ну тут дело вкуса, кому как)
Другой подход)
Проще всего смотреть на это так: на сколько-нибудь большом и загруженном кластере у вас будет очень небольшой процент node local работы (если вы только не держите РФ большим), поэтому узкое место будет сеть, поэтому сеть надо брать «на все»)
Обсуждают сегодня