момент имею 6 hot нод с парой десятков относительно небольших дневных индексов (до 40гб/день), у каждого из них по 6 шардов и один индекс 4тб (3ккк документов), у него 12 шардов. На тачках по 24cpu, при этом load average стабильно днем >30, есть ощущение недостаточности производительности. Необходимо ли стремиться к <50gb/shard согласно доке ?
Все зависит от типа данных. Если там логи, то наверное можно стремиться, но не сильно. Первое, я бы перестал делать дневные индексы и делал бы ролловер по размеру шарда.
Есть ненулевая вероятность что в вашем случае проблема не в размере шардов. Размер шардов обычно стреляет немного в других случаях. Скорее всего - неоптимальные запросы или проблемы с дисковой подсистемой
Советую последовать документации сделать <50гб/шард. Занимаюсь эксплуатацией кластера на несколько петабайт, у нас стоит такое ограничение на шард.
Обсуждают сегодня