одного шарда с двумя репликами будет больше, так как не будет расходов (мизерных на самом деле) на координацию запросов. Ответ с него вы будете получать быстрее. Два шарда с одной репликой - трудный сценарий, здесь вы выиграете в скорости чтения, если локально данных поднимается много, а по сети пересылается значительно меньше. Правильно понимаю, что есть два сервера и вы думаете как их правильно нарезать? Если так то в случае с репликой вы проигрываете по занимаемому месту. В случае шардов вам доступно всё место.
В остальном разница будет незначительной, и добавлять шард имеет смысл когда данные не влезают на один сервер, или же вы хотите увеличить пропускную способность кластера, но реплик уже достаточно.
Мне бы понять в целом как правильно скалироваться. Латенси не слишком важна.
Обсуждают сегодня