уникальные данные - схлопываются. Появилась необходимость использовать шардинг данных ну и репликацию. У меня теоретический вопрос, после миграции на схему distributed таблица + две ноды, если на разные ноды запишутся одни и те же данные (условно один и те же), при запросе через distributed таблицу они будут схлопываться или же нет?
нет
Из таких движков всегда надо брать с группировками и доаггрегациями. Даже на одной ноде не гарантируется схлопывание и аггрегация
например у вас ключ в таблице order by (Имя, Фамилия). Нужно сделать шардирование в distributed не по rand() , а по например cityHash64(ИмяФамилия). Тогда все одинаковые ключи окажутся на одном шарде.
Обсуждают сегодня