1) на новом шарде создать все distributed таблички которые используют этот кластер
2) добавить его в файлы конфигов на всех нодах кластера и перезапустить их
После этого клик сам начнет раскидывать запросы (понятно что без ребаланса данных) и на новый шард автоматом?
Надо ли на момент постепенного перезапуска както ограничивать заливку данных?
И надо ли пересоздавать дистрибьютед на какоймто из этапов?
1) да 2) да, в секцию remote_servers перезапускать на шаге 2 не надо, оно автоматом подтянется проверить можно через SELECT * FROM system.clusters пересоздавать distributed на старых шардах не надо...
еще можно с weight поиграться... в remote_servers если вы вставку делаете в distributed , чтобы новые данные только в новый шард шли...
есть мелкий вопрос. Было 2 шарда на каждом шарде вычитывалось из кафки и вставлялось в distr таблицу. Добавили еще одни шард с такой же схемой. Но больше всего записи идет в новый шард, что это может быть?
Обсуждают сегодня