вставка производилась не через нее, а напрямую в ReplicatedMergeTree. Distributed только объединяла данные всех шардов.
Теперь хотим вставлять через Distributed. Новые данные по ключу шардирования будут отправлены на нужных шард и, если включена настройка optimize_skip_unused_shards - то SELECT будут по возможности идти не ко всем шардам, а выбирать по ключу шардирования нужные.
Вопрос как будут работать SELECT из Distributed для старых данных, которые не через нее вставлялись? Не будет ли он пропускать часть данных, не заходя на некоторые шарды якобы по ключу шардирования, который раньше не использовался?
неправильно будут работать запросы. optimize_skip_unused_shards использует текущий ключ шардирования, и не в курсе что в таблицах внизу.
Обсуждают сегодня