реплик нету, и отдельный сервер как "прокси" с шардами в servers.xml) _периодически_ случается магия: запрос вида SELECT x, count(*) FROM table GROUP BY x возвращает повторяющиеся значение колонки x (будто не доагреггировал или что-то такое). В логах сходу ничего интересного, проблема приходит и уходит в рандомное время.
Сталкивался кто-нибудь?
UPDATE: да, судя по значениями, он буквально недосуммировал
из какой таблицы выбираете ? Distributed? Distributed поверх чего сделано? SummingMergeTree?
таблица Distributed, без ключа, используется строго как рид онли. Distributed поверх SummingMergeTree отсыпает почаще, поверх MergeTree пореже (но аналогичная проблема вылазит).
делали дифы по логам сейчас, нашли нано разницу: - когда все хорошо, видим сообщение <Trace> Aggregator: Merging partially aggregated single-level data. - когда все плохо, видимо два сообщния <Trace> Aggregator: Merging partially aggregated two-level data. + <Trace> Aggregator: Merging partially aggregated single-level data.
попробуйте FINAL добавить в SELECT запрос
FINAL решает проблему, но перфоманс деградиует на порядок 🙁
Обсуждают сегодня