виртуалках если это важно, по 4 ядра 8 Гб оперативки).
Есть тестовая таблица (из туториала кликхауса, та что hits_v1)
Она развернута как локально на 1 ноде вся, так и размазана по шардам через distributed таблицу по ключу rand()
Вопрос собственно в скорости, например обычный SELECT * дает одинаковый результат по скорости что из distributed что из локальной таблицы, хотя, насколько я понимаю, из distributed должен быть быстрее. Не в 3 раза конечно но как то и не в рамках погрешности. Или я неправильно понимаю? Может кто то сталкивался?
Версия 20.3.19.4
Заранее спасибо.
с чего бы просто select * быть быстрее? Это надо в диски упереться на 100%. и как вы тестируете select * ? Я бы тестил select * from hits_v1 format Null -- чтобы клиент и сеть не были узким местом и например попробуйте select * hits_v1 from where ClientIP = 666 и еще например select RegionID , count() hits_v1 from group by RegionID CH и distributed созданы для запросов group by , а не для select *
Спасибо большое, действительно запросы с group by показывают прирост скорости. Еще почитаю матчасть
Обсуждают сегодня