типами *_ARRAY ? Радует более низкий постоянные расход памяти, местами разница колоссальная. Сильно ли влияет на пиковый расход памяти при выполнении запросов? Были замечены ООМ через какое-то время после перевода словарей (прогружены они были заранее) на эти типы, потом также быстро само и прошло, не понял на них грешить или нет :)
они чуть медленее чем hashed
спасибо, по скорости особо разницы не заметил пока. значит что-то другое ООМ вызвало
https://github.com/ClickHouse/ClickHouse/issues/30236#issuecomment-945188809 можете почитать весь ишью
спасибо за ссылку. Есть ещё интересный вопрос - почему так много внимания уделяется словарям, а join engine забыт? Я тут провел подобные тесты и получилось, что join engine работает не сильно медленее hashed, однако занимает в разы меньше памяти. И обновлять значения по ключу можно без мучительной перегрузки. Может там есть какой-то подвох?
1. Я не пользуюсь engine join, потому что источники данных у меня внешние -- http. Я не вижу смысла писать ETL который будет перекладывать в engine=Join. 2. Engine = join не гарантирует целостности при перезагрузке. 3. Бекэнд не умеет Engine=Join, а SQL запросы руками не пишем вообще никогда, и переделывать бекэнд лень. 4. Engine join если наделать множество инсертов, создаст кучу каталогов на диске, мержить он не умеет (или не умел) , я уже видел КХ который стартовал 2 часа, атача engine=join. Спасибо. 5. Словари более менее консистенты между шардами без вообще траты каких-либо ресурсов на это.
А если Engine=Join для очень маленьких файлов которые не меняеются почти никогда, у меня в таком лежит справочник по странам где всякая инфа(200 строк буквально), не должно быть проблем больших?
а да, разве layout = SparseHashed занимает сильно больше памяти чем engine join?
Да. 1.5Gb/7sec против 5.27 GiB/224 sec. Но для словаря пришлось отказаться от LowCardinality в пользу обычных строк. Наверное из-за этого.
не понимаю, что такое "1.5Gb/7sec" ? мы обсуждали "однако занимает в разы меньше памяти"
Обсуждают сегодня