юзеров, не более
примерные столбцы:
- uuid пользователя
- text (сообщения с чатик тех.поддержки; от 20 до 100 символов)
вопросики:
- какое дисковое пространство примерно понадобится? Грубо, вилка
- насколько может быть быстрой выборка по uuid пользователя или поиск по тексту сообщений?
Поиск по тексту внутри поля - это не кликхауз, увы. По uuid - пожалуйста, будет быстро.
Берите сырые данные и делите их на 5-10, если данные хорошо жмутся (а текст жмется хорошо). Если сделаете индекс по uuid, то выборка по нему будет быстрая (ну, для ClickHouse быстрая, в пределах 50 мс). Поиск по тексту будет идти full scan по нужным партициям. Это работает примерно с такой скоростью, с которой может работать хорошо оптимизированный многопоточный full scan — быстро для full scan, но данные всё равно прочитать с диска все придется :).
Обсуждают сегодня