юзеров, не более
                  
                  
                  
                  
                  
                  примерные столбцы:
                  
                  
                  
                  
                  
                  - uuid пользователя
                  
                  
                  - text (сообщения с чатик тех.поддержки; от 20 до 100 символов)
                  
                  
                  
                  
                  
                  вопросики:
                  
                  
                  
                  
                  
                  - какое дисковое пространство примерно понадобится? Грубо, вилка
                  
                  
                  - насколько может быть быстрой выборка по uuid пользователя или поиск по тексту сообщений?
                  
                  
                
Поиск по тексту внутри поля - это не кликхауз, увы. По uuid - пожалуйста, будет быстро.
Берите сырые данные и делите их на 5-10, если данные хорошо жмутся (а текст жмется хорошо). Если сделаете индекс по uuid, то выборка по нему будет быстрая (ну, для ClickHouse быстрая, в пределах 50 мс). Поиск по тексту будет идти full scan по нужным партициям. Это работает примерно с такой скоростью, с которой может работать хорошо оптимизированный многопоточный full scan — быстро для full scan, но данные всё равно прочитать с диска все придется :).
Обсуждают сегодня