на уровне таблицы? чтобы при инсертах это не нужно было указывать?
columnn default generateUUIDv4() может сработать
лучше так не делать это бесполезные для clickhouse данные весить будут дофига а выборку по ним делать напряжно потому что это высоко кардинальные данные без монотонного возрастания значений зачем вы хотите генерировать эту колонку? что вы потом собираетесь с этими данными делать?
для того, чтобы в другой таблице (в mysql) иметь ссылку на строки из таблицы в кх. в кх при этом есть пара колонок, образующих уник, но удобнее ссылаться на 1 колонку в стандартном формате, чем на 2 или больше
что-то откровенно говоря не могу представить кейс в котором такая связка была бы полезна... то есть вы что хотите сделать то? после вставки в clickhouse вы потом в clickhouse данные как то фильтруете и обратно вставляете в MySQL чтобы на стороне MySQL join сделать, или что?
да вроде бы примитивный кейс :( строка в таблице в кх представляет некоторую сущность, на которую ссылается другая сущность, хранящаяся в таблице в реляционной бд. мы оперируем в интерфейсе данными из таблицы в мускуле и хотим подтягивать там же данные из соответствующей строки в КХ
лучше конкретезивать сущности, станет понятно как лучше вам помочь
JOIN между MySQL и ClickHouse где делается? в приложени?
речь идёт не о полноценном джойне, а выборе строки по айдишнику. на уровне приложения открывается страница сущности, которая лежит в mysql и там же делается поиск по айдишнику в кх
кликхауз - некоторые события (мероприятия) в мире, их там очень много с разными параметрами. у нас таблица с обзорами событий, их значительно меньше и хочется иметь ссылку на общий перечень событий
clickhouse не предназначен для выбора ОДНОЙ СТРОКИ по IDшнику как минимум выборка WHERE UUID IN ... и она будет медленная, потому что у вас UUID это рандомная величина всю таблицу надо будет сканировать чтобы выбрать как вы в MySQL узнаете какой UUID должен получиться "в другой сущности"?
а какой порядок кол-ва строк в таблице мероприятий (клик) и какой в таблице обзоров (мускуль)?
очень много это сколько? миллиард?
ну естественно предполагалось, что эта колонка будет проиндексирована. ну хорошо, а выбор одной строки по 2 колонкам, образующим уник это тоже не корректный юзкейс? ну мы можем по определённым колонкам выбрать из кх те строки, для которых будет связанная сущность в мускуле и просто по очереди с ними работать
в клике 200М, порядка 10М новых в неделю. у себя 60к на данный момент
индексы тут не такие как в мускуле, btree не посторишь
Обсуждают сегодня