использовать ClickHouse в качестве feature store? И если да, где-нибудь можно об этом почитать?
Можно и нужно!
Структура данных зависит от объема данных, количества фичей и джобов которые их генерят, а так же от объема оперативки. Весь вопрос как джойнить данные и значения фичей. Мне нравиться собирать с помощью словарей, но проблема в том, что словари полностью лежат в оперативе.
наверное, вот этот туториал для этого кейса https://github.com/yandex/clickhouse-presentations/blob/master/tutorials/catboost_with_clickhouse_en.md
Обсуждают сегодня