и линейную регрессию поверх данных ClickHouse, - есть какие-то best practices?
У нас друзья сейчас разрабатывают как раз такую возможность в виде встроенных в ClickHouse функций. А пока её нет - нужно выгружать данные из ClickHouse и строить модели уже снаружи.
Про лучшие практики не знаю (самому было бы интересно), но я использую связку Clickhouse+Spark+Zeppelin. Уже год использую, очень удобно.
Обсуждают сегодня