Я сейчас пересчитаю все на проме. Максимально весь датасэт на всех экспериментах обвесил дампами в пикл. Посмотрю, если nan нет и распределния не пляшут, то буду оформлять баг наверное. Также прорабатываю гипотезу коррапта данных при записи в КликХаус. Вернусь к вам позже.
Окей
Лагает точно не катбуст. Сохранил пиклы перед записью в клик. Значения корректные(из распределения y). Либо спарк, либо КликХаус
Обсуждают сегодня