Делаю прогноз (сумма всех продаж) на день (фичи стандарт даты, + несколько функций с ТО связанные). Точность гуд. Но скорость создания модели... печальная. Хотелось бы ускорить все это дело
Варианты которые пришли в голову (не без помощи гугла ессно)
1. У h20 есть параметр - отвечающий за макс затраченное время на создание/проверку модели, но обозначение такого потолка ухудшает общую точность модели.
2. Грузить данные с названием магазина (as.factor) в надежде что h20 это сожрет, пережуют и выплюнет конфетку (вот тут немного сомневаюсь, нид или тест или совет от более опытных коллег)
3. Распараллелить процесс (с этого и начал гуглить, но foreach создает доп сессию R, а h20 - вычисления идут на виртуальной машине джава. Если и есть способ распараллелить, то или лучше гуглить или спросить у более знающий коллег)
4. Вроде как бустинг имеет такой параметр как цпу/гпу (на чем расчеты вести), но на моем серве нет видюхи... расчеты ток на цп могу вести
Есть у кого какие мысли? Может уже кто-то сталкивался с подобной ситуацией?
Так а модель-то в h20 какая в итоге?
Обсуждают сегодня