Привет! Есть у меня к вам концептуальный вопрос. У нас есть

мл модели, которые обучаются раз в день, два раза в день и раз в неделю. Данные для них готовим по аналогичному расписанию. Всё это работает в спарке и пандасе, оркестрирует это добро эрфлоу. Метрики моделей храним в млфдлу.
Мл модели в одном питонячем пакете, который ставится через Пип инсталл, пайплайны в другом. В зависимостях у пакета с пайплайнами пакет с мл'ем. И само обучение - это по сути просто ещё одна таска в эирфлоу.
И вот есть потребность обучать разные версии моделей, т.е. в тасках использовать разные версии мл пакета. С одной стороны в новых версиях есть python Virtual env оператор и можно держать просто разные venv'ы для моделей. С другой стороны, можно держать 2 (3,4, N) версий airflow, но:
1. Хочется не пересчитывать одно и то же по несколько раз. Т.е. если у нас есть базовый датасет, то переиспользовать его.
2. Не переделывать пайплайны при добавлении новой версии модели.
3. Иметь возможность использовать немного разные датасеты для обучения (например, проверяем, влияет ли добавление ещё нескольких фичей, т.е. нужно ещё несколько полей в датасете)
4. Иметь возможность одновременно иметь в проде >2 версий моделей (АБн) тестирование.
5. Хотелось бы избежать переделывания всего)
6. Не слишком всё усложнять, не строить космолётов, а иметь понятную, поддерживаемую и удобную систему.

В общем, мб есть какие-то рекомендации или бестпрактисы, чтобы не изобретать велосипед?

P.S. датасеты готовятся на спарке, а перед обучением делается .to_pandas, если это важно.
P.P.S. добавлять, заменять технологии можем без проблем, если это не влечёт за собой очень больших переделок проекта.

2 ответов

18 просмотров

Невер майнд

Oleg-Ilinsky Автор вопроса
Anton Zadorozhniy
Невер майнд

В хадупе и минио(

Похожие вопросы

Обсуждают сегодня

Добрый вечер, Пока не совсем понимаю как наладить общение между телеграм ботом и ПО для работы с сим боксом. По самому боту так понял: - Нужен некий баланс, который можно поп...
Magic
6
сделал сайт, прикрутил в боте сайт, и виджет логина. как автоматически логинить пользователя в аккаунт(телеграм), при входе с бота?
Александра Чернивецкая
5
Объясните, пожалуйста, почему компилятор ругается на использование в условии неинициализированной переменной: int x; Task.Run(async () => { x = await somefunc(); }).Wait...
Александр
5
Ребят, подскажите, пожалуйста, почему в префиксе к ассетам, которые генерируются через фильтр | theme в шаблоне, стал вдруг появляться index.php? Вот так выглядит ссылка на а...
Виталий
1
Всем привет. Ребята, подскажите, пожалуйста. у ботов есть ограничение на отправку сообщений - 30 сообщений в секунду, эти ограничения накладываются на все сообщения? или на со...
Artem Stormageddon
4
Блин, ребята, сори за тупые вопросы. А можно ли как-то открыть вебапку по нажатию на кнопку в меню(которое появляется слева, команды)?
Artem Stormageddon
3
а плаксы из-под питона умеют только в комфортных условиях что-то выдавить из себя?)
Lencore
9
Но, может, есть уже проверенная? Наши требования такие: 1. Сообщения должны приходить из Инста в CRM оду 2. Должна быть возможность подключить несколько экаунтов Инстаграм. Р...
Alexander Sharoiko MSE / Александр Шаройко
13
Это может быть все-таки не флудвейт? у меня ботфазер принимает изменения и отображает даже что они изменились, на видео видно что он прислал якобы уже измененное описание, н...
OVERLINK
13
Коллеги, может знает кто, можно ли цвет бейджа счётчика в BackendMenu менять без бубнов?
Alex Blaze
3
Карта сайта