215 похожих чатов

Ребята, поделитесь информацией как у кого организована работа в командах?

Сорри за длинный текст).
У подавляющего большинства моих знакомых дата сайнтистов почти никогда нет ревью кода, и частенько нет ревью хода эксперимента, только анализ метрик и забор бинарных файлов-моделей. На мой взгляд, это не очень, это банально неэффективно, когда лид не чекает какие-то вещи и не дает рекомендации как что-то можно улучшить в будущем.
Я работаю параллельно в development (в том числе вывод в прод мл) и в самом мл инжиниринге, и я вижу просто огромный разрыв между организацией в dev командах и data science командах. Дело не только в devops и авто devops, ci/cd и прочем, потому что в мл сейчас вполне можно тоже и автодеплой млопсить сразу в кубер, и метрики трекать централизованно, а именно дело само в деталях мониторинга и контроля работы того, что делает дата сайнтист на уровне чистоты кода и корректности построения эксперимента, его хода, выбора решений, хотя бы на базовом уровне - ревью в гите с апрувом след стадии передачи в прод, например (есть спец аддоны для ноутбуков), выделение общих репозиториев под повторяющиеся куски кода из ноутбука в ноутбук и прочее.
Может какие-то источники хорошие посоветуете по хорошим техникам организации работы команд? Много есть примитивной воды типа описания стадийности - прототипирование, оптимизация гиперпараметров, вывод в прод и прочее - но это не организация детальная в части именно процесса выделения и ведения таски конкретной, применения конкретных инструментов.

10 ответов

15 просмотров

ods.ai там курс есть специальный))

Aleksandr- Автор вопроса
ssv
ods.ai там курс есть специальный))

ага, вижу, спасибо). Обычно в млопс курсах сразу к млфло идут, здесь кодревью даже есть)

Привет! Интересная тема. Я например на 100% за ревью всего кода, но, увы - это стоит кучу денег для бизнеса. У нас сейчас дела обстоят так - если это просо какое то исследование то ревью у нас не проходит, только если результаты подозрительные тогда обычно руководитель просит кого то из нас (но не того кто изначально писал код) повторить эксперимент либо на немного других исходных данных или еще как то. Если же речь идет про что то, что идет в прод (модель, даг записывающий резалты в бд и так далее) - то тут уже идет двойное ревью, от тимлида дс и от тимлида разрабов продукта

Aleksandr- Автор вопроса
Антон Дорохов
Привет! Интересная тема. Я например на 100% за рев...

спасибо. А ревью делаете ноутбуков или каким образом? Я вот видел платные фичи расширения для гита, где можно прямо в вебе ревьюить как обычный код, открывая диспуты по определенным ячейкам или строкам в ячейках. Но халявы такой нигде не видел

Aleksandr
спасибо. А ревью делаете ноутбуков или каким образ...

у нас весь код идущий в прод пишется в pycharm, дальше в нашу репу ДС, там проходит ревью от тимлида ДС и если это идет в прод то дальше модули перекочёвывают в репу продукта, там еще ревью тимлида разрабов и в итоге встраивается в продукт

Да, всё так. Но большинство дс-ов считают, что раз они знают математику, то соблюдать стандарты кодирования им вовсе не обязательно

Лучше соблюдать минимальные требования на код, чтоб он был человекочитаемый хотя бы. Можно взять.любую книгу по рекомендациям программирования. Выделить самое основное. Плюсы выполнения элементарных правил: - систематизация работы - увеличение собственной продуктивности - облегчение жизни команде: например, коллеги тупо будут меньше тратить времени, чтобы понять, что за "2+2" имется ввиду. Не говоря уже о чем-то умном или о введение нового человека в курс дела - гибкость моделирования. Допустим, вас попросят через месяц попросят добавить фичу, желательно быстро. И тут может быть проблема - вместо 60 мин, вы потратить нервы и еще пару часов на осмысление/вспоминание (хорошо, если проект простой), а возможно и усложнить жизнь другим - читаемость улучшает качество. Будет больно через какое-то время понять, что было что-то не так, потому "1.5+1.5 оказалось 2.5" (утрирую) - бизнес процессы ускоряются. Легче внедрить, легче поддерживать. Меньше времени вас парят вопросами "а что, а почему, а зачем" и т.п. - ну и как минииум - из минусов, кроме оправдания минимальной собственной лени - их в общем-то нет...

Aleksandr- Автор вопроса
ssv
ods.ai там курс есть специальный))

спасибо еще раз, начал смотреть первую лекцию - реально я об этом и спрашивал, супер:)

Aleksandr- Автор вопроса
Roman Nm
А как называется?

https://ods.ai/tracks/ml-in-production-spring-22

Похожие вопросы

Обсуждают сегодня

Мужики и девушки, привет) в Вelphi xe7 в настройках во вкладке "Editor Options" далее " Color" есть список: "Elements", открыв который мы можем настраивать отображение разных...
Kraszx
14
Добрый вечер. Есть вопрос, а может и предложение. Был у меня диалог в другой группе о делфи и я задался вопросом: "А нельзя ли в делфи цвет //коментария и {комментария} сде...
Kraszx
24
Я вот подумал. SSE выполняет операции максимум с 64-битной точностью. А FPU - всегда с 80-битной. Разве не должно быть FPU точнее тогда?
The Bird of Hermes
13
как быть с принтером? такой подход прокатит?
zamtmn
12
Мдя, прикол, боевая сборка запускается (именно под отладчиком) после F9 примерно полторы минуты (97 секунд если быть точным). Начал копать - проблема детектится сразу - зависа...
Александр (Rouse_) Багель
38
Всем привет! Подскажи, пожалуйста, как передать в TComboBox сразу значение и id записи. На Delphi я делал так: ComboBox1.Items.AddObject('Какое-то значение', Pointer(id запис...
Евгений
13
Здравствуйте, вопрос по структурам данных. Были у вас случаи, когда пришлось писать деревья или двунаправленные списки?
/ /
50
Я не понимаю, это троллинг или что? Швабрика поддерживают, который буквально пишет на ассемблере взаимодействия с винапи. Я это ещё написал загрузчик и хоть что-то изучаю в о...
Shadow Akira
6
А вот это что за конструкция? Вернее, она тут нафига?
Serjone
10
Привет. Подскажите, как правильно сматчить лист фиксированного размера, чтобы компилятор не говорил мне о неполном паттерне? Допустим что-то такое [x', y'] = sort [x, y]?
Arseny
8
Карта сайта