инференса нейросети классификации изображений в продакте.
Выводы анализируются оператором и корректируются при необходимости, т.к. система риалтайм.
Все работает, все отлично.
Вопрос: реально ли приладить к этой системе RL без потери производительности?
Пример: оператор даёт класс, отличный от выхода нейросети, сеть корректирует веса с небольшим шагом и продолжает функционировать.
Буду благодарен за любые ссылки и контакты, третий день нормальных примеров не могу нагуглить
Зачем тут rl?
Обсуждают сегодня