разделения ресурсов, в частности самой модели? Пробовал 2 подхода использую pqdm.threads.pqdm - скопировать для каждой итерации (игры) инстанс окружения, но оставить общую ссылку на модель для предсказания экшенов, работает по скорости примерно как и без параллелизма из-за GIL. Второй - копировать и окружение и модель для каждой итерации(игры). Пробовал tf.keras.models.clone_model, работает, но по скорости хуже в два раза, чем без параллелизма (4 воркера), пробовал copy.deepcopy, не работает, ловлю AssertionError на предикте
А у модели есть память куда складывается прошлый опыт?
метод модели fit() возвращает объект с историей метрик, но он вызывается вне параллельной секции. Примерно выглядит так while True: # цикл обучения ... for _ in range(game_per_epoch): # цикл который нужно параллелить for step in range(steps_per_game): # тут находится model.predict() .... # end step ... # end game # end games ... model.fit()
Обсуждают сегодня