215 похожих чатов

Вопрос про inference с OpenVino (версия 2023.0.1): Есть моделька ( Unet,

на pytorch) , конвертирую её в onnx, потом openvino ковертирует её в IR ( mo.convert_model(onnx_path, compress_to_fp16=True) )

Потом, когда запускаю её в inference на CPU ( AMD 5950X 16 ядер), наблюдаю что загрузка CPU ~ 180% , если никакие параметры не трогаю. Если явно прописываю использьвать 4 ядра через
core.set_property("CPU", {inference_num_threads():4}) перед компиляцией, то загрузка падает вообще до ~ 50%

Ну и сам инференс занимает очень долго - вопрос , почему так и как это починить?
Если исхдную модель на pytorch гонять в инференсе, на том-же CPU - то она даёт загрузку CPU ~ 1600% и выполняется гораздо быстрее

8 ответов

8 просмотров

а для чего тебе нужно в ONNX загнать всё?

Так OpenVIno же оптимизирован под процессоры от Intel, не ?

Vladimir-F Автор вопроса

Короче, ежели вдруг кто-то ещё на такие грабли наступит: похоже это новая фича OpenVino оптимизатора - он по умолчачнию оптимизирует на асинхронное паралельное исполнение большого количества inference. А у меня синхронное, один сэмпл за раз, но большой. Если ему прописать core.set_property("CPU", { "PERFORMANCE_HINT_NUM_REQUESTS": "1" }) то он загрузка становится примерно 700% , т.е использует половину доступных cores

Vladimir F
Короче, ежели вдруг кто-то ещё на такие грабли нас...

Загрузка 700 проц и примерно 50 проц ядер используется? Что за 700 проц

Vladimir F
AMD 5950X у него 16 cores

Владимир, а что значит 700 процентов загрузки? Типо на ядро сто процентов итого 16 ядер и получается как раз примерно половина

Vladimir-F Автор вопроса
Григорий Lᵖ space
Владимир, а что значит 700 процентов загрузки? Тип...

это линуксовые команды так показывают , top или time 100% - полная загрузка одного ядра

Похожие вопросы

Обсуждают сегодня

@MrMiscipitlick А можешь макрос написать, который будет вычислять смещение относительно переданных меток? Просто .label1-.label2, и вернуть значение.
КТ315
35
я не магистр хаскеля, но разве не может лейзи тип конвертнуться в не-лейзи запросив вычисление содержимого прям при инициализации?
deadgnom32 λ madao
100
А еще в перле можно уже @arr1 + @arr2?
Sergei Zhmylove
53
Подобного рода ;Следующие три строки это директивы ассемблера, ;которые можно не задавать, т.к.работаем в Visual Studio. ;Символ ";" - это начало однострочного комментария ...
Егор Анелькин
3
Привет всем. появился вопрос. Разрабатываю сайт, в данный момент он запущен. Хостинг beget. Добавляю на сайт яндекс метрику с помощью полей client-settings (взято отсюда http...
Andrew
2
Подскажите, где смотреть результат выполнения программы? Код: ;.686 ;Система команд процессора 686 ;.MODEL FLAT,stdcall ;Модель памяти плоская, станда...
Егор Анелькин
5
еще вопрос, допустим мы создадим char массив из 10 элементов и присвоим ему через сканф 10 символов. и выведем все символы. Хотел спросить последний элемент /0 будет включать...
Anthem
11
открыть папку в проводнике: 1 - ShellExecute 2 - ExecuteProcess 3 - OpenDocument что лучше выбрать?
Alexey Kulakov
12
Изменение типа с SomeException на String и правда удобней @cheese_hs . А вот такой вариант насколько некрасив еще? loadConfigDB :: IO (Either String ConfigDataBase) loadConfi...
Camara
7
Только сейчас дошли руки до Orange pi 5. Это нормально что на нем YOLOv5s выдает 1 кадр раз в 2-3 секунды на CPU? Это без оптимизаций и прочих настроек, просто голый запуск че...
Denis
10
Карта сайта