для проводника ocr-pdf называется (можно загрузить из настройки/действия..). Тоесть по правой кнопки при нажатии на pdf он этот документ распознает и накладывает текстовый слой и сохраняет рядом копию этого pdf, но уже с текстовым слоем, для копирования или поиска по документу. Все отлично работает, но есть одно но - он язык по умолчанию использует английский и распознает соответственно не правильно. Этот скрипт использует консольную утилиту ocrmypdf. Если в консоли запустить распознавание с аргументом -l rus, то полученный файл такой как надо. Так вот. Как мне заставить это работать через контекстное меню, нужно что бы язык по умолчанию в ocrmypdf был русский? Тоесть использовал для распознавания tesseract rus, а не какой-нибудь другой.
Тоже стало интересно...
ocrmypdf на питоне написана, а скрип запускает .sn этой утилиты. Кто в bash силен? Нужно правильно задать аргумент -l rus в скрипте
Сам спросил и сам решил)). Не тот файл ковырял. По пути /home/user/.local/share/nemo/actions/pdf-ocr@schorschii (вместо user ставим своего пользователя). Там есть исполняемый файл ocr-pdf.sh. Вот в нем RUN= .. делаем, как на скрине ниже
Обсуждают сегодня