текст с определенного PDF-файла с таблицей.
Так как PDFkit некорректно соблюдает очередность извлеченного текста, приходится сперва переводить PDF в картинку, а потом с картинки через фреймворк Vision считывать текст и сортировать по координатам.
Есть такая проблема: Если PDF довольно длинный, то по какой-то причине картинка получается не очень высокого разрешения, из-за чего Vision некачественно распознает текст.
Есть ли возможность как-то железно указать разрешение картинки при конвертации PDF -> Image через PDFkit ?
да я пробовал, тут проблема не в качестве. Изначально PDF-файл очень хорошо читаемый, но, если я правильно понял, при конвертации выбирается слишком небольшое разрешение и для фреймворка Vision его не хватает, чтобы правильно прочитать текст.
Обсуждают сегодня