чтения содержимого PDFок?
Хы, я на чисто луа что-то писал в своё время, там типа пдф разбивается на блоки, берётся блок с таблицей замен символов, и из остальных блоков извлекается текст через замену )
Уже разобрался - как раз сейчас в линухе сижу, в линухах уже давно есть простенькая в использовании утилитка - pdftotext, в консоли выполнить pdftotext file.pdf file.txt и утилитка перегоняет pdf в чистый текст без картинок, уже попробовал, примерно 50ти страничный PDF она перегнала мне в TXT так быстро я даже не успел заметить, и весь текст там есть, ну а дальше простой текст можно парсить уже хоть луа хоть чем
Обсуждают сегодня