xls? В идеале выдёргивать определённые строки(нейронка?)
искал в своё время библиотеки под файлы, которые мне нужно было распознавать ни одна из распространенных не подошла, в итоге остановился на утилите командной строки https://www.xpdfreader.com/pdftotext-man.html
Обсуждают сегодня