и прочее
                  
                  
                  сейчас используется PDF.js и его метод getPage и в принципе норм, но как опознать например таблицы в PDF? он все вытаскивает в виде отдельных строк и их координат
                  
                  
                
Конвертируй pdf в html, потом его парси
Обсуждают сегодня