Коллеги, всем приветик! Есть какие-то готовые решения для извлечения более менее чистых текстов из PDF? Понятно, что есть куча библиотек, которые достают текст, но там обычно...
О, ещё проверка географии чата! "подай лентяйку" - это про что? 🤪 До сих пор с этого хихикаю, что-то на ярославском (как правило) 🙈
Всем привет, что сейчас можно использовать для векторизации статьи, посвежее чем Doc2Vec? 😅