Как буд то ты сделал скрин всего содержимого файла, удалил все содержимое из файла и вставил скрин? Есть идеи? Желательно не слишком трудоемко...
https://stackoverflow.com/questions/63315215/capturing-screenshot-and-saving-to-a-document-with-python-background-script Вот это похоже на то, что нужно.
1. За бабло - https://developer.pdf4me.com/docs/api/getting-started/ https://cloudmersive.medium.com/how-to-convert-docx-to-jpg-in-python-a1c46e1b398c 2. Нищеброд эдишен в пдф (например так https://stackoverflow.com/questions/6011115/doc-to-pdf-using-python) потом из пдф в джпег (например так https://www.geeksforgeeks.org/convert-pdf-to-image-using-python/)
Докх в хтмл затем известно как?
попробовал сейчас, конвертация docx в html очень сильно по качеству бьет...мне так не подойдет
А зачем, просто для справки, может так больше ясности будет. Просто если смогли залезть в ворд и сделать его скрин, то наверное можно получить форматирование и прочее
Тут суть в том что бы собрать конечный pdf уже из картинок, а не из текста, чтобы если кто то захотел через онлайн-конвертер сделать из него docx, то получил бы просто набор скриншотов в файле
Это типо конвертер пдф в доск?
Распознает. А чистый текст хорошо распознается.
тестил на 2-ух конвертаторах, не распознают. к тому же далеко не везде чистый текст...
https://stackoverflow.com/questions/6011115/doc-to-pdf-using-python
а, мне же впринципе достаточно конвертнуть docx в jpeg, а jpeg затем в pdf или типо такого...
Обсуждают сегодня