
![]() |
Наши проекты:
Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту |
|
ПРАВИЛА | FAQ | Помощь | Поиск | Участники | Календарь | Избранное | RSS |
[18.97.14.88] |
![]() |
|
Сообщ.
#1
,
|
|
|
Здравствуйте.
Нужно из PDF получать в Word с чистой разметкой (текст в стиле заголовка, обычный текст, таблицы, изображения). Тестировал готовые решения: экспорт в Word в самом pdf, сервисы конвертирования, FineReader. На выходе получаю кашу из артефактов, причем рандомную от файла к файлу. Вопросы: 1. В PDF разметке есть ли свойство для текста "Заголовок"? Или в PDF только визуально текст выделяют как заголовок? 2. Если использоваться Python библиотеки конвертации из PDF в Word, то можно извлекать по отдельности каждый объект? 3. Если в PDF вместо 1 изображения несколько картинок и текст на слоях, можно ли их "склеить" в одну картинку? |