На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
Модераторы: RaD
  
    > Как через Python конвертировать PDF в Word с чистой разметкой?
      Здравствуйте.

      Нужно из PDF получать в Word с чистой разметкой (текст в стиле заголовка, обычный текст, таблицы, изображения).

      Тестировал готовые решения: экспорт в Word в самом pdf, сервисы конвертирования, FineReader. На выходе получаю кашу из артефактов, причем рандомную от файла к файлу.

      Вопросы:
      1. В PDF разметке есть ли свойство для текста "Заголовок"? Или в PDF только визуально текст выделяют как заголовок?
      2. Если использоваться Python библиотеки конвертации из PDF в Word, то можно извлекать по отдельности каждый объект?
      3. Если в PDF вместо 1 изображения несколько картинок и текст на слоях, можно ли их "склеить" в одну картинку?
      0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)
      0 пользователей:


      Рейтинг@Mail.ru
      [ Script execution time: 0,0224 ]   [ 15 queries used ]   [ Generated: 26.03.25, 23:52 GMT ]