На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
Модераторы: RaD
  
    > Как с помощью Python из файла Word удалить не нужные изображения и таблицы?
      Здравствуйте.

      После экспорта из PDF в Word (через) в файле остается много не нужных артефактов в тексте:
      - бессмысленные части картинок
      - пустые таблицы из 1 ячейки

      Подскажите как реализовать следующее решение на базе Python и Google Colab:
      1. Добавляю файл Word, через кнопку "загрузить".
      2. Вывести в интерфейсе миниатюры всех изображений и таблиц (в 1 экземпляре) с галочкой рядом.
      3. Снимаю галочки у не нужных изображений и таблиц.
      4. Подтверждаю.
      5. Из файла Word удаляются изображения и таблицы, с которых я снял галочки.
      6. Авто-скачивание файла Word на ПК.

      Пример файла Word: https://disk.yandex.ru/i/VQkZzn7LQflE1Q
        Скрипт для удаление изображений и таблиц из Word
        https://colab.research.google.com/drive/1ar...-ZnsCoKxazRKrbj
        Образец файла
        https://disk.yandex.ru/i/VQkZzn7LQflE1Q

        Таблица выводит в интерфейс.
        Изображения и фигуры из word не выводит. Помогите, пожалуйста, найти ошибку. Что поправить?
          Сможете подсказать?

          Добавлено
          Доступ к файлу гугл колаб открыл.
          0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)
          0 пользователей:


          Рейтинг@Mail.ru
          [ Script execution time: 0,0182 ]   [ 15 queries used ]   [ Generated: 27.03.25, 01:11 GMT ]