
![]() |
Наши проекты:
Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту |
|
ПРАВИЛА | FAQ | Помощь | Поиск | Участники | Календарь | Избранное | RSS |
[18.97.14.88] |
![]() |
|
Сообщ.
#1
,
|
|
|
Здравствуйте.
После экспорта из PDF в Word (через) в файле остается много не нужных артефактов в тексте: - бессмысленные части картинок - пустые таблицы из 1 ячейки Подскажите как реализовать следующее решение на базе Python и Google Colab: 1. Добавляю файл Word, через кнопку "загрузить". 2. Вывести в интерфейсе миниатюры всех изображений и таблиц (в 1 экземпляре) с галочкой рядом. 3. Снимаю галочки у не нужных изображений и таблиц. 4. Подтверждаю. 5. Из файла Word удаляются изображения и таблицы, с которых я снял галочки. 6. Авто-скачивание файла Word на ПК. Пример файла Word: https://disk.yandex.ru/i/VQkZzn7LQflE1Q |
Сообщ.
#2
,
|
|
|
Скрипт для удаление изображений и таблиц из Word
https://colab.research.google.com/drive/1ar...-ZnsCoKxazRKrbj Образец файла https://disk.yandex.ru/i/VQkZzn7LQflE1Q Таблица выводит в интерфейс. Изображения и фигуры из word не выводит. Помогите, пожалуйста, найти ошибку. Что поправить? |
Сообщ.
#3
,
|
|
|
Сможете подсказать?
Добавлено Доступ к файлу гугл колаб открыл. |