При работе с файлами PDF или переносимого формата документов иногда вам может потребоваться извлечь весь текст из файла PDF. В этом руководстве мы покажем, как можно легко извлекать текст из файлов PDF или конвертировать PDF-файлы в текстовые файлы в Windows с помощью онлайн-инструментов или без них.
Самый простой и быстрый способ извлечь текст из PDF-файлов — воспользоваться бесплатными онлайн-сервисами. Эти онлайн-сервисы не требуют какого-либо дополнительного программного обеспечения, а это означает, что вы можете выполнять свою работу без необходимости устанавливать какое-либо дополнительное программное обеспечение на свой компьютер.
Если нижеуказанные онлайн-сервисы не дают желаемых результатов или вы хотите извлечь текст из конфиденциального файла, который не хотите загружать на удаленный сервер, вы можете воспользоваться бесплатным программным обеспечением для Windows, упомянутым в методах с 3 по 5.. Также прочтите наше руководство по 6 способов сжать PDF-файлы .
Метод 1 из 6
ИзвлечьPDF
ИзвлечьPDF – это бесплатный онлайн-сервис для дополнения текста и изображений из файлов PDF. Сервис предлагает понятную структуру. Открыв страницу ExtractPDF в веб-браузере, нажмите кнопку «Обзор», чтобы выбрать файл PDF, нажмите кнопку «Загрузить», чтобы загрузить выбранный файл на сервер ExtractPDF и начать извлечение.
После завершения работы вы увидите варианты загрузки текстового контекста, шрифтов и изображений из загруженного PDF-файла. Чтобы загрузить извлеченный текст в виде файла.txt (чтобы открыть его в Блокноте или Word), перейдите на вкладку «Текст» и нажмите кнопку «Загрузить результат как файл».
Как видно на рисунке выше, сервис не поддерживает файлы размером более 12 МБ. Это ограничение не должно быть программным, поскольку размер большинства PDF-файлов не превышает 12 МБ.
Во время тестирования мы заметили, что для некоторых PDF-файлов служба не дает желаемого результата. Если у вас возникли проблемы с этим сервисом, воспользуйтесь следующим.
Метод 2 из 6
Онлайн-распознавание текста
Онлайн-распознавание текста – это онлайн-инструмент, который поможет вам извлечь текст из PDF-файлов размером менее 5 МБ. Сервис конвертирует PDF-файлы в редактируемые файлы Microsoft Word (.docx) или текстовые (.txt).
Метод 3 из 6
Просмотр STDU
По сути, СТДУ Просмотрщик — это бесплатное программное обеспечение, предназначенное для открытия и просмотра файлов различных форматов. Кроме того, бесплатная версия STDU Viewer поддерживает экспорт текстового содержимого из файлов PDF.
Чтобы экспортировать текстовое содержимое PDF-файла, откройте PDF-файл с помощью STDU Viewer, выберите меню «Файл», нажмите «Экспорт», нажмите «В текст», выберите место для сохранения нового текстового файла и нажмите кнопку «ОК».
Опция экспорта позволяет извлекать текст из одной, нескольких или всех страниц. Размер загрузки STDU Viewer не превышает 3 МБ. Бесплатная версия STDU Viewer предназначена только для личного и некоммерческого использования.
Метод 4 из 6
Пилотная версия PDF2Text
PDF2Текст Пилотный проект — это бесплатное программное обеспечение для Windows, позволяющее конвертировать PDF-файлы в текстовые файлы одним щелчком мыши. После установки и запуска программного обеспечения вам просто нужно выбрать PDF-файлы, которые вы хотите видеть как текстовые файлы, а затем нажать кнопку «Преобразовать». Конвертированные файлы будут готовы через пару секунд.
Сильной стороной PDF2Text Pilot является его простой интерфейс и возможность конвертировать несколько PDF-файлов одновременно.
Метод 5 из 6
Экстрактор текста в формате A-PDF
Экстрактор текста A-PDF — еще одно программное обеспечение для Windows, предназначенное для извлечения текста из файлов PDF. Программное обеспечение абсолютно бесплатно как для личного, так и для коммерческого использования.
После установки A-PDF Text Extractor (размер установщика менее 1 МБ) запустите A-PDF Text Extractor. Нажмите кнопку «Открыть», чтобы открыть PDF-файл, а затем нажмите кнопку «Извлечь текст», чтобы начать извлечение из него текста.
Метод 6 из 6
Программа чтения PDF-файлов Gaaiho
Гаайхо PDF-ридер — отличное программное обеспечение, предназначенное для работы с PDF-файлами. Это бесплатное программное обеспечение предлагает множество функций, которые вы не найдете в других бесплатных программах для чтения PDF-файлов. Одной из функций является возможность легко извлекать текст из файлов PDF.
Чтобы сохранить PDF-файл как текстовый файл, после открытия PDF-файла в Gaaiho Reader выберите меню «Файл», нажмите «Сохранить как», а затем выберите параметр «PDF в текст» в раскрывающемся меню рядом с пунктом «Сохранить как тип».
Что вы думаете об этих инструментах? Знаете ли вы лучший бесплатный инструмент для той же работы? Дайте нам знать в комментариях.