Pdf-extract-API
RSS-Bridge was unable to find the content of this post.
This media is not supported in your browser
VIEW IN TELEGRAM
Pdf-extract-API
Проект предлагает инструмент для конвертации изображений и PDF-файлов в текст форматов Markdown и JSON с высокой точностью, включая поддержку табличных данных и математических формул.
Он основан на FastAPI, использует Celery для асинхронной обработки и Redis для кэширования результатов OCR, предоставляя различные стратегии для конвертации, такие как Marker, Surya-OCR и Tesseract, а также возможность удаления персонально идентифицируемой информации.
https://github.com/CatchTheTornado/pdf-extract-api
👁 ****@open_source_friend
#lang_ru #ru #opensourcefriend #открытыйисходныйкод #opensource
There are no comments yet.