Aplicativo web funcional construído em Streamlit para a leitura de arquivos PDF e conversão automática do seu texto em formato Markdown (.md).
Ele utiliza a biblioteca subjacente pymupdf4llm para realizar uma extração de texto em alta fidelidade voltada para documentação em geral ou para uso direto em modelos de linguagem (LLMs).
Acesse a interface, clique em Browse files e faça o upload de um documento PDF. O sistema salva o arquivo localmente de maneira temporária, aciona o script subjacente para efetuar a leitura com pymupdf e disponibiliza para o usuário um botão para baixar o retorno .md.
Pré-requisito: Python 3 instalado na sua máquina.
- Clone esse repositório:
git clone https://github.com/SEU-USUARIO/NOME-DO-REPOSITORIO.git
cd "NOME-DO-REPOSITORIO"- Crie um ambiente virtual (recomendado):
python -m venv venv- Ative o ambiente virtual:
- Mac/Linux:
source venv/bin/activate- Windows:
venv\Scripts\activate- Instale as dependências:
pip install -r requirements.txtInicie o servidor do Streamlit:
streamlit run app.pyO navegador abrirá automaticamente em http://localhost:8501.