Pesquisar

Scraping de arquivo .PDF ou TXT (implementação Regex ou similar)

19/10/2020 às 23:21

Descrição do Projeto:

Tenho arquivo em PDF (todo estruturado e com leiaute definido) que preciso extrair via scraping determinadas informações dele para um banco de dados em .excel.

Neste arquivo, podem ocorrer várias ocorrências desta informação que preciso extrair, que ao achar determinado critério de inicio e fim, me copie cada elemento para uma coluna do .excel.

No arquivo, como dito acima, consigo definir o inicio e fim de cada busca, bem como os elementos que preciso copiar.

Caso for útil essa informação, eu consegui um código em python (via github) que consigo extrair o .pdf em .txt. Caso for mais fácil retirar as informações do .txt do que .pdf via regex ou similar, também tem essa possibilidade de implementação.

Como é uma tarefa diária que preciso realizar, preciso que o código busque em determinada pasta o .pdf (ou .txt no caso de usar o código do github) e copie para as linhas abaixo da copiada no dia anterior.

Disto, a principio a contratação seria para implementar o código regex ou função similar para buscar determinados textos do arquivo. Mas caso for necessário para automatizar melhor, podemos conversar sobre todos os aspectos.

Para mais detalhes do arquivo a ser extraído, favor mandar mensagem.

Atividades do cliente nesse projeto:

Última visualização: 09/12/2021 às 13:27

Informações adicionais

Categoria: Web, Mobile & Software
Subcategoria: Desenvolvimento Desktop
Orçamento: Aberto
Nível de experiência: Iniciante
Visibilidade: Público
Propostas: 29
Propostas excluídas: 29
Interessados: 50
Tempo restante:
Valor Mínimo: R$ 50,00

Cliente

Propostas (0)

Nenhuma proposta foi encontrada.

Carregando...
Projetos semelhantes no 99Freelas

Postagens automáticas em mídias sociais - Preciso de um site que faça postagens automáticas nas redes sociais, como Instagram, TikTok e Kwai. Pode ser um programa.

Instalação do Apache Superset no Windows Server 2022 - Preciso instalar o Apache Superset no Windows Server 2022. Eu consigo instalar no Windows normal via Docker, mas não consegui fazer no Windows Server, nem via Docker nem via WSL.

Aplicativo para saúde visual em Windows - Aplicativo para Windows capaz de manter a tela em movimento, de modo que o usuário sempre esteja com os olhos se movendo enquanto usa o PC. Um pouco mais sobre a teoria por trás dest...

Desenvolvimento de plugin para Revit - Preciso criar um plugin para Revit. Tenho a ideia e preciso de alguém com experiência para desenvolver.

Desenvolver software de USDT Flashing - Estou procurando um desenvolvedor que possa criar um software portátil de USDT Flashing na rede principal (baseado em Windows, de preferência Windows 10). Os requisitos são os s...

Carregando...

Carregando...

Pesquisar

FREELANCERS
PROJETOS
Ocorreu um erro inesperado. Caso o erro persista, entre em contato conosco através do e-mail suporte@99freelas.com.br.