Pesquisar

Scraping de arquivo .PDF ou TXT (implementação Regex ou similar)

19/10/2020 às 23:21

Descrição do Projeto:

Tenho arquivo em PDF (todo estruturado e com leiaute definido) que preciso extrair via scraping determinadas informações dele para um banco de dados em .excel.

Neste arquivo, podem ocorrer várias ocorrências desta informação que preciso extrair, que ao achar determinado critério de inicio e fim, me copie cada elemento para uma coluna do .excel.

No arquivo, como dito acima, consigo definir o inicio e fim de cada busca, bem como os elementos que preciso copiar.

Caso for útil essa informação, eu consegui um código em python (via github) que consigo extrair o .pdf em .txt. Caso for mais fácil retirar as informações do .txt do que .pdf via regex ou similar, também tem essa possibilidade de implementação.

Como é uma tarefa diária que preciso realizar, preciso que o código busque em determinada pasta o .pdf (ou .txt no caso de usar o código do github) e copie para as linhas abaixo da copiada no dia anterior.

Disto, a principio a contratação seria para implementar o código regex ou função similar para buscar determinados textos do arquivo. Mas caso for necessário para automatizar melhor, podemos conversar sobre todos os aspectos.

Para mais detalhes do arquivo a ser extraído, favor mandar mensagem.

Atividades do cliente nesse projeto:

Última visualização: 09/12/2021 às 13:27

Informações adicionais

Categoria: Web, Mobile & Software
Subcategoria: Desenvolvimento Desktop
Orçamento: Aberto
Nível de experiência: Iniciante
Visibilidade: Público
Propostas: 29
Propostas excluídas: 29
Interessados: 50
Tempo restante:
Valor Mínimo: R$ 50,00

Cliente

Propostas (0)

Nenhuma proposta foi encontrada.

Carregando...
Projetos semelhantes no 99Freelas

Recuperar backup de Windows Server 2012 R2 - Tinha uma VPS e precisei interromper os trabalhos. Na época foi feita uma imagem de backup do server. Tenho essa imagem e agora preciso recuperá-la em um servidor local.

Extrair dados de PHP para Excel - O projeto visa extrair conteúdo de páginas em PHP e salvar em Excel. Possuo diversas páginas/arquivos em .php e gostaria de extrair as informações desses arquivo...

Integração JSON Dialogflow - Integração Dialogflow WhatsApp, tenho sistema da Stackpost que utiliza o Baileys para WhatsApp, preciso integrar o arquivo JSON do Dialogflow.

Desenvolvimento de aplicação em java - O objetivo deste projeto é desenvolver uma aplicação simples em Java que simula uma máquina de pedidos de lanches. A aplicação permitirá que os usu&...

Sistema de Copy Trade para Metatrader 5 - WebSockets - Eu possuo um sistema de copy trade feito usando WebRequest e preciso que seja alterado para funcionar usando WebSockets. O sistema funciona direitinho, mas preciso que ele ganhe velocidade na execu...

Carregando...

Carregando...

Pesquisar

FREELANCERS
PROJETOS
Ocorreu um erro inesperado. Caso o erro persista, entre em contato conosco através do e-mail suporte@99freelas.com.br.