Juan C.

Projetos (Aguardando Propostas):

Extração de dados via OCR/NLP de comprovantes de venda (máquinas de cartão)

Outra - Web, Mobile & Software | Orçamento: Aberto | Publicado: | Propostas: 8

O objetivo deste projeto é desenvolver uma solução para captura, processamento e extração automatizada de informações textuais de comprovantes de venda de cartão de crédito a partir de imagens recebidas via API RESTful, com retorno em formato JSON estruturado e sem necessidade de armazenamento das imagens. A aplicação será capaz de lidar com múltiplos tipos de comprovantes, layouts variados de adquirentes, objetos irrelevantes na imagem, e realizar pré-processamento avançado para garantir qualidade de OCR.

Escopo Funcional
A solução deve contemplar:
- Recepção de imagens via API RESTful (formatos .jpeg, .jpg, .png)
- Detecção e segmentação de comprovantes (inclusive múltiplos por imagem)
- Remoção de ruídos, correção de inclinação e binarização
- Aplicação de OCR (offline ou baseado em cloud)
- Extração semântica com NLP e regex dos seguintes campos (Adquirente, Data, Hora, Valor da transação, Parcelamento, Bandeira do cartão, Final do número do cartão, Serial da máquina, Código da venda, Nome da empresa, CNPJ)
- Retorno via JSON estruturado com campos validados
- Execução em ambiente cloud ou servidor local, com escalabilidade para cerca de 10 mil requisições mensais
- Sem necessidade de armazenamento das imagens

Exemplo de Pipeline de Desenvolvimento Proposto
- Entrada: Recepção da imagem via API
- Pré-processamento: OpenCV, PIL — limpeza, correção de inclinação
- OCR: Tesseract, EasyOCR ou API de terceiros
- Extração de Dados: Regex + NLP (spaCy, NLTK, transformers)
- Validação: Regras sintáticas e semânticas
- Saída: JSON estruturado

Considerações Técnicas
- Suporte à execução em nuvem (AWS, Azure, GCP) ou em servidor local via Docker
- Filtragem de regiões relevantes por heurísticas de contorno
- Possibilidade de extensões futuras para armazenamento ou dashboard analítico
- Consumo estimado: 10 mil imagens/mês com tempo de resposta inferior a 3 segundos por requisição

Entregáveis Esperados
- Código-fonte e documentação técnica
- API REST pronta para produção
- Instruções de deploy local e cloud
- Conjunto de testes funcionais
- Relatório de validação de OCR com diferentes layouts

Habilidades desejadas: Web API, OCR, RESTful API, Inteligência Artificial e Python.

Ocorreu um erro inesperado. Caso o erro persista, entre em contato conosco através do e-mail suporte@99freelas.com.br.

Projetos (Aguardando Propostas):

Extração de dados via OCR/NLP de comprovantes de venda (máquinas de cartão)

Pesquisar