Pesquisar

Juan C.

(0.0 - 0 avaliações)

Projetos concluídos: 0 | Recomendações: 0 | Registrado desde: 04/08/2025

Projetos (Aguardando Propostas):

  • Extração de dados via OCR/NLP de comprovantes de venda (máquinas de cartão)

    Outra - Web, Mobile & Software | Orçamento: Aberto | Publicado: | Propostas: 8

    O objetivo deste projeto é desenvolver uma solução para captura, processamento e extração automatizada de informações textuais de comprovantes de venda de cartão de crédito a partir de imagens recebidas via API RESTful, com retorno em formato JSON estruturado e sem necessidade de armazenamento das imagens. A aplicação será capaz de lidar com múltiplos tipos de comprovantes, layouts variados de adquirentes, objetos irrelevantes na imagem, e realizar pré-processamento avançado para garantir qualidade de OCR.

    Escopo Funcional
    A solução deve contemplar:
    - Recepção de imagens via API RESTful (formatos .jpeg, .jpg, .png)
    - Detecção e segmentação de comprovantes (inclusive múltiplos por imagem)
    - Remoção de ruídos, correção de inclinação e binarização
    - Aplicação de OCR (offline ou baseado em cloud)
    - Extração semântica com NLP e regex dos seguintes campos (Adquirente, Data, Hora, Valor da transação, Parcelamento, Bandeira do cartão, Final do número do cartão, Serial da máquina, Código da venda, Nome da empresa, CNPJ)
    - Retorno via JSON estruturado com campos validados
    - Execução em ambiente cloud ou servidor local, com escalabilidade para cerca de 10 mil requisições mensais
    - Sem necessidade de armazenamento das imagens

    Exemplo de Pipeline de Desenvolvimento Proposto
    - Entrada: Recepção da imagem via API
    - Pré-processamento: OpenCV, PIL — limpeza, correção de inclinação
    - OCR: Tesseract, EasyOCR ou API de terceiros
    - Extração de Dados: Regex + NLP (spaCy, NLTK, transformers)
    - Validação: Regras sintáticas e semânticas
    - Saída: JSON estruturado

    Considerações Técnicas
    - Suporte à execução em nuvem (AWS, Azure, GCP) ou em servidor local via Docker
    - Filtragem de regiões relevantes por heurísticas de contorno
    - Possibilidade de extensões futuras para armazenamento ou dashboard analítico
    - Consumo estimado: 10 mil imagens/mês com tempo de resposta inferior a 3 segundos por requisição

    Entregáveis Esperados
    - Código-fonte e documentação técnica
    - API REST pronta para produção
    - Instruções de deploy local e cloud
    - Conjunto de testes funcionais
    - Relatório de validação de OCR com diferentes layouts

    Habilidades desejadas: Web API, OCR, RESTful API, Inteligência Artificial e Python.

Carregando...

Carregando...

Pesquisar

FREELANCERS
PROJETOS
Ocorreu um erro inesperado. Caso o erro persista, entre em contato conosco através do e-mail suporte@99freelas.com.br.