Sobre mim:
Atuo no desenvolvimento de soluções de IA Generativa, LLMs Open Source e AI Agents, aplicando RAG, Automação e Integração Multimodal (Texto, Imagem, Áudio e Vídeo) em projetos que geram impacto direto nos negócios.
Possuo experiência em NLP, Visão Computacional, OCR, Transcrição de Áudio (STT), Síntese de Voz (TTS) e Geração de Imagens e Vídeos com IA Generativa.
Trabalhei em projetos para grandes empresas como Caixa Econômica Federal, Condor e Nissan, desenvolvendo desde automações corporativas, extração e análise inteligente de documentos em larga escala e até simuladores imersivos em VR.
Sou movido pelo desafio de criar soluções disruptivas, integrando IA Generativa, Automação, Visão Computacional e as tecnologias certas para transformar problemas em resultados reais.
Áreas de Atuação e Especialidades:
Modelos Open Source: LLama 3.3, Deepseek-R1, Mistral, Qwen-2.5, Phi-4, Minicpm-v.
-Quantização: Redução de tamanho e otimização de desempenho de LLMs e modelos de visão, focando em eficiência e baixa latência e uso otimizado de recursos computacionais.
GPT e Gemini: API, Assistants, Fine-tuning, Vision.
RAG Multimodal: Recuperação de texto, imagens, vídeos, áudios e documentos.
Embeddings e Bancos Vetoriais: Weaviate, Chroma.
TF-IDF: Indexação e extração de palavras-chave em grandes volumes de documentos.
AI Agents: Desenvolvimento de agentes autônomos e arquitetura multi com agentes com funções específicas dentro do projeto.
Resumo da experiência profissional:
Texto:
-Extração de insights e automação de respostas.
-Embeddings: Vetorização e busca semântica em documentos e bases de conhecimento.
-Desenvolvimento de Chatbots inteligentes.
-Converse com seus dados: IA aplicada para responder com base em qualquer fonte de dados
Audio:
-Transcrição de Áudio (Speech-to-Text): Conversão de voz para texto com Whisper e outros modelos.
-TTS (Text-to-Speech): Síntese de fala natural por IA.
-Tradução de audio
Video:
-Transcrição e resumo de video
-Criação de videos curtos com IA Generativa
-Dublagem de videos em diferentes idiomas.
Visão Computacional:
-OCR para Documentos Extração e análise de textos de imagens e PDFs digitalizados.
-Técnicas Clássicas de Processamento: Otsu, Binarização, Canny, Análise de Contornos, Segmentação para limpeza, separação e otimização de imagens de documentos.
-YOLOv8 e OpenCV: Detecção e reconhecimento visual.
Machine Learning e Redes Neurais
-Modelagem de Tópicos e Clustering: LDA, K-Means.
-Redução de Dimensionalidade: PCA, UMAP.
-CNNs: Aplicação de redes neurais para identificação automática de padrões de layout.