Pesquisar
Projeto urgente

Implementação de container serverless para IDM-VTON na RunPod (NVIDIA L40)

hoje às 17:44

Descrição do Projeto:

**Especificação de Requisito (Briefing)**

-----

**Assunto:** Especificação Técnica: Implementação de Docker serverless para IDM-VTON na RunPod (NVIDIA L40)

**Objetivo:**
Criar e realizar o deploy de uma imagem Docker otimizada para o **RunPod Serverless**, contendo o pipeline de Virtual Try-On **IDM-VTON**, rodando sobre hardware **NVIDIA L40 (48GB VRAM)**.

**1. Especificações de Infraestrutura**

* **Plataforma:** RunPod Serverless.
* **GPU target:** NVIDIA L40 (48GB VRAM).
* **Sistema base:** Linux (preferencialmente Ubuntu 22.04) com drivers compatíveis com CUDA 12.x.

**2. Requisitos da Imagem Docker (Critical Path)**
A imagem deve ser construída para minimizar o Cold Start.

* **Deep Learning Stack:** PyTorch 2.x (compilado para CUDA 12.1+).
* **Dependencies:**
* `diffusers` (Hugging Face).
* `accelerate`, `transformers`.
* **CRÍTICO:** `Detectron2` (Facebook Research). Deve ser instalado e compilado corretamente para a versão exata do PyTorch/CUDA utilizada. Atenção para incompatibilidades de wheels pré-compiladas.
* **Model caching:** O download dos pesos do modelo **IDM-VTON** (e dependências como DensePose/OpenPose) deve ocorrer durante o `docker build`, e **NÃO** no runtime. A imagem final deve conter os modelos cacheados em disco.

**3. Otimizações de Performance (L40)**

* **Flash Attention 2:** A imagem deve ter suporte e estar configurada para usar Flash Attention 2, aproveitando a arquitetura Ada Lovelace da L40.
* **Precision:** O pipeline deve rodar nativamente em `torch.float16`.
* **Uso de VRAM:** Ajustar para utilizar o máximo da VRAM disponível se necessário, priorizando a velocidade de inferência (target: < 6s por imagem).

**4. Interface de Entrada/Saída (API Handler)**
O script `handler.py` deve aceitar o payload padrão do RunPod:

* **Input (JSON):**
```json
{
"input": {
"user_image": "base64_string...",
"garment_image": "base64_string...",
"category": "upper_body", // Opcional, default para upper_body
"steps": 30 // Opcional, default 30
}
}
```
* **Processamento:**
1. Decodificar Base64.
2. Pré-processamento (DensePose/Masking automático via Detectron2).
3. Inferência IDM-VTON.
* **Output (JSON):**
```json
{
"output_image": "base64_string..."
}
```

**5. Definição de Pronto (DoD)**

1. Container sobe na RunPod sem erros de `ModuleNotFoundError` (especialmente Detectron2).
2. Endpoint recebe 2 imagens e retorna a imagem processada.
3. Tempo de Cold Start aceitável (< 20s) e tempo de inferência quente otimizado.

-----
Se você tem experiência e interesse, me chama para ajustarmos os detalhes.

Se for iniciante, agradeço o interesse, mas não tenho tempo para laboratório.

Atividades do cliente nesse projeto:

Última visualização: hoje às 17:58

Tem dúvidas? Faça uma pergunta.

ou

Enviar proposta

Informações adicionais

Categoria: Web, Mobile & Software
Subcategoria: Cloud Computing
Orçamento: Aberto
Nível de experiência: Especialista
Visibilidade: Público
Propostas: 3
Interessados: 5
Tempo restante:
Valor Mínimo: R$ 50,00

Cliente

Propostas (3)
  • Freelancer novo Promovida Aceita Aceita Rejeitada

    Submetido: | Oferta: Privado | Duração estimada: Privado

  • Freelancer novo Promovida Aceita Aceita Rejeitada

    Submetido: | Oferta: Privado | Duração estimada: Privado

  • Freelancer novo Promovida Aceita Aceita Rejeitada

    Submetido: | Oferta: Privado | Duração estimada: Privado

Nenhuma proposta foi encontrada.

Carregando...
Projetos semelhantes no 99Freelas

Freela Azure DevOps - Pipelines e automações - Stack: - Azure Pipelines - Powershell scripts - Azure cloud (AKS, Functions, LogicApp, App Service, APIM, Fabric, Service Bus) Criar pipeline para automatizar a criação de app regist...

Implementar Cloudflare for SaaS - Possuo uma plataforma SaaS de e-commerce multi-tenant. A plataforma foi desenvolvida aproximadamente 85% com IA, está totalmente funcional e em produção. Porém, agora pr...

Consultoria para criação de ambiente controlado com Nginx e Docker - Preciso de consultoria para: Criar um ambiente com Docker usando Nginx como load balancer e proxy. O banco de dados estará separado da API e do front. Não quero nada pronto, quero co...

OCR e classificação de planos no Google Sheets - Busco um desenvolvedor com experiência em Google Apps Script, Google Vision API (OCR) e automações no Google Sheets. O objetivo é criar uma solução simples...

Carregando...

Carregando...

Pesquisar

FREELANCERS
PROJETOS
Ocorreu um erro inesperado. Caso o erro persista, entre em contato conosco através do e-mail suporte@99freelas.com.br.