Pesquisar

Implementação de container serverless para IDM-VTON na RunPod (NVIDIA L40)

13/12/2025 às 17:44

Descrição do Projeto:

**Especificação de Requisito (Briefing)**

-----

**Assunto:** Especificação Técnica: Implementação de Docker serverless para IDM-VTON na RunPod (NVIDIA L40)

**Objetivo:**
Criar e realizar o deploy de uma imagem Docker otimizada para o **RunPod Serverless**, contendo o pipeline de Virtual Try-On **IDM-VTON**, rodando sobre hardware **NVIDIA L40 (48GB VRAM)**.

**1. Especificações de Infraestrutura**

* **Plataforma:** RunPod Serverless.
* **GPU target:** NVIDIA L40 (48GB VRAM).
* **Sistema base:** Linux (preferencialmente Ubuntu 22.04) com drivers compatíveis com CUDA 12.x.

**2. Requisitos da Imagem Docker (Critical Path)**
A imagem deve ser construída para minimizar o Cold Start.

* **Deep Learning Stack:** PyTorch 2.x (compilado para CUDA 12.1+).
* **Dependencies:**
* `diffusers` (Hugging Face).
* `accelerate`, `transformers`.
* **CRÍTICO:** `Detectron2` (Facebook Research). Deve ser instalado e compilado corretamente para a versão exata do PyTorch/CUDA utilizada. Atenção para incompatibilidades de wheels pré-compiladas.
* **Model caching:** O download dos pesos do modelo **IDM-VTON** (e dependências como DensePose/OpenPose) deve ocorrer durante o `docker build`, e **NÃO** no runtime. A imagem final deve conter os modelos cacheados em disco.

**3. Otimizações de Performance (L40)**

* **Flash Attention 2:** A imagem deve ter suporte e estar configurada para usar Flash Attention 2, aproveitando a arquitetura Ada Lovelace da L40.
* **Precision:** O pipeline deve rodar nativamente em `torch.float16`.
* **Uso de VRAM:** Ajustar para utilizar o máximo da VRAM disponível se necessário, priorizando a velocidade de inferência (target: < 6s por imagem).

**4. Interface de Entrada/Saída (API Handler)**
O script `handler.py` deve aceitar o payload padrão do RunPod:

* **Input (JSON):**
```json
{
"input": {
"user_image": "base64_string...",
"garment_image": "base64_string...",
"category": "upper_body", // Opcional, default para upper_body
"steps": 30 // Opcional, default 30
}
}
```
* **Processamento:**
1. Decodificar Base64.
2. Pré-processamento (DensePose/Masking automático via Detectron2).
3. Inferência IDM-VTON.
* **Output (JSON):**
```json
{
"output_image": "base64_string..."
}
```

**5. Definição de Pronto (DoD)**

1. Container sobe na RunPod sem erros de `ModuleNotFoundError` (especialmente Detectron2).
2. Endpoint recebe 2 imagens e retorna a imagem processada.
3. Tempo de Cold Start aceitável (< 20s) e tempo de inferência quente otimizado.

-----
Se você tem experiência e interesse, me chama para ajustarmos os detalhes.

Se for iniciante, agradeço o interesse, mas não tenho tempo para laboratório.

Atividades do cliente nesse projeto:

Última visualização: 19/12/2025 às 11:34

Informações adicionais

Categoria: Web, Mobile & Software
Subcategoria: Cloud Computing
Orçamento: Aberto
Nível de experiência: Especialista
Visibilidade: Público
Propostas: 10
Interessados: 13
Tempo restante:
Valor Mínimo: R$ 50,00

Cliente

Propostas (10)
  • Freelancer novo Promovida Aceita Aceita Rejeitada

    Submetido: | Oferta: Privado | Duração estimada: Privado

  • Freelancer novo Promovida Aceita Aceita Rejeitada

    Submetido: | Oferta: Privado | Duração estimada: Privado

  • Freelancer novo Promovida Aceita Aceita Rejeitada

    Submetido: | Oferta: Privado | Duração estimada: Privado

  • Freelancer novo Promovida Aceita Aceita Rejeitada

    Submetido: | Oferta: Privado | Duração estimada: Privado

  • Freelancer novo Promovida Aceita Aceita Rejeitada

    Submetido: | Oferta: Privado | Duração estimada: Privado

  • Freelancer novo Promovida Aceita Aceita Rejeitada

    Submetido: | Oferta: Privado | Duração estimada: Privado

  • Freelancer novo Promovida Aceita Aceita Rejeitada

    Submetido: | Oferta: Privado | Duração estimada: Privado

  • Freelancer novo Promovida Aceita Aceita Rejeitada

    Submetido: | Oferta: Privado | Duração estimada: Privado

  • Freelancer novo Promovida Aceita Aceita Rejeitada

    Submetido: | Oferta: Privado | Duração estimada: Privado

  • Freelancer novo Promovida Aceita Aceita Rejeitada

    Submetido: | Oferta: Privado | Duração estimada: Privado

Nenhuma proposta foi encontrada.

Carregando...
Projetos semelhantes no 99Freelas

Reativar comunicação entre Windows e VPS Ubuntu 24.04 - Preciso de um técnico/programador com conhecimentos em Python e redes (Ubuntu/Windows) para colocar um sistema que já estava funcionando de volta no ar. O software roda em um computa...

Configuração ou fornecimento de proxy brasileiro (IPv4/IPv6) - Estou procurando um freelancer com experiência comprovada em proxies para ajudar em uma das duas possibilidades abaixo: - Configuração de servidor de proxy próprio, roda...

Implementação e customização de Xibo Signage - Busco um desenvolvedor com experiência comprovada em Xibo Signage (open source) para realizar a implementação completa de uma rede de sinalização digital, inspirad...

Configurar e-mails e rotina de backup em VPS - Minha hospedagem venceu e decidi trocar de provedor. Na hospedagem compartilhada eu conseguia fazer tudo normalmente, porém no VPS o processo é diferente e preciso de auxílio ...

Restaurar Moodle em servidor VPS - Minha hospedagem venceu e decidi trocar de provedor. Tenho uma aplicação Moodle que está desativada, mas gostaria de mantê-la ativa para estudos. Os backups já fo...

Carregando...

Carregando...

Pesquisar

FREELANCERS
PROJETOS
Ocorreu um erro inesperado. Caso o erro persista, entre em contato conosco através do e-mail suporte@99freelas.com.br.