Implementação de container serverless para IDM-VTON na RunPod (NVIDIA L40)

13/12/2025 às 17:44

Descrição do Projeto:

**Especificação de Requisito (Briefing)**

-----

**Assunto:** Especificação Técnica: Implementação de Docker serverless para IDM-VTON na RunPod (NVIDIA L40)

**Objetivo:**
Criar e realizar o deploy de uma imagem Docker otimizada para o **RunPod Serverless**, contendo o pipeline de Virtual Try-On **IDM-VTON**, rodando sobre hardware **NVIDIA L40 (48GB VRAM)**.

**1. Especificações de Infraestrutura**

* **Plataforma:** RunPod Serverless.
* **GPU target:** NVIDIA L40 (48GB VRAM).
* **Sistema base:** Linux (preferencialmente Ubuntu 22.04) com drivers compatíveis com CUDA 12.x.

**2. Requisitos da Imagem Docker (Critical Path)**
A imagem deve ser construída para minimizar o Cold Start.

* **Deep Learning Stack:** PyTorch 2.x (compilado para CUDA 12.1+).
* **Dependencies:**
* `diffusers` (Hugging Face).
* `accelerate`, `transformers`.
* **CRÍTICO:** `Detectron2` (Facebook Research). Deve ser instalado e compilado corretamente para a versão exata do PyTorch/CUDA utilizada. Atenção para incompatibilidades de wheels pré-compiladas.
* **Model caching:** O download dos pesos do modelo **IDM-VTON** (e dependências como DensePose/OpenPose) deve ocorrer durante o `docker build`, e **NÃO** no runtime. A imagem final deve conter os modelos cacheados em disco.

**3. Otimizações de Performance (L40)**

* **Flash Attention 2:** A imagem deve ter suporte e estar configurada para usar Flash Attention 2, aproveitando a arquitetura Ada Lovelace da L40.
* **Precision:** O pipeline deve rodar nativamente em `torch.float16`.
* **Uso de VRAM:** Ajustar para utilizar o máximo da VRAM disponível se necessário, priorizando a velocidade de inferência (target: < 6s por imagem).

**4. Interface de Entrada/Saída (API Handler)**
O script `handler.py` deve aceitar o payload padrão do RunPod:

* **Input (JSON):**
```json
{
"input": {
"user_image": "base64_string...",
"garment_image": "base64_string...",
"category": "upper_body", // Opcional, default para upper_body
"steps": 30 // Opcional, default 30
}
}
```
* **Processamento:**
1. Decodificar Base64.
2. Pré-processamento (DensePose/Masking automático via Detectron2).
3. Inferência IDM-VTON.
* **Output (JSON):**
```json
{
"output_image": "base64_string..."
}
```

**5. Definição de Pronto (DoD)**

1. Container sobe na RunPod sem erros de `ModuleNotFoundError` (especialmente Detectron2).
2. Endpoint recebe 2 imagens e retorna a imagem processada.
3. Tempo de Cold Start aceitável (< 20s) e tempo de inferência quente otimizado.

-----
Se você tem experiência e interesse, me chama para ajustarmos os detalhes.

Se for iniciante, agradeço o interesse, mas não tenho tempo para laboratório.

Habilidades desejadas:

Aprendizagem Profunda CUDA Docker Sistema de Gestão de Aprendizagem (LMS) Ubuntu

Atividades do cliente nesse projeto:

Última visualização: 19/12/2025 às 11:34

Informações adicionais

Categoria:	Web, Mobile & Software
Subcategoria:	Cloud Computing
Orçamento:	Aberto
Nível de experiência:	Especialista
Visibilidade:	Público
Propostas:	10
Interessados:	13
Tempo restante:
Valor Mínimo:	R$ 50,00

Cliente

Rogerio F.

Propostas (10)

Sérgio V.

Freelancer novo Promovida Aceita Aceita Rejeitada

Submetido: | Oferta: Privado | Duração estimada: Privado
Steply

Freelancer novo Promovida Aceita Aceita Rejeitada

Submetido: | Oferta: Privado | Duração estimada: Privado
Mayckon G.

Freelancer novo Promovida Aceita Aceita Rejeitada

Submetido: | Oferta: Privado | Duração estimada: Privado
Vitória M.

Freelancer novo Promovida Aceita Aceita Rejeitada

Submetido: | Oferta: Privado | Duração estimada: Privado
Maikon D.

Freelancer novo Promovida Aceita Aceita Rejeitada

Submetido: | Oferta: Privado | Duração estimada: Privado
Fabricio B.

Freelancer novo Promovida Aceita Aceita Rejeitada

Submetido: | Oferta: Privado | Duração estimada: Privado
Cleber D.

Freelancer novo Promovida Aceita Aceita Rejeitada

Submetido: | Oferta: Privado | Duração estimada: Privado
Ana K.

Freelancer novo Promovida Aceita Aceita Rejeitada

Submetido: | Oferta: Privado | Duração estimada: Privado
Arthur g.

Freelancer novo Promovida Aceita Aceita Rejeitada

Submetido: | Oferta: Privado | Duração estimada: Privado
Claudiomar E.

Freelancer novo Promovida Aceita Aceita Rejeitada

Submetido: | Oferta: Privado | Duração estimada: Privado

Nenhuma proposta foi encontrada.

Projetos semelhantes no 99Freelas

Integração Microsoft Entra ID e Intune - 63 dispositivos Windows - Estamos buscando profissional com experiência comprovada em Microsoft Entra ID (Azure AD) e Microsoft Intune para executar projeto de integração de aproximadamente 63 dispositiv...

Projeto de arquitetura especializada em AWS - Projeto que necessita da estruturação de um ambiente AWS e da otimização da arquitetura, com atuação especializada em AWS. Prazo do projeto: 6 meses.

API Node.js em TypeScript para TEF Scope (PinPAD PPC-930) - Preciso de um projeto em Node.js com TypeScript e Express para integrar com o TEF Scope da Tech Provider. Deve implementar o fluxo de venda com cartão de crédito, cartão de d&e...

Engenheiro de Dados Sênior - Azure e Databricks - Vaga: Engenheiro(a) de Dados Sênior – Azure + Databricks Projeto: Ingestão de dados e arquitetura Medallion (Bronze / Silver / Gold) Descrição do projeto Estamos ...

Ajuste em VPS e cPanel - Urgente O que precisa ser feito: • Migração completa do banco de dados para o novo ambiente (VPS/cPanel). • Garantir que o site continue funcionando normalmente apó...

Carregando...