Proposta Técnica

Agente de IA para
Área da Saúde

Desenvolvimento de um agente inteligente personalizado, com infraestrutura escalável em Docker, pronto para crescer conforme a demanda do negócio.

📅 Março de 2026 👤 Miguel Leal do Nascimento

O que será entregue

Um agente de IA conversacional voltado para a área da saúde, capaz de atender pacientes/clientes, tirar dúvidas, agendar consultas e guiar processos — integrado via web, WhatsApp ou outra plataforma.

🤖

Agente Conversacional

IA treinada com base de conhecimento personalizada do cliente, respondendo dúvidas e guiando interações de forma natural.

🏥

Foco em Saúde

Configuração especializada para linguagem médica/saúde, respeitando termos técnicos e tom adequado ao setor.

📱

Multi-Plataforma

Funcionamento via interface web embarcada, com possibilidade de integração com WhatsApp, Telegram ou apps.

📈

Escalável

Arquitetura em containers Docker que permite escalar rapidamente conforme crescimento dos usuários.

Como funciona o consumo da IA

A inteligência artificial funciona por consumo de "tokens" — unidades de texto processado. Cada conversa gasta tokens de entrada (pergunta) e saída (resposta).

🔤 O que é um Token?

Um token é uma unidade de texto que a IA processa. Em português, 1 token ≈ 0,75 palavras. Ou seja, uma mensagem de 100 palavras consome aproximadamente 133 tokens.

Cada conversa tem dois custos: os tokens de entrada (o que o usuário envia + o contexto do sistema) e os tokens de saída (a resposta da IA). A saída é mais cara porque exige mais processamento.

GPT-4o Mini
Rápido e econômico. Ideal para 90% das interações comuns.
Entrada: $0,15 / 1M tokens
Saída: $0,60 / 1M tokens
GPT-4o
Mais inteligente. Para tarefas complexas que exigem raciocínio.
Entrada: $2,50 / 1M tokens
Saída: $10,00 / 1M tokens
💡 Estratégia Mix: Usamos GPT-4o Mini para a grande maioria das conversas (mais barato) e GPT-4o apenas quando a IA identifica que precisa de raciocínio mais complexo. Isso reduz o custo em até 80% comparado a usar só o GPT-4o.

Estimativa de custo mensal com IA (somente tokens)

Baseado em média de ~800 tokens de entrada e ~400 tokens de saída por interação (chat). Usando 90% GPT-4o Mini + 10% GPT-4o. Câmbio estimado: R$ 5,30/USD.

Uso Básico
100 usuários · ~5 chats/dia
~R$ 15/mês
~$2,80 USD/mês em tokens
Chats/mês~15.000
Tokens entrada~12M
Tokens saída~6M
Custo Mini (90%)$1,90
Custo 4o (10%)$0,90
Uso Moderado
300 usuários · ~5 chats/dia
~R$ 45/mês
~$8,50 USD/mês em tokens
Chats/mês~45.000
Tokens entrada~36M
Tokens saída~18M
Custo Mini (90%)$5,70
Custo 4o (10%)$2,80
Uso Intenso
500 usuários · ~8 chats/dia
~R$ 130/mês
~$24,50 USD/mês em tokens
Chats/mês~120.000
Tokens entrada~96M
Tokens saída~48M
Custo Mini (90%)$16,60
Custo 4o (10%)$7,90

Infraestrutura e Hospedagem

Toda a solução roda em containers Docker dentro de uma VPS dedicada, permitindo isolamento total dos serviços, facilidade de manutenção e escalabilidade horizontal.

👤 Usuário / Cliente Navegador ou App
HTTPS criptografado
☁️ Cloudflare CDN · DNS · SSL · DDoS
Proxy reverso
🖥️ VPS Hostinger KVM 2 4 vCPU · 8GB RAM · 100GB
🐳 Aplicação Web + API Container Docker
🗄️ Banco de Dados Container Docker
API externa (tokens)
🧠 OpenAI API GPT-4o · GPT-4o Mini

🖥️ VPS — Hostinger KVM 2

Servidor virtual dedicado com recursos garantidos. 4 vCPU, 8GB RAM, 100GB NVMe. Roda todos os serviços Docker simultaneamente: web, API, banco de dados e proxy reverso.

🐳 Por que Docker?

Cada serviço roda isolado em seu container. Isso permite: atualizar um sem derrubar o outro, escalar serviços individualmente, facilitar backups e migrar para outro servidor em minutos se necessário.

Escalabilidade do Sistema

A arquitetura em Docker + VPS permite que o sistema cresça junto com o negócio, sem precisar reconstruir nada do zero.

📦

Escala Vertical

Precisa de mais potência? Basta fazer upgrade do plano da VPS. Sem downtime, sem migração complexa.

🔀

Escala Horizontal

Múltiplas instâncias do mesmo serviço para atender mais usuários simultaneamente via load balancer.

💰

Custo Proporcional

Tokens da IA são cobrados por uso. Mais clientes = mais receita para cobrir o aumento proporcional de custos.

🔄

Zero Vendor Lock-in

Não ficamos presos a nenhuma plataforma. Podemos migrar de provedor, trocar modelo de IA ou expandir livremente.

Serviços e Valores

Todos os custos detalhados do projeto, separados entre investimento inicial (mão de obra) e custos recorrentes (infraestrutura).

ItemDescriçãoValorTipo
Desenvolvimento do Agente
Configuração, prompts, fluxos, integrações e testes
Mão de obra completa para criação do agente de IA personalizado, incluindo base de conhecimento
R$ 2.000,00
Pagamento único
Pagamento único
VPS — Hostinger KVM 2
4 vCPU · 8GB RAM · 100GB NVMe
Servidor que hospeda toda a infraestrutura Docker (aplicação, banco, proxy)
R$ 110,00/mês
Preço cheio sem promoção
Recorrente mensal
Domínio
Registro .com.br ou equivalente
Endereço web personalizado para o sistema
R$ 65,00/ano
~R$ 5,42/mês
Recorrente anual
API OpenAI (Tokens)
GPT-4o Mini + GPT-4o (mix)
Créditos de IA consumidos por uso. Valor varia conforme volume de conversas
R$ 15 ~ R$ 130/mês
Estimativa para 100-500 usuários
Recorrente por uso
Cloudflare + SSL
CDN, DNS, proteção DDoS, HTTPS
Segurança e performance com certificado SSL gratuito (Let's Encrypt)
Gratuito
Manutenção (Opcional)
Ajustes, monitoramento e suporte
Correção de bugs, melhorias nos prompts, monitoramento, suporte prioritário
R$ 300,00/mês
Opcional
Recorrente mensal
Custo recorrente estimado (sem manutenção)
VPS + Domínio + Tokens (cenário básico: 100 usuários)
~R$ 130/mês
R$ 110 + R$ 5,42 + ~R$ 15
Custo recorrente estimado (sem manutenção)
VPS + Domínio + Tokens (cenário moderado: 300 usuários)
~R$ 160/mês
R$ 110 + R$ 5,42 + ~R$ 45
⚠️ Aviso Importante — Valores Estimados Os valores apresentados neste documento são estimativas e não representam o preço final. Os custos de API (tokens OpenAI) variam conforme o volume real de uso, comprimento das conversas e complexidade das interações. Valores em dólar estão sujeitos à variação cambial (câmbio de referência utilizado: R$ 5,30/USD).

Fases e Prazos

O desenvolvimento segue em fases claras, com um MVP funcional entregue em até 30 dias.

Fase 1 — 5 a 7 dias

Kickstart e Levantamento

Reunião de requisitos, mapeamento do agente, definição da base de conhecimento, configuração da VPS e ambiente Docker.

Fase 2 — 15 a 20 dias

Desenvolvimento e Testes

Construção do agente, prompts, interface web, integrações e banco de dados. Testes internos de qualidade.

Fase 3 — Até 30 dias

Entrega do MVP

Demo funcional completa para validação. Agente operando com base de conhecimento e interface acessível.

Fase 4 — A definir pós-MVP

Ajustes, Expansão e Suporte

Refinamento de prompts, adição de funcionalidades extras, integrações adicionais. Período de suporte incluso.

Início e Entrega

🚀 Para Iniciar

Pagamento de 30% do valor de mão de obra via Pix ou boleto. A contratação da VPS e domínio deve ser feita diretamente pelo cliente (orientamos todo o processo).

✅ Na Entrega

Após aprovação do MVP e testes finais, pagamento dos 70% restantes. O cliente terá 31 dias de suporte gratuito pós-implantação para ajustes e refinamentos.