Proposta Técnica

Agente de IA para
Área da Saúde

Desenvolvimento de um agente inteligente personalizado, com infraestrutura escalável em Docker, pronto para crescer conforme a demanda do negócio.

📅 Março de 2026 👤 Miguel Leal do Nascimento

Visão Geral

O que será entregue

Um agente de IA conversacional voltado para a área da saúde, capaz de atender pacientes/clientes, tirar dúvidas, agendar consultas e guiar processos — integrado via web, WhatsApp ou outra plataforma.

🤖

Agente Conversacional

IA treinada com base de conhecimento personalizada do cliente, respondendo dúvidas e guiando interações de forma natural.

🏥

Foco em Saúde

Configuração especializada para linguagem médica/saúde, respeitando termos técnicos e tom adequado ao setor.

📱

Multi-Plataforma

Funcionamento via interface web embarcada, com possibilidade de integração com WhatsApp, Telegram ou apps.

📈

Escalável

Arquitetura em containers Docker que permite escalar rapidamente conforme crescimento dos usuários.

Entendendo os Custos

Como funciona o consumo da IA

A inteligência artificial funciona por consumo de "tokens" — unidades de texto processado. Cada conversa gasta tokens de entrada (pergunta) e saída (resposta).

🔤 O que é um Token?

Um token é uma unidade de texto que a IA processa. Em português, 1 token ≈ 0,75 palavras. Ou seja, uma mensagem de 100 palavras consome aproximadamente 133 tokens.

Cada conversa tem dois custos: os tokens de entrada (o que o usuário envia + o contexto do sistema) e os tokens de saída (a resposta da IA). A saída é mais cara porque exige mais processamento.

GPT-4o Mini

Rápido e econômico. Ideal para 90% das interações comuns.

Entrada: $0,15 / 1M tokens
Saída: $0,60 / 1M tokens

GPT-4o

Mais inteligente. Para tarefas complexas que exigem raciocínio.

Entrada: $2,50 / 1M tokens
Saída: $10,00 / 1M tokens

        💡 Estratégia Mix: Usamos GPT-4o Mini para a grande maioria das conversas (mais barato) e GPT-4o apenas quando a IA identifica que precisa de raciocínio mais complexo. Isso reduz o custo em até 80% comparado a usar só o GPT-4o.
      

Estimativa de custo mensal com IA (somente tokens)

Baseado em média de ~800 tokens de entrada e ~400 tokens de saída por interação (chat). Usando 90% GPT-4o Mini + 10% GPT-4o. Câmbio estimado: R$ 5,30/USD.

Uso Básico

100 usuários · ~5 chats/dia

~R$ 15/mês

~$2,80 USD/mês em tokens

Chats/mês~15.000
Tokens entrada~12M
Tokens saída~6M
Custo Mini (90%)$1,90
Custo 4o (10%)$0,90

Uso Moderado

300 usuários · ~5 chats/dia

~R$ 45/mês

~$8,50 USD/mês em tokens

Chats/mês~45.000
Tokens entrada~36M
Tokens saída~18M
Custo Mini (90%)$5,70
Custo 4o (10%)$2,80

Uso Intenso

500 usuários · ~8 chats/dia

~R$ 130/mês

~$24,50 USD/mês em tokens

Chats/mês~120.000
Tokens entrada~96M
Tokens saída~48M
Custo Mini (90%)$16,60
Custo 4o (10%)$7,90

Arquitetura

Infraestrutura e Hospedagem

Toda a solução roda em containers Docker dentro de uma VPS dedicada, permitindo isolamento total dos serviços, facilidade de manutenção e escalabilidade horizontal.

👤 Usuário / Cliente Navegador ou App

HTTPS criptografado

☁️ Cloudflare CDN · DNS · SSL · DDoS

Proxy reverso

🖥️ VPS Hostinger KVM 2 4 vCPU · 8GB RAM · 100GB

🐳 Aplicação Web + API Container Docker

🗄️ Banco de Dados Container Docker

API externa (tokens)

🧠 OpenAI API GPT-4o · GPT-4o Mini

🖥️ VPS — Hostinger KVM 2

Servidor virtual dedicado com recursos garantidos. 4 vCPU, 8GB RAM, 100GB NVMe. Roda todos os serviços Docker simultaneamente: web, API, banco de dados e proxy reverso.

🐳 Por que Docker?

Cada serviço roda isolado em seu container. Isso permite: atualizar um sem derrubar o outro, escalar serviços individualmente, facilitar backups e migrar para outro servidor em minutos se necessário.

Crescimento

Escalabilidade do Sistema

A arquitetura em Docker + VPS permite que o sistema cresça junto com o negócio, sem precisar reconstruir nada do zero.

📦

Escala Vertical

Precisa de mais potência? Basta fazer upgrade do plano da VPS. Sem downtime, sem migração complexa.

🔀

Escala Horizontal

Múltiplas instâncias do mesmo serviço para atender mais usuários simultaneamente via load balancer.

💰

Custo Proporcional

Tokens da IA são cobrados por uso. Mais clientes = mais receita para cobrir o aumento proporcional de custos.

🔄

Zero Vendor Lock-in

Não ficamos presos a nenhuma plataforma. Podemos migrar de provedor, trocar modelo de IA ou expandir livremente.

Investimento

Serviços e Valores

Todos os custos detalhados do projeto, separados entre investimento inicial (mão de obra) e custos recorrentes (infraestrutura).

Item	Descrição	Valor	Tipo
Desenvolvimento do Agente Configuração, prompts, fluxos, integrações e testes	Mão de obra completa para criação do agente de IA personalizado, incluindo base de conhecimento	R$ 2.000,00 Pagamento único	Pagamento único
VPS — Hostinger KVM 2 4 vCPU · 8GB RAM · 100GB NVMe	Servidor que hospeda toda a infraestrutura Docker (aplicação, banco, proxy)	R$ 110,00/mês Preço cheio sem promoção	Recorrente mensal
Domínio Registro .com.br ou equivalente	Endereço web personalizado para o sistema	R$ 65,00/ano ~R$ 5,42/mês	Recorrente anual
API OpenAI (Tokens) GPT-4o Mini + GPT-4o (mix)	Créditos de IA consumidos por uso. Valor varia conforme volume de conversas	R$ 15 ~ R$ 130/mês Estimativa para 100-500 usuários	Recorrente por uso
Cloudflare + SSL CDN, DNS, proteção DDoS, HTTPS	Segurança e performance com certificado SSL gratuito (Let's Encrypt)	Gratuito	—
Manutenção (Opcional) Ajustes, monitoramento e suporte	Correção de bugs, melhorias nos prompts, monitoramento, suporte prioritário	R$ 300,00/mês Opcional	Recorrente mensal

Custo recorrente estimado (sem manutenção)

VPS + Domínio + Tokens (cenário básico: 100 usuários)

~R$ 130/mês

R$ 110 + R$ 5,42 + ~R$ 15

Custo recorrente estimado (sem manutenção)

VPS + Domínio + Tokens (cenário moderado: 300 usuários)

~R$ 160/mês

R$ 110 + R$ 5,42 + ~R$ 45

⚠️ Aviso Importante — Valores Estimados Os valores apresentados neste documento são estimativas e não representam o preço final. Os custos de API (tokens OpenAI) variam conforme o volume real de uso, comprimento das conversas e complexidade das interações. Valores em dólar estão sujeitos à variação cambial (câmbio de referência utilizado: R$ 5,30/USD).

Cronograma

Fases e Prazos

O desenvolvimento segue em fases claras, com um MVP funcional entregue em até 30 dias.

Fase 1 — 5 a 7 dias

Kickstart e Levantamento

Reunião de requisitos, mapeamento do agente, definição da base de conhecimento, configuração da VPS e ambiente Docker.

Fase 2 — 15 a 20 dias

Desenvolvimento e Testes

Construção do agente, prompts, interface web, integrações e banco de dados. Testes internos de qualidade.

Fase 3 — Até 30 dias

Entrega do MVP

Demo funcional completa para validação. Agente operando com base de conhecimento e interface acessível.

Fase 4 — A definir pós-MVP

Ajustes, Expansão e Suporte

Refinamento de prompts, adição de funcionalidades extras, integrações adicionais. Período de suporte incluso.

Condições

Início e Entrega

🚀 Para Iniciar

Pagamento de 30% do valor de mão de obra via Pix ou boleto. A contratação da VPS e domínio deve ser feita diretamente pelo cliente (orientamos todo o processo).

✅ Na Entrega

Após aprovação do MVP e testes finais, pagamento dos 70% restantes. O cliente terá 31 dias de suporte gratuito pós-implantação para ajustes e refinamentos.