Desconexões de usuários na plataforma
Resolvido
Apr 14, 2025 at 6:37pm UTC
📝 Post-mortem — Desconexões de Usuários na Plataforma
Data: 14/04/2025
Horário: 15:09 – 15:14 (GMT-3)
Resumo do Incidente
No dia 14/04, entre 15h09 e 15h14, identificamos desconexões inesperadas de usuários em nossa plataforma, impactando os seguintes serviços:
- Back-end API
- Vox - Back-end CLI
- Controle de Telefonia
- Telefonia - Agentes
- Telefonia - Ligações
Causa Identificada
Durante a investigação, constatamos que o limite de conexões simultâneas em recursos de banco de dados foi atingido em algumas instâncias do serviço, resultando em falhas de autenticação e perda de sessão para parte dos usuários conectados.
Ação Corretiva
Realizamos um procedimento emergencial de reinicialização e limpeza de estados travados, normalizando a operação da plataforma. A causa raiz foi tratada de forma definitiva durante essa manutenção.
Próximos Passos
- Seguimos com o monitoramento contínuo da estabilidade do ambiente.
- Adicionamos novos pontos de alerta ao nosso sistema de monitoramento preventivo para mitigar recorrências semelhantes.
Serviços afetados
Atualizado
Apr 14, 2025 at 6:14pm UTC
Procedimento finalizado, plataforma normalizada.
Serviços afetados
Atualizado
Apr 14, 2025 at 6:11pm UTC
Iniciado procedimento emergencial de reinicialização e limpeza de estados travados durante a falha.
Serviços afetados
Criado
Apr 14, 2025 at 6:09pm UTC
Identificamos que alguns usuários foram desconectados da plataforma de forma inesperada.
Serviços afetados