Abandono de chamadas com agentes disponíveis
Resolved
Oct 14, 2025 at 3:24am UTC
Causa Identificada
Após uma análise minuciosa, identificamos que o incidente teve origem em um aumento repentino e fora do padrão no volume de ligações durante o processo automático de redução de instâncias.
Esse comportamento inesperado causou sobrecarga em parte do serviço de telefonia, resultando em falhas temporárias no processamento e na conexão de chamadas.
Ações Corretivas e Melhorias Implementadas
Durante a noite, realizamos uma ampla revisão em toda a camada de telefonia e automação da plataforma, com o objetivo de aumentar a resiliência e eliminar pontos críticos recorrentes.
Entre as principais medidas aplicadas estão:
- Reestruturação dos agendamentos automáticos (cron jobs) para garantir que os serviços de telefonia se ajustem com precisão aos horários reais de operação.
- Aprimoramento do comportamento de escalonamento automático, tornando o processo de redução mais gradual e seguro.
- Ampliação dos tempos de desligamento controlado, evitando interrupções em chamadas ainda ativas.
- Reforço de capacidade e monitoramento, com aumento de recursos e isolamento de serviços críticos em nós dedicados.
- Expansão das instâncias de controle de chamadas (ARI), elevando a tolerância a picos inesperados de demanda.
Monitoramento Contínuo
Estamos tratando este incidente com máxima prioridade.
As medidas aplicadas visam corrigir definitivamente as causas estruturais que contribuíram para instabilidades anteriores, elevando significativamente a estabilidade da plataforma.
Seguiremos em monitoramento constante ao longo das próximas horas e dias, garantindo que todos os indicadores de desempenho se mantenham dentro da normalidade.
Affected services
Updated
Oct 13, 2025 at 8:09pm UTC
Nosso monitoramento acusa normalidade. Seguimos acompanhando.
Affected services
Updated
Oct 13, 2025 at 8:05pm UTC
Processo finalizado, plataforma liberada para uso.
Estamos monitorando se tudo foi restabelecido corretamente.
Affected services
Updated
Oct 13, 2025 at 8:02pm UTC
Monitoramento acusa que a falha ainda está ocorrendo. Identificamos grande volume de ligações presas em estado incorreto, estamos realizando o procedimento de limpeza novamente. Previsão de retorno em 3 minutos.
Affected services
Updated
Oct 13, 2025 at 7:52pm UTC
Procedimento concluído, plataforma normalizada. Seguimos investigando a causa raiz desta falha e reportaremos assim que concluirmos a análise.
Affected services
Updated
Oct 13, 2025 at 7:49pm UTC
Procedimento de limpeza e reinicialização dos componentes iniciado. Previsão de normalização em 5 minutos.
Affected services
Updated
Oct 13, 2025 at 7:44pm UTC
Identificamos o problema e estamos aplicando a correção. Previsão de normalização de 10 mintuos.
Affected services
Created
Oct 13, 2025 at 7:42pm UTC
Nossa equipe está investigando uma falha causando abandono de ligações com agentes disponíveis para receber as chamadas.
Affected services