Abandono de chamadas com agentes disponíveis
Resolvido
14 Out, 12:24am GMT-3
Causa Identificada
Após uma análise minuciosa, identificamos que o incidente teve origem em um aumento repentino e fora do padrão no volume de ligações durante o processo automático de redução de instâncias.
Esse comportamento inesperado causou sobrecarga em parte do serviço de telefonia, resultando em falhas temporárias no processamento e na conexão de chamadas.
Ações Corretivas e Melhorias Implementadas
Durante a noite, realizamos uma ampla revisão em toda a camada de telefonia e automação da plataforma, com o objetivo de aumentar a resiliência e eliminar pontos críticos recorrentes.
Entre as principais medidas aplicadas estão:
- Reestruturação dos agendamentos automáticos (cron jobs) para garantir que os serviços de telefonia se ajustem com precisão aos horários reais de operação.
- Aprimoramento do comportamento de escalonamento automático, tornando o processo de redução mais gradual e seguro.
- Ampliação dos tempos de desligamento controlado, evitando interrupções em chamadas ainda ativas.
- Reforço de capacidade e monitoramento, com aumento de recursos e isolamento de serviços críticos em nós dedicados.
- Expansão das instâncias de controle de chamadas (ARI), elevando a tolerância a picos inesperados de demanda.
Monitoramento Contínuo
Estamos tratando este incidente com máxima prioridade.
As medidas aplicadas visam corrigir definitivamente as causas estruturais que contribuíram para instabilidades anteriores, elevando significativamente a estabilidade da plataforma.
Seguiremos em monitoramento constante ao longo das próximas horas e dias, garantindo que todos os indicadores de desempenho se mantenham dentro da normalidade.
Serviços afetados
Atualizado
13 Out, 05:09pm GMT-3
Nosso monitoramento acusa normalidade. Seguimos acompanhando.
Serviços afetados
Atualizado
13 Out, 05:05pm GMT-3
Processo finalizado, plataforma liberada para uso.
Estamos monitorando se tudo foi restabelecido corretamente.
Serviços afetados
Atualizado
13 Out, 05:02pm GMT-3
Monitoramento acusa que a falha ainda está ocorrendo. Identificamos grande volume de ligações presas em estado incorreto, estamos realizando o procedimento de limpeza novamente. Previsão de retorno em 3 minutos.
Serviços afetados
Atualizado
13 Out, 04:52pm GMT-3
Procedimento concluído, plataforma normalizada. Seguimos investigando a causa raiz desta falha e reportaremos assim que concluirmos a análise.
Serviços afetados
Atualizado
13 Out, 04:49pm GMT-3
Procedimento de limpeza e reinicialização dos componentes iniciado. Previsão de normalização em 5 minutos.
Serviços afetados
Atualizado
13 Out, 04:44pm GMT-3
Identificamos o problema e estamos aplicando a correção. Previsão de normalização de 10 mintuos.
Serviços afetados
Criado
13 Out, 04:42pm GMT-3
Nossa equipe está investigando uma falha causando abandono de ligações com agentes disponíveis para receber as chamadas.
Serviços afetados