Voltar para visão geral
Tempo de inatividade

Abandono de chamadas com agentes disponíveis

13 Out, 04:42pm GMT-3
Serviços afetados
Controle de Telefonia
Telefonia - Agentes
Telefonia - Ligações

Resolvido
14 Out, 12:24am GMT-3

Causa Identificada

Após uma análise minuciosa, identificamos que o incidente teve origem em um aumento repentino e fora do padrão no volume de ligações durante o processo automático de redução de instâncias.

Esse comportamento inesperado causou sobrecarga em parte do serviço de telefonia, resultando em falhas temporárias no processamento e na conexão de chamadas.


Ações Corretivas e Melhorias Implementadas

Durante a noite, realizamos uma ampla revisão em toda a camada de telefonia e automação da plataforma, com o objetivo de aumentar a resiliência e eliminar pontos críticos recorrentes.

Entre as principais medidas aplicadas estão:

  • Reestruturação dos agendamentos automáticos (cron jobs) para garantir que os serviços de telefonia se ajustem com precisão aos horários reais de operação.
  • Aprimoramento do comportamento de escalonamento automático, tornando o processo de redução mais gradual e seguro.
  • Ampliação dos tempos de desligamento controlado, evitando interrupções em chamadas ainda ativas.
  • Reforço de capacidade e monitoramento, com aumento de recursos e isolamento de serviços críticos em nós dedicados.
  • Expansão das instâncias de controle de chamadas (ARI), elevando a tolerância a picos inesperados de demanda.

Monitoramento Contínuo

Estamos tratando este incidente com máxima prioridade.

As medidas aplicadas visam corrigir definitivamente as causas estruturais que contribuíram para instabilidades anteriores, elevando significativamente a estabilidade da plataforma.

Seguiremos em monitoramento constante ao longo das próximas horas e dias, garantindo que todos os indicadores de desempenho se mantenham dentro da normalidade.

Atualizado
13 Out, 05:09pm GMT-3

Nosso monitoramento acusa normalidade. Seguimos acompanhando.

Atualizado
13 Out, 05:05pm GMT-3

Processo finalizado, plataforma liberada para uso.
Estamos monitorando se tudo foi restabelecido corretamente.

Atualizado
13 Out, 05:02pm GMT-3

Monitoramento acusa que a falha ainda está ocorrendo. Identificamos grande volume de ligações presas em estado incorreto, estamos realizando o procedimento de limpeza novamente. Previsão de retorno em 3 minutos.

Atualizado
13 Out, 04:52pm GMT-3

Procedimento concluído, plataforma normalizada. Seguimos investigando a causa raiz desta falha e reportaremos assim que concluirmos a análise.

Atualizado
13 Out, 04:49pm GMT-3

Procedimento de limpeza e reinicialização dos componentes iniciado. Previsão de normalização em 5 minutos.

Atualizado
13 Out, 04:44pm GMT-3

Identificamos o problema e estamos aplicando a correção. Previsão de normalização de 10 mintuos.

Criado
13 Out, 04:42pm GMT-3

Nossa equipe está investigando uma falha causando abandono de ligações com agentes disponíveis para receber as chamadas.