Incidentes anteriores
Falha nas discagens da plataforma
Resolvido Apr 23, 2025 at 11:31am UTC
Falha corrigida.
1 atualização anterior
Interrupções na conexão websocket com a plataforma
Resolvido Apr 22, 2025 at 12:55pm UTC
Correção realizada. Plataforma normalizada.
3 atualizações anteriores
Desconexões de usuários na plataforma
Resolvido Apr 14, 2025 at 6:37pm UTC
📝 Post-mortem — Desconexões de Usuários na Plataforma
Data: 14/04/2025
Horário: 15:09 – 15:14 (GMT-3)
Resumo do Incidente
No dia 14/04, entre 15h09 e 15h14, identificamos desconexões inesperadas de usuários em nossa plataforma, impactando os seguintes serviços:
- Back-end API
- Vox - Back-end CLI
- Controle de Telefonia
- Telefonia - Agentes
- Telefonia - Ligações
Causa Identificada
Durante a investigação, constatamos que o limite de conexões simu...
3 atualizações anteriores
Degradação de performance na velocidade de discagem do sistema
Resolvido Apr 14, 2025 at 1:33pm UTC
Processo concluído. Estamos monitorando para garantir normalização completa.
2 atualizações anteriores
Demora no recebimento de mensagens no omnichannel
Resolvido Mar 24, 2025 at 6:45pm UTC
O recebimento de mensagens e as atualizações de status das mensagens enviadas (ACK) foram normalizados.
1 atualização anterior
Abandono de ligações
Resolvido Mar 28, 2025 at 2:31pm UTC
Informamos que nosso monitoramento após ajustes aplicados mostra normalização completa de todos os serviços. Nossa equipe segue monitorando tudo em tempo real.
18 atualizações anteriores
Abandono de ligações
Resolvido Mar 19, 2025 at 5:46pm UTC
Estamos monitorando e iniciando processo de investigação mais profundo neste momento.
3 atualizações anteriores
Instabilidade detectada
Resolvido Mar 18, 2025 at 6:21pm UTC
Confirmamos após monitoramento que todos os serviços foram completamente restabelecidos. A causa raiz do problema foi solucionada. Além do monitoramento contínuo, nenhuma ação futura será necessária para este incidente.
4 atualizações anteriores
Omnichannel - Falha em carregar tela de chats
Resolvido Mar 17, 2025 at 2:38pm UTC
Foi identificado a causa raiz do problema e corrigido.
Tela de chats normalizado.
1 atualização anterior
Chamadas presas impedindo discagem
Resolvido Mar 1, 2025 at 12:17pm UTC
Postmortem – Falha na Geração de Ligações
Data do incidente: 01 de março de 2025
Duração: 07:59 – 08:39 GMT-3
Status: Resolvido
Resumo do Incidente
Na manhã do dia 01 de março, identificamos uma falha que impedia a geração de ligações na plataforma. As chamadas que foram iniciadas não foram corretamente processadas, impactando a operação.
Causa Raiz
A investigação apontou que o problema teve origem nas atualizações automáticas do Google Kubernetes Engine (GKE), onde nosso cluster e...
4 atualizações anteriores
Atraso no recebimento de mesagens
Resolvido Feb 28, 2025 at 6:50pm UTC
A capacidade de processamento da infraestrutura foi aumentada, os eventos acumulados foram processados e o tempo de recebimento de mensagens, assim como a atualização do status das mensagens enviadas, foi normalizado.
1 atualização anterior
Incidente de abandono de ligações
Resolvido Feb 24, 2025 at 6:48pm UTC
Post-mortem – Incidente de abandono de ligações (24/fev)
A seguir apresentamos um resumo cronológico do incidente, as ações tomadas e o tempo total de indisponibilidade identificado.
Tempo total de indisponibilidade
Somando os três períodos identificados de efetiva indisponibilidade:
- 1º Período 11h20–11h29: 9 minutos
- 2º Período 11h42–11h46: 4 minutos
- 3º Período 15h22–15h26: 4 minutos
Total: ~17 minutos de indisponibilidade.
Causa raiz e ...
11 atualizações anteriores
Omnichannel 3C+: Falha no envio e listagem de chats
Resolvido Feb 20, 2025 at 2:24pm UTC
Concluímos a correção para normalização da falha.
Estamos agora iniciando testes e monitorando o sistema para garantir que está tudo solucionado.
3 atualizações anteriores
Instabilidade na plataforma
Resolvido Feb 12, 2025 at 6:19pm UTC
Após investigações, encontramos uma possível causa para o problema enfrentado. Estamos atuando nela neste momento. As correções serão aplicadas ao ambiente sem impactos previstos.
6 atualizações anteriores
Instabilidade no serviço de Back-end API
Resolvido Feb 5, 2025 at 1:36pm UTC
Enfrentamos uma instabilidade em nosso sistema decorrente de um súbito aumento no tráfego de usuários. Este incremento inesperado de acessos não permitiu tempo hábil para a escalabilidade dos componentes necessários, culminando na ocorrência de um erro 500 em nossa plataforma.
O incidente foi prontamente identificado e as medidas necessárias foram tomadas para mitigar o impacto aos nossos usuários. Nossa equipe técnica está empenhada em monitorar continuamente o ambiente, a fim de assegurar ...
2 atualizações anteriores
Instabilidade no serviço de Back-end API
Resolvido Feb 4, 2025 at 5:20pm UTC
As instabilidades no processamento de requisições da API foram totalmente resolvidas. Após uma investigação detalhada, identificamos a causa raiz do problema, relacionada a limitações nas configurações que impactavam o processamento de grandes volumes de requisições paralelas.
Realizamos ajustes específicos nessas configurações, o que permitiu otimizar a capacidade de processamento do microsserviço de back-end. As melhorias foram aplicadas com sucesso e, desde então, o sistema opera de forma...
3 atualizações anteriores