Incidentes anteriores
Atraso no recebimento de mesagens
Resolvido 28 Fev, 03:50pm GMT-3
A capacidade de processamento da infraestrutura foi aumentada, os eventos acumulados foram processados e o tempo de recebimento de mensagens, assim como a atualização do status das mensagens enviadas, foi normalizado.
1 atualização anterior
Incidente de abandono de ligações
Resolvido 24 Fev, 03:48pm GMT-3
Post-mortem – Incidente de abandono de ligações (24/fev)
A seguir apresentamos um resumo cronológico do incidente, as ações tomadas e o tempo total de indisponibilidade identificado.
Tempo total de indisponibilidade
Somando os três períodos identificados de efetiva indisponibilidade:
- 1º Período 11h20–11h29: 9 minutos
- 2º Período 11h42–11h46: 4 minutos
- 3º Período 15h22–15h26: 4 minutos
Total: ~17 minutos de indisponibilidade.
Causa raiz e ...
11 atualizações anteriores
Omnichannel 3C+: Falha no envio e listagem de chats
Resolvido 20 Fev, 11:24am GMT-3
Concluímos a correção para normalização da falha.
Estamos agora iniciando testes e monitorando o sistema para garantir que está tudo solucionado.
3 atualizações anteriores
Instabilidade na plataforma
Resolvido 12 Fev, 03:19pm GMT-3
Após investigações, encontramos uma possível causa para o problema enfrentado. Estamos atuando nela neste momento. As correções serão aplicadas ao ambiente sem impactos previstos.
6 atualizações anteriores
Instabilidade no serviço de Back-end API
Resolvido 05 Fev, 10:36am GMT-3
Enfrentamos uma instabilidade em nosso sistema decorrente de um súbito aumento no tráfego de usuários. Este incremento inesperado de acessos não permitiu tempo hábil para a escalabilidade dos componentes necessários, culminando na ocorrência de um erro 500 em nossa plataforma.
O incidente foi prontamente identificado e as medidas necessárias foram tomadas para mitigar o impacto aos nossos usuários. Nossa equipe técnica está empenhada em monitorar continuamente o ambiente, a fim de assegurar ...
2 atualizações anteriores
Instabilidade no serviço de Back-end API
Resolvido 04 Fev, 02:20pm GMT-3
As instabilidades no processamento de requisições da API foram totalmente resolvidas. Após uma investigação detalhada, identificamos a causa raiz do problema, relacionada a limitações nas configurações que impactavam o processamento de grandes volumes de requisições paralelas.
Realizamos ajustes específicos nessas configurações, o que permitiu otimizar a capacidade de processamento do microsserviço de back-end. As melhorias foram aplicadas com sucesso e, desde então, o sistema opera de forma...
3 atualizações anteriores
Vox Back-end API - Erro 500
Resolvido 30 Jan, 11:42am GMT-3
Nosso time está investigando a causa das falhas que foram identificadas em alguns usuários e clientes mas não foram automaticamente detectadas por nosso monitoramento e sistemas de health-check.
2 atualizações anteriores
Abandono indevido de ligações
Resolvido 28 Jan, 05:10pm GMT-3
POSTMORTEM: Abandono Indevido de Ligações - 28 de Janeiro
Resumo do Incidente
- Incidente: Abandono Indevido de Ligações
- Primeira Identificação: 28 Jan, 10:06am GMT-3
- Serviços Afetados:
- Socket Realtime
- Controle de Telefonia
- Telefonia - Agentes
- Telefonia - Ligações
- Socket Realtime
- Resolução Final: 28 Jan, 04:31pm GMT-3
Indisponibilidades Totais Durante o Período
- 28 Jan, 10:06am - 10:10am → 4 minutos
- **28 Jan, 11:1...
24 atualizações anteriores
Ligações abandonadas com agentes disponíveis
Resolvido 22 Jan, 04:17pm GMT-3
Visão Geral do Incidente
Nos dias recentes, a plataforma 3C Plus experienciou instabilidades significativas que resultaram em downtime. Foi observado um grande volume de chamadas sendo abandonadas, apesar da disponibilidade de agentes para atender a essas chamadas. Este relatório visa documentar as causas, impactos e medidas corretivas adotadas para resolver a situação.
Descrição do Incidente
- Datas dos Incidentes: Dois dias consecutivos 21 e 22 de Janeiro de 2024
- Horários dos Picos...
6 atualizações anteriores
Instabilidade na plataforma - Telefonia
Resolvido 22 Jan, 04:18pm GMT-3
Visão Geral do Incidente
Nos dias recentes, a plataforma 3C Plus experienciou instabilidades significativas que resultaram em downtime. Foi observado um grande volume de chamadas sendo abandonadas, apesar da disponibilidade de agentes para atender a essas chamadas. Este relatório visa documentar as causas, impactos e medidas corretivas adotadas para resolver a situação.
Descrição do Incidente
- Datas dos Incidentes: Dois dias consecutivos 21 e 22 de Janeiro de 2024
- Horários dos Picos...
4 atualizações anteriores
Instabilidade na plataforma 3C+
Resolvido 17 Dez, 11:21am GMT-3
Procedimento de normalização finalizado.
Todos os serviços foram restabelecidos.
2 atualizações anteriores
Instabilidade na META, não no whatsapp 3C+
Resolvido 11 Dez, 05:20pm GMT-3
A API da META retornou, porém com certa lentidão
1 atualização anterior
Instabilidades na plataforma
Resolvido 06 Dez, 11:24am GMT-3
O monitoramento continua demonstrando que a plataforma está totalmente normalizada após a instabilidade.
Nossa equipe está alocada na investigação da causa inicial do problema que ocorreu.
Até o momento, verificamos que o Cluster GKE sofreu eventos de atualização e estamos buscando mais informações sobre o que iniciou esse processo.
Durante a fase de atualização, o cluster deixa de disponibilizar micro-serviços utilizados para a descoberta de instâncias ativas, necessários para o correto f...
7 atualizações anteriores
Manutenção Preventiva Emergencial
Resolvido 03 Dez, 12:27pm GMT-3
Testes realizados e todos os serviços foram normalizados.
3 atualizações anteriores