Previous incidents

February 2025
Feb 28, 2025
1 incident

Atraso no recebimento de mesagens

Degraded

Resolved Feb 28 at 03:50pm GMT-3

A capacidade de processamento da infraestrutura foi aumentada, os eventos acumulados foram processados e o tempo de recebimento de mensagens, assim como a atualização do status das mensagens enviadas, foi normalizado.

1 previous update

Feb 24, 2025
1 incident

Incidente de abandono de ligações

Degraded

Resolved Feb 24 at 03:48pm GMT-3

Post-mortem – Incidente de abandono de ligações (24/fev)

A seguir apresentamos um resumo cronológico do incidente, as ações tomadas e o tempo total de indisponibilidade identificado.


Tempo total de indisponibilidade

Somando os três períodos identificados de efetiva indisponibilidade:

  • 1º Período 11h20–11h29: 9 minutos
  • 2º Período 11h42–11h46: 4 minutos
  • 3º Período 15h22–15h26: 4 minutos

Total: ~17 minutos de indisponibilidade.


Causa raiz e ...

11 previous updates

Feb 20, 2025
1 incident

Omnichannel 3C+: Falha no envio e listagem de chats

Degraded

Resolved Feb 20 at 11:24am GMT-3

Concluímos a correção para normalização da falha.
Estamos agora iniciando testes e monitorando o sistema para garantir que está tudo solucionado.

3 previous updates

Feb 12, 2025
1 incident

Instabilidade na plataforma

Downtime

Resolved Feb 12 at 03:19pm GMT-3

Após investigações, encontramos uma possível causa para o problema enfrentado. Estamos atuando nela neste momento. As correções serão aplicadas ao ambiente sem impactos previstos.

6 previous updates

Feb 05, 2025
1 incident

Instabilidade no serviço de Back-end API

Degraded

Resolved Feb 05 at 10:36am GMT-3

Enfrentamos uma instabilidade em nosso sistema decorrente de um súbito aumento no tráfego de usuários. Este incremento inesperado de acessos não permitiu tempo hábil para a escalabilidade dos componentes necessários, culminando na ocorrência de um erro 500 em nossa plataforma.

O incidente foi prontamente identificado e as medidas necessárias foram tomadas para mitigar o impacto aos nossos usuários. Nossa equipe técnica está empenhada em monitorar continuamente o ambiente, a fim de assegurar ...

2 previous updates

Feb 04, 2025
1 incident

Instabilidade no serviço de Back-end API

Degraded

Resolved Feb 04 at 02:20pm GMT-3

As instabilidades no processamento de requisições da API foram totalmente resolvidas. Após uma investigação detalhada, identificamos a causa raiz do problema, relacionada a limitações nas configurações que impactavam o processamento de grandes volumes de requisições paralelas.

Realizamos ajustes específicos nessas configurações, o que permitiu otimizar a capacidade de processamento do microsserviço de back-end. As melhorias foram aplicadas com sucesso e, desde então, o sistema opera de forma...

3 previous updates

January 2025
Jan 30, 2025
1 incident

Vox Back-end API - Erro 500

Degraded

Resolved Jan 30 at 11:42am GMT-3

Nosso time está investigando a causa das falhas que foram identificadas em alguns usuários e clientes mas não foram automaticamente detectadas por nosso monitoramento e sistemas de health-check.

2 previous updates

Jan 28, 2025
1 incident

Abandono indevido de ligações

Downtime

Resolved Jan 28 at 05:10pm GMT-3

POSTMORTEM: Abandono Indevido de Ligações - 28 de Janeiro

Resumo do Incidente

  • Incidente: Abandono Indevido de Ligações
  • Primeira Identificação: 28 Jan, 10:06am GMT-3
  • Serviços Afetados:
    • Socket Realtime
    • Controle de Telefonia
    • Telefonia - Agentes
    • Telefonia - Ligações
  • Resolução Final: 28 Jan, 04:31pm GMT-3

Indisponibilidades Totais Durante o Período

  1. 28 Jan, 10:06am - 10:10am4 minutos
  2. **28 Jan, 11:1...

24 previous updates

Jan 22, 2025
1 incident

Ligações abandonadas com agentes disponíveis

Downtime

Resolved Jan 22 at 04:17pm GMT-3

Visão Geral do Incidente

Nos dias recentes, a plataforma 3C Plus experienciou instabilidades significativas que resultaram em downtime. Foi observado um grande volume de chamadas sendo abandonadas, apesar da disponibilidade de agentes para atender a essas chamadas. Este relatório visa documentar as causas, impactos e medidas corretivas adotadas para resolver a situação.

Descrição do Incidente

  • Datas dos Incidentes: Dois dias consecutivos 21 e 22 de Janeiro de 2024
  • Horários dos Picos...

6 previous updates

Jan 21, 2025
1 incident

Instabilidade na plataforma - Telefonia

Downtime

Resolved Jan 22 at 04:18pm GMT-3

Visão Geral do Incidente

Nos dias recentes, a plataforma 3C Plus experienciou instabilidades significativas que resultaram em downtime. Foi observado um grande volume de chamadas sendo abandonadas, apesar da disponibilidade de agentes para atender a essas chamadas. Este relatório visa documentar as causas, impactos e medidas corretivas adotadas para resolver a situação.

Descrição do Incidente

  • Datas dos Incidentes: Dois dias consecutivos 21 e 22 de Janeiro de 2024
  • Horários dos Picos...

4 previous updates

December 2024
Dec 17, 2024
1 incident

Instabilidade na plataforma 3C+

Downtime

Resolved Dec 17 at 11:21am GMT-3

Procedimento de normalização finalizado.
Todos os serviços foram restabelecidos.

2 previous updates

Dec 11, 2024
1 incident

Instabilidade na META, não no whatsapp 3C+

Degraded

Resolved Dec 11 at 05:20pm GMT-3

A API da META retornou, porém com certa lentidão

1 previous update

Dec 06, 2024
1 incident

Instabilidades na plataforma

Downtime

Resolved Dec 06 at 11:24am GMT-3

O monitoramento continua demonstrando que a plataforma está totalmente normalizada após a instabilidade.

Nossa equipe está alocada na investigação da causa inicial do problema que ocorreu.

Até o momento, verificamos que o Cluster GKE sofreu eventos de atualização e estamos buscando mais informações sobre o que iniciou esse processo.

Durante a fase de atualização, o cluster deixa de disponibilizar micro-serviços utilizados para a descoberta de instâncias ativas, necessários para o correto f...

7 previous updates

Dec 03, 2024
1 incident

Manutenção Preventiva Emergencial

Downtime

Resolved Dec 03 at 12:27pm GMT-3

Testes realizados e todos os serviços foram normalizados.

3 previous updates