Indisponibilidade do Back-End
Resolved
Nov 12 at 05:40pm GMT-3
[Post-Mortem - Incidente de indisponibilidade de serviços]
Com este post-mortem, queremos fornecer uma compreensão completa do ocorrido na data de hoje, que causou uma interrupção dos nossos serviços. Queremos assegurar a nossos clientes que já tomamos medidas necessárias para prevenir tal problema e para melhorar a nossa resposta em futuras ocorrências.
RESUMO
Data & Hora: 12 de Novembro
Hora inicial: 04:30pm GMT-3
Horário de Resolução: 04:55pm GMT-3
Duração Total: 25 minutos
Serviço afetado: Back-end da plataforma
DESCRIÇÃO
Em 12 de Novembro, nosso backend ficou indisponível por aproximadamente 25 minutos, causando a resposta de ERRO HTTP 503 para nossos clientes. Isso foi causado por uma aplicação incorreta de uma configuração de ambiente do tipo configmap no ambiente.
RESOLUÇÃO
Depois de identificarmos o problema, iniciamos imediatamente um procedimento de limpeza e reinicialização da plataforma. Após a plicação da configuração certa, a plataforma ficou normalizada por volta das 04:50pm GMT-3 e pelos nossos monitoramentos e feedback dos clientes, confirmamos a normalização completo dos serviços às 04:55pm GMT-3.
AÇÕES DE PREVENÇÃO
Este incidente foi uma situação única, sendo a primeira vez que este determinado erro aconteceu. Apesar disso, eventos como este nos permitem melhorar nossos processos e sistemas.
Embora já tenhamos encerrado este incidente, continuaremos a monitorar nossa plataforma para prevenir futuros incidentes semelhantes. Pedimos desculpas por qualquer inconveniente causado, e agradecemos a sua paciência enquanto trabalhamos para corrigir o problema e prevenir a recorrência deste tipo de incidente no futuro.
Affected services
Back-end API
Telefonia - Agentes
Telefonia - Ligações
Updated
Nov 12 at 04:55pm GMT-3
Nosso monitoramento acusa normalidade. Estamos realizando testes internamente e recebendo feedbacks dos clientes para garantirmos normalização e restabelecimento completo dos serviços.
Affected services
Back-end API
Telefonia - Agentes
Telefonia - Ligações
Updated
Nov 12 at 04:50pm GMT-3
Plataforma normalizada.
Affected services
Back-end API
Telefonia - Agentes
Telefonia - Ligações
Updated
Nov 12 at 04:45pm GMT-3
Reinicialização em reta final. Plataforma será normalizada dentro de instantes.
Previsão atualizada 16h47.
Affected services
Back-end API
Telefonia - Agentes
Telefonia - Ligações
Updated
Nov 12 at 04:41pm GMT-3
Reinicialização ainda em curso. Estamos aguardando o upload dos dados antes de finalizar os serviços.
Nova previsão: 16h45
Affected services
Back-end API
Telefonia - Agentes
Telefonia - Ligações
Updated
Nov 12 at 04:33pm GMT-3
Procedimento de reinicialização iniciado.
Previsão de normalização 16h40.
Affected services
Back-end API
Telefonia - Agentes
Telefonia - Ligações
Updated
Nov 12 at 04:32pm GMT-3
Identificamos a causa do problema e estamos trabalhando na solução definitiva.
Inciaremos em instantes o procedimento de limpeza e reinicialização da plataforma.
Previsão para completa normalização às 16h40.
Affected services
Back-end API
Created
Nov 12 at 04:30pm GMT-3
Identificamos que o back-end da plataforma está indisponível e retornando ERRO HTTP 503.
Estamos tratando a falha com máxima prioridade e urgência neste momento.
Affected services
Back-end API