Você sabe qual é o comportamento do seu negócio? Quantos pedidos são gerados em um determinado horário do dia e se estão ocorrendo normalmente nos intervalos esperados. Se todos seus parceiros comerciais estão funcionando e se não, quando e por quê aconteceu?
A monitoração de anomalias visa justamente responder esta e outras perguntas, servindo como um poderoso indicador da saúde do seu negócio, permitindo às organizações reagirem a imprevistos antes que maiores prejuízos sejam causados.
Os comportamentos podem ser descritos por meio de curvas, histogramas de volumes e frequência (taxas).
Por exemplo: o número de pedidos gerados, com os dados de canal e status da transação apresentam um comportamento de volume e taxas de chegada e sucesso/falha que tendem a seguir padrões ao longo do tempo (normalmente semanais ou mensais). Se os dados forem devidamente entendidos, medidos e acompanhados podem indicar em tempo real se está de acordo ou não com o histórico.
Analisando o gráfico abaixo vemos a representação da quantidade de usuários gerando transações no período de uma semana.
A linha mostra o comportamento hora a hora e os volumes. Obviamente, cada negócio pode ter diferentes sazonalidades e características, mas, a partir da análise de comportamento, é possível definir padrões.
No gráfico abaixo podemos ver o momento de falha em um sistema.
Comparando com o mesmo dia da semana anterior é visível que a partir das 12 horas, um incidente aconteceu e passou a impactar as transações efetuadas.
Uma outra visão mostra que, se os dados estiverem devidamente classificados e organizados em diferentes dimensões, é possível rapidamente determinar a origem do incidente, avaliando-se qual canal gerou tais distorções. Em nosso exemplo, as transações via Web foram às responsáveis pela falha.
A criação de uma linha-base de comportamento com suas devidas dimensões, inteligência baseada em estatística avançada e Machine Learning aplicado, pode detectar não somente que há um impacto, mas também demonstrar de onde a falha vêm.
O mesmo modelo pode ser aplicado de forma complementar às taxas de chegada (frequência de ocorrências): Canal de origem, tipo de transação, linha de produto, cliente, etc. que também apresentam comportamentos esperados nos seus intervalos entre ocorrências. Diferentes horários e dias do mês ou da semana apresentaram diferentes taxas de chegada para cada dimensões.
Assim é possível gerar alertas com níveis de criticidade, como no exemplo abaixo:
Critical – 30 minutos sem receber por boletos
Attention – 25 minutos sem nenhum carro passar pela entrada 5
Critical – 10 minutos sem receber ligações pelo tronco X
Existem diversas ferramentas no mercado que oferecem ingestão e armazenamento de dados, mas o grande diferencial é a análise e detecção de anomalias em real-time. A grande maioria das ferramentas de analytics oferece um report posterior ao evento, impedindo que a detecção e reação do problema ocorra a tempo de minimizar prejuízos.
Entretanto é possível implementar uma plataforma completa para monitoração de negócios em que os dados são ingestados, correlacionados e analisados em tempo real contra os baselines aprendidos. Dessa forma, alertas apontam que um determinado fluxo no negócio poderá ser impactado, o que permite às áreas responsáveis tomar medidas de correção ou remediação antes que potenciais perdas ocorram.
A adoção de plataformas que ofereçam predição com base nos dados pode reduzir o tempo de detecção de anomalia e tomada de decisão em mais de 90%, praticamente salvando um negócio. Os resultados mostram que grandes empresas de varejo distribuído, como operadoras de telefonia, distribuidoras de bebidas e comércio em geral passaram a ter o tempo de interrupção nos negócios de uma média 4 horas por episódio, para menos de 10 minutos, entre a detecção e o incidente. Um investimento em tecnologia, quase sempre com especialistas brasileiros, que se retorna em poucos meses. Vale a análise.
**Artigo escrito por Saulo Meneghini, Founder e CEO da Pinpoint
{loadmoduleid 180}