Nos últimos anos a transformação digital têm acelerado a busca por soluções em nuvem (IaaS, PaaS, SaaS) para entrega de serviços digitais cada vez mais conectados e on-line. Como consequência o “time to market” diminuiu e gerou vantagens competitivas em praticamente todos os mercados, por sua adaptabilidade sob demanda e facilidade na integração.
Ao mesmo tempo ocorre a disruptura do modelo tradicional de TI, dando lugar à novas arquiteturas que combinam sistemas legados, on-premise, multinuvem, micro serviços, SaaS e APIs de fornecedores externos. Um novo paradigma de TI com múltiplos benefícios, vantagens competitivas para as organizações:
– Captação e Processamento de transações 100% on-line e automatizada
– Ecossistema de parceiros e agentes internos e externos fortemente integrados
– Time-to-Market reduzido drasticamente
– Processos em cadeia automatizados
Essa mudança exige uma adaptação rápida de todos os processos de gestão de TI, de forma a não se perder a governança destes novos ambientes. Elencamos alguns pontos chave da observabilidade para garantir up-time e sucesso desses projetos:
1) Ambientes híbridos (onPrem vs. nuvem e vs. Multinuvem vs. SaaS)
Apesar da grande oferta de soluções de nuvem/SaaS para alavancar diversas dessas iniciativas, há ainda diversos sistemas legados que por uma série de fatores como complexidade, obsolescência, larga escala, necessidade de interface com equipamentos ou usuários nas redes locais, obrigações regulatórias ou sensibilidade dos dados, deverão permanecer por médio ou longo prazo ainda funcionando nos datacenters atuais. Os demais sistemas em nuvem são integrados a estes sistemas, gerando o cenário de um ambiente híbrido.
Mesmo nos cenários onde é possível a adoção de soluções 100% em nuvem, existe a probabilidade de que a solução adote serviços de diferentes nuvens (AWS, Azure, GCP, etc.), e também APIs com SaaS e provedores externos (Serasa, NFe, Salesforce, etc.), exigindo uma gestão unificada agnóstica destes diferentes players.
2) Acesso às Nuvens (conectividade e segurança)
Com a mudança dos sistemas de uma arquitetura concentrada em datacenter, para os sistemas em nuvem, ocorre naturalmente a mudança da estrutura da rede. Antes, desenhada em forma de “estrela” para garantir tanto a conectividade quanto a segurança do acesso nas unidades, parceiros e clientes. As interligações eram em sua maioria em redes fechadas e privadas. Já no cenário atual, a rede passa a ser um “mesh” de acessos N-to-N entre todos os players envolvidos, trafegando pela internet (meio público) e aumentando a complexidade da arquitetura da rede e segurança.
Um dos principais pontos é garantir que todos os players envolvidos (clientes internos, externos, parceiros, etc.) tenham uma performance satisfatória para consumir ou integrar estes sistemas, porém há muito mais pontos de conexão a serem considerados e medidos.
A realidade é que o custo e oferta de redes/links no Brasil ainda há grande variação nas diferentes regiões de um país com dimensões continentais. O desafio de manter o “mesh” em qualidade satisfatória a todos os pontos é uma preocupação constante dos gestores. Há inclusive cenários onde o componente de rede pode comprometer – tanto por custo quanto por qualidade – as iniciativas de nuvem.
3) Experiência do Usuário / Performance das transações
Com as mudanças de paradigmas que falamos anteriormente, conhecer e mensurar como cada agente externo e interno consome e interage passa a ser vital. Do ponto de vista de “entrega de serviços”, seja para os clientes internos quanto externos, é necessário gerenciar a disponibilidade e performance da entrega para cada um destes agentes, de forma destrinchada e detalhada para cada etapa, grupo ou rede envolvida.
Quanto às integrações entre sistemas e parceiros internos, que cada vez mais são demandados pelo negócio para se comportarem como uma cadeia 100% on-line e sem gargalos, é natural que ocorra uma proliferação de micro serviços, queues, gateways e APIs rodando de forma totalmente dependente uma da outra, em diferentes pontos da nuvem e do datacenter.
Uma vez que isto acaba envolvendo na maioria das vezes provedores externos, na qual o TI não tem controle direto, faz-se necessária a gestão de todos estes “pontos de interconexão”, gerando KPIs que apoiem a gestão de TI a constantemente melhorar a performance, aumentar a disponibilidade e erradicar problemas independente do ambiente.
Conclusão
Com estes novos desafios fazendo parte do dia a dia dos executivos, especialistas de TI e negócio, é definitivamente necessária a adoção de um programa de observabilidade.
Trata-se de uma mudança no foco, do “O que” para o “Por que”.
No mundo tradicional das operações de TI, o foco do monitoramento está centrado no que está acontecendo no sistema e não em descobrir por que está acontecendo. Quando se lida com aplicações monolíticas em servidores hospedados em datacenter, essa abordagem tradicional de monitoramento ajudou até hoje a resolver a maioria dos problemas enfrentados pelas operações de TI em suas tarefas diárias.
Com nova realidade da nuvem, alimentada por contêineres na infraestrutura e micro serviços na camada de aplicações, a TI moderna se depara com ambientes cada vez mais distribuídos, onde as ideias tradicionais sobre confiabilidade e monitoramento são interrompidas. As operações de TI enfrentam uma infraestrutura mais distribuída por baixo e mais aplicações por cima. Com foco na resiliência, é fundamental ir além do que está acontecendo para descobrir por que os sistemas estão se comportando de determinada maneira.
A capacidade da observabilidade reúne dados de monitoramento, dados de log e dados de rastreamento das transações para adicionar uma correlação e contexto, oferecendo aos gestores e equipes uma melhor visão da dinâmica do sistema e auxiliá-los na tomada das medidas adequadas proativamente, com mais agilidade e profundidade que a abordagem reativa tradicional.
É importante que a observabilidade e monitoração sejam agnósticas, abrangentes e integradas de forma a trazer uma visão única dos “porquês”, independentemente da plataforma ou player em ambientes híbridos.
** Artigo escrito por Saulo Meneghini, Founder e CEO da Pinpoint. Especialista em monitoração e observabilidade para negócios.
{loadmoduleid 180}