FinOps em ação: empresa reduziu custos de cloud com visibilidade e governança

Por Fábio Catein, João Antônio Rondina, Jonathas Ferreira e Rafael Cabral

  • Fatura de cloud cresceu +50% em 12 meses sem que a organização conseguisse explicar a causa, cenário típico de ambientes sem governança.
  • Diagnóstico revelou que um único serviço respondia por quase 70% do aumento total da fatura.
  • Quick wins geraram redução de ~60% no custo de armazenamento e ~50% no custo de pipelines selecionados, sem impacto operacional.
  • Painel unificado no Power BI integrou dados de Azure e Databricks, habilitando governança contínua por projeto, time e serviço.

Uma grande companhia do setor de Óleo e Gás vinha evoluindo de forma acelerada em sua jornada de Data & Analytics, processando volumes cada vez maiores de informação para apoiar decisões operacionais e estratégicas. Com esse crescimento, os custos com cloud também aumentaram. Em 12 meses, a fatura cresceu +50%.

Crescer é natural quando a operação de dados se expande, mas o problema era que ninguém conseguia explicar exatamente esse aumento de custo. Os números chegavam no fim do mês, mas a leitura era opaca quanto a qual serviço estava custando mais, se o crescimento era esperado ou mero desperdício.

A jornada FinOps foi estruturada nos três fluxos sequenciais: primeiro entender (Informar), depois agir (Otimizar) e, por fim, garantir que os resultados se sustentassem ao longo do tempo (Operacionalizar).

Diagnóstico inicial: mapeando para onde os custos iam

O ponto de partida foi mapear para onde os custos estavam indo. Utilizamos o Azure Cost Management, ferramenta nativa da Microsoft que funciona como um extrato bancário detalhado, para analisar os custos mensais por serviço, por grupo de recursos e por ambiente, cobrindo um período de 12 meses.

O que o raio-X revelou
  • Um único serviço respondia por quase 70% do aumento da fatura. O Databricks, plataforma usada para processar e transformar dados, havia crescido de forma consistente, especialmente a partir do início do ano.
 
  • O segundo maior gasto era uma ferramenta de visualização (dashboards e relatórios para o negócio), representando cerca de um quarto do crescimento da fatura.
 
  • O armazenamento de dados apresentava custo surpreendentemente alto. Os dados estavam configurados com replicação geográfica, em que cada arquivo era automaticamente copiado para um datacenter em outra região. Útil em cenários de desastre extremo, mas desnecessário e significativamente mais caro para a maioria dos dados do dia a dia.

Imagine pagar para guardar uma cópia de cada documento da empresa em outro estado, por precaução. Para documentos críticos, faz sentido. Mas como abordagem para todos os arquivos da organização, inclusive aqueles de uso meramente rotineiro, é um custo que pode ser eliminado.

  • Recursos criados para testes continuavam ligados. Ambientes de experimentos e projetos piloto que nunca foram desativados após o uso, gerando custo silencioso que não agregava valor após o fim do experimento.
 

Esse diagnóstico gerou um relatório de baseline com um retrato fiel do estado atual dos custos que serviu como fundação para todas as decisões seguintes. Sem ele, qualquer ação de otimização seria um chute no escuro.

  1. Ajustes simples, resultados concretos: os Quick Wins

Com o mapa de custos em mãos, o próximo passo foi mapear e executar as ações. As primeiras iniciativas foram priorizadas pela lógica do maior impacto com menor esforço, os chamados Quick Wins.

Mudança na forma de armazenar dados
  • O problema: os dados estavam sendo replicados geograficamente, o que significava pagar mais que o dobro do armazenamento para um nível de proteção que a maioria dos dados não exigia.
 
  • A ação: migração para um modelo de armazenamento local, mantendo os dados seguros dentro da mesma região, sem a cópia geográfica adicional.
 
  • O resultado: redução de aproximadamente 60% no custo de armazenamento afetado, sem nenhum impacto na operação do dia a dia.
Desligamento de aceleradores em processos não críticos
  • O problema: alguns pipelines de dados rodavam com acelerador de performance ativado, recurso que aumenta a velocidade de processamento, mas eleva significativamente o custo. Esses processos rodavam uma vez por dia, sem exigência de alta velocidade.
 
  • A ação: desligamento do acelerador nesses processos específicos, mantendo-o apenas onde a velocidade realmente importava.
 
  • O resultado: redução de aproximadamente 50% no custo dos pipelines selecionados, sem perda de qualidade nos resultados entregues.
Limpeza de recursos esquecidos
  • O problema: ao longo do tempo, foram criados ambientes de teste, experimentos e POCs que não foram desativados após o uso. Esses recursos continuavam ligados e cobrando.
 
  • A ação: identificação e eliminação de todos os grupos de recursos inativos.
 
  • O resultado: economia de aproximadamente $300/mês com recursos que não deveriam existir mais.
 
Painel de controle financeiro que sustenta os ganhos

Após os ajustes pontuais, o foco passou a ser evitar regressão. Para isso, foi construído um dashboard centralizado no Power BI que unifica os dados de custo do Azure e do Databricks, habilitando governança contínua.

Por que um dashboard unificado?

Embora o Azure mostre o valor total da fatura, ele não consegue responder perguntas como qual pipeline específico gerou o custo ou qual time ou produto foi o responsável. Esse nível de detalhe fica registrado apenas dentro do próprio Databricks. Sem integrar essas duas fontes, a organização perde a capacidade de analisar custo por pipeline, produto ou domínio de dados.

Como foi construído
  1. [Azure] Criação de storage dedicado a custos, separado do ambiente operacional, com controle de acesso específico para dados de faturamento.
  2. [Azure] Configuração de exportação automática (Cost Management Export), para envio agendado dos dados de faturamento, eliminando dependência manual.
  3. [Databricks] Pipeline versionado de ETL, utilizando Databricks Asset Bundles (DAB) para garantir governança DevOps com rastreabilidade e padronização.
  4. [Power BI] Publicação do dashboard unificado, aproveitando a ferramenta já utilizada pela empresa, reduzindo fricção e acelerando a entrega de insights.
 
O que o painel entrega na prática
  • Visão macro: custo total do mês, crescimento ao longo do mês e forecast
 
  • Quebra por dimensão: custo por projeto, time, grupo de recursos e serviço
 
  • Histórico: comparação mês a mês e ano a ano para identificação de tendências e anomalias

A jornada descrita se apoiou em uma base parcialmente estruturada: o tagueamento de recursos e as políticas de ciclo de vida dos dados já eram realidade no ambiente, o que acelerou a execução e a precisão das análises. Os próximos passos incluem a configuração de alertas automáticos de orçamento e detecção de anomalias.

Resultados e próximos passos

Este case ilustra como uma abordagem estruturada de FinOps transforma a relação de uma organização com seus custos de cloud. Em vez de tratar a fatura como um número opaco a ser aceito no fim do mês, a jornada de Informar, Otimizar e Operacionalizar converteu gastos descontrolados em decisões orientadas por dados.

Os resultados concretos (redução de ~60% no armazenamento, ~50% em pipelines selecionados e eliminação de custos fantasma) demonstram que, mesmo com ajustes simples, o impacto financeiro pode ser significativo quando precedido por diagnóstico preciso.

Com o painel de controle em operação, a organização agora tem visibilidade contínua e capacidade de agir proativamente sobre desvios, garantindo que os ganhos se sustentem e que novos investimentos em dados sejam alocados com inteligência.

Acesse o site e saiba mais sobre nossas ofertas, que incluem soluções de Dados e IA aplicadas ao negócio.

 

FÁBIO CATEIN é Sócio e Especialista Sênior em engenharia de dados na EloGroup

JOÃO ANTÔNIO RONDINA é Gerente na EloGroup

JONATHAS FERREIRA é Engenheiro de Dados na EloGroup

RAFAEL CABRAL é Gerente de Data & AI na EloGroup

Enviar por email