Os Fundamentos da Análise de Dados

A análise de dados é um componente essencial para uma empresa, pois permite extrair insights significativos a partir da coleta e análise de informações. Esses insights servem como base para a tomada de decisões empresariais.

O processo, desde a coleta de dados até a tomada de decisão, é composto por várias etapas. Nesse caminho, utilizamos desde cálculos matemáticos simples até algoritmos avançados.

Existem 4 tipos de análises de dados:

  • Análise descritiva (o que aconteceu no passado?)
  • Análise de diagnóstico (por que isso aconteceu no passado?)
  • Análise preditiva (o que acontecerá no futuro?)
  • Análise prescritiva (como podemos fazer isso acontecer?)


Análise descritiva

A análise descritiva retrata o que aconteceu no passado. Ela visa apenas mostrar os fatos, sem explicar o “porquê” ou as causas e efeitos que geraram determinado resultado. O objetivo é fornecer um relatório instantâneo e digerível.

Plataformas como o Google Analytics e outras voltadas para o marketing utilizam bem essa análise. Elas mostram quantos usuários acessaram o site, em quais localidades o site carregou mais rápido e quantas vendas o site fez. Nesse tipo de análise, os dados são apenas apresentados em uma primeira instância, sem explicar por que aconteceu, como aconteceu ou o que fazer para mudar certas situações.


Análise diagnostica

Diferente da análise descritiva, a análise diagnóstica visa encontrar relações de causa e efeito para compreender algo que aconteceu, deixando mais nítido, ela busca explicar o “porquê” determinado fato ocorreu.

Trazendo para um contexto como educação, saúde ou gestão de empresas, esse tipo de análise visa reunir as informações, entender como os eventos aconteceram e formular estratégias para resolver as questões identificadas.

Principais Etapas da Análise diagnóstica

Coleta de dados: Levantamos informações relevantes por meio de questionários, entrevistas, observações ou análise de documentos

Identificação de problemas: Análise dos dados coletados para identificar as principais dificuldades ou desafios que precisam ser abordados.

Análise de Causas: Investigação das causas subjacentes dos problemas identificados, utilizando métodos como a análise de causa e efeito.

Propostas de Soluções: Com base nas informações e causas analisadas, são elaboradas sugestões e estratégias para resolução dos problemas.

Implementação e Monitoramento: Após a formulação das soluções, é importante implementar as ações e monitorar os resultados para avaliar a eficácia das intervenções.

Cenários de aplicação

Educação: Identificar lacunas de aprendizado dos alunos e desenvolver planos de ensino personalizados.

Saúde: Diagnosticar condições de saúde e formular tratamentos adequados.

Gestão empresarial: Analisar o desempenho organizacional e melhorar processos internos.


Análise preditiva

Aqui, temos uma forma avançada da análise de dados, é onde tentamos prever o que pode acontecer, o processo usa análise de dados, machine learning, inteligência artificial e modelos estatísticos para que podemos prever comportamentos futuros.

Como a análise preditiva funciona?

Coleta de dados: a análise começa com a coleta de dados relevantes, que podem vir de várias fontes, como bancos de dados internos, redes sociais, sensores e qualquer outro sistema que gere dados históricos. Esses dados podem incluir informações estruturadas e não estruturadas.

Preparação dos dados: os dados coletados precisam ser preparados para a análise, esse processo inclui:

Limpeza de dados: remover inconsistências, dados duplicados ou erros.

Transformação de dados: normalizar os dados, preencher valores ausentes e preparar variáveis de entrada.

Engenharia de features: criar novas variáveis ou transformar as existentes para melhorar o desempenho do modelo.

Seleção de modelos: Dependendo do tipo de previsão desejada, um modelo estatístico ou de machine learning é selecionado. Os modelos mais comuns incluem:

Regressão: Para prever valores numéricos contínuos, como vendas ou preços.

Classificação: Para prever categorias ou classes, como se um cliente vai comprar ou não.

Séries temporais: Para previsões ao longo do tempo, como tendências de mercado.

Árvores de decisão e redes neurais também são usados para padrões mais complexos.

Treinamento do modelo: O modelo é treinado usando um conjunto de dados históricos. Nesse processo, o algoritmo aprende padrões a partir dos dados de entrada e os mapeia para o resultado desejado (rótulos ou valores). O treinamento envolve otimizar os parâmetros do modelo para melhorar a precisão das previsões

OBS: é claro que isso é um resumo para um assunto avançado, após essas etapas vem as de testes e validações, implatação e previsão e depois o monitoramento e o ajuste. Não vamos nos aprofundar muito no tema pois futuramente pretendo abordar de forma mais objetiva em projetos reais.


Análise prescritiva

A análise prescritiva é uma forma avançada de análise de dados que vai além da análise descritiva e preditiva. Enquanto a análise descritiva explica oque aconteceu e a preditiva tenta prever oque acontecerá, a análise prescritiva busca recomendar ações para lidar com um cenário futuro ou otimizar algum resultado com base nas previsões. Basicamente essa análise responde á pergunta “Oque deve ser feito a seguir?”, e é usada para apoiar a tomada de decisões com base em dados e cenários que projetamos.

Daniel Borba