Categorias
Auditoria Data Analytics

O Ciclo de Vida dos Dados

O ciclo de vida dos dados é um processo essencial que abrange todas as etapas pelas quais as informações passam dentro de uma organização, desde sua criação até sua utilização final. Esse fluxo inclui a geração, armazenamento, ingestão, transformação, disponibilização e, por fim, o consumo por todos os stakeholders. Em cada uma dessas fases, a auditoria desempenha um papel fundamental, garantindo a integridade, a segurança e a conformidade dos dados.

Geração

A primeira etapa do ciclo é a geração dos dados, que pode ocorrer por meio de diversas fontes, como dispositivos IoT, sistemas transacionais, interações de usuários e aplicações web. Desde o início, é crucial registrar metadados e criar logs de auditoria que possibilitem rastrear a origem dos dados, assegurando sua autenticidade e permitindo futuras verificações de conformidade.

Armazenamento

Após a geração, os dados são armazenados em bancos de dados, data lakes ou outras infraestruturas de armazenamento. Essa fase requer cuidados especiais com segurança e backup, pois a integridade das informações é vital para análises futuras. A implementação de auditorias regulares neste estágio permite monitorar o acesso, detectar alterações não autorizadas e garantir que os dados sejam mantidos de acordo com as políticas internas e regulamentações externas.

Ingestão

A ingestão é o processo pelo qual dados provenientes de diversas fontes são coletados e integrados em um sistema unificado para posterior processamento. Nesse momento, controles de qualidade e mecanismos de auditoria são aplicados para validar a precisão e a integridade dos dados, evitando que inconsistências comprometam a confiabilidade das informações que serão utilizadas nas análises. Existem muitas ferramentas para esta etapa. Alguns exemplos de ferramentas são: ACL Analytics, Alteryx, Arbutus, Qlik View, Qlik Sense, Tableau.

Transformação

Durante a transformação, os dados brutos passam por processos de limpeza, normalização e enriquecimento para se tornarem informações úteis para a tomada de decisão. Este estágio envolve diversas operações de extração, transformação e carga (ETL), e é aqui que a auditoria se mostra indispensável, registrando todas as modificações e garantindo que o histórico das alterações seja preservado para futuras análises e revisões.

Disponibilização

Após a transformação, os dados são disponibilizados para os usuários finais através de dashboards, relatórios, APIs ou outros meios. Essa etapa exige a implementação de controles de acesso rigorosos e a manutenção de logs de auditoria para monitorar o uso dos dados, assegurando que apenas pessoas autorizadas tenham acesso e que o consumo das informações esteja de acordo com as políticas de segurança e privacidade da organização

Auditoria e Data Analytics

A auditoria é um componente transversal que permeia todas as fases do ciclo de vida dos dados. Seja durante a geração, armazenamento, ingestão, transformação ou disponibilização, os processos de auditoria garantem a transparência e a rastreabilidade das operações, permitindo a identificação precoce de falhas e a implementação de melhorias contínuas. Essa prática é fundamental para manter a conformidade com as regulamentações e para reforçar a governança dos dados dentro da empresa.

Conclusão

Em suma, compreender o ciclo de vida dos dados e integrar práticas robustas de auditoria em cada etapa é crucial para garantir a qualidade, segurança e confiabilidade das informações. Ao adotar esses processos, as organizações não só aprimoram a tomada de decisão, mas também fortalecem sua governança, assegurando que os dados, um dos ativos mais valiosos, estejam sempre protegidos e devidamente gerenciados.

Categorias
Auditoria Big Data Compliance Segurança da Informação Tecnologia da Informação

Big Data: Volume, Variedade e Velocidade

Big Data é um termo utilizado para se referir aos métodos de estruturação, armazenamento e disponibilização de grandes dados.

Essa é uma definição simplista e para quem busca começar a entender o assunto. Tenha em mente o tema é muito mais complexo e abrangente.

O termo Big Data pode ser melhor entendido analisando-se os seus três atributos principais, mais conhecidos como: os 3 V´s do Big Data.

Volume e Armazenamento

O atributo principal do Big Data é o volume. Aliás, vem daí o big (grande em inglês). A quantidade de dados gerados hoje é impressionante! A cada segundo, os sistemas de informação geram milhões e milhões de registros.

Veja um exemplo cotidiano: imagine-se uma viagem de carro utilizando o aplicativo Waze no celular. Seu aparelho está registrando tudo:

  • Campo magnético (bússola);
  • Acelerômetro (posição do celular);
  • Geolocalização, ponto de partida, distância, ponto de chegada;
  • Velocidade média, mínima, máxima, tempo de parada, mudanças de rota, desaceleração, aceleração e sentido.

Agora imagine todos os usuários que estão fazendo o mesmo trajeto (ou parte dele)! A correlação de todas essas informações permite a predição do melhor caminho e do tempo estimado com uma pequena margem de erro. Onde ficam todos estes dados? Qual o tamanho deles?

A capacidade de armazenamento dobra em pouquíssimo tempo comprovando a lei de Moore. Você viu isso com os pendrives: Megabytes, Gigabytes, Terabytes e por aí vai…

Variedade

Nem sempre os dados estão estruturados, isto é, em bancos de dados relacionais com chaves primárias e relacionamento entre tabelas.

No ambiente corporativo, as informações importantes também trafegam fora dos sistemas e em meios diversos como: arquivos diversos, vídeos, áudios, imagens, planilhas, e-mails e mensagens em aplicativos.

Com a popularização da tecnologia móvel, os smartphones estão repletos de sensores e ávidos por dados: campo magnético, acelerômetros, dados biométricos, geolocalização, temperatura, altitude – vale tudo! Tudo! Inclusive dados pessoais, muitas vezes sensíveis como: preferências de compra, históricos de pesquisas e acessos, contatos e etc.

Velocidade dos Dados

A demanda por velocidade está tanto na coleta quanto no consumo da informação. Dados são gerados, coletados, processados e monitorados em tempo real ou com uma pequena defasagem de tempo. A evolução dos padrões de rede, protocolos de comunicação, computação em nuvem e novos meios de transmissão permitem tudo isso. Além disso, quanto mais rápido a informação chega até a gestão, mais rápida é a tomada de decisões.

Ferramentas comuns em Big Data: Hadoop, Spark, Tensorflow, Databricks, Presto, S3, Python.

O Big Data traz novos desafios para a Auditoria Interna na TI e o monitoramento contínuo de riscos:

  • Computação distribuída: balanceamento de servidores, barramento ethernet de rack, disponibilidade, tolerância à falhas;
  • Arquitetura: on premise, nuvem (cloud), nuvem híbrida;
  • Otimização: indexação, pré-ordenação, compressão, normalização, desnormalização;
  • Modelos: relacionais, não relacionais, hierárquicos;
  • Estrutura de Dados: colunares, alinhados;
  • Privacidade: mascaramento, anonimização, “forget my data”, portabilidade, compliance com a lei de dados – LGPD / GPRD.

Referências sobre Big Data

Big Data – Técnicas e tecnologias para extração de valor dos dados (Rosangela M.)

você está offline!