Categorias
ACL Analytics Auditoria Data Analytics Data Science

Correlação e Heterocedasticidade: Como Escolher as Variáveis Certas na Auditoria Baseada em Dados

1. A Importância da Estatística na Auditoria Interna

A auditoria baseada em dados vem se consolidando como uma das maiores transformações no campo da governança corporativa e da auditoria interna. Com o avanço da tecnologia, auditores deixaram de analisar amostras pequenas para avaliar 100% das transações, apoiando-se em ferramentas como ACL Analytics, Python, Power BI e SQL.

Entender conceitos estatísticos como correlação e heterocedasticidade é fundamental para aplicar modelos analíticos confiáveis. Essas técnicas permitem identificar relações entre variáveis, detectar anomalias financeiras e garantir que os testes automatizados sejam baseados em evidências robustas.

Além de aumentar a eficiência operacional, o domínio dessas análises dá ao auditor uma visão mais estratégica sobre riscos, fraudes e comportamento de dados. Isso possibilita a transição de uma auditoria reativa para uma auditoria preventiva e inteligente, em que os riscos são monitorados continuamente.

Em um cenário de transformação digital, o auditor que domina a linguagem dos dados deixa de ser apenas um avaliador de controles para se tornar um agente de inovação e mitigação de riscos corporativos.


2. Correlação: Entendendo as Relações Entre Variáveis

A correlação é uma medida estatística que indica como duas variáveis se relacionam. Em termos simples, mostra se elas se movem na mesma direção (correlação positiva), em direções opostas (correlação negativa) ou se não há relação (correlação nula).

Na auditoria interna, esse conceito é aplicado para avaliar comportamentos esperados entre variáveis financeiras e operacionais. Por exemplo, espera-se correlação positiva entre quantidade de vendas e receita, e negativa entre custos e margem de lucro. Quando essas relações não se confirmam, pode haver indícios de erro, desvio ou fraude.

Ferramentas como Python (pandas, seaborn), Excel e ACL Analytics permitem calcular o coeficiente de correlação de forma rápida. Esse coeficiente varia entre -1 e +1, indicando a força e a direção da relação. Quanto mais próximo de 1 (ou -1), maior é a dependência entre as variáveis.

Um auditor pode, por exemplo, identificar que pagamentos a fornecedores cresceram sem aumento proporcional nas quantidades compradas. Essa quebra de correlação pode indicar superfaturamento, pagamentos duplicados ou desvios contratuais, orientando análises mais profundas.

No Python, por exemplo, o auditor pode importar os dados e aplicar:

import pandas as pd
dados = pd.read_csv("financeiro.csv")
dados.corr()

3. Heterocedasticidade: Quando os Dados Não se Comportam de Forma Constante

A heterocedasticidade ocorre quando a variabilidade dos dados não é constante ao longo das observações. Em termos práticos, significa que o erro do modelo aumenta ou diminui conforme o tamanho da amostra ou o valor da variável analisada.

Na auditoria de dados, isso é comum. Por exemplo, em uma análise de reembolso de despesas por centro de custo, áreas menores tendem a apresentar valores mais estáveis, enquanto áreas maiores (como vendas ou logística) têm valores muito dispersos. Essa variação é um indício de heterocedasticidade.

Quando não é tratada, a heterocedasticidade pode comprometer os resultados das análises estatísticas, fazendo o auditor tirar conclusões incorretas sobre a confiabilidade de controles. Por isso, é importante aplicar testes como o de Breusch-Pagan para identificar o problema e, se necessário, transformar os dados (por exemplo, com logaritmos) para estabilizar a variância.

Com esse ajuste, os modelos de regressão e análise preditiva tornam-se mais robustos, permitindo que alertas e relatórios automatizados de auditoria contínua reflitam a realidade de forma mais precisa e confiável.


4. A Escolha das Variáveis Certas na Auditoria de Dados

A seleção das variáveis é o ponto crítico na construção de testes analíticos confiáveis. Variáveis irrelevantes adicionam ruído e confundem os resultados; já variáveis redundantes (altamente correlacionadas entre si) causam multicolinearidade, distorcendo o modelo.

Na auditoria contábil, por exemplo, ao investigar pagamentos suspeitos, incluir variáveis como valor, data, número da nota fiscal e CNPJ do fornecedor é fundamental. Mas incluir o “nome do fornecedor” pode gerar inconsistências, já que grafias diferentes representam o mesmo registro.

Outro exemplo está na auditoria de folha de pagamento: utilizar salário base, horas extras e encargos pode ser eficiente, mas incluir variáveis derivadas (como total de descontos) pode introduzir redundância. O ideal é escolher variáveis independentes e representativas do processo auditado.

A escolha certa das variáveis impacta diretamente na precisão do monitoramento contínuo. Ao trabalhar com dados limpos, correlacionados e bem definidos, o auditor consegue detectar exceções com maior assertividade e menor custo de revisão manual.


5. Aplicações Práticas e Benefícios para a Governança

Aplicar correlação e heterocedasticidade na auditoria interna vai muito além da teoria. Essas análises são a base para criar modelos preditivos, dashboards de risco e testes automatizados.

Com a correlação, é possível monitorar relações esperadas entre indicadores de desempenho e controles financeiros, detectando desvios em tempo real. Já com a heterocedasticidade, o auditor entende a variabilidade do comportamento organizacional, ajustando modelos de risco conforme o porte e a complexidade de cada área.

Ao combinar essas técnicas com ferramentas como Python, Power BI ou ACL Analytics, as equipes de auditoria conseguem implementar monitoramentos contínuos, emitindo alertas sempre que um comportamento foge do padrão estatístico esperado. Isso reduz o tempo de resposta e fortalece a cultura de auditoria preventiva.

Os benefícios são claros: maior eficiência operacional, relatórios mais precisos, decisões baseadas em evidências e ganho de credibilidade institucional. Em um ambiente corporativo cada vez mais digital e orientado a dados, dominar essas técnicas é o que diferencia um auditor tradicional de um auditor analítico e estratégico.

Categorias
ACL Analytics Auditoria

ACL Analytics: Como Criar Um Script Padrão

ACL Analytics é uma ferramenta de auditoria muito conhecida para os profissionais de Auditoria Contínua. Trata-se de um software para a auditoria de dados. O ACL permite a análise atualizada e eficiente das informações da estrutura de uma gestão e a automatização de processos.

Todo trainee de BIG4 faz algum tipo de treinamento sobre essa ferramenta ou outra semelhante para compilar grande quantidade de dados. Dependendo das atividades diárias, deixamos de utilizá-la, acabamos esquecendo e perdendo um poderoso aliado de análise.

Mas, o ACL é grande aliado na auditoria de base de dados de todos os processos: fiscal, contábil, TI. Ele é especialmente útil em dados estruturados como relatórios extraídos do SAP ou SQL Server.

Atualmente o ACL é fornecido pela Galvanize e faz parte de uma plataforma maior de Governança Corporativa chamada Highbond.

Principais Comandos do ACL Analytics

Abaixo listei os comandos essenciais para criar um script básico no ACL Analytics:

  • COMMENT;
  • SET;
  • IMPORT;
  • OPEN;
  • DEFINE;
  • EXTRACT;
  • SUMMARIZE;
  • EXPORT;

Comando COMMENT

O COMMENT cria comentários no script. São trechos que serão ignorados durante a execução. Utilize para explicar o que está sendo feito e com qual objetivo.

Eles permitem que outras pessoas estejam habilitadas a entender, executar e alterar os seus scripts.

 COMMENT
** Criado por: Daniel Oyama
** Data: 04/12/2019
** Script: Script Padrão
** Objetivo: Testar o controle XYZ
**

Comando SET

O comando SET define parâmetros globais da ferramenta como: formato numérico, padrão de datas, ligar e desligar a geração de logs.

É interessante começar todo script com os seguintes comandos:

SET SAFETY OFF
SET FOLDER /RESULTADOS

O primeiro comando desliga a “segurança” do ACL. Durante a execução ele não irá confirmar se o as arquivos podem ser excluídos, ou sobrescritos. Isso evita que o script pare no meio e fique aguardando alguém responder a pergunta “Este arquivo já existe. Deseja realmente sobrescrever o arquivo?”

O segundo comando, SET FOLDER, cria uma pasta chamada RESULTADOS, e guarda as tabelas geradas dentro desta pasta. Isto é util para organizar o projeto, principalmente quando você tem muitos scripts e muitas tabelas que não podem ser apagadas.

Comando IMPORT

O Comando IMPORT traz as informações externas para dentro do ACL. Ele faz uma cópia dos dados originais para a pasta do projeto ACL. A tabela importada é salva com a extensão “.fil”.

 IMPORT ... NomeDaTabela 

Considerando o arquivo de exemplo TabelaProdutos.csv, com as seguintes linhas:

codigo;produto;categoria;preço
1;"Produto A";"Categoria 1";10,00
2;"Produto B";"Categoria 1";10,00
3;"Produto C";"Categoria 1";10,00
4;"Produto D";"Categoria 2";15,00
5;"Produto E";"Categoria 2";15,00
6;"Produto F";"Categoria 3";18,00
7;"Produto G";"Categoria 3";18,00
8;"Produto H";"Categoria 4";20,00

Após a importação no ACL, o comando ficaria assim:

IMPORT DELIMITED TO TabelaProdutos "TabelaProdutos.fil" FROM "C:\ACL_EXEMPLO\TabelaProdutos.csv" 0 SEPARATOR ";" QUALIFIER '"' CONSECUTIVE STARTLINE 1 KEEPTITLE FIELD "codigo" N AT 1 DEC 0 WID 1 PIC "" AS "" FIELD "produto" C AT 2 DEC 0 WID 9 PIC "" AS "" FIELD "categoria" C AT 11 DEC 0 WID 11 PIC "" AS "" FIELD "preço" N AT 22 DEC 2 WID 5 PIC "" AS "" 

Comando OPEN

O comando OPEN é o início de tudo. Só é possível executar um comando, se antes você abrir uma tabela pré existente (já importada).

 OPEN NomeDaTabela 

Comando DEFINE

O comando DEFINE é utilizado para definir parâmetros no layout da tabela. É possível criar um campo calculado – uma nova coluna baseada nos dados originais. O campo calculado utiliza fórmulas semelhantes ao Excel para tratar o dado original, e transformá-lo, facilitando a análise do auditor.

DEFINE FIELD CC_Campo_Calculado_1 COMPUTED

ALLTRIM(NomeDaColuna)

Comando EXTRACT

O EXTRACT serve para criar uma nova tabela. Depois de filtrar algo, você pode separar esse grupo menor em uma nova tabela, para análise posterior.

OPEN NomeDaTabela

EXTRACT RECORD TO TabelaFiltrada IF CC_Campo_Calculado_1 <> "" OPEN

OPEN TabelaFiltrada

Comando SUMMARIZE

O SUMMARIZE é usado para agrupar linhas por categorias. Tem um efeito semelhante ao GROUP BY se você está familiarizado com a linguagem SQL.

OPEN TabelaFiltrada

SUMMARIZE ON CC_Campo_Calculado_1 TO TabelaSumarizada OPEN PRESORT

Comando EXPORT

O comando EXPORT leva os dados para fora do ACL. Use por exemplo para gerar uma planilha Excel com os resultados do teste.

EXPORT FIELDS ALL XLSX TO PlanilhaResultado WORKSHEET Planilha

Criando um Script Padrão do ACL Analytics

Sugestão de script padrão:

COMMENT
** Criado por: Daniel Oyama
** Data: 04/12/2019
** Script: Script Padrão
** Objetivo: Testar o controle XYZ
**

SET SAFETY OFF
SET FOLDER /RESULTADOS

IMPORT ... NomeDaTabela

OPEN NomeDaTabela

DEFINE FIELD CC_Campo_Calculado_1 COMPUTED ALLTRIM(NomeDaColuna)

EXTRACT RECORD TO TabelaFiltrada IF CC_Campo_Calculado_1 <> "" OPEN

OPEN TabelaFiltrada
SUMMARIZE ON CC_Campo_Calculado_1 TO TabelaSumarizada OPEN PRESORT

OPEN TabelaSumarizada
EXPORT FIELDS ALL XLSX TO PlanilhaResultado WORKSHEET Planilha

Altere os trechos em negrito conforme a sua necessidade.

Dicas

É importante seguir uma padronização ao criar scripts, como em qualquer linguagem de programação:

  • Procure usar identação para facilitar a leitura;
  • Use letras maiúsculas e minúsculas como forma de organização do código: OPEN (upper case), open (lower case), TabelaProdutos (camel case);
  • Crie comentários para relembrar o objetivo de cada trecho;
  • Separe os scripts por assunto, ou por etapa;
  • Use variáveis para coisas que se repetem e podem ser alteradas no futuro;

Scripts ACL agendados no windows podem ser utilizados para a auditoria contínua de riscos e controles. Basta que o script seja estruturado em sequência lógica e padronizada.

você está offline!