Categorias
Auditoria Data Science Inteligência Artificial LGPD

Como utilizar modelos LLM como o llama3 na auditoria

A auditoria é uma atividade que envolve analisar muitos documentos. As vezes trata-se de centenas de páginas de texto que devem ser lidas. Embora a tecnologia não substitua o auditor, ela pode facilitar tarefas exaustivas ou repetitivas como resumir textos. A técnica de NLP (Natural Language Processing) e os modelos LLM (Large Language Models) podem ser uma ferramente poderosa para esta atividade.

Como utilizar o poder das LLM para resumir documentos de forma segura e sigilosa? Com certeza há a preocupação de não enviar dados sigilosos através da internet. Uma solução é rodar o modelo localmente em sua própria máquina.

Vejamos 3 ferramentas para cumprir este objetivo.

Python

Python é uma das linguagens de programação mais populares do mundo, amplamente utilizada para desenvolvimento de software, análise de dados, inteligência artificial e automação de tarefas. Criado por Guido van Rossum no final dos anos 1980 e lançado oficialmente em 1991, Python se destaca por sua sintaxe simples e legível, além de possuir uma vasta comunidade e uma grande variedade de bibliotecas. Sua flexibilidade permite que seja usado tanto para scripts simples quanto para aplicações complexas, como desenvolvimento web e aprendizado de máquina.

Ollama

Ollama é uma ferramenta que facilita o uso de modelos de inteligência artificial localmente, permitindo a execução de modelos de linguagem diretamente no computador do usuário. Projetado para ser simples e eficiente, Ollama elimina a necessidade de configurar ambientes complexos para rodar modelos de IA. Ele permite o download e a execução de modelos como LLaMA, Mistral e outros com apenas um comando no terminal. Seu objetivo principal é tornar a utilização de grandes modelos de linguagem mais acessível para desenvolvedores e pesquisadores.

LLaMA3

LLaMA 3 (Large Language Model Meta AI 3) é a terceira geração da família de modelos de linguagem desenvolvidos pela Meta (antiga Facebook). Ele é projetado para fornecer respostas mais precisas e contextualmente relevantes, sendo otimizado para eficiência e menor consumo de recursos computacionais. Os modelos da série LLaMA ganharam notoriedade por serem alternativas mais leves e abertas em comparação com os modelos fechados de empresas como OpenAI e Google. O LLaMA 3 continua essa tradição, trazendo avanços em arquitetura e desempenho.

Para baixar e instalar o Ollama, basta acessar o site oficial ollama.com e seguir as instruções para o sistema operacional desejado (Windows, macOS ou Linux). Após a instalação, pode-se baixar e rodar o LLaMA 3 usando comandos simples no terminal. Por exemplo, para instalar um modelo específico, basta rodar ollama pull llama3, e para executá-lo, o comando ollama run llama3 inicia a interação com o modelo. Isso torna o processo de configuração extremamente simples e rápido.

Um exemplo prático de uso do LLaMA 3 no Ollama seria gerar um resumo de um texto. Suponha que você tenha um arquivo chamado relatorio.txt e deseja obter um resumo. Você pode usar o seguinte comando no terminal:

cat relatorio.txt | ollama run llama3 --system "Resuma o seguinte texto:"

Esse comando extrai o conteúdo do arquivo e o envia para o modelo, que então retorna um resumo conciso. Dessa forma, Ollama e LLaMA 3 oferecem uma solução poderosa para quem deseja utilizar modelos de IA localmente sem depender de servidores externos.

Comente o que achou do resultado. O modelo resumiu de forma adequada e eficiente?

Categorias
Auditoria Compliance LGPD Segurança da Informação

Ferramentas LGPD: Microsoft lança portal 7 meses antes da nova lei entrar em vigor

Ferramentas LGPD da Microsoft ganham um portal na internet. O objetivo é explicar a nova lei e as ferramentas disponibilizadas pela companhia. Você já começou a implementar os procedimentos necessários para a sua empresa ficar em conformidade com a LGPD?

A Lei Geral de Proteção de Dados entrará em vigor daqui há sete meses!

Há muito material sendo criado na internet como e-books, vídeos, webinars sobre o tema. A Microsoft acaba de lançar um site dedicado à nova lei. Lá há o detalhamento das soluções de conformidade da Microsoft, ofertas de proteção e respostas que vão ajudar e orientar na efetivação do processo.

Dados, Informação e Conhecimento

Os dados têm um ciclo de vida bastante complexo nas organizações. Dados podem ser criados, importados, modificados, detectados, classificados, rotulados, protegidos, enviados, compartilhados, movidos, monitorados, retidos, expirados e por fim deletados. Esse rico conjunto de dados, quando  relacionados, pode ser chamado de informação.

No passado os cursos de tecnologia eram chamados de Processamento de Dados. Hoje com o Big Data, o simples processamento é obsoleto. Os cursos passaram a se chamar Tecnologia da Informação. O volume, variedade, e velocidade de processamento dos dados (e das informações) foi evoluindo com o passar do tempo.

Hoje, as informações são correlacionadas e com técnicas de business intelligence, matemática, estatística e análise de dados, transformam-se em conhecimento. A inteligência artificial permite ainda associações improváveis e análises preditivas com grande margem de assertividade.

As ferramentas microsoft para LGPD abrangem 4 pilares: conformidade, gestão de identidade, proteção de identidade e segurança da informação.

O Security & Compliance Center ajuda na conformidade, por exemplo na apuração de denúncias do Canal de Conduta. A ferramenta eDiscovery permite gerenciar investigações legais com pesquisas indexadas, hold (congelamento) de dados para pesquisas futuras, atribuição de papéis e responsabilidades durante a avaliação do caso.

Saiba mais sobre estes tópicos comuns no ITGC e Auditoria de TI:

Segurança da Informação

De acordo com a ABNT NBR ISO/IEC 17799, a segurança da informação consiste em formas de proteger dados através de regras firmes, ou controles, bem definidos, implementados e em constante monitoramento, que garantem a Continuidade  de Negócios.

A segurança pode ser controlada com as seguintes propriedades básicas:

  • Confidencialidade: garantir que apenas indivíduos autorizados tem acesso às informações;
  • Integridade: garantia de que os dados não foram alterados e estão armazenados sem falhas;
  • Disponibilidade: a informação deve estar acessível ao usuário à qualquer tempo necessário;
  • Não-repúdio: deve servir como prova legal sem margem para dúvidas da autoridade legal;
  • Autenticidade: originalidade, veracidade, identificação da real origem da informação.

você está offline!