Categorias
Auditoria Data Science Inteligência Artificial LGPD

Como utilizar modelos LLM como o llama3 na auditoria

A auditoria é uma atividade que envolve analisar muitos documentos. As vezes trata-se de centenas de páginas de texto que devem ser lidas. Embora a tecnologia não substitua o auditor, ela pode facilitar tarefas exaustivas ou repetitivas como resumir textos. A técnica de NLP (Natural Language Processing) e os modelos LLM (Large Language Models) podem ser uma ferramente poderosa para esta atividade.

Como utilizar o poder das LLM para resumir documentos de forma segura e sigilosa? Com certeza há a preocupação de não enviar dados sigilosos através da internet. Uma solução é rodar o modelo localmente em sua própria máquina.

Vejamos 3 ferramentas para cumprir este objetivo.

Python

Python é uma das linguagens de programação mais populares do mundo, amplamente utilizada para desenvolvimento de software, análise de dados, inteligência artificial e automação de tarefas. Criado por Guido van Rossum no final dos anos 1980 e lançado oficialmente em 1991, Python se destaca por sua sintaxe simples e legível, além de possuir uma vasta comunidade e uma grande variedade de bibliotecas. Sua flexibilidade permite que seja usado tanto para scripts simples quanto para aplicações complexas, como desenvolvimento web e aprendizado de máquina.

Ollama

Ollama é uma ferramenta que facilita o uso de modelos de inteligência artificial localmente, permitindo a execução de modelos de linguagem diretamente no computador do usuário. Projetado para ser simples e eficiente, Ollama elimina a necessidade de configurar ambientes complexos para rodar modelos de IA. Ele permite o download e a execução de modelos como LLaMA, Mistral e outros com apenas um comando no terminal. Seu objetivo principal é tornar a utilização de grandes modelos de linguagem mais acessível para desenvolvedores e pesquisadores.

LLaMA3

LLaMA 3 (Large Language Model Meta AI 3) é a terceira geração da família de modelos de linguagem desenvolvidos pela Meta (antiga Facebook). Ele é projetado para fornecer respostas mais precisas e contextualmente relevantes, sendo otimizado para eficiência e menor consumo de recursos computacionais. Os modelos da série LLaMA ganharam notoriedade por serem alternativas mais leves e abertas em comparação com os modelos fechados de empresas como OpenAI e Google. O LLaMA 3 continua essa tradição, trazendo avanços em arquitetura e desempenho.

Para baixar e instalar o Ollama, basta acessar o site oficial ollama.com e seguir as instruções para o sistema operacional desejado (Windows, macOS ou Linux). Após a instalação, pode-se baixar e rodar o LLaMA 3 usando comandos simples no terminal. Por exemplo, para instalar um modelo específico, basta rodar ollama pull llama3, e para executá-lo, o comando ollama run llama3 inicia a interação com o modelo. Isso torna o processo de configuração extremamente simples e rápido.

Um exemplo prático de uso do LLaMA 3 no Ollama seria gerar um resumo de um texto. Suponha que você tenha um arquivo chamado relatorio.txt e deseja obter um resumo. Você pode usar o seguinte comando no terminal:

cat relatorio.txt | ollama run llama3 --system "Resuma o seguinte texto:"

Esse comando extrai o conteúdo do arquivo e o envia para o modelo, que então retorna um resumo conciso. Dessa forma, Ollama e LLaMA 3 oferecem uma solução poderosa para quem deseja utilizar modelos de IA localmente sem depender de servidores externos.

Comente o que achou do resultado. O modelo resumiu de forma adequada e eficiente?

Categorias
Auditoria

Git: Controle de Versões – Básico I

E esse tal de GitHub? Resolvi estudar sobre o assunto e fiz este post com o aprendizado. Ao realizar uma busca, você com certeza já se deparou com muitas soluções disponíveis na plataforma: códigos em Python, projetos do Arduino, portfólios de Machine Learning e até mesmo livros!

No GitHub o autor pode compartilhar os códigos-fonte de sua obra, como no caso do livro “Mãos à Obra: Aprendizado de Máquina com Scikit-Learn, Keras & TensorFlow“, de Aurélien Géron. Todos os códigos fontes estão disponíveis no GitHub do autor neste link.

Git e GitHub

O que é Git? O Git é um sistema de controle de versões desenvolvido em 2005 pelo criador do Linux, Linus Torvalds. O Git é gratuito e open source e tem apoio de toda uma comunidade de desenvolvedores pelo mundo. Já o GitHub é um dos repositórios – talvez o mais famoso e utilizado.

Mais do que um simples backup – o controle de versões permite que você controle de forma organizada e sistemática cada uma das alterações que ocorreram no projeto. Com ele, é possível saber quando ocorreu cada mudança, o que mudou, quem mudou e porque mudou.

Você também fazer o rollback – voltar para uma versão específica antes de uma mudança significativa ou mesmo um erro.

Crie uma conta no Github e Instale o Git

Acesse o GitHub e crie uma conta gratuita. Depois faça o download do instalador do Git de acordo com o seu sistema operacional e crie um repositório. Os repositórios podem ser públicos ou privados dependendo do seu objetivo.

Defina uma diretório para sincronização na sua máquina.

Crie uma pasta no seu computador onde ficarão todos os seus projetos hospedados no GitHub. Por exemplo: c:\Repositorios\.

cd c:\
mkdir Repositorios
cd Repositorios

Utilize o Git Bash

Após instalar o Git, procure no menu iniciar pelo Git Bash. Aqui você poderá digitar os principais comandos Git. Para verificar em qual diretório você se encontra, utilize o comando abaixo.

git pwd

Para listar os diretórios da pasta atual:

ls

Stage, Commit, Push

Verifique o status de sincronização dos seus diretórios:

git status

Para realizar o Stage e selecionar todos os itens da pasta atual, digite o comando:

git add .

Para realizar o Commit, digite o comando:

git commit -m "Atualizando meu diretório"

O último passo é subir todo o conteúdo para o seu repositório no GitHub, com o comando Push:

git push

Contribua

Por ser tratar de uma tecnologia Open Source, você pode baixar o código-fonte do Git – utilizando o próprio Git, com o comando:

git clone https://github.com/git/git

Utilize o mesmo comando para copiar projetos para o seu repositório.

Referências

O Coursera possui diversos cursos sobre Git, GitHub e Controle de versões. Este artigo foi escrito com base no conteúdo deste curso da Emory University: Modelos reproduzíveis para análise e divulgação.

Você pode utilizar este cheatsheet do GitHub como guia de referência. Se você trabalha com a linguagem R, outro guia muito legal é o HappyGitWithR. Consulte também estes documentos: cheatsheet do RStudio, Atlassian e GitLab.

Este artigo do Medium pode ser útil.

Post original: Linkedin

você está offline!