Skip to main content

Desenvolvido pelo Semantix Research Labs, o LLoro é o primeiro Large Language Model (Modelo de Linguagem de grande escala) treinado por bases de dados nacionais e capaz de realizar análise de dados a partir de comandos gerados em português-brasileiro.

O que é LLM?

Large Language Models ou Modelos de Linguagem de Grande Escala são um tipo de modelo de Inteligência Artificial capaz de entender e gerar texto. Em uma linguagem mais técnica, os LLMs são modelos de aprendizado de máquina ou Machine Learning que utilizam algoritmos de aprendizado profundo para processar e entender algum tipo de linguagem natural. O ChatGPT, Gemini (o antigo Bard) e o Llama são alguns LLMs que você já deve ter testado ou ouvido falar.

Sobre o LLoro

O LLoro é o primeiro LLM especializado em análise de dados e desenvolvido 100% em português. Com expertise em engenharia, transformação e análise de dados, ele é um poderoso aliado para impulsionar negócios na jornada de análise de dados.

Como o LLoro funciona?

Treinado com diversas bases de dados nacionais, consegue compreender contextos gramaticais e ortográficos com facilidade, eliminando a necessidade de traduções. Aprimorado a partir do Python 7B do Code Llama, um conjunto robusto de modelos de texto generativos, entre outras diversas bases de dados sintéticos, essa estrutura sólida permite que o LLoro processe e transforme instruções em português em código prático e executável com eficiência e precisão sem a necessidade de traduções, o que potencializa a análise de dados. Otimizado e treinado para essa finalidade, supera outros modelos generalistas de LLM em relação a performance e assertividade de resultados.

As métricas de desempenho do LLoro em tarefas de análise de dados são particularmente impressionantes quando comparadas ao modelo original da Meta, o Llama. Especificamente, o LLoro demonstrou uma melhoria substancial, alcançando um ganho de 19,44 pontos no fornecimento de respostas corretas como podemos ver no comparativo abaixo.

O que LLoro pode criar? 

Ao estabelecer conexões com qualquer base de dados, como por exemplo, APIs, bancos de dados, entre outros formatos, é capaz de tratar e analisar dados de maneira eficiente. São diversas possibilidades de uso. É possível gerar automaticamente códigos em Python a partir de simples comandos por chat (prompts) para realizar o processo de tratamento e padronização de dados de acordo com a necessidade de cada cenário de dados, além de construir gráficos personalizados a partir de comandos via prompt (chat to dash). Na imagem abaixo podemos ver como o LLoro funciona na prática.

Podemos dizer ainda que o LLoro é mais sustentável e gera muito mais valor com menos custos. Enquanto outras LLMs necessitam de GPUs de última geração para gerar traduções, o que traz custos elevados para evitar problemas de performance e maiores gastos de energia, o LLoro se destaca como um modelo treinado especificamente em dados em português, o que reduz custos e o torna uma opção sustentável e mais amigável para o meio ambiente. 

O Semantix LLoro já está disponível e integrado ao Semantix AI Agents, nossa plataforma intuitiva que facilita a criação de aplicações de IA personalizadas para todos os tipos de negócios. 

Referências:  

[1] https://semantix.ai/lloro/ 

[2] https://blog.dsacademy.com.br/o-que-sao-large-language-models-llms/ 

Leave a Reply