⦁ Introdução
O conceito de modelagem Data Vault é uma métodologia de banco de dados que é projetado para fornecer armazenamento histórico de longo prazo puxando os dados dos vários sistemas da empresa para um repositório central, incluindo alem da modelagem de dados processos de ETL (Extract, transform, load).
Com o Data Vault podemos desenvolver um Armazém de Dados com baixo custo, alta produtividade, baixo retrabalho, com processo de ETL de alta performance.
- Veja também: o que são dados?
⦁ Metodologia de modelagem data vault:
A metodologia de modelagem data vault é construido através de regras simples, capturando o negócio no modelo de dados. desta forma quando temos a lista de data bases com suas respectivas tabelas e colunas dos sistemas de origem, fica muito mais fácil e rápido de desenhar o modelo.
Outra grande vantagem do modelo data vault é que os dados são armazenados de maneira integrada. Os dados são inseridos no modelo sendo que todo o histórico dos dados e sistema de origem são armazenados no modelo.
As possíveis alterações nas origens dos dados podem ser resolvidas de forma rápida e simples, desta forma qualquer manutenção leva praticamente o mesmo tempo de repetir o desenvolvimento.
Horas ao invés de semanas, portanto;)Também podemos citar a paralelização de processos como grande vantagem no modelo data vault já que devido ao ETL, todas as operações podem ser maciçamente paralelizadas.
⦁ Experimentos e Resultados com a modelagem data vault
A composição da modelagem data vault é composta por 3 componentes básicos:
1. Hubs
2. Links
3. Satélites
Tabela HubOs Hubs indentificam as chaves de negócio. Essa chave de negócio e um conceito importante na modelagem data vault e deve ser única na tabela Hub.
A tabela hub possui os seguintes atributos:
1. BusinessKey: Atributo interio que contém a chave de negócio. é a chave primária da tabela hub.
2. Load Date: horário e data da inserção do registros.
3. Record Source: Sistema de origem do dado inserido.
Exemplo de tabela hub:
TabelaLink
A tabela link é responsavel por armazenar os relacionamentos entre as tabelas hubs. A tabela link possui os seguintes atributos:
1. LinkKey: chave primária da tabela link.
2. Load Date: horário e data da inserção do registros.
3. Record Source: Sistema de origem do dado inserido.
4.Business Key: chave da tabela hub que será usada para fazer o relacionamento
Exemplo de tabela link:
Tabela Satélite
As tabelas satélite armazenam todo o contexto das informações das tabelas Hubs. Ou seja para uma tabela Hub de cliente, aonde pode conter o cpf do cliente como chave de negócio na tabela satélite contém informações adicionais como por exemplo: nome do cliente , endereço do cliente.
A tabela satélite possui os seguintes atributos:
1. Busness key ou Link Key: chave primária da tabela hub ou link.
2. Load Date: horário e data da inserção do registros.
3.Record Source: Sistema de origem do dado inserido.
4. Atributos: pode ter um ou mais atributos, como por exemplo: nome do cliente, endereço do cliente.
Exemplo de tabela Satélite:
Exemplo tabela completa data vault:
Conclusões
Com isso podemos concluir que a adoção da metodologia data vault beneficos que tornam os processos de armazenamento de dados mais eficientes, reduzindo o tempo de desenvolvimento sendo facilmente escalável. Além disso o histórico dos dados de origem armazenados automaticamente facilitando o rastreamento das informações.