Skip to main content

⦁ Introdução

O conceito de modelagem Data  Vault é  uma  métodologia de banco  de  dados que  é  projetado para fornecer armazenamento histórico de longo prazo puxando os dados dos vários sistemas da empresa para um repositório central, incluindo alem da modelagem de dados processos de ETL (Extract, transform, load).

Com  o Data  Vault  podemos desenvolver  um  Armazém de  Dados  com baixo  custo,  alta produtividade, baixo retrabalho, com processo de ETL de alta performance.

⦁ Metodologia de modelagem data vault:

A metodologia de modelagem  data vault  é  construido através  de  regras simples,  capturando  o negócio  no  modelo de dados. desta forma quando temos a lista de data bases com suas respectivas tabelas e colunas dos sistemas de origem, fica muito mais fácil e rápido de desenhar o modelo.

Outra grande vantagem do modelo data vault  é que os dados são armazenados de maneira integrada. Os dados são inseridos no modelo sendo que todo o histórico dos dados e sistema de origem são armazenados no modelo.

As  possíveis  alterações nas  origens  dos dados  podem  ser resolvidas  de  forma rápida  e simples,  desta forma  qualquer  manutenção leva  praticamente  o mesmo  tempo  de repetir  o desenvolvimento.

Horas ao invés de semanas, portanto;)Também podemos citar a paralelização de processos como grande vantagem no modelo data vault já que devido ao ETL, todas as operações podem ser maciçamente paralelizadas.

modelagem datavault

⦁ Experimentos e Resultados com a modelagem data vault

A composição da modelagem data vault é composta por 3 componentes básicos:

1. Hubs

2. Links

3. Satélites

Tabela HubOs Hubs indentificam as chaves de negócio. Essa chave de negócio e um conceito importante na modelagem data vault e deve ser única na tabela Hub.

A tabela hub possui os seguintes atributos:

1. BusinessKey: Atributo interio que contém a chave de negócio. é a chave primária da tabela hub.

2. Load Date: horário e data da inserção do registros.

3. Record Source: Sistema de origem do dado inserido.

Exemplo de tabela hub:

modelagem datavault

TabelaLink

A tabela link é responsavel por armazenar os relacionamentos entre as tabelas hubs. A tabela link possui os seguintes atributos:

1. LinkKey: chave primária da tabela link.

2. Load Date: horário e data da inserção do registros.

3. Record Source: Sistema de origem do dado inserido.

4.Business Key: chave da tabela hub que será usada para fazer o relacionamento

Exemplo de tabela link:

datavault

Tabela Satélite

As tabelas satélite armazenam todo o contexto das informações das tabelas Hubs. Ou seja para uma tabela Hub de cliente, aonde pode conter o cpf do cliente como chave de negócio na tabela satélite contém informações adicionais como por exemplo: nome do cliente , endereço do cliente.

A tabela satélite possui os seguintes atributos:

1. Busness key ou Link Key: chave primária da tabela hub ou link.

2. Load Date: horário e data da inserção do registros.

3.Record Source: Sistema de origem do dado inserido.

4. Atributos: pode ter um ou mais atributos, como por exemplo: nome do cliente, endereço do cliente.

Exemplo de tabela Satélite:

conceito de modelagem datavault

Exemplo tabela completa data vault:

conceito de modelagem datavault

Conclusões

Com isso podemos concluir que a adoção da metodologia data vault beneficos que tornam os processos  de  armazenamento de  dados  mais eficientes,  reduzindo  o tempo  de desenvolvimento sendo facilmente escalável. Além disso o histórico dos dados de origem armazenados automaticamente facilitando o rastreamento das informações.

Leave a Reply