3.1.2 - Transformação

Em geral, pelo fato de os dados de um DW virem de diversos sistemas (diversos BD) muitas vezes localizados em SGBD diferentes, é comum que o mesmo tipo de informação esteja gravado de formas diferentes nesses bancos de dados. Os dados precisam ser formatados por coerência dentro do armazém. Nomes, domínios dos dados de fontes não relacionadas precisam ser reconciliados.

Por exemplo, uma informação referente à cidade de São Paulo pode estar armazenada como “São Paulo” em um BD, como “SAO PAULO” em outro e como “S. Paulo” em um terceiro BD.

É necessário que se entenda essas divergências e se corrija para um único formato a ser armazenado no DW. Uma rotina denominada transformação de dados é responsável por essa tarefa.

A limpeza de dados é um processo complicado e complexo, que tem sido identificado como o componente que mais exige trabalho na construção do data warehouse. Para a entrada de dados, a limpeza precisa ocorrer antes que eles sejam carregados no armazém.
Copyright © 2016 AIEC.