1.1 - Mineração de dados versus data warehouse

O objetivo de um data warehouse é dar suporte à tomada de decisão com dados. A mineração de dados pode ser usada junto com um data warehouse para ajudar com certos tipos de decisões. A mineração de dados pode ser aplicada a bancos de dados operacionais com transações individuais. Para tornar a mineração de dados mais eficiente, o data warehouse deve ter uma coleção de dados agregada ou resumida.

Uma definição comum para um data warehouse é:

Uma coleção de dados orientada a assunto, integrada, não volátil, variável no tempo para o suporte às decisões da gerência. Os data warehouses oferecem acesso a dados para análise complexa, descoberta de conhecimento e tomada de decisão. Eles dão suporte a demandas de alto desempenho sobre os dados e informações de uma organização.

Já a mineração de dados é o ato de explorar o data warehouse, é o local de armazenamento dos dados a serem explorados, organizado de tal forma a facilitar a exploração.

Essa coleção de dados é formada por rotinas de conversão de dados transacionais, nas quais novas formas de análise sobre os mesmos dados são gerados. Exemplo: uma empresa poderá, a partir dos dados de todas as vendas realizadas em determinado ano, criar um banco de dados que resuma e consolide as vendas por tipo de item, faixas de valor, região da venda, faixas de valor de venda, marca e outros. Esse novo banco de dados gerado é a representação agregada/resumida do banco de dados relacional. A conversão transforma um banco de dado transacional (On-line Transaction Processing – OLTP) em um banco de dados analítico (On-line Analytical Processing – OLAP).

Copyright © 2016 AIEC.