1.2 - Mineração de dados como parte do processo de descoberta do conhecimento
A descoberta de conhecimento nos bancos de dados, normalmente abrange mais do que a mineração de dados. O processo de descoberta de conhecimento compreende seis fases:
Como exemplo, considere um banco de dados de transação mantido por um supermercado. Suponha que os dados do cliente incluam um nome de cliente, CEP, número de telefone, data de compra, código do item, preço, quantidade e valor total. Uma grande quantidade de conhecimento novo pode ser descoberta pelo processamento desse banco de dados de cliente. Veja a seguir.
|
Durante a seleção de dados, dados sobre itens específicos ou categorias de itens, ou de lojas em uma região, ou área específica do país, podem ser selecionados.
|
O processo de limpeza de dados, então, pode corrigir códigos postais inválidos ou eliminar registros com prefixos de telefone incorretos.
|
O enriquecimento normalmente melhora os dados com fontes de informação adicionais. Exemplos
|
||
|
Se a mineração de dados for baseada em um data warehouse existente para essa cadeia de varejo, podemos esperar que a limpeza já tenha sido aplicada. É somente depois do pré-processamento que as técnicas de mineração de dados são usadas para extrair diferentes regras e padrões.
|
A transformação de dados e a codificação podem ser feitas para reduzir a quantidade de dados. Veja exemplos
|
Por exemplo, dados os nomes de cliente e números de telefone, a loja pode adquirir outros dados sobre idade, renda e avaliação de crédito e anexá-los a cada registro.
XPor exemplo, os códigos de item podem ser agrupados em relação a categorias de produtos, em áudio, vídeo, suprimentos, aparelhos eletrônicos, câmera, acessórios, e assim por diante. Os códigos postais podem ser agregados em regiões geográficas, as rendas podem ser divididas em faixas, e assim por diante.
X