5 - Os Passos do Data Mining

Para nosso escopo, é suficiente apresentar os passos fundamentais de uma mineração bem sucedida.


A partir de fontes de dados (bancos de dados, relatórios, logs de acesso, transações, etc) efetua-se uma limpeza (consistência, preenchimento de informações, remoção de ruído e redundâncias, etc). Daí nascem os repositórios organizados (Data Marts e Data Warehouses), que são úteis de diversas maneiras.

Mas é a partir desses repositórios que se pode selecionar algumas colunas para atravessarem o processo de mineração. Tipicamente, este processo não é o final da história: de forma interativa e frequentemente usando visualização gráfica, um analista refina e conduz o processo até que valiosos padrões apareçam. Observe que todo esse processo parece indicar uma hierarquia, algo que começa em instâncias elementares (embora volumosas) e terminam em um ponto relativamente concentrado, mas muito valioso.




Copyright © 2003 AIEC.