5
- Os Passos do Data Mining
Para nosso objetivo,
é suficiente apresentar os passos fundamentais de uma mineração
bem-sucedida.
A
partir de fontes de dados (bancos de dados, relatórios,
logs de acesso, transações, etc.), efetua-se uma
limpeza (consistência, preenchimento de informações,
remoção de ruído e redundâncias etc.).
Daí nascem os repositórios organizados (Data Marts
e Data Warehouses).
|
É
a partir desses repositórios que se pode selecionar algumas colunas
para atravessarem o processo de mineração.
Tipicamente, este processo não é o final da história:
de forma interativa e frequentemente usando visualização
gráfica, um analista refina e conduz o processo até que
valiosos padrões apareçam. Observe que todo esse processo
parece indicar uma hierarquia, algo que começa em instâncias
elementares (embora volumosas) e termina em um ponto relativamente concentrado,
mas muito valioso.

|