Uma das principais tecnologias em mineração de dados envolve a descoberta de regras de associação. O banco de dados é considerado uma coleção de transações, cada uma envolvendo um item de dado.
Um exemplo comum é o de dados de cesta de mercado. Aqui, a cesta de mercado corresponde aos conjuntos de itens que um consumidor compra em um supermercado durante uma visita. A ideia principal dessa característica é que um cliente que compra um item X, provavelmente comprará um item Y. Exemplo:
Observe que a maioria dos consumidores compram pão e leite. Uma política de marketing, baseada na análise das vendas, poderia sugerir que:
A relação entre dois itens pode ser definida por dois parâmetros: suporte e confiança.
| O suporte refere-se à frequência em que um conjunto de itens ocorre no banco de dados. Ou seja, o suporte é o percentual de transações que dois itens aparecem correlacionados. No exemplo acima, percebemos que pão e leite aparecem em 75% das compras. | A confiança é a relação em que o segundo item aparece associado ao primeiro. No nosso exemplo, 100% das pessoas que compraram pão também compraram leite. |
|---|