1.3 - Objetivos da mineração de dados e da descoberta do conhecimento
A mineração de dados costuma ser executada com alguns objetivos finais ou aplicações. De um modo geral, esses objetivos se encontram nas seguintes classes:
| Previsão | Identificação | Classificação | Otimização |
|---|---|---|---|
|
|
|
|
O termo mineração de dados é usado popularmente em um sentido muito amplo. Em algumas situações, ele inclui análise estatística e otimização restrita, bem como aprendizado de máquina.
Não existe uma linha nítida separando a mineração de dados dessas disciplinas. Portanto, está além do nosso escopo discutir com detalhes a gama inteira de aplicações que compõem esse vasto corpo de trabalho. Para um entendimento detalhado do assunto, os alunos poderão consultar livros especializados, dedicados à mineração de dados.
Alguns exemplos de mineração de dados previsível incluem a análise de transações de compra para prever o que os consumidores comprarão sob cerros descontos, quanto volume de vendas uma loja gerará em determinado período e se a exclusão de uma linha de produtos gerará mais lucros. Em tais aplicações, a lógica de negócios é usada junto com a mineração de dados. Em um contexto científico, certos padrões de onda sísmica podem prever um terremoto com alta probabilidade.
XPor exemplo, intrusos tentando quebrar um sistema podem ser identificados pelos programas executados, arquivos acessados e tempo de CPU por sessão. Em aplicações biológicas, a existência de um gene pode ser identificada por certas sequências de símbolos nucleotídeos na sequência de DNA. A área conhecida como autenticação é uma forma de identificação. Ela confirma se um usuário é realmente um usuário específico ou de uma classe autorizada, e envolve uma comparação de parâmetros, imagens ou sinais contra um banco de dados.
XPor exemplo, os clientes em um supermercado podem ser categorizados em compradores que buscam desconto, compradores com pressa, compradores regulares leais, compradores ligados a marcas conhecidas e compradores eventuais. Essa classificação pode ser usada em diferentes análises de transações de compra de cliente como uma atividade pós-mineração. Às vezes, a classificação baseada em conhecimento de domínio comum é utilizada como uma entrada para decompor o problema de mineração e torná-lo mais simples. Por exemplo, alimentos saudáveis, alimentos de festa ou alimentos de lanche escolar são categorias distintas nos negócios do supermercado. Faz sentido analisar os relacionamentos dentro e entre categorias como problemas separados. Essa categorização pode servir para codificar os dados corretamente antes de submetê-los a mais mineração de dados.
XEsse objetivo da mineração de dados é semelhante à função objetiva, usada em problemas de pesquisa operacional, que lida com otimização sob restrições.
X