4.6. Bancos de dados versus recuperação de informações

Tradicionalmente, a tecnologia de banco de dados se aplica a dados estruturados e formatados, que surgem em aplicações de rotina no governo, no comércio e na indústria. Ela é bastante utilizada nos setores de manufatura, varejo, bancos, seguros, finanças e saúde, onde dados estruturados coletados por meio de formulários, como faturas ou documentos de registro de pessoas.

Uma área relacionada à tecnologia de banco de dados é a Recuperação de Informação (RI), que lida com livros, manuscritos e diversas formas de artigos baseados em biblioteca. O dado é indexado, catalogado e anotado usando palavras-chave. A RI está relacionada à busca por conteúdo com base nessas palavras-chave e a muitos problemas que lidam com processamento de documento e processamento de texto em forma livre.

Muito trabalho tem sido feito sobre busca em texto baseada em palavras-chave, de documentos e sua classificação conforme a relevância, categorização automática de texto, classificação de documentos de texto por tópicos, e assim por diante. Com o advento da Web e a proliferação de páginas HTML na faixa dos bilhões, é preciso aplicar muitas técnicas de RI para processar os dados na Web. Os dados dessas páginas normalmente contêm imagens, texto e objetos que são ativos e mudam de maneira dinâmica.

A recuperação de informações na Web é um problema novo que exige que técnicas de bancos de dados e RI sejam aplicadas a uma série de combinações novas.

Copyright © 2014 AIEC.