sábado, 16 de mayo de 2009

FUNDAMENTOS DEL DATA MINING

Las técnicas de Data Mining son el resultado de un largo proceso de investigacion y desarrollo de productos. Esta evoluciòn comenzó cuando los datos de negocios fueron almacenados por primera vez en computadoras y continuó con mejoras en el acceso a los datos, y más recientemente con tecnologías generadas para permitir a los usuarios navegar a través de los datos en tiempo eal. Data Mining toma este proceso de evoluciòn más allá del acceso y navegación retrospectiva de los datos, hacia la entrega de información prospectiva y proactiva. Data Mining está listo para su aplicación en la comunidad de negocios porque está soportado por tres tecnologías que ya están suficientemente maduras:

  • Recolección masiva de datos
  • Potentes computadoras con multiprocesadores
  • Algoritmos de Data Mining

Las bases de datos comerciales están creciendo a un ritmo sin precedentes. Un reciente estudio del META GROUP sobre los proyectos de data warehause encontró que el 19% de los que contestaron están por encima del nivel de los 50 Gigabytes, mientras que el 59% espera alcanzarlo en el segundo trimestre de 1997. En algunas industrias, tales como ventas al por menor (retail), estos números pueden ser aún mayores. MCI Telecommunications Corp. cuenta con una base de datos de 3 terabytes + 1 terabyte de índices y overhead corriendo en MVS sobre IBM SP2. La necesidad paralela de motores computacionales mejorados puede ahora alcanzarse de forma màs costos - efectiva con tecnologia de computadoras con multiprocesamiento paralelo. Los algoritmos de Data Mining utilizan técnicas que han existido por lo menos desde hace 10 años, pero que sólo han sido implementadas recientemente como herramientas maduras, confiables, entendibles que consistentemente son más performantes que metodos estadísticos clásicos.

En la evoluciòn desde los datos de negocios a información de negocios, cada nuevo paso se basa en el previo. Por ejemplo, el acceso a datos dinámicos es crítico para las aplicaciones de navegación de datos (drill through applications), y la habilidad para almacenar grandes bases de datos es crítica para Data Mining.

Los componentes esenciales de la tecnologia de Data Mining han estado bajo desarrollo por décadas, en áreas de investigaciòn como estadisticas, inteligenicas artificial y aprendizaje de máquinas. Hoy, la madurez de estas técnicas, junto con los motores de base de datos relacionales de alta performance, hicieron que estas tecnologías fueran prácticas para los entornos de data warehause actuales.

No hay comentarios:

Publicar un comentario