sábado, 30 de mayo de 2009

INTEGRANTES


CATALINA ISAZA

PAULA OLGUIN
JAZMIN BARRERA
DANIEL CADAVID

INTRODUCCIÒN

En este trabajo desarrollaremos los conceptos del Data Warehouse y Data Mining como uno de los mejores avances tecnológicos para la toma de decisiones en las empresas, para tomar dichas decisiones requerimos de hechos y cifras, sabemos que la competencia crece en todo momento entonces las decisiones que debemos tomar en nuestra organización deben ser mas aceleradas; por ese motivo se requieren herramientas que nos ayuden a minimizar el tiempo para analizar mucha información con mayor velocidad y precisión; utilizando dichas herramientas logramos mantenernos competitivos, ya que nuestros actuar deben reaccionar al cambio del mercado. De otro modo el mercado globalizado, la presión inmensa de la competencia, los arranques tecnológicos, etc. Debilitaran nuestra organización. Esto nos muestra que las empresas invierten en tecnología y soluciones con las cuales se mantienen en este mundo cambiante, ahora las organizaciones no dependen tan solo de factores como ubicación, productos, etc. Sino también del conocimiento. Tal conocimiento basado en información comprensible, detallada y relevante es crucial para lograr y sostener ventaja competitiva. El poseer conocimientos correctos significa tener respuestas correctas y realizar decisiones estratégicas para la ejecución de la organización. Pero las tareas de recolectar, procesar, limpiar y transformar la información necesaria para la toma de decisiones no es una tarea sencilla mas si consideramos que una empresa tiene distintas áreas que a veces se encuentran alejadas de los ejecutivos de negocios.

sábado, 16 de mayo de 2009

DATA WAREHOUSE

Es un repositorio de datos de muy fácil acceso, alimentado de numerosas fuentes, transformadas en grupos de informaciòn sobre temas específicos de negocios para permitir nuevas consultas, anàlisis, reporteado y decisiones.

¿QUÈ ES LO QUE LE PREOCUPA A LOS EJECUTIVOS?

Se tienen montañas de datos en la compañía, pero no podemos llegar a ellos adecuadamente. Nada enloquece más a los ejecutivos que dos personas presentando el mismo resultado de operación pero con diferentes números y los ejecutivos lo que buscan es ver la información pero desde diferentes ángulos, mostrando únicamente lo que es importante para tomar una decisión en la empresa, finalmente los ejecutivos saben que hay datos que nunca serán confiables, por lo que prefieren que se eviten en los reportes ejecutivos.

Uno de los valores más importantes de una organizaciòn es la información.

Estos valores normalmente son guardados por la organizaciòn de dos formas:

  • Los sistemas operacionales de registros
  • Y el Data Warehouse

Crudamente hablando, los sistemas operacionales de registros es donde los datos son depositados y el Data WareHouse es de donde se extraen eso datos.

OBJETIVOS FUNDAMENTALES DE UN DATA WAREHOSE

  • Hace que la información de la organización sea accesible: Los contenidos del Data WareHouse son entendibles y navegables, y el acceso a ellos son caracterizado por el rápido desempeño. Estos requerimientos no tienen fronteras y tampoco limites fijos. Cuando hablamos de entendible significa, que los niveles de la información sean correctos y obvios. Y Navegables significa el reconocer el destino en la pantalla y llegar a donde queramos con solo un clic. Rápido desempeño significa, cero tiempo de espera. Todo lo demás es un compromiso y por consiguiente algo que queremos mejorar.
  • Hacer que la información de la organización sea consistente: La información de una parte de la organización puede hacerse coincidir con la información de la otra parte de la organización. Si dos medidas de la organización tienen el mismo nombre, entonces deben significar la misma cosa. Y a la inversa, si dos medidas no significan la misma cosa, entonces son etiquetados diferentes. Información consistente significa, información de alta calidad. Significa que toda la información es contabilizada y completada. Todo lo demás es un compromiso y por consiguiente algo que queremos mejorar.
  • Es información adaptable y elástica: El Data WareHouse está diseñado para cambios continuos. Cuando se le hacen nuevas preguntas al Data WareHouse, los datos existentes y las tecnologías no cambian ni se corrompen. Cuando se agregan datos nuevos al Data WareHouse, los datos existentes y las tecnologías tampoco cambian ni se corrompen. El diseño de Data Marts separados que hacen al Data WareHouse, deben ser distribuidos e incrementados. Todo lo demás es un compromiso y por consiguiente algo que queremos mejorar.
  • Es un seguro baluarte que protege los valores de la información: El Data WareHouse no solamente controla el acceso efectivo a los datos, si no que da a los dueños de la información gran visibilidad en el uso y abusos de los datos, aún después de haber dejado el Data WareHouse. Todo lo demás es un compromiso y por consiguiente algo que queremos mejorar.
  • Es la fundación de la toma de decisiones:El Data WareHouse tiene los datos correctos para soportar la toma de decisiones. Solo hay una salida verdadera del Data WareHouse: las decisiones que son hechas después de que el Data WareHouse haya presentado las evidencias. La original etiqueta que preside el Data WareHouse sigue siendo la mejor descripciòn de lo que queremos construir: un sistema de soporte a las decisiones.

ELEMENTOS BÀSICOS DE UN DATA WAREHOUSE

  • Sistema fuente: Sistemas operacionales de registros donde sus funciones son capturar las transacciones del negocio. A los sistemas fuentes también se le conoce como Legacy System.
  • Área de tráfico de datos: Es un área de almacenamiento y grupos de procesos, que limpian transforman, combinan, remover los duplicados, guardan, archivan y preparan los datos fuente para ser usados en el Data WareHouse.
  • Servidor de presentación: La maquina fisica objeto en donde los datos del Data WareHouse son organizados y almacenados para queries directos por los usuarios finales, reportes y otras aplicaciones.
  • Modelo dimensional: Una diciplina específica para el modelado de datos que es una alternativa para los modelos de entidad – relación.
  • Procesos de negocios: Un coherente grupo de actividades de negocio que hacen sentido a los usuarios del negocio del Data WareHouse.
  • Data Mart: Un subgrupo lógico del Data WareHouse completo.
  • Data WareHouse: Búsquedas fuentes de datos de la empresa. Y es la unión de todos los data marts que la constituyen.
  • Almacenamiento operacional de datos: Es el punto de integraciòn por los sistemas operacionales. Es el acceso al soporte de decisiones por los ejecutivos.
  • OLAP: Actividad general de búsquedas para presentación de texto y números del Data WareHouse, también un estilo dimensional específico de búsquedas y presentación de información y que es ejemplificada por vendedores de OLAP.
  • ROLAP: Un grupo de interfaces de usuarios y aplicaciones que le dan a la base de datos relacional un estilo dimensional.
  • MOLAP: Un grupo de interfaces de usuarios, aplicaciones y propietarios de teconologìa de base de datos que tienen un fuerte estilo dimensional.
  • Aplicaciones para usuarios finales: Una colección de herramientas que hacen los queries, analizan y presentan la información objetivo para el soporte de las necesidades del negocio.
  • Herramientas de acceso a datos por usuarios finales: Un cliente de Data WareHouse.
  • Ad Hoc Query Tool: Un tipo especifico de herramientas de acceso a datos por usuarios finales que invita al usuario a formas sus propios queries manipulando directamente las tablas relacionales y sus uniones.
  • Modelado de aplicaciones: Un sofisticado tipo de cliente de Data WareHouse con capacidades analíticas que transforma o digiere las salidas del Data WareHouse.
  • Meta Data: Toda la información en el ambiente del Data WareHouse que no son así mismo los datos actuales.





PROCESOS BÀSICOS DEL DATA WAREHOUSE (ETL)

  • Extracción: este es el primer paso de obtener la información hacia el ambiente del Data WareHouse.
  • Transformación: una vez que la información es extraída hacia el área de trafico de datos, hay posibles paso de transformación como; limpieza de la información, tirar lla basura que no nos sirve, seleccionar únicamente los campos necesarios para el Data WareHouse, combinar fuentes de datos, haciéndolas coincidir por los valores de las llaves, creando nuevas llaves para cada registro de una dimensión.
  • Carga: al final del proceso de transformación, los datos están en forma para ser cargados.