Professional Documents
Culture Documents
Datos de produccin: Se refieren a las bases operacionales de datos que contienen la informacin recopilada de las aplicaciones operacionales (relacionales, no relacionales o basadas en archivos). Datos de herencia: estn fuera de lnea, en archivos perdidos, por que ya no son necesarios para apoyar oper. Sin embargo, estos datos tienen un gran valor histrico. Sistemas Internos de oficina: no estn almacenados en una BD operacional (formas no electrnicas, reportes, hojas de clculo, etc.). Sistemas Externos: la empresa no lo controla, ni posee, ni opera. Puede ser electrnica cmo el Dow Jones, o no electrnicas como: revistas. Metadatos para fuentes: Son la informacin de definicin a cerca de los datos de la fuente. Incluyen: nombre, definicin de campos, fecha y la fuente.
Filtrar y ajustar
Condensar y agregar Hacer un clculo previo y derivar Traducir Y formatear Transformar Y reubicar
Condensar
Limpiar y pulir
Agregar
Conciliar y validar
El componente de reingeniera es responsable de preparar los datos para que sean congruentes con las necesidades de anlisis del usuario empresarial
Des. Consultas con base en la arquitectura Examinar y navegar por los metadatos
Crear metadatos
Crear glosario
Integrar y fragmentar
Condensar
Agregar
Conciliar y validar
La principal diferencia entre el data warehouse y el mercado de datos es el enfoque del usuario final. El segundo se concentra en las necesidades de un departamento individual, mientras que el primero est compuesto de todos los departamentos de la corporacin.
Des. Consultas con base en la arquitectura Examinar y navegar por los metadatos
Crear glosario
Herramientas SSD Herramientas de modelado empresarial Herramientas para minera de datos Aplicaciones de nueva produccin Reporte y administracin de metadatos
El componente de acceso y recuperacin es responsable de transformar los datos recuperados en vistas multidimensionales o de almacenarlo en una base de datos multidimensional para un anlisis posterior. Una consideracin importante es el rango de consultas: predefinidas, ad hoc, repetitivas, para profundizar.
Reingeniera
Crear depsito local Administrar metadatos del data warehouse Creacin y extraccin de metadatos
OLAP
Capa de Transporte
Capa de infraestructura
Administracin de sistemas Administracin del flujo de trabajo Sistemas de almacenamiento Sistemas de procesamiento
Ciclo de desarrollo
Planeacin
Seleccin de la estrategia de implementacin Seleccin de la metodologa de desarrollo Seleccin del mbito de implementacin PLANEACIN Seleccin del enfoque arquitectnico Desarrollo de un programa y del presupuesto del proyecto Desarrollo de escenarios de uso empresarial Recopilacin de meta datos
Seleccin de la estrategia de implementacin La decisin tiene mucho que ver con la cultura organizacional y se basan en cmo se llevan a cabo las tareas dentro de la organizacin: El enfoque de arriba hacia abajo (de lo general a lo particular): Se identifican primero los requerimientos empresariales que debe cubrir el data warehouse propuesto. Se recomienda cuando: * Se est familiarizado con las tecnologas y se tiene una amplia experiencia. * Cuando se tiene una idea clara donde encaja el datawarehouse para toma de desiciones. El enfoque de abajo hacia arriba (de lo particular a lo general): Se comienza con experimentos y prototipos. Se recomienda cuando: * Cuando la organizacin no est comprometida con la tecnologa. * Cuano la organizacin trata de obtener una idea de los costos y gastos adicionales. Una combinacin de las anteriores.
PLANEACI N
En cascada
Desarrollo en espiral
Etc.
Cules son las capacidades planeadas en trminos de caractersticas y funciones? Para que se til el data warehouse debe considerar si satisface un conjunto mnimo de caractersticas
Cules son las diversas fuentes de datos que pueden y/o deben integrarse al data warehouse? Se extrae de base de datos de herencia, como las externas.
Cundo debe volverse operacional el data warehouse? Se est usando el data warehouse para identificar a los clientes y ofrecer servicios mejorados
PLANEACIN
Desarrollo de un programa y del presupuesto del proyecto Desarrollo de escenarios de uso empresarial
Entre ms especficos sean los formatos de consultas, ser mas fcil definir las dimensiones y las especificaciones de adicin y resumen, as como el rango de entidades empresariales que deben rastrearse dentro del data warehouse. Dame las ventas por trimestre para los ltimos tres aos de clientes que compraron pizza de pepperoni en la zona poniente de Tuxtla Gutirrez
PLANEACIN
Desarrollo de un programa y del presupuesto del proyecto Desarrollo de escenarios de uso empresarial
PLANEACIN
Reservar un presupuesto adecuado para el programa al tiempo que se compromete el gasto para proyectos especficos.
Estimacin del costo, con base en el historial de la organizacin en el desarrollo de software. Estimacin del costo, con base en la arquitectura de referencia.
Seleccin de la estrategia de implementacin Seleccin de la metodologa de desarrollo Seleccin del mbito de implementacin PLANEACIN Seleccin del enfoque arquitectnico Desarrollo de un programa y del presupuesto del proyecto Desarrollo de escenarios de uso empresarial Recopilacin de meta datos
El data warehouse lo utilizan personas distintas a los desarrolladores y gerentes. Un factor de xito fundamental para asegurar que el data warehouse sea utilizable consiste en hacer que los usuarios finales se involucren e|n el establecimiento de expectativas de lo que puede ofrecer el data warehouse. Un usuario empresarial claramente identificado, como un gerente de produccin de accesorios para automovil, con un papel empresarial bien definido. Un rea funcional que respalde el data warehouse o el mercado de datos y que lo utilice cuando est terminado, como la de planeacin de productos y anlisis de mercado. Las consultas empresariales deben formularse en trminos precisos empleando el lenguaje comn de negocios que entiendan los usuarios finales y el rea funcional. Cules son las ventas por trimestre de equipo de aire acondicionado para automviles durante los dos ltimos aos en el mercado europeo? Cul es la correlacin entre las temperaturas promedio en verano por pas y las ventas de equipo de aire acondicionado?
Seleccin de la estrategia de implementacin Seleccin de la metodologa de desarrollo Seleccin del mbito de implementacin PLANEACIN Seleccin del enfoque arquitectnico Desarrollo de un programa y del presupuesto del proyecto Desarrollo de escenarios de uso empresarial Recopilacin de meta datos
Requerimient os
Los requerimientos describirn con claridad el ambiente operativo en que se entregar el data warehouse.
Algunas de las cuestiones que proponen los propietarios (o inversionistas) del data warehouse son las siguientes: Por qu construir un data warehouse o un mercado de datos? qu problema empresarial abordar? Cules son los objetivos empresariales?
Cunto costar?Cundo estar listo? Cul es el impacto sobre la gente? sobre las habilidades? sobre las organizacin? Cmo afecta nuestras inversiones actuales en cmputo?
reas Tema
Granularidad
Dimensiones
reas tema
Ejemplo: el departamento de comercializacin pudiera tener inters en uno de los temas siguientes:
Investigacin de mercado. Anlisis de competitividad. Comportamiento del comprador. Producto de segmentacin de mercado. Decisiones sobre precios y presupuestos. Decisiones sobre productos. Decisiones sobre promocin. Decisiones sobre canales. Pronsticos de tendencias. Pruebas de calidad. reas tema de inters del departamento de comercializacin: Pedidos. Promociones. Mercados. Ventas. Ciclo de Tiempo
Granularidad
Se refiere al nivel de detalle de la informacin requerida. La granularidad tiene una relacin directa con las actividades de resumen y adicin que deben realizarse sobre los datos fuente. A menor granularidad menor cantidad de detalle. Para incrementar su granularidad (y su utilidad para quienes toman las decisiones), los datos operacionales deben resumirse y acumularse toda va ms. Por lo regular, entre mayor sea la granularidad, mayor ser la cantidad de procesamiento requerido para convertir y resumir los datos operacionales. Al mismo tiempo los datos con alta granularidad requieren de menos volumen de almacenamiento y se pueden tambin consultar con rapidez y conveniencia.
Cules son los nombres de los diez primeros productos por regin para ventas en volumen? (no el volumen real de ventas).
Quin es el representante de ventas / contratos con el mas alto ingreso? (no el ingreso por contratos individuales para ese representante de ventas).
Dimensiones
Un data warehouse organiza un gran conjunto de datos operacionales e histricos mediante mltiples dimensiones de categorizacin. Las siguientes dimensiones son de uso comn en las consultas empresariales.
Tiempo Grupo de clientes. Familias de productos. Geografa y ubicacin. Estructura de la organizacin. Especificas de la organizacin. Especificas de la industria
GEOGRAFA Rep. Ventas Territorio Distrito Regin del pas CLIENTE Cliente Segmento de mercado PRODUCTO Producto Familia de productos ORGANIZACIN Linea de productos Mercado Industria Regin del pas Pas Regin Corporativa internacional
Departamento
Unidad empresarial
Divisin
Definir los requerimientos del arquitecto REQUERIMIENTOS Definir los requerimientos del desarrollo
El arquitecto es la persona responsable de disear los diversos componentes del data warehouse para sustentar las necesidades actuales y futuras. Deben compilar una serie de requerimientos que coincidan con la visin del propietario, as como un conjunto de requerimientos que refleje la implementacin de la tecnologa. Tipos de arquitectura: Arquitectura de datos Modelo entidad - relacin Arquitectura de aplicacin Catalogo de aplicaciones junto con funciones que ofrecen y las interfaces entre ellas. Arquitectura de tecnologa Descripcin de todos los componentes de tecnologa (computadora, servidor, RDBMS, etc)
Definir los requerimientos del arquitecto REQUERIMIENTOS Definir los requerimientos del desarrollo
Definir requerimientos
Definir requerimientos
Definir requerimientos
Los requerimientos del desarrollador son un refinamiento de los del arquitecto, con decisiones tomadas respecto a la seleccin de plataformas y la separacin de arquitectura de datos y la arquitectura de aplicaciones sobre las plataformas seleccionadas.
Tambin los requerimientos del desarrollador se relacionan con descripciones detalladas de la arquitectura de tecnologa para la especificacin de elementos tales como el lenguaje de programacin, el acceso al RDBMS y los protocolos de comunicacin.
Definir los requerimientos del arquitecto REQUERIMIENTOS Definir los requerimientos del desarrollo
Requerimientos de consulta: Captan las consultas empresariales expresadas en la terminologa del usuario final Departamento de Ventas
Departamento de comercializacin
Departamento de embarques
Requerimientos de reportes
Cada uno de los usuarios finales antes descritos tiene diversos requerimientos de reportes.
Anlisis
Convertir los requerimientos acopiados en la fase anterior de requerimientos, en conjunto de especificaciones que puedan apoyar al diseo.
Diseo
Los modelos lgicos desarrollados en la fase de anlisis se convierten en modelos fsicos
El diagrama consolidado resultante para cada rea tema se denomina modelo Starnet (red estrella)
Construccin
La fase de construccin es responsable de implementar fsicamente los diseos desarrollados durante la fase de diseo. La construccin del data warehouse es similar a la construccin de un sistema de base de datos relacional grande. La mayora de las aplicaciones que se necesitan construir son las siguientes:
Programas que creen y modifique n las bases de datos para el data warehouse . Programas que extraigan datos de fuentes relacionale s y no relacionale s. Programas que realicen transform aciones de datos, tales como integraci n, resumen y adicin. Programas que realicen actualizaci ones de bases de datos relacionale s.
La capacidad de integracin de sistemas para conjuntar los sistemas de fabricacin con las fuentes de datos existentes y las herramientas de acceso de datos existentes y propuestas.
La administracin de metadatos.
Procesamiento Analtico
Cuales fueron los ingresos por ventas en el fin de semana del Da de Accin de Gracias (nuestro mejor fin de semana de ventas) para todas las tiendas del medio oeste, con corte por departamento
Cuales fueron los diez artculos ms rentables durante la venta posterior a la Navidad?. Cuales fueron los diez menos rentables?
Como se comparan las ventas del Da de Accin de Gracias con las del mismo fin de semana en los ltimos cinco aos, por departamen to y tienda?
Los mismos gerentes y analticos requieren la funcionalidad del procesamiento analtico cuando deben responder a preguntas complejas como las siguientes: Cuantos esques de nieve, fabricados por SpeedSkiDown, Inc., Se vendieron a hombres en el mes de noviembre, en nuestras tiendas de las regiones del medio oeste, del noroeste y de la montaa? Como se compara lo programado con lo real del mismo mes en los dos ltimos aos?
Cuantas minivans azules tenamos en inventario (al fin del trimestre) con un reproductor de discos compactos y un tercer asiento, cuando la lista de precios era menor de $19,995? Se requieren totales por estado para cada trimestre de los ltimos cinco aos, comparar lo real contra lo planeado, y comparar el inventario de cada trimestre con el del anterior y el del siguiente
Un requerimiento fundamental para las grandes empresas es buscar nuevas oportunidades de mercado y segmentos de micromercado y crear programas de comercializacin detallados. Para lograr esto es un requisito el anlisis multidimensional
Anlisis multidimensional
Los datos se representan mediante dimensiones como producto, territorio y cliente. Por lo regular las dimensiones se relacionan en jerarquas, por ejemplo, ciudad, estado, regin, pas y continente, o estado territorio y regin. El tiempo es tambin una dimensin estndar con su propia jerarqua como da, semana, mes, trimestre y ao, o da y ao calendario.
El procesamiento analtico se usa para entender lo que est sucediendo en la empresa y promete anlisis del tiempo Qu pasa si? e y ahora qu?
Qu hace OLAP?
Presenta una visin multidimensional lgica de los datos. Comprende siempre la consulta interactiva y el anlisis de los datos. Ofrece opciones de modelado analtico, incluyendo un motor de clculo para obtener proporciones, desviaciones, etc. Que comprende mediciones de datos numricos a travs de muchas dimensiones. Crea resmenes y adiciones, jerarquas, y cuestiona todos los niveles de adicin y resumen en cada interseccin de las dimensiones. Maneja modelos funcionales de pronostico, anlisis de tendencias y anlisis estadsticos. Recupera y exhibe datos tabulares en dos o tres dimensiones, cuadros y grficas, con un pivote fcil de los ejes. Responde con rapidez a las consultas, de modo que el proceso de anlisis no se interrumpe y la informacin no se desactualiza. Tiene un motor de depsito de datos multidimensional, que almacena los datos en arreglo. Estos arreglos son una representacin lgica de las dimensiones empresariales.
Click Derecho
Click
Click
Click
Click
Click
Click Derecho
Click
Click
Click
Click
Click derech o
Click derecho
Comparar promociones
Biblioagrafa
1. Data Warehousing: La integracin de informacin para la mejor toma de decisiones, Harjinder S. Gill y Prakash C. Rao, Prentice Hall. 2. http://premiunnet.com/Information/lab0 , Ricardo Mendoza Rivera, consultado Marzo de 2008