You are on page 1of 44

INFORMACION PARA LA TOMA DE DESICIONES

Data Warehouse-Data Mining Business Intelligence

Inteligencia de negocios (Business Intelligence)




El trmino Inteligencia de negocios es la traduccin de Business Intelligence (BI). BI es un proceso centrado en el usuario que permite explorar datos, relaciones entre datos y tendencias, permitiendo mejorar la toma de decisiones. Esto incluye un proceso interactivo de acceso a los datos y el anlisis de los mismos para obtener conclusiones

Caso de aplicacin de BI


Twentieth Century Fox utiliza BI para predecir que actores, argumentos y filmes sern populares en cada barrio o ciudad. Evitando ciertos argumentos en cines especficos, la compaa tiene ahorros de $100M alrededor del mundo cada ao. Esa misma tecnologa utilizan para seleccionar los trailers alternativos para cada pelcula en cada cine y as maximizar las ventas.

Componentes de BI
   

Multidimensionalidad Data Mining Agentes Data Warehouse

Areas de utilizacin de BI


 

Ventas: Anlisis de ventas. Deteccin de clientes importantes, pronsticos y proyecciones. Marketing: Segmentacin y anlisis de clientes, seguimiento de nuevos productos. Finanzas: Anlisis de gastos, rotacin de cartera. Manufactura: Anlisis de desperdicios y calidad. Rotacin de inventarios y partes crticas. Embarques: Seguimiento de embarques, motivos de la prdida de pedidos.

Como detectar si es necesario una solucin de BI en su negocio




Paso ms tiempo recolectando y preparando informacin que analizndola. Me frustra no poder encontrar informacin que estoy seguro que existe. Paso mucho tiempo haciendo que mis reportes luzcan bien Quisiera saber que productos fueron los ms rentables durante un determinado perodo. No conozco los patrones de compra de mis clientes

Caso de una franquicia de hoteles




Con BI puede llevar un registro estadstico del porcentaje promedio de ocupacin del hotel, as como el tiempo promedio de estada de cada husped considerando las diferentes temporadas. Con esta info puede: Calcular la rentabilidad de cada hotel en cada temporada Determinar quien es su segmento de mercado Identificar oportunidades y amenazas

Ahora tenemos ms conocimiento de nuestro negocio para actuar con inteligencia

data warehouse


Un es un repositorio de informacin extrada de otros sistemas de la compaa (ya sean los sistemas transaccionales, las bases de datos departamentales, la Intranet, o bases de datos externas, tales como datos macroeconmicos, indicadores del mercado, etc.) y que es accesible a los usuarios de negocios.

Caractersticas
  

Estn orientados al tema Son integrados, no voltiles e historiados Estn organizados para el apoyo de un proceso de ayuda a la decisin.

Creacin de un Data Warehouse




Antes de cargarse en el data warehouse, los datos deben extraerse, depurarse y prepararse. Estas fases de alimentacin son generalmente muy complejas. Una vez integrada, la informacin debe presentarse de manera comprensible para el usuario.

Objetivos


lograr recomponer los datos disponibles para obtener una visin integrada y transversal de las distintas funciones de la empresa, una visin de negocio a travs de distintos ejes de anlisis y una visin agregada o detallada, adaptada a las necesidades.

Funcionamiento


El data warehouse es por lo general, pero no necesariamente, una plataforma separada de las dems computadoras. Un data warehouse se construye duplicando los datos que existen en algn otro lugar. Esto tiene algunas ventajas, entre ellas, no se utilizan los recursos de los sistemas transaccionales para realizar las consultas, y como consecuencia no se recargan dichos sistemas. Por otro lado, se obtiene mayor seguridad debido a que los datos de los sistemas de la compaa no pueden ser alterados con consultas realizadas por los usuarios.

Orientacin al tema


El data warehouse se organiza alrededor de los temas principales de la empresa. As, los datos se estructuran por temas, contrariamente a los datos de los sistemas transaccionales, organizados generalmente por proceso funcional. El inters de esta estructuracin particular de los datos es disponer de todas las informaciones tiles sobre un tema normalmente transversal a las estructuras funcionales y organizativas de la empresa. En la prctica, puede crearse una estructura suplementaria llamada data mart (almacn de datos) para apoyar la orientacin al tema.

Datos integrados


Para llegar a obtener un punto de vista nico y transversal, los datos deben estar integrados. La consolidacin de todas las informaciones respecto de un cliente dado es necesaria para dar una visin homognea de dicho cliente. Antes de estar integrados en el data warehouse, los datos deben formatearse y unificarse para llegar a un estado coherente. Un dato debe tener una descripcin y una codificacin nicas.

Datos Historiados


Los sistemas transaccionales raramente conservan el historial de los valores de los datos. El data warehouse almacena el historial, es decir, el conjunto de valores que los datos habrn tenido en su historia.

Datos no voltiles


La no volatilidad es en cierto modo una consecuencia de la historializacin. Una misma consulta efectuada en un data warehouse con tres meses de intervalo, precisando naturalmente la fecha de referencia de la informacin buscada, dar el mismo resultado. En un sistema transaccional, la informacin es voltil, el dato se actualiza regularmente. Las consultas afectan los datos actuales y es difcil recuperar un resultado antiguo.

Data Mart


un data warehouse abarca a toda la compaa, mientras que un data mart abarca solo una parte de ella, es decir, est referido a un rea o tema de la organizacin. Su construccin requiere mucho menos tiempo y costo que la construccin de un data warehouse, debido a que su complejidad es baja o mediana.

Estructura de un data warehouse




cuatro clases de datos, organizadas segn un eje histrico y un eje sinttico. Datos detallados Datos comprimidos Datos histricos Metadatos

   

Datos detallados


Las inserciones regulares de datos surgidos de los sistemas de produccin habitualmente se realizarn en este nivel. Aunque no hay que generalizar, los datos detallados pueden ser muy voluminosos y necesitar mquinas sofisticadas para gestionarlos y tratarlos. El nivel de detalle almacenado en el data warehouse no es forzosamente idntico al nivel de detalle gestionado en los sistemas transaccionales. El dato insertado en el data warehouse puede ser una agregacin o una simplificacin de informaciones sacadas del sistema transaccional.

Datos comprimidos


Los datos comprimidos se utilizan a menudo, dado que corresponden a elementos de anlisis representativos de las necesidades de los usuarios. Constituyen un resultado de anlisis y una sntesis de la informacin contenida en el sistema de decisin. Por eso deben ser fcilmente accesibles y comprensibles. La facilidad de acceso viene dada por estructuras multidimensionales que permiten a los usuarios navegar por los datos segn la lgica ms intuitiva. El rendimiento vinculado al acceso de estos niveles debe ser tambin ptimo.

Datos histricos


Uno de los objetivos del data warehouse es conservar en lnea los datos histricos. El soporte de almacenamiento de los datos historiados depende del volumen de stos, de la frecuencia de acceso, del tipo de acceso y del costo de los soportes.

Metadatos


Los metadatos proveen definiciones acerca de los datos almacenados en un data warehouse como, por ejemplo, la fuente de los datos, la forma en que stos han sido transformados desde los sistemas de origen, las reglas utilizadas en la sumarizacin y agregacin, el significado de la interpretacin apropiada, si el significado del dato ha cambiado en el tiempo, o los caminos para navegar a travs de los datos en el data warehouse. Los metadatos permiten tener definiciones de los datos y facilitan a los usuarios saber si lo que buscan realmente existe y en qu lugar pueden encontrarlo, informando qu base de datos y qu tabla deben consultar.

Existen diferentes tipos de metadatos




Metadatos del negocio: conocidos como metadatos para el usuario final. Describen datos especficos del negocio y pueden tambin incluir sinnimos, restricciones de acceso a datos, reglas de negocios, etc. Metadatos de la base de datos: definen los trminos utilizados en la base de datos, en particular los nombre de los objetos (bases de datos, tablas, columnas, etc.). Metadatos de aplicaciones: explican trminos y funciones en una aplicacin, por ejemplo, nombres de informes.

Mtodos de anlisis para la toma de decisiones

Consultas estndar


Estas consultas son ms utilizadas que los otros tres mtodos de anlisis por las personas de negocios. Las consultas, en general, estn predefinidas: mientras que los datos pueden ir variando da a da, las consultas estndar no pueden ser redefinidas cada vez que se utilizan.

Anlisis multidimensional


El anlisis multidimensional provee diferentes perspectivas de los datos a travs de las diferentes dimensiones. Ejemplos de dimensiones pueden ser: tiempo, ubicacin, producto. En general, los usuarios observan la informacin por alguna de las dimensiones, por ejemplo ver todos los clientes nuevos por regin. Esta dimensin es geogrfica, y el usuario puede solicitar detalles adicionales una vez realizada la consulta. Por ejemplo, ver todos los clientes nuevos por distrito. Las herramientas utilizadas para el anlisis multidimensional son muchas veces las mismas que se utilizan para las consultas estndar. La diferencia es que mientras las consultas estndar recuperan grandes cantidades de datos cruzados, el anlisis multidimensional permite ver los mismos datos en forma diferente.

Modelizacin y segmentacin
 

Utilizando datos existentes en el data warehouse, en especial los datos histricos, se pueden realizar diferentes anlisis para predecir eventos futuros. El trabajo predictivo puede realizarse utilizando determinadas herramientas de anlisis que extraen datos del data warehouse, llamadas modelos. Un modelo es simplemente una coleccin de patrones para una caracterstica dada, y puede ser representado grficamente o mediante un conjunto de reglas y notaciones. Por otra parte, los clientes u otros datos son divididos en segmentos, en los cuales las caractersticas en comn pueden definir comportamientos que permiten definir estrategias de marketing. El mtodo de modelizacin y segmentacin es una de las tcnicas utilizadas en lo que se conoce como data mining (minera de datos), que se explica ms adelante.

Descubrimiento del conocimiento




El descubrimiento del conocimiento est representado por un nmero de algoritmos que buscan patrones en una base de datos. Estos patrones, a diferencia de la modelizacin, no son especificados de antemano, y reflejan el comportamiento de clientes, ventas de productos, cancelaciones, compras futuras, y otros eventos. Estos patrones son muy especficos y arbitrarios para ser definidos por el analista. Las herramientas de software encuentran los patrones e informan a los analistas cules son esos patrones y dnde estn. Uno de los mtodos de descubrimiento del conocimiento es el anlisis de afinidad, que busca en el data warehouse afinidad entre diferentes comportamientos. Una compaa puede encontrar entre la compra de diferentes productos; por ejemplo, si se determina que, de los clientes que compran papas fritas, el 80% compra tambin gaseosas, la compaa puede tomar decisiones para aprovechar este comportamiento, como hacer descuentos u ofrecer promociones con ambos productos. El mtodo de descubrimiento del conocimiento es otra de las tcnicas utilizadas en data mining, concepto que se explica a continuacin.

Data mining (minera de datos)




Data mining no es un tipo de anlisis, sino una variedad de tipos de anlisis, y abarca los tipos de modelizacin/segmentacin y descubrimiento del conocimiento, mencionados anteriormente. El objetivo del data mining es descubrir relaciones entre los datos que no hubieran sido hallados sin la aplicacin de procedimientos especializados. El data mining integra las herramientas de visualizacin de datos, y las correspondientes a estadsticas y clasificacin. Es un conjunto de tecnologas avanzadas, susceptibles de analizar la informacin de un data warehouse para obtener tendencias, para segmentar la informacin o para encontrar correlaciones en los datos.

Tipos de Data Mining


  

Descubrimiento Anlisis predictivo Anlisis forense

Descubrimiento


es el proceso en el cual se buscan patrones ocultos en una base de datos sin una idea predeterminada, o hiptesis acerca de cules pueden ser esos patrones. En otras palabras, el programa busca cules son los patrones interesantes, sin requerir que el usuario realice las preguntas. En grandes bases de datos, la cantidad de patrones es tan extensa que los usuarios no pueden descubrirlos todos.

Anlisis predictivo


los patrones descubiertos en la base de datos son utilizados para predecir el futuro. lado predictivo permite a los usuarios realizar preguntas, y el sistema responder sobre la base de patrones encontrados anteriormente para esos valores desconocidos. Mientras que el descubrimiento descripto anteriormente se encarga de encontrar patrones en los datos, el modelado predictivo aplica los patrones para determinar valores probables.

Anlisis forense


Es el proceso mediante el cual se aplican patrones extrados para encontrar datos inusuales o anomalas. Para ellos, primero se debe descubrir cul es la norma, y luego detectar aquellos datos que se desvan de la misma.

Los mtodos usados en data mining incluyen:


 

Estadstica. rboles de decisin: son estructuras en forma de rbol que representan un conjunto de decisiones. Estas decisiones generan reglas para la clasificacin de un conjunto de datos. Algoritmos genticos: son tcnicas de optimizacin que utilizan procesos tales como combinaciones genticas, mutacin y seleccin natural de un diseo basado en evolucin. Redes neuronales: son modelos de prediccin no lineales que aprenden a travs del entrenamiento y semejan la estructura de una red neuronal biolgica. Lgica difusa: es un subconjunto de la lgica convencional, que ha sido extendida para manejar el concepto de la verdad parcial.

Herramientas de visualizacin


Los data warehouses proveen herramientas para la visualizaciny presentacin de los datos, basadas en una interfaz grfica y con posibilidad de construir informes ajustados a las necesidades del nivel superior. Adems, proveen mecanismos que permiten navegar a travs de la informacin, cambiando el nivel de detalle o el punto de vista del observador para detectar diferentes relaciones entre los datos.

Herramientas de extraccin y carga de datos




La extraccin y carga de datos en el data warehouse es una tarea muy complicada. Pero en realidad, el trabajo ms complejo es el que debe realizarse para transformar los datos en informacin que pueda ser consultada por los usuarios de negocios. Las herramientas ETL (Extraction, Transformation, Loading), que significa extraccin, transformacin y carga, permiten recolectar datos de un lugar y colocarlos en otro, y adems permiten realizar las siguientes operaciones:

   

Recolectar datos de diferentes sistemas transaccionales. Convertir los datos desde un formato a otro. Modificar los datos para que sean ms completos o significativos. Cargar los datos modificados en el data warehouse. Las tecnologas ETL han evolucionado a lo largo de los aos y se han vuelto fciles de utilizar. La mayora de ellas estn basadas en interfaces de usuario amigables, pueden tambin generar metadatos creando definiciones de los datos de origen y de los que se debern introducir en el data warehouse.

Extraccin Se extraen los datos de su fuente original para determinar los temas (conceptos lgicos) que se deben crear y cargar en el data warehouse. Transformacin En el proceso de transformacin se convierten los datos de las transacciones en un formato consistente y orientado a los negocios. Tambin se genera la informacin que no proviene de los sistemas transaccionales, pero que podra ser til en la toma de decisiones. La transformacin incluye tareas de sumarizacin, agregacin, ordenamiento y agrupamiento de los datos por dimensiones y palabras clave. Carga La carga consiste en integrar las herramientas necesarias para cargar la informacin en el data warehouse. A diferencia de los sistemas transaccionales, un data warehouse no cambia su estado de un momento a otro, sino que se carga peridicamente con una frecuencia programada.

Estructura de un sistema de BI

Sistemas transaccionales (OLTP) vs. sistemas analticos (OLAP)


  

A diferencia de los sistemas transaccionales (OLTP) que estn orientados a los procesos, los sistemas analticos (OLAP) estn orientados al tema y tienen un alcance corporativo. Los sistemas analticos no solo trabajan con datos actuales, sino tambin histricos. Los sistemas analticos no se actualizan con cada transaccin en el nivel operativo, sino que lo hacen peridicamente, y son utilizados por analistas y en el nivel gerencial. Los sistemas transaccionales tienen una estructura bidimensional, mientras que los analticos tienen una estructura multidimensional. Ms adelante se explica con ms detalle el concepto de estructura multidimensional.

Implementacin de un sistema BI


Implementar un sistema BI no significa solamente comprar un producto e instalarlo. Requiere que se lleve a cabo un proyecto de desarrollo que involucre tareas de consultora para establecer los mecanismos de conversin de datos e implementacin. La tecnologa por s sola no resuelve el problema, es solo una herramienta que debe ser aprovechada correctamente para lograr ptimos resultados. La instalacin de un data warehouse no asegura que se proveer a los usuarios de las herramientas adecuadas y la informacin que necesitan. Eso es solo el comienzo. A menos que la informacin en el data warehouse sea cuidadosamente documentada y fcil de acceder, la complejidad har que solo las personas capacitadas en sistemas puedan acceder a la misma. Los sistemas BI deben proveer informacin tanto a las personas de sistemas como a los usuarios de negocios. Para ello, cuentan con interfaces avanzadas, sistemas OLAP basados en formatos web, las de minera de datos y aplicaciones que permitan aprovechar estas herramientas. Un sistema BI debe proveer escalabilidad y debe soportar e integrar productos de varios proveedores. Los expertos coinciden en que el xito de un data warehouse depende de que se comience con una identificacin de los requerimientos del negocio. Estos requerimientos son los que determinarn el diseo del data warehouse y los datos que sern necesarios.

SISTEMAS PARA LOS DIFERENTES NIVELES DE DECISIN

You might also like