You are on page 1of 8

EJERCICIOS

NOTAS PREVIAS

Para los ejercicios se va a utilizar el explorador de internet FireFox y la base de datos Mysql.
sta contiene dos esquemas:
Northwind: contiene las tablas de la empresa.
Datawarehouse: contiene las tablas asociadas al diseo del Modelo Dimensional del DW.

Para acceder a la base de datos utilizad el programa MySQL Workbench 5.2 CE entrando con el
usuario administrador pentaho_user y el password pentaho

Los esquemas citados aparecern en la parte superior-izquierda de la pantalla dentro de la
ventana Object Browser. Seleccionando un esquema y desplegndolo posteriormente veris los
objetos que contiene. El objeto Tablas tambin se puede desplegar para poder ver las tablas.

Para poder ver los registros de una tabla seleccionad la tabla y pulsad el botn derecho del ratn.
Aparecer un men del cual tendris que seleccionar la opcin Select Rows Limit 1000.
OJO: Esta opcin slo muestra los primeros 1000 registros.

Atencin a:
Para realizar las publicaciones la plataforma Pentaho User Console tiene que estar
corriendo.
Cada vez que se publica en el servidor se tienen que realizar desde Pentaho User Console
las siguientes acciones:
o Si se publica metadatos: desde el men Herramientas seleccionar Actualizar el
cache del repositorio y despus Actualizar Metadata del Reporte

o Si se publica un cubo OLAP: desde el men Herramientas seleccionar Actualizar
el cache del repositorio y despus Vaciar el cache de Esquemas Mondrian

o Si se publica o graba un dashboard: desde el men Herramientas seleccionar
Actualizar el cache del repositorio, Vaciar el cache de Esquemas Mondrian y
finalmente CDA Cache


MODELADO DIMENSIONAL

Realice el Proceso de diseo dimensional para obtener el Modelo Dimensional del Data Mart
Ventas en la empresa Northwind Traders teniendo en cuenta la visin general de cmo
funciona, la documentacin escrita en la fase de Definicin de Requerimientos de Negocio y,
finalmente, la informacin de que se dispone sobre su sistema operacional.

Visin general: Caso Northwind Traders.docx
Documentacin fase de Requerimientos de negocio: Matriz Procesos de Negocio
Northwind.pdf
Documentacin sistema operacional:
Diagrama_Entidad_Relacion_Empresa_Northwind.pdf
Especificaciones de las tablas Diagrama Entidad Relacion Northwind.pdf

Escribe qu cambios haras en el modelo y/o datos en los siguientes casos:

A. El sistema BI ya est marcha y ha pasado un tiempo:

i. Una de las empresas cliente cambia su denominacin social.
En el sistema operacional se realiza tal cambio pero a efectos de informes,
anlisis,, tc. la direccin quiere mantener tambin la antigua denominacin.

ii. La empresa, en base a un estudio de mercado, toma la decisin de cambiar la
unidad de venta de un producto de forma que el precio deja de establecerse por
unidades y pasa a venderse por peso. La direccin solicita que se preparen
informes para hacer el seguimiento en la evolucin.

Toma como premisa inicial que en el Modelo Dimensional ya estaba incluido
el atributo Sales_Unit (peso, unidades) dentro de la dimensin Producto.

B. La empresa quiere saber si existe relacin entre las condiciones de estabilidad que
rodean al empleado y su productividad. Para ello suponed que en el sistema
operacional se tiene ms informacin sobre el empleado referente a salario, nmero de
hijos y estado civil.

INTEGRACIN DE DATOS - ETL

Utilizando Pentaho Data Integration:

a. Disea las ETL de carga del Data Warehouse teniendo en cuenta las siguientes
instrucciones:

I. Disea y ejecuta primero las ETL de carga de las tablas de Dimensiones.

Notas:
La tabla Customers del sistema operacional de Northwind Traders
contiene clientes con valor nulo en el campo Pas y Ciudad. stos
tendrn que eliminarse. Incorpora a la ETL lgica que cambie estos
valores por Spain-Madrid respectivamente.
En el campo Name de la dimensin Empleado se tiene que concatenar
los campos FirstName y LastName de la tabla Employees (northwind).
La dimensin Tiempo ya est cargada (tabla Dim_time).

II. Disea y ejecuta despus la ETL de carga de la tabla de Hechos.

Notas:
Para poder utilizar el paso Agrupar por un conjunto de campos es
necesario utilizar previamente el paso Ordenar filas por ese conjunto
de campos.
Para obtener la clave de la dimensin tiempo para la tabla de hechos
utiliza la funcin ObtenerTIME_PK sobre el campo OrderDate de la
tabla Orders (northwind).

Esta funcin se puede llamar directamente desde una select de un paso
con datawarehouse.ObtenerTIME_PK(cast(cast(OrderDate as date) as
char)) TIME_PK

III. Los pasos que puedes utilizar son:

Carpeta Paso
Entrada Entrada Tabla
Salida Salida Tabla
Utility If field value is null
Uniones Juntar Filas
Transformar Aadir secuencia
Transformar Selecciona/Renombra valores
Transformar Ordenar filas
Transformar Calculadora
Bsqueda Bsqueda en Flujo de Datos
Statistics Agrupar por


Nota: Cada vez que se ejecute una ETL se tiene que comprobar que sta es correcta
viendo el log de Pentaho Data Integration y viendo que efectivamente se han insertado
los registros esperados en la tabla del Data Warehouse correspondiente.

Resultados esperados
Tabla Nmero de registros
Dim_Customers 93
Dim_Employees 9
Dim_Products 77
Dim_Shippers 3
Dim_Suppliers 29
Dim_Time 309
Orders_Fact 2802


b. Disea el Workflow de carga de todas las tablas del Data Warehouse

Nota: Borrar primero todos los registros de las tablas cargadas.

Tanto en el caso de xito como de Fracaso se tiene que mostrar un mensaje de
advertencia.

Ampliacin

c. En el caso de que el Sistema BI ya estuviera en funcionamiento desde hace un tiempo
y ya existieran registros en la Tabla de Hechos, sera posible aadir otra dimensin
Envase a la tabla de Hechos teniendo en cuenta que cada producto tiene asociado un
envase el cual puede cambiar en el paso del tiempo?

Razona la repuesta.

d. Disea las ETL de actualizacin de las dimensiones utilizando el paso
Bsqueda/Actualizacin en Dimensin de la carpeta Almacn de Datos.

Para probarlas:
i. Inserta nuevos registros en las tablas del sistema operacional Northwind
(customers, employees, products, shippers, y suppliers).

ii. Ejecuta cada ETL y comprueba que slo se han cargado los nuevos registros
en la dimensin correspondiente a la tabla actualizada.




ADMINISTRACION PENTAHO USER CONSOLE
Ejecutar Pentaho User Console y hacer login con el usuario administrador Joe. Crea una carpeta para
el Departamento de Ventas pulsando el botn derecho del ratn dentro de la ventana y seleccionando
la opcin Nueva Carpeta. Ponle nombre Ventas


METADATOS

Utilizando Pentaho Metadata Editor:

Crea el repositorio de metadatos para el Data Mart Ventas de la empresa Northwind.

Para ello tendrs que completar las capas:
Fsica: Connections
Lgica: Business Tables y Relationships
De Negocio: Business View

Graba el dominio en un fichero de nombre metadatosventas.xml dentro de la carpeta de
Ventas

Publica los metadatos en la Plataforma BI

Nota: Para la publicacin utilizar la opcin de Men File -> Publish To Server e informad
los campos de la ventana emergente:

Publish Location: Nombre de la carpeta asociada al Departamento Ventas
Publish Password: pentaho
Server Userid: joe
Server Password: password

Ampliacin

a) Crea un nuevo concepto Moneda definiendo su formato (tipo de alineacin, tipo de
fuente, color, color de fondo, mscara del nmero con el smbolo de ) y aplcalo al
campo Importe. En qu capa actuaras?
b) Crea otro concepto ID para asignrselo a todos los campos que sean identificadores.
La propiedad fundamental de este concepto es que tiene que ocultar el campo al
usuario final.
c) Crea un campo calculado en la Tabla de Hechos de la capa lgica que calcule el
importe mximo de ventas y otro que calcule la media.

Nota: Utiliza la herramienta Query Editor para comprobar que los metadatos estn bien
definidos.

REPORTING

Crea una subcarpeta de la carpeta Ventas con el nombre Reporting

Utilizando la herramienta de Informes Ad-hoc WAQR de Pentaho User Console crea un
informe VentasAnyoAdhoc tipo HTML que muestre las ventas (importe, cantidad) de
cada familia de productos agrupados por ao. Para ello se tendr que utilizar como origen
de datos el repositorio de metadatos definido en el ejercicio anterior.

Guarda el informe en la carpeta Reporting

Utilizando la herramienta de informes Pentaho Reports Designer:

a. Disea el mismo informe que en el apartado anterior y llmalo
VentasAnyoRDesigner. Aade la funcin de Band para que cada lnea de detalle
tenga un color diferente, y las funciones de Sum-Summary y Sum-Running para
calcular la cantidad e importe total de todos los aos y el acumulado hasta ese ao
respectivamente .

Utiliza como origen de datos el Data Warehouse (JDBC).

b. Pon un parmetro para que el usuario pueda seleccionar el ao.

c. Aade un grfico de barras que muestre las ventas (importe) de cada familia en el ao
seleccionado.


Publcalo en la carpeta Reporting de Ventas para poder acceder a l desde Pentaho User
Console. Para ello selecciona la entrada de men File -> Publish e informa en la ventana
emergente el usuario (joe) y el password (password).

Ampliacin

Modifica el repositorio de metadatos cambiando el formato y/o nombre de los campos en la
capa de negocio y observa los efectos a la hora de visualizar el informe ya creado o de
realizar otro informe.

Aade un campo calculado al detalle del informe VentasAnyoRDesigner que sea el precio
medio de los productos de la familia en ese ao seleccionado.

CUBO OLAP

Crea una subcarpeta de la carpeta Ventas con el nombre Analisis

Utilizando la herramienta Pentaho Schema Workbench:

Crea un cubo OLAP para el DataMart de Ventas que se denomine CuboVentas. Incluye
todas las dimensiones necesarias (tiempo, productos, proveedores, clientes, transportistas
y empleados) y las medidas a analizar.

Crea jerarquas para cada una de las dimensiones
Por ejemplo:

En la dimensin Cliente sera Pas Ciudad NombreCliente
En la dimensin Tiempo seran dos:
Ao (Year) Nmero Mes (Month) Nmero Semana (Week)
Ao (Year) Nombre Mes (NMonth) Nombre Semana (NWeek)

Aade las medidas Cantidad e Importe.

Nota: Utiliza la herramienta MDX Query para comprobar que los metadatos estn bien
definidos. Por ejemplo utiliza la consulta: Select from [CuboVentas]

Graba el cubo en un fichero de nombre Cuboventas.xml dentro de la carpeta de Analisis

Una vez creado el cubo se tiene que Publicar su esquema en la carpeta Analisis de la carpeta
Ventas definida anteriormente. Utiliza la opcin del men File -> Publish e informa los
siguientes campos:

Publish Password: pentaho
Server Userid: joe
Server Password: password

Pentaho or JNDI Data Source: ConexionJNDIDW
Activa el chech Register XMLA Data Source

Una vez publicado ya se puede probar desde Pentaho User Console. Entra en sta aplicacin
y selecciona la opcin New Analysis View de la ventana central. Aparecer una ventana
emergente en la cual se tendr que seleccionar el esquema del DW (datawarehouse) y el
nombre del cubo creado (CuboVentas).

Familiarzate con el entorno de anlisis:
Prueba los botones de exploracin del cubo (detallar miembro, abrir detalle, )
Modifica el tipo de consulta y la forma de visualizar los datos con el botn Abrir
Navegador OLAP
Observa las consultas MDX que se generan a medida que vas cambiando el anlisis.
Crea grficos con la informacin de anlisis.
Guarda el anlisis en la carpeta de Ventas y ejectalo posteriormente desde esta
carpeta.

Ampliacin

Aade nuevas medidas analticas creando campos calculados a partir de las medidas ya
existentes. Utiliza para ello las funciones MDX disponibles en http://msdn.microsoft.com/en-
us/library/ms145970.aspx

Ej: Funciones Var, ParallelPeriod,


DASHBOARDS

Crea una subcarpeta de la carpeta Ventas con el nombre CuadroMando

Utilizando la herramienta Pentaho Dashboard Editor:

Crea un dashboard como el de la ilustracin 1 que contenga:
un grfico en la parte superior donde se muestre las ventas (importe) por familias de
productos en el ao 1997.
un grfico en la parte inferior donde se muestre la distribucin de las ventas (importe)
en los productos de la familia seleccionada en el grfico de arriba haciendo click con
el ratn sobre su columna respectiva.

Guarda el dashboard en la carpeta CuadroMando de la carpeta Ventas.

Notas:
a. Components: el grfico superior e inferior tienen que ser de tipo CCC Bar Chart y
CCC Pie Chart respectivamente.

Establecer las propiedades de ambos grficos:
Crosstab mode = false
Series in rows = false

b. Data Sources:
Grfico Jndi Tipo Mondrian schema
Superior ConexionJNDIDW Mdx over
mondrianJndi
Ventas/Analisis/Cuboventas.xml
Inferior ConexionJNDIDW Sql over
sqlJndi



lustracin 1: Dashboard Ventas

You might also like