You are on page 1of 10

Dentro del mundo del Business Intelligence nos encontramos con muchos trminos que para

los ms profanos en la materia, pueden sonar a cualquier cosa y uno de ellos es OLAP (On-
Line Analytical Processing) una solucin muy usada que tiene como objetivo principal agilizar
la consulta de grandes volmenes de datos. Este trmino naci gracias a Edgar F. Codd, de
la compaa EF Codd & Associates, donde se usaban bases de datos relacionales para el
proceso de la informacin con diferentes sistemas.

Para ello se usan cubos OLAP o estructuras multidimensionales que cuentan con datos
resumidos de grandes BDs o Sistemas Transacionales (OLTP, On-Line Transactional
Processing) y suele ser usado en el mundo de BI, con informes de negocios de ventas, informes
de direccin, marketing, data mining, etc.

Todo ello est enfocado para obtener la mayor rapidez de respuesta aunque para que
verdaderamente sea efectivo debe cumplir con una serie de reglas impuestas por el
propio Edgar F Codd aunque muchas de ellas son prcticamente imposibles de conseguir,
aunque s se pueden obtener buenos resultados si seguimos estos consejos de cara a la
implantacin de un sistema OLAP.

Hay que contar con una visin multidimensional de los datos, no ajustarse a un nico
punto de vista, hay que procurar pensar en dimensiones y mtricas de negocio, no en
tablas y campos.
El motor OLAP tiene que ser un organizador intermedio para que las aplicaciones finales
como los cuadros de mando, aplicaciones de analticas, Scorecard, etc.,
puedan proveer de datos al usuario.
El sistema OLAP tiene que adaptar automticamente su estructura segn sean las
dimensiones, datos, mtricas, etc., es algo que no resulta fcil y normalmente requiere
de intervencin manual.
Debe haber la posibilidad de acceder a datos almacenados directamente o en procesos
batch desde el relacional. Como si se tratase de un sistema hbrido.
Hay que mantener los clculos y resultados de queries OLAP separados y
almacenados en una ubicacin diferente del sistema fuente.
Procurar crear modelos basados en OLAP, algo que puede resultar muy subjetivo
porque depende de la complejidad de los modelos. Cuantos ms tipos, mejor ser
el OLAP.
Se debe permitir el acceso multiusuario a las aplicaciones de forma concurrente, con
la posibilidad de realizar modificaciones, establecer colas de trabajo, etc.
Tiene que ser transparente para los usuarios, procurando ocultar todo el mecanismo
intrnseco como los procesos batch, de cargas, etc. dejando solamente visible una capa
de abstraccin de negocio.
Buscar una arquitectura cliente/servidor, pensando siempre en la posibilidad de que
los usuarios interacten y colaboren en la aplicacin.

Hay ms reglas que prcticamente van con el sentido comn y aqu hemos condensado algunas
de ellas que un sistema OLAP debera tener para un mejor funcionamiento y productividad.

Qu es OLAP?
Definiciones
jueves, 29 de diciembre de 2011
Segn la Wikipedia, OLAP es:
OLAP es el acrnimo en ingls de procesamiento analtico en
lnea (On-Line Analytical Processing). Es una solucin
utilizada en el campo de la llamada inteligencia empresarial
(o Business Intelligence) cuyo objetivo es agilizar la consulta
de grandes cantidades de datos. Para ello utiliza estructuras
multidimensionales (o cubos OLAP) que contienen datos
resumidos de grandes bases de datos o Sistemas
Transaccionales (OLTP). Se usa en informes de negocios de
ventas, marketing, informes de direccin, minera de datos y
reas similares.

Te has enterado de algo? No? Pues tal vez te ayude esta


imagen:

Todava no? Pues aqu tienes una explicacin mucho mejor


(via TodoBI). Esto es OLAP:

Porque OLAP no es ms que eso: Una manera de acceder a tu


informacin utilizando un lenguaje natural. Esta seora
selecciona su pizza filtrando todas las pizzas posibles a travs
de sus caractersticas relevantes.
En el mundo corporativo, los analistas acceden a la informacin
filtrando sus indicadores de negocio por regiones, por
producto, por tiempo...

A partir de esta definicin bsica, existen distintas tecnologas


que lo implementan (ROLAP, MOLAP,...), pero bsicamente
todas hacen las mismas acciones bsicas sobre la informacin:

Segmentar: Como cuando pides las ventas por producto y


por trimestre
Filtrar: Como cuando pides el informe de ventas de Espaa
en 2011
Profundizar (Drill down): Como cuando ves los datos de
trimestre 2 y te interesa el desglose de abril, mayo, junio.
Sintetizar (Drill up): Cuando deshacesel desglose anterior y
vuelves al desglose por trimestre.
Rotar (Drill anywhere): Cuando en lugar de pasar de un
desglose por trimestres a uno mensual, te interesa un
desglose por familia de producto, o por nacionalidad, es
decir, por una caracterstica de una jerarqua distinta a la que
lo estas viendo actualmente.

No s si la enumeracin anterior es completa o clara. Sospecho


que no. En cualquier caso, lo relevante es que el anlisis OL AP
te permite navegar fcilmente por la informacin,
solicitndola con el detalle preciso y con los filtros adecuados,
y que puedes hacerlo de manera dinmica, fcil, ad hoc, sobre
la marcha, sin necesitar asistencia, rpido, y utilizando el
lenguaje de negocio. Vamos, como la seora del vdeo.
Diferencia entre OLTP y OLAP
Editar 0 2

Las aplicaciones OLTP se caracterizan por la creacin de muchos usuarios, actualizaciones o


recuperacin de registros individuales. Por consiguiente, las bases de datos OLTP se perfeccionan
para actualizacin de transacciones. Las aplicaciones OLAP son usadas por analistas y gerentes
que frecuentemente quieren una vista de datos de nivel superior, como las ventas totales por lnea
de producto, por regin, etc. Las bases de datos OLAP normalmente se actualizan en lote, a
menudo de mltiples fuentes, y proporcionan un back-end analtico poderoso a las aplicaciones de
mltiples usuarios. Por tanto, las bases de datos OLAP se perfeccionan para el anlisis.
Mientras las bases de datos relacionales son buenas al recuperar un nmero pequeo de archivos
rpidamente, ellas no son buenas al recuperar un nmero grande de archivos y resumirlos on-the-
fly. Un tiempo de respuesta lento y el uso excesivo de recursos del sistema son las caractersticas
comunes de las aplicaciones de soporte de decisin construidas exclusivamente sobre la
tecnologa de bases de datos relacionales. Debido a la facilidad con la cul se puede emitir un
ejecutar una consulta SQL externa, muchos distribuidores IS (Information Systems) no brindan
acceso directo a los usuarios a sus bases de datos relacionales.
Muchos de los problemas que las personas intentan resolver con la tecnologa relacional son
realmente multidimensionales en naturaleza. Por ejemplo, una consulta SQL para crear resmenes
de ventas del producto por la regin, las ventas de la regin por producto, y as sucesivamente,
podran involucrar la revisin de la mayora, si no todos, de los registros en una base de datos de
mercadeo y podra tomar horas de proceso. Un servidor OLAP podra ocuparse de estas preguntas
en unos segundos.

OLTP (Relational) OLAP(Multidimensional)

Atomized Summarized
Present Historical
Record-at-a-time Many records at a time
Process oriented Subject oriented

Las aplicaciones OLTP tienden a tratar con datos atomizados registro a un tiempo, considerando
que las aplicaciones de OLAP normalmente se tratan de los datos resumidos. Mientras las
aplicaciones OLTP generalmente no requieren de datos histricos, casi cada aplicacin de OLAP
se preocupa por ver las tendencias y por consiguiente requiere de datos histricos. Como
consecuencia, las bases de datos OLAP necesitan la capacidad de ocuparse de datos series de.
Mientras las aplicaciones OLTP y bases de datos tienden a ser organizados alrededor de procesos
especficos (como ordenes de entrada), las aplicaciones OLAP tienden a ser orientadas al tema,
respondiendo a preguntas como Qu productos estn vendiendo bien? o Dnde estn mis
oficinas de ventas ms dbiles?.

Caracterstica OLTP OLAP

Tamao BBDD GigaBytes Giga a TeraBytes

Origen Datos Interno Interno y Externo


Actualizacin On-Line Batch

Periodos Actual Histrico

Consultas Predecibles Ad Hoc

Actividad Operacional Analtica


Bases de datos OLTP y OLAP

OLTP - On-Line Transactional Processing

Los sistemas OLTP son bases de datos orientadas al procesamiento de transacciones.


Una transaccin genera un proceso atmico (que debe ser validado con un commit, o
invalidado con un rollback), y que puede involucrar operaciones de insercin,
modificacin y borrado de datos. El proceso transaccional es tpico de las bases de datos
operacionales.

El acceso a los datos est optimizado para tareas frecuentes de lectura y


escritura. (Por ejemplo, la enorme cantidad de transacciones que tienen que
soportar las BD de bancos o hipermercados diariamente).

Los datos se estructuran segn el nivel aplicacin (programa de gestin a medida,


ERP o CRM implantado, sistema de informacin departamental...).

Los formatos de los datos no son necesariamente uniformes en los diferentes


departamentos (es comn la falta de compatibilidad y la existencia de islas de
datos).

El historial de datos suele limitarse a los datos actuales o recientes.

OLAP - On-Line Analytical Processing

Los sistemas OLAP son bases de datos orientadas al procesamiento analtico. Este
anlisis suele implicar, generalmente, la lectura de grandes cantidades de datos para
llegar a extraer algn tipo de informacin til: tendencias de ventas, patrones de
comportamiento de los consumidores, elaboracin de informes complejos etc. Este
sistema es tpico de los datamarts.

El acceso a los datos suele ser de slo lectura. La accin ms comn es la


consulta, con muy pocas inserciones, actualizaciones o eliminaciones.

Los datos se estructuran segn las reas de negocio, y los formatos de los datos
estn integrados de manera uniforme en toda la organizacin.

El historial de datos es a largo plazo, normalmente de dos a cinco aos.

Las bases de datos OLAP se suelen alimentar de informacin procedente de los


sistemas operacionales existentes, mediante un proceso de extraccin,
transformacin y carga (ETL).
Unidad II
Deja un comentario

Base de datos multidimensionales

Bases de datos OLTP y OLAP


OLTP On-Line Transactional
Processing
Los sistemas OLTP son bases de datos orientadas al procesamiento de transacciones. Una
transaccin genera un proceso atmico (que debe ser validado con un commit, o invalidado
con un rollback), y que puede involucrar operaciones de insercin, modificacin y borrado de
datos. El proceso transaccional es tpico de las bases de datos operacionales.

El acceso a los datos est optimizado para tareas frecuentes de lectura y escritura. (Por
ejemplo, la enorme cantidad de transacciones que tienen que soportar las BD de bancos o
hipermercados diariamente).

Los datos se estructuran segn el nivel aplicacin (programa de gestin a medida, ERP o
CRM implantado, sistema de informacin departamental).

Los formatos de los datos no son necesariamente uniformes en los diferentes departamentos
(es comn la falta de compatibilidad y la existencia de islas de datos).

El historial de datos suele limitarse a los datos actuales o recientes.

OLAP On-Line Analytical Processing


Los sistemas OLAP son bases de datos orientadas al procesamiento analtico. Este anlisis suele implicar, generalmente, la
lectura de grandes cantidades de datos para llegar a extraer algn tipo de informacin til: tendencias de ventas, patrones
de comportamiento de los consumidores, elaboracin de informes complejos etc. Este sistema es tpico de los datamarts.

El acceso a los datos suele ser de slo lectura. La accin ms comn es la consulta, con muy pocas inserciones,
actualizaciones o eliminaciones.

Los datos se estructuran segn las reas de negocio, y los formatos de los datos estn integrados de manera uniforme en
toda la organizacin.

El historial de datos es a largo plazo, normalmente de dos a cinco aos.


Las bases de datos OLAP se suelen alimentar de informacin procedente de los sistemas operacionales existentes,
mediante un proceso de extraccin, transformacin y carga (ETL).

Persistencia ROLAP, MOLAP, HOLAP

Operaciones Analticas Bsicas OLAP.

Consolidacin: Comprende el conjunto de datos. Esto puede involucrar acumulaciones


simples o agrupaciones complejas que incluyen datos interrelacionados.
Drill-Down: OLAP puede moverse en la direccin contraria y presentar
automticamente datos detallados que abarcan datos consolidados.
Slicing and Dicing: Se refiere a la capacidad de visualizar a la Base de Datos desde
diferentes puntos de vista.

Vistas de Datos OLAP

Como cubos es una extensin de la manera normal en que los usuarios de negocios
interactan con los datos.

Por ejemplo: La mayora de los usuarios deseara ver como se desarrollan las ventas a lo
largo del tiempo, para ello se necesitara ver varias planillas de clculo.

Esto mismo puede ser visualizado mediante un cubo:


Debido a su representacin pueden ser tomadas rebanadas de datos de las mismas para
responder a diversas preguntas.

Modelo Sistemas OLAP

La informacin es vista como cubos, los cuales consisten de categoras descriptivas


(dimensiones) y valores cuantitativos (medidas). El modelo de datos multidimensional
simplifica a los usuarios formular consultas complejas, arreglar datos en un reporte, cambiar
de datos resumidos a datos detallados y filtrar o rebanar los datos en subconjuntos
significativos.
Sistemas de Gestin del Conocimiento

Los sistemas de gestin del conocimiento son una clase de sistemas de informacin aplicados
a la gestin del conocimiento organizacional. Estn basados en las tecnologas de informacin
y desarrollados para apoyar los procesos de creacin, almacenamiento, recuperacin,
transferencia y aplicacin del conocimiento y, adems, facilitan bastantes de los aspectos
sociales y culturales de la gestin del conocimiento.

Preparacin de los datos

La preparacin de los datos es una parte crtica dentro del anlisis avanzado de informacin,
ya sea que se trate de efectuar un anlisis estadstico, un anlisis de minera de datos o textos
o bien para la construccin de un sistema de descubrimiento de conocimiento.

http://inteligenciadenegocios-iff-1016.blogspot.mx/p/unidad-2.html

You might also like