Professional Documents
Culture Documents
Contenidos
Algo grande
Vamos al asunto.
04
Parte 1
Preparación
Hemos dividido el cuaderno en tres
partes. En esta primera parte, vamos
a intentar afinar su visión para que
escoja el proyecto adecuado.
Parte 1 / Preparación 05
Información
imprescindible
Antes de abordar los aspectos concretos
de su propio proyecto, presentamos
algunas lecciones que la mayoría de los
profesionales del Big Data habría deseado
conocer antes de iniciar sus proyectos.
Parte 1 / Preparación 06
Según un estudio1, el 55% de todos 1. Objetivos difusos buscando petróleo en un mar de terabytes de
los proyectos de Big Data incógnitas. Si las expectativas de la oferta no
El motivo de fracaso que más se cita son realistas, se encontrará intentando cumplir
no se termina y muchos otros en el estudio es el “ámbito de aplicación plazos y presupuestos nada razonables.
no cumplen sus objetivos. impreciso” del proyecto. Demasiadas
empresas desarrollan proyectos ambiciosos 3. Aumento de costes y retrasos
(y, al mismo tiempo, demasiado ambiguos)
Aunque este llamativo porcentaje
que carecen de objetivos claros, y que luego Si se tiene en cuenta lo novedosa que es esta
no es infrecuente en una fase terminan fracasando cuando llega el momento disciplina para la empresa, no sorprende que
tan temprana de una tendencia de tomar decisiones complicadas sobre casi todos los proyectos de Big Data terminen
lo que reviste importancia y lo que no. costando o tardando más de lo previsto.
tecnológica, sería una insensatez
Ello se suele deber a una mezcla de expectativas
pasar por alto la lección que 2. Expectativas equivocadas irreales e incomprensión del procedimiento para
imparten esos proyectos. crear una arquitectura escalable. En los casos en
Con toda la fama del Big Data, hay quien llega que se contrata a los escasos y bien remunerados
a algunas suposiciones muy arriesgadas desarrolladores de Java para Hadoop, a quienes
Veamos los cuatro motivos
en cuanto a lo que puede ofrecer el proyecto. se les encomiendan titánicas implementaciones
principales por los que fracasan Aunque resulte tentador hacer promesas de codificación manual, las empresas no tardan
los proyectos de Big Data. valientes para plazos breves, es importante en asumir que resulta imposible salir del entorno
mantener una visión realista de lo que cabe de pruebas sin ningún error. La consecuencia
esperar del proyecto, el tiempo que va a necesitar es que los proyectos de Big Data terminan
y la cantidad de esfuerzos que requiere. como un experimento científico que languidece
Cuando las expectativas del impacto y de la en el laboratorio y nunca llega a ver la luz.
información son demasiado elevadas, acaba
1
InformationWeek, “Vague Goals Seed Big Data Failures.”
Parte 1 / Preparación 09
4. Incapacidad de escalar
En vista de que la mayoría de los 1. Marque objetivos claros y contenga 2. Defina las métricas que demuestran
proyectos de Big Data fracasa por las expectativas el valor del proyecto
la falta de claridad y la incapacidad Si no sabe con certeza qué propósito debe Si las métricas están definidas con claridad
para demostrar la utilidad de la fijar para el proyecto, plantee los objetivos y se ajustan a sus objetivos, se ahorra
iniciativa, debe asumir la tarea marcados para la infraestructura de datos muchos problemas. Al fijarse metas realistas
existente. y susceptibles de cuantificación, todos
de aportar al proyecto el enfoque
a su alrededor percibirán sus progresos.
y las pruebas pertinentes. Siga Si su organización ya necesita datos para
estos tres útiles consejos para determinados procesos de negocio (como Aún más importante: sabrán a qué aspira
asegurarse de que el proyecto detección de fraudes o análisis de mercado), a largo plazo. Plantéese el modo de cuantificar
reflexione sobre la manera en que el Big Data la repercusión del proyecto en el contexto
inicia y continúa su andadura. podría mejorar esos procesos o dotarlos de sus objetivos.
de mayor valor. En lugar de afrontar un problema
completamente nuevo, solo debería mejorar Es crucial porque habrá concesiones a corto
un proyecto o un proceso existente. plazo que tendrá que racionalizar ante
los usuarios de negocio, y los objetivos
Sin un enfoque claro ni un valor demostrable cuantificables sirven para demostrar que
ante los usuarios de negocio, el proyecto está les ofrece más valor del que perciben.
abocado al fracaso.
Parte 1 / Preparación 11
Evite la tentación de codificar todo de forma Decántese por herramientas que aumenten
manual y directamente en Hadoop. Recuerde la productividad del equipo de desarrollo
que el objetivo no es crear de la nada y con aprovechando las competencias y los
sus propias manos una implementación que conocimientos de sus actuales expertos en ETL,
funcione, sino suministrar el valor del Big Data calidad de datos y business intelligence, y reserve
a su organización. para sus superestrellas de Java el trabajo
en la lógica específica, para la cual no hay
En lugar de realizar la codificación manual herramientas disponibles.
de todas las integraciones, limpiar todos
los conjuntos de datos y, luego, realizar Además, dado que las tecnologías como
la codificación manual de todos los Hadoop evolucionan día a día, vale la pena
análisis, busque herramientas y métodos perfilar una capa de abstracción que sirva
de automatización con los que acelerar estos como protección ante los constantes cambios
procesos. en las especificaciones de las tecnologías
subyacentes.
Más importante si cabe es evitar la trampa
de malgastar el escaso y costoso talento en Ante todo, recuerde que las competencias
el desarrollo de Java en aspectos que se pueden que necesita escasean, pero siempre hay
delegar en otros empleados. Su función consiste herramientas disponibles.
en tomar decisiones estratégicas sobre
la implantación de recursos limitados de tal
manera que se alcancen los objetivos.
Parte 1 / Preparación 12
Selección
del proyecto
adecuado
En vista de los retos que deberá afrontar,
veamos, a continuación, cómo debe
proceder para elegir el proyecto
apropiado para su organización.
Parte 1 / Preparación 13
El primer proyecto táctico tiene una importancia Como señalábamos en el último punto, el valor
estratégica vital. del primer proyecto le sirve para convencer
a otros departamentos de la empresa.
Aparte de demostrar más allá de toda duda Con ese fin, debe aprender las competencias,
razonable que el Big Data resulta útil para las capacidades y las lecciones apropiadas
la unidad de negocio en cuestión, debe con el primer proyecto. Con más exactitud,
asegurarse, asimismo, de que su valor tiene que documentarlas de manera que pueda
se comunica después con facilidad al resto trasladarlas al siguiente proyecto. Recuerde
de la empresa. que, si pretende lograr el éxito, debe mirar
a los proyectos futuros.
Por ello, a la hora de escoger el primer proyecto,
tenga en cuenta la estrategia. Así pues, prepare condiciones de escalabilidad
para poder ocuparse de más proyectos
Una vez que demuestre el valor del Big Data en el futuro. No se trata solo de escalar
al departamento de marketing, por ejemplo, el clúster. Se trata de escalar las competencias
resultará más sencillo recabar apoyos entre y las operaciones. O bien tiene que descubrir
los equipos de logística, los cuales se habrían más superestrellas de Java para Hadoop o bien
mostrado reticentes en otro caso. halla la manera de sacar más partido a los
recursos de los que ya dispone.
Parte 1 / Preparación 15
Consideración
de las repercusiones
Al estudiar varios proyectos iniciales, es natural Teniendo en cuenta el análisis de los dos
decantarse por los que ofrecen más mejoras factores anteriores, piense en los recursos que
y el máximo efecto para el negocio. No obstante, hay a su disposición. Trataremos este tema
también es relevante abundar en la naturaleza a ondo más adelante pero, de momento, tenga
del impacto en el negocio: ¿se apreciará en cuenta que, como es natural, su intención
la mayor parte del valor a corto o a largo plazo? con el proyecto es esquilmar cada euro invertido.
Más importante aún: ¿cuándo notarán La consecución de ese objetivo opera en ambos
los usuarios de negocio dicho impacto? sentidos. Por un lado, pretende conseguir
Por ejemplo, si introduce la gestión de datos la máxima repercusión en el negocio pero,
maestros en el data warehouse, mejorará por otro, debe trazar una estrategia de inversión
de forma drástica la eficiencia de su business del presupuesto. Aunque le seduzca la idea
intelligence, pero los analistas de negocio solo de formar un equipo de especialistas en datos
percibirán ese valor cuando se den cuenta comparable al de Google, ¿acaso se lo puede
de que no tendrán que volver a limpiar datos permitir? Tomar decisiones inteligentes
financieros nunca más. en lo referente a herramientas y personal
es esencial para lograr el éxito del proyecto.
Parte 1 / Preparación 17
Parte 2
Su estrategia
A continuación, seremos prácticos
y nos fijaremos en los requisitos
específicos de su próximo proyecto
de Big Data.
Parte 2 / Su estrategia 19
Definición de
sus objetivos
Coja lápiz y papel. Como ya hemos
señalado, la principal causa del fracaso
de los proyectos de Big Data es la falta
de objetivos claros. Vamos a asegurarnos
de que el proyecto que tiene en mente
no se pierda en ambigüedades.
Parte 2 / Su estrategia 20
Objetivos de negocio
Objetivos de TI
A continuación, fijémonos en los objetivos Enumere, por orden de importancia, Deténgase, colabore y escuche
de TI relacionados con su proyecto. los objetivos de su proyecto de Big Data
que guarden relación con TI. (Indique tantos Hemos redactado este cuaderno
(Recuerde que, si su proyecto pretende o tan pocos objetivos como desee). para que le resulte más fácil iniciar
agilizar o mejorar el trabajo de TI, le va a costar su proyecto de Big Data, tanto si trabaja
vendérselo a los usuarios de negocio. Por eso, Ejemplo: Establecer procesos para recopilar, para el negocio como si lo hace para TI.
conviene comunicar los objetivos de TI junto limpiar, controlar y almacenar en tiempo real Sea como fuere, no deje los objetivos
con los objetivos que ya entusiasman a los datos agregados de clientes, datos de uso en el aire. Si precisa orientación concreta
usuarios de negocio). de tarjetas de crédito, datos de gráficos sobre las posibles pretensiones,
sociales e indicadores de rotación. llame a un compañero con experiencia
en el campo e inicie ya la colaboración.
Objetivos de TI
Anote los plazos mínimo y máximo en que Ahora, por cada objetivo, escriba una
se debe alcanzar cada objetivo. medida de éxito que sirva para determinar
si se ha alcanzado. Lo idóneo es que aporte
Ejemplo: De dos a cuatro meses. métricas o cálculos.
Definición de
sus necesidades
de datos
Una vez descritos los objetivos concretos
de su iniciativa de Big Data, pasemos
al meollo del proyecto: los datos en sí.
En cualquier proyecto, ha de mantener
una mentalidad estratégica acerca
de la información necesaria, los conjuntos
de datos que cubren esa necesidad,
la manera de obtenerlos y la forma
de utilizarlos.
Parte 2 / Su estrategia 25
Datos necesarios
Antes de nada, fijémonos en la finalidad Para alcanzar los objetivos de negocio ¿Qué datos sirven para aportar esos
más básica de su proyecto de Big Data: antes descritos, según los usuarios conocimientos?
la información que desea proporcionar de negocio, ¿qué deben saber para tomar
a su organización. Responda a las preguntas decisiones fundadas? Ejemplo: Historial de compras del cliente,
siguientes con tanta minuciosidad como pueda. críticas, porcentaje de compras, porcentaje
Ejemplo: Qué clientes más valorados tienen de abandono, porcentaje de rechazo y calidad
probabilidades de descartar la empresa del servicio de atención al cliente.
y qué comportamientos se relacionan
con la rotación.
Parte 2 / Su estrategia 26
¿Qué sistemas de origen contienen esos Aparte de los datos ya señalados, ¿existe
conjuntos de datos? alguna otra información que aporte
contexto o más valor a los análisis?
Ejemplo: Registros del servicio de atención
al cliente, métricas de rendimiento Ejemplo: Encuestas del servicio de atención
de productos, base de datos de actividad del al cliente, análisis de la competencia, datos
cliente y gestión de datos maestros de clientes. meteorológicos y datos de redes sociales.
Parte 2 / Su estrategia 27
Cinco consideraciones
clave en torno a los datos
Tras describir los datos que 1. Prepárese para un gran volumen 2. Tenga en cuenta la diversidad
va a buscar, ya cuenta con una visión
Prepárese para afrontar la infinidad de datos El aspecto más complicado del Big Data radica
más clara de los retos concretos que va a precisar. En todas las dimensiones, en la multitud de formatos y estructuras que
que le plantea el Big Data. clasifique los datos por su valor (por ejemplo, debe conciliar en sus análisis. Tiene que integrar
transacciones de clientes), su uso (frecuencia varias fuentes si desea incluir estructuras
de acceso), su tamaño (gigabytes, terabytes), y tipos de datos nuevos (sociales, de sensores
Hay cinco elementos en particular
su complejidad (datos de máquinas, datos o de vídeos) con las fuentes a las que están
que debe tener en cuenta antes relacionales, vídeos…) y las personas con acostumbrados (relacionales o mainframes
de seguir adelante, ya que acceso a ellos (solo los especialistas en datos heredados).
o cualquier usuario de negocio).
dictan las necesidades tanto
La codificación manual de cada integración
de cada conjunto de datos como Un inventario concienzudo y organizado de los precisa resulta tan engorrosa que puede
de conjunto de datos del Big Data. datos facilita la decisión de cómo gestionarlos. consumir todo el tiempo y todos los recursos
Evalúe la capacidad actual de almacenamiento de que dispone. Aproveche al máximo las
y procesamiento y busque los métodos más herramientas disponibles de integración
rentables y eficientes para hacerla escalable. y calidad de datos para agilizar el proceso
y dedicarse a tareas más útiles.
Parte 2 / Su estrategia 29
Por lo general, al combinar la transmisión Da igual lo relevantes que sean sus análisis: Los distintos conjuntos de datos que
de datos en tiempo real con los datos históricos, no valen nada si los usuarios no pueden tener una va a manejar tienen diferentes requisitos
aumenta el potencial predictivo de los análisis. confianza razonable en los datos que incluyen. y condiciones de seguridad. En cada conjunto
Por ello, algunos de los datos que le interesan Cuantos más datos analice, más importante de datos, se debe plantear qué hace falta para
solo tienen valor si fluyen de manera constante es que mantenga la máxima calidad de datos. mantener el anonimato de los datos conforme
hacia sus sistemas. a las políticas de seguridad.
Para que los datos sirvan a un fin determinado,
En efecto, casi todos los análisis en tiempo tiene que conocer dicho fin. Si un especialista Montones de datos proliferarán en centenares
real se tienen que basar en transmisiones en datos busca patrones en datos agregados de almacenes por toda la empresa.
de datos que, a menudo, proceden de fuentes de clientes, la preparación necesaria es mínima.
diferentes y tienen distintos formatos. Integre Sin embargo, los datos de los informes financieros Entérese de dónde residen los datos sensibles,
en el proyecto alguna tecnología de análisis y de la cadena de suministro exigen un elevado protéjalos en la fuente mediante cifrado y,
de transmisiones y una infraestructura lógica grado de conservación, limpieza y certificación a continuación, controle quiénes tienen acceso
que le permitan gestionar todos los datos. de precisión y cumplimiento. a ellos.
Parte 3
Su eficaz cadena
de suministro de datos
Los métodos tradicionales de business
intelligence y data warehouse no
se escalan para cubrir las necesidades
de las iniciativas de Big Data. Por eso,
a continuación, veremos la manera
de escalar su equipo, sus procesos
y su infraestructura.
Parte 3 / Su eficaz cadena de suministro de datos 31
Su equipo
Su equipo de Big Data representa
tanto su mayor reto como su mayor
oportunidad. Debe hallar el delicado
equilibrio entre quienes comprenden
los objetivos de negocio y quienes
saben ejecutar los requisitos técnicos.
Parte 3 / Su eficaz cadena de suministro de datos 32
1. A proveche las competencias por las que 2. Mantenga una mentalidad estratégica conocimientos técnicos y el personal con
contrató a su personal acerca de la composición del equipo la experiencia en el campo precisa para crear
los modelos adecuados.
Uno de los mayores errores que cometen las Si todo sale como es debido, crecerán tanto
empresas cuando contratan especialistas el ámbito como los recursos del proyecto. 3. A juste los objetivos del proyecto cuanto
en datos y analistas cuantitativos consiste Piense ahora en la estrategia para ahorrarse antes y, luego, comuníquelos
en obligarlos a hacer el trabajo sucio. Si sus la dura realidad de no poder escalar ciertos
recursos más competentes invierten su tiempo procesos con la suficiente rapidez porque solo Uno de los errores más comunes que cometen
en la codificación manual de las integraciones hay un número limitado de personal con las las empresas cuando contratan personal
de datos y en la limpieza de los datos, no solo competencias precisas, incluso en Silicon Valley. nuevo consiste en olvidar comunicar los
consigue que se sientan frustrados sino que, auténticos objetivos del proyecto. Desde
además, desaprovecha las competencias que Si se amplía el ámbito de aplicación del proyecto, la primera entrevista y en todo momento
le han resultado tan difíciles de hallar. ¿qué posibilidades reales hay de encontrar hasta el desempeño del trabajo en sí, debe
a tiempo las competencias que cubran esas dejar meridianamente claro qué pretende
Concentre las competencias que escasean necesidades? Por ejemplo, los especialistas en ofrecer a los usuarios de negocio. Aproveche
en las tareas que de verdad las necesitan. datos son infinitamente más difíciles de encontrar, el respaldo de los ejecutivos para explicar
No le interesa que esas personas abandonen formar y contratar que los desarrolladores3. la misión y compartir tanto los casos prácticos
el barco, y mucho menos que pierdan el tiempo como los problemas.
en trabajos que podría acometer con cualquier El equilibrio del equipo es crucial. Ha de buscar
herramienta. la mezcla perfecta de la experiencia en gestión Si no entienden a la perfección el valor de
de datos adquirida con tesón y el entusiasmo negocio del proyecto, corre el riesgo de que los
por aprender herramientas nuevas. Además, empleados nuevos crean que solo deben tener
debe lograr el equilibrio entre el personal con en cuenta los objetivos de TI.
3
“B ig Data’s High-Priests of Algorithms,” Wall Street Journal,
8 de agosto de 2014
Parte 3 / Su eficaz cadena de suministro de datos 34
4. C uando el equipo se amplía, también 5. S u equipo no puede permitirse quedarse Importancia de la estrategia
es mayor la necesidad de gestionarlo parado
Una decisión importante que deberá tomar
A diferencia de la tecnología nueva, que Todos los días surgen tecnologías de Big Data una y otra vez es la de crear las funciona-
se puede implantar, implementar e integrar y las que ya existen evolucionan con rapidez. lidades con herramientas automatizadas
de forma objetiva, el personal nuevo se tiene Se trata de un momento fascinante para las o mediante integraciones manuales.
que acostumbrar al puesto de trabajo, a sus empresas que tienen el coraje de adoptar las
La codificación manual ofrece un control
cometidos y al motivo por el que se les mejores prácticas enseguida. Ahora bien,
completo y preciso sobre el objeto de la
encomiendan. Puede ser usted o cualquier también representa el reto definitivo de obtener
creación. A menudo, tiene un valor incalcu-
otro, pero alguien tiene que afrontar el reto ventaja frente a la competencia.
lable y es necesaria si, por ejemplo, desea
de gestión que plantea un equipo nuevo.
crear una secuencia compleja para extraer
Su personal tiene que desarrollar sus
metadatos de una forma que aún no
No conviene infravalorar elementos como competencias tan rápido como cambia
es posible.
la cultura o la cohesión. Reflexione largo el mundo que lo rodea. La buena noticia es que
y tendido sobre el modo de integrar a los nada motiva más a los buenos empleados que Las herramientas, por su parte, ofrecen
empleados nuevos en sus procesos. Quizá no el reto de ir por delante de los acontecimientos. mayor agilidad y la capacidad de repetir
pueda enseñarles competencias pero, sin duda, El desafío radica en ofrecer la formación de manera sostenible el mismo proceso.
puede ayudarlos a ser mejores miembros del y el debate que precisan para seguir aumentando En tareas como la integración y la calidad
equipo. tanto sus capacidades como las suyas. de datos, son cruciales porque, gracias
a ellas, no obliga a los superdotados analistas
y especialistas a encargarse del trabajo sucio.
Establecimiento de la gobernanza
de datos
Si (y, esperemos, cuando) En esencia, la comisión de gobernanza de Se debe proponer crear procesos que garanticen
emprende una iniciativa de Big datos es el organismo formal de ejecutivos que la estructura de gobernanza de datos
que tiene el cometido de supervisar el enfoque resulte más positiva que negativa. Trabaje de
Data más básica, debe implantar de los datos de la empresa, pero también forma activa para que no se convierta en una
la estructura de procedimientos para debe incluir administradores de datos, esto carga burocrática asegurándose de que todos
la gobernanza de datos. De hecho, es, personal funcional o de un departamento los implicados se comprometen a alcanzar los
determinado que se encarga de gestionar los mismos objetivos en los mismos plazos.
aunque el proyecto de Big Data
datos procedentes de una unidad de negocio
tenga como objetivo ofrecer valor concreta. La estructura de gobernanza de datos debe
a un solo departamento, puede poseer las cinco características siguientes.
ser interesante crear una comisión (De hecho, algunos de nuestros clientes
asignan funciones de administración de datos
reducida de gobernanza de datos según el dominio de datos. Eso significa que
para aprender a superar los retos una persona tiene a su cargo los datos de los
únicos que tal organismo presenta. productos, otra se ocupa de los datos de los
clientes, y así sucesivamente.)
Parte 3 / Su eficaz cadena de suministro de datos 36
Una comisión de gobernanza de datos cuyos El proceso transversal no debe suponer El mayor reto de la estructura de gobernanza
miembros tengan funciones parecidas es del un obstáculo. Hace falta una gran agilidad de datos se presenta a la hora de dar prioridad
todo ineficaz. El objetivo consiste en crear para que el proyecto de Big Data llegue a buen a los objetivos de una unidad de negocio
un organismo donde estén representadas las puerto. Por eso, integre reglas de comunicación frente a los de otra que también cuenta con
visiones y las necesidades exclusivas de cada de excepciones y de automatización siempre representación en la comisión. Las decisiones
una de las unidades de negocio a las que esté que sea factible y adopte herramientas se deben sustentar en los beneficios a largo
dirigido el proyecto de Big Data. de colaboración que mantengan líneas plazo para toda la comisión aunque ello
de comunicación oportunas abiertas. suponga que los beneficios a corto plazo
2. Comunicativa se aprecien solo en una unidad de negocio.
4. Comprometido
Sin una comunicación fluida entre las funciones,
los departamentos y los dominios, es probable Comunique los objetivos principales del proyecto
que el proyecto quede enterrado en burocracia con eficacia y compruebe que todos los
y malentendidos. Esto sucede con demasiada implicados en la estructura de gobernanza
frecuencia. Asegúrese de que todas las de datos se dedican a conseguir esos objetivos.
inquietudes se calman o reciben una respuesta Tanto los planteamientos de gobernanza como
apropiada. la toma de decisiones se deben regir por los
objetivos comunes.
Parte 3 / Su eficaz cadena de suministro de datos 37
Competencias que
necesita y competencias
que posee
Vuelva a coger lápiz y papel. Ahora que ya sabe
las diversas oportunidades y los distintos
inconvenientes subjetivos que presentará
el nuevo equipo, imaginemos su composición.
Función ¿Tiene ya a alguien Es preciso contratar Por el tiempo disponible, Necesidad de una mentalidad
capaz de desempeñar a alguien para esta es preciso contratar a este integradora
esta función? función número de personas
Otro
Otro
Otro
Otro
Parte 3 / Su eficaz cadena de suministro de datos 39
Sus procesos
Pasemos a los procesos reales que
precisa para enfrentarse al Big Data.
Aunque sus procesos sean específicos
según sus objetivos y sus requisitos,
en esta sección, se ofrece información
general sobre lo que cabe esperar
y aprender.
Parte 3 / Su eficaz cadena de suministro de datos 41
Ha de establecer dos procesos básicos. Se trata de un paso que, a pesar de ser Si domina estos ocho pasos, su proyecto
El primero consiste en definir las normas y las fundamental, casi siempre se obvia. Establezca de Big Data marchará en la dirección
prácticas de seguridad que exija cada conjunto un proceso claro para el análisis de las correcta. El objetivo consiste en establecer
de datos; el segundo, en detectar los datos necesidades de negocio incluso mientras procesos claros, repetibles y escalables
sensibles y enmascararlos de forma persistente se analizan los datos. Es fundamental porque, en permanente mejora. Con ese fin,
o dinámica para garantizar la aplicación si no mantiene el pulso al negocio, se arriesga la documentación de dichos procesos
uniforme de esas normas y mejores prácticas. a dividir los esfuerzos y a minimizar la repercusión y las consiguientes mejoras resultan
en el negocio. vitales para el equipo.
6. Análisis de los datos
Las competencias, las capacidades
8. Aprovechamiento operativo
y las lecciones del proyecto de Big Data
El proceso de análisis depende de los analistas, de la información
han de ser trasladables y se tienen que
las herramientas analíticas y los requisitos
comunicar con frecuencia.
relacionados con los objetivos. Resulta Como ya hemos destacado antes en el cuaderno,
esencial mantener una mentalidad que priorice es indispensable que se perciba el impacto
la detección iterativa y la mejora continua en el negocio del proyecto de Big Data. Cree
ya que conviene que este proceso sea mejor, procesos automatizados para suministrar las
más rápido, más barato y más escalable con respuestas halladas a los usuarios de negocio
el tiempo y la experiencia. que más las necesitan. Por ejemplo, es preciso
poner los datos sobre los clientes con más
probabilidad de rotación a disposición de los
agentes del servicio de atención al cliente
mediante un cuadro de mando. No olvide
incorporar también un bucle de comentarios
para saber cómo se recibe la información.
Parte 3 / Su eficaz cadena de suministro de datos 43
Su arquitectura
Para que la cadena de suministro
del Big Data sea eficaz y efectiva,
es imprescindible garantizar que
la arquitectura es sólida y está concebida
de forma estratégica. En esta sección,
veremos el aspecto de la arquitectura
de Big Data idónea y la manera
de implantar la suya por fases.
Parte 3 / Su eficaz cadena de suministro de datos 44
Primeros pasos:
zona de pruebas
A la hora de crear la arquitectura Empiece con moderación Enmascare los datos antes de probarlos
de su proyecto de Big Data,
Si configura una zona de pruebas bien Cuando las organizaciones emplean datos
el punto de partida más lógico definida en la que ejerza un control absoluto, de prueba, suelen utilizar una variante de sus
consiste en configurar un entorno podrá iterar el método hasta conseguir datos de producción activos para garantizar
de desarrollo de pruebas en el cual una implementación correcta. Póngase que los formatos y las estructuras representen
en marcha cuanto antes y documente el entorno activo. Lamentablemente, si no se
probar datos para asegurarse
las lecciones aprendidas con cada iteración. realiza un enmascaramiento adecuado, los
de que la arquitectura sea viable. datos sensibles pueden quedar expuestos en
Al hacerlo, tenga en cuenta las El tamaño importa un entorno nada seguro.
recomendaciones siguientes.
La diferencia clave entre la zona de pruebas No se extravíe en el camino
y la implementación real radica en que
el entorno de producción será mucho más Una de las causas más comunes del aumento
grande. Por ello, hará falta un procesamiento de costes y del retraso de los proyectos de
automatizado para incorporar, integrar, limpiar Big Data es que los errores de codificación manual
y distribuir los resultados. Por lo tanto, hacen no detectados en la zona de pruebas se convierten
falta una estructura mucho más sólida así en la peor pesadilla del equipo cuando se activa la
como procesos y componentes de eficacia arquitectura. Por eso, si codifica a mano bastantes
probada para que el entorno de producción partes de la arquitectura, no se sorprenda
activo sea del todo fiable y flexible. si tiene que rehacer un montón de código
para satisfacer los requisitos de producción
y contener las expectativas. También cuenta con
la alternativa de emplear de primero herramientas
de productividad y automatización que le eviten
rehacer el código y subsanar los errores.
Parte 3 / Su eficaz cadena de suministro de datos 45
–– B
ases de datos Incorporación –– Integración de datos Entrega de datos –– Visualización
relacionales de datos
–– Calidad de datos –– Aplicaciones móviles
Carga en batch
–– Mainframe
Carga en batch –– Máquina virtual de datos –– Análisis
–– Documentos y correos Hub de integración
–– Seguridad de datos –– Business intelligence
electrónicos Captura de cambios de datos
de datos –– Gestión de datos –– Cuadros de mando
–– Redes sociales, datos
maestros Virtualización de datos en tiempo real
de terceros y archivos
Transmisión de datos
de registro –– A lmacenamiento
Procesamiento
escalable (por ejemplo,
–– Sensores de máquinas Archivado basado en eventos
Hadoop)
y en tiempo real
–– Cloud público
–– Data warehouse
–– Cloud privado
Parte 3 / Su eficaz cadena de suministro de datos 46
Plan de
su proyecto
Ya hemos analizado todos los aspectos
de su transición al Big Data. A continuación,
sírvase de este plan como modelo para
gestionar el proyecto de Big Data desde
su concepción hasta su implementación.
Parte 3 / Su eficaz cadena de suministro de datos 47
Plan de su proyecto
En marcha
Esto es grande.
50
Siguientes pasos
DESCARGAR AHORA
Acerca de Informatica
IN18-0917-2730
© Copyright Informatica LLC 2015, 2017. Informatica y el logotipo de Informatica son marcas comerciales
o marcas comerciales registradas de Informatica LLC en los Estados Unidos de Norteamérica y en otros países.