You are on page 1of 8

Gabriela Rodrguez Rojas

Big data
By Vangie Beal
Big data is a buzzword, or catch-phrase, used to describe a massive volume of
both structured and unstructured data that is so large that it's difficult to process
using traditional database and software techniques. In most enterprise scenarios
the data is too big or it moves too fast or it exceeds current processing capacity.
Big data has the potential to help companies improve operations and make faster,
more intelligent decisions.
Is Big Data a Volume or a Technology?
While the term may seem to reference the volume of data, that isn't always the
case. The term big data, especially when used by vendors, may refer to the
technology (which includes tools and processes) that an organization requires to
handle the large amounts of data and storage facilities. The term big data is
believed to have originated with Web search companies who needed to query very
large distributed aggregations of loosely-structured data.
An Example of Big Data
An example of big data might be petabytes (1,024 terabytes) or exabytes (1,024
petabytes) of data consisting of billions to trillions of records of millions of people
all from different sources (e.g. Web, sales, customer contact center, social media,
mobile data and so on). The data is typically loosely structured data that is often
incomplete and inaccessible.
Big Data and Types of Business Datasets
When dealing with larger datasets, organizations face difficulties in being able to
create, manipulate, and manage big data. Big data is particularly a problem in
business analytics because standard tools and procedures are not designed to
search and analyze massive datasets.
As research from Webopedia parent company QuinStreet demonstrates, big data
initiatives are poised for explosive growth. QuinStreet surveyed 540 enterprise
decision-makers involved in big data and found the datasets of interest to many
businesses today include traditional structured databases of inventories, orders,
and customer information, as well as unstructured data from the Web, social
networking sites, and intelligent devices.
This data, when captured, formatted, manipulated, stored, and analyzed can help a
company to gain useful insight to increase revenues, get or retain customers, and
improve operations. Big data may also be called enterprise big data.
Big data analytics
Gabriela Rodrguez Rojas
Big data analytics refers to the process of collecting, organizing and analyzing
large sets of data ("big data") to discover patterns and other useful information. Not
only will big data analytics help you to understand the information contained within
the data, but it will also help identify the data that is most important to the business
and future business decisions. Big data analysts basically want the knowledge that
comes from analyzing the data.
The Benefits of Big Data Analytics
Enterprises are increasingly looking to find actionable insights into their data. Many
big data projects originate from the need to answer specific business questions.
With the right big data analytics platforms in place, an enterprise can boost sales,
increase efficiency, and improve operations, customer service and risk
management.
Webopedia parent company, QuinStreet, surveyed 540 enterprise decision-makers
involved in big data purchases to learn which business areas companies plan to
use Big Data analytics to improve operations. About half of all respondents said
they were applying big data analytics to improve customer retention, help with
product development and gain a competitive advantage.

For most organizations, big data analysis is a challenge. Consider the sheer
volume of data and the many different formats of the data (both structured and
unstructured data) collected across the entire organization and the many different
ways different types of data can be combined, contrasted and analyzed to find
patterns and other useful information.
The first challenge is in breaking down data silos to access all data an organization
stores in different places and often in different systems. A second big data
challenge is in creating platforms that can pull in unstructured data as easily as
structured data. This massive volume of data is typically so large that it's difficult to
process using traditional database and software methods.
Big Data Requires High-Performance Analytics
To analyze such a large volume of data, big data analytics is typically performed
using specialized software tools and applications for predictive analytics, data
mining, text mining, forecasting and data optimization. Collectively these processes
are separate but highly integrated functions of high-performance analytics. Using
big data tools and software enables an organization to process extremely large
volumes of data that a business has collected to determine which data is relevant
and can be analyzed to drive better business decisions in the future.
Examples of How Big Data Analytics is Used Today
Gabriela Rodrguez Rojas
As technology to break down data silos and analyze data improves, business can
be transformed in all sorts of ways. According to Datamation, today's advances in
analyzing Big Data allow researchers to decode human DNA in minutes, predict
where terrorists plan to attack, determine which gene is mostly likely to be
responsible for certain diseases and, of course, which ads you are most likely to
respond to on Facebook. The business cases for leveraging Big Data are
compelling. For instance, Netflix mined its subscriber data to put the essential
ingredients together for its recent hit House of Cards, and subscriber data also
prompted the company to bring Arrested Development back from the dead.
Another example comes from one of the biggest mobile carriers in the world.
France's Orange launched its Data for Development project by releasing
subscriber data for customers in the Ivory Coast. The 2.5 billion records, which
were made anonymous, included details on calls and text messages exchanged
between 5 million users. Researchers accessed the data and sent Orange
proposals for how the data could serve as the foundation for development projects
to improve public health and safety. Proposed projects included one that showed
how to improve public safety by tracking cell phone data to map where people went
after emergencies; another showed how to use cellular data for disease
containment.

The pace of data creation will surely increase, especially as machine-to-machine
communications gets cheaper and more common. Think about how much data all
of those sensor networks, burglar alarms and vehicle telematics systems will
create.
According to IBM, every single day we create 2.5 quintillion bytes of data. IBM
argues that the exponential growth of data means that 90 percent of the data that
exists in the world today has been created in the last two years. "This data comes
from everywhere: sensors used to gather climate information, posts to social media
sites, digital pictures and videos, e-commerce transaction records, and cell phone
GPS coordinates, to name a few."
Of course, it's important to remember that in early human history, anything as
ephemeral as a tweet just would not have been recorded, so these comparisons
can only be taken so far.
To put the data explosion in context, consider this. Every minute of every day we
create
More than 204 million email messages
Over 2 million Google search queries
48 hours of new YouTube videos
Gabriela Rodrguez Rojas
684,000 bits of content shared on Facebook
More than 100,000 tweets
$272,000 spent on e-commerce
3,600 new photos shared on Instagram
Nearly 350 new WordPress blog posts

BIG DATA

Big data es una palabra de moda, o coger-frase usada para describir un volumen
masivo de datos tanto estructurados como no estructurados que es tan grande
que es difcil de procesar utilizando tcnicas de bases de datos y de software
tradicionales. En la mayora de escenarios empresariales los datos son demasiado
grandes o se mueven demasiado rpido o se excede la capacidad de
procesamiento actual. Grandes datos tiene el potencial de ayudar a las empresas
a mejorar sus operaciones y tomar decisiones ms rpidas, ms inteligentes.
Es Big Data un volumen o una tecnologa?

Mientras que el trmino puede parecer para hacer referencia al volumen de datos,
que no siempre es el caso. El trmino big data, especialmente cuando es usado
por los proveedores, pueden referirse a la tecnologa (que incluye herramientas y
procesos) que una organizacin necesita para manejar las grandes cantidades de
datos e instalaciones de almacenamiento. Se cree que el Big Data trmino que se
origin con las empresas de bsqueda Web que necesitaban consultar muy
grandes agregaciones de datos distribuidos dbilmente estructurada.
Un ejemplo de Big Data

Un ejemplo de datos grandes podran ser peta bytes (1024 terabytes) o exabytes
(1.024 petabytes) de datos que constan de miles de millones a miles de millones
de registros de millones de personas todos de diferentes fuentes (por ejemplo,
Web, ventas, centro de contacto con el cliente, medios de comunicacin social, los
datos mviles y as sucesivamente). Los datos son normalmente poco
estructurados de datos que a menudo son incompletos e inaccesibles.
Datos y tipos de conjuntos de datos de las grandes empresas

Cuando se trata de grandes conjuntos de datos, las organizaciones se enfrentan a
dificultades para poder crear, manipular y gestionar grandes volmenes de datos.
Big Data es un problema particularmente en anlisis de negocios porque las
herramientas y procedimientos estndar no estn diseados para buscar y
analizar conjuntos de datos masivos. Como la investigacin de la compaa matriz
Gabriela Rodrguez Rojas
Webopedia QuinStreet demuestra, iniciativas de grandes datos estn preparadas
para un crecimiento explosivo. QuinStreet encuest a 540 empresas que toman
las decisiones involucradas en grandes volmenes de datos y encontr a los
conjuntos de datos de inters para muchas empresas hoy en da incluyen las
bases de datos tradicionales estructurados de inventarios, pedidos y la
informacin del cliente, as como datos no estructurados de la Web, los sitios de
redes sociales y dispositivos inteligentes. Estos datos, cuando fue capturado,
formateado, manipulado, almacena, analiza y puede ayudar a una empresa para
obtener informacin til para aumentar los ingresos, obtener o retener a los
clientes, y mejorar las operaciones. Grandes datos tambin pueden ser llamados
de la empresa de datos grandes.
Anlisis de datos grandes.

Anlisis de grandes datos se refiere al proceso de recoleccin, organizacin y
anlisis de grandes conjuntos de datos ("big data") para descubrir patrones y otra
informacin til. No slo habr anlisis de datos grandes ayudar a entender la
informacin contenida en los datos, sino que tambin ayudar a identificar los
datos
Que es ms importante para el negocio y las decisiones futuras del negocio. Los
analistas de datos Big bsicamente quieren que el conocimiento que proviene de
analizar los datos.
Los beneficios de Big Data Analytics

Las empresas estn cada vez ms buscando para encontrar informacin
procesable en sus datos. Muchos proyectos de grandes datos se originan en la
necesidad de responder a las preguntas especficas del negocio. Con las grandes
plataformas de anlisis de los datos correctos en el lugar, una empresa puede
impulsar las ventas, aumentar la eficiencia y mejorar las operaciones, servicio al
cliente y la gestin de riesgos. Empresa matriz Webopedia, QuinStreet, encuest a
540 empresas que toman las decisiones que participan en las compras de grandes
datos para saber qu reas de negocio empresas planean utilizar la analtica Big
Data para mejorar las operaciones. Aproximadamente la mitad de todos los
encuestados dijeron que estaban aplicando analtica de grandes datos para
mejorar la retencin de clientes, ayudar con el desarrollo de productos y obtener
una ventaja competitiva.
Para la mayora de las organizaciones, el anlisis de grandes datos es un reto.
Tenga en cuenta la gran cantidad de datos y los distintos formatos de los datos
(datos estructurados y no estructurados) recogidos en toda la organizacin y de
las diferentes maneras diferentes tipos de datos se pueden combinar,
contrastados y analizados para encontrar patrones y otra informacin til. El
primer desafo es romper los hilos de datos para tener acceso a todos los datos de
Gabriela Rodrguez Rojas
los depsitos de las organizaciones en diferentes lugares y, a menudo en
diferentes sistemas. Un segundo desafo de grandes datos es en la creacin de
plataformas que pueden tirar en los datos no estructurados con tanta facilidad
como los datos estructurados. Este volumen masivo de datos suele ser tan grande
que es difcil de procesar utilizando los mtodos de base de datos y de software
tradicionales.
Big Data Analytics Requiere de Alto Rendimiento

Para analizar un gran volumen de datos como, anlisis de datos grandes se
realiza normalmente utilizando herramientas de software y aplicaciones
especializadas para el anlisis predictivo, minera de datos, minera de texto, la
prediccin y la optimizacin de datos. En conjunto, estos procesos son funciones
separadas pero altamente integradas de anlisis de alto rendimiento. El uso de
herramientas de datos grandes y software permite a una organizacin para
procesar extremadamente grandes volmenes de datos que un negocio ha
recogido para determinar qu datos son relevantes y pueden ser analizados para
tomar mejores decisiones de negocio en el futuro.
Ejemplos de cmo Big Data Analytics se utiliza hoy

Como la tecnologa para romper los hilos de datos y anlisis de datos mejora,
negocio puede transformarse en todo tipo de formas. Segn Datamation, los
avances en el anlisis de Big Data de hoy permiten a los investigadores a descifrar
el ADN humano en cuestin de minutos, predicen que los terroristas planean
atacar, determinan qu gen es sobre todo probable que sea responsable de
ciertas enfermedades y, por supuesto, que los anuncios que tienen ms
probabilidades de responder a en Facebook. Los casos de negocio para
aprovechar los grandes datos son convincentes. Por ejemplo, Netflix extrae sus
datos de suscriptor de poner los ingredientes esenciales juntos por su reciente
xito Castillo de naipes, y los datos de abonado tambin llevaron a la compaa a
llevar Arrested Development de entre los muertos.
Otro ejemplo proviene de una de las mayores compaas de telefona mvil en el
mundo. Orange de Francia puso en marcha su proyecto de datos para el
Desarrollo por la liberacin de los datos de abonado para los clientes en la Costa
de Marfil. Los 2,5 mil millones de registros, que se hicieron en el anonimato,
incluidos detalles sobre las llamadas y mensajes de texto intercambiados entre 5
millones de usuarios. Los investigadores acceden a los datos y enviaron
propuestas a Orange de cmo los datos pueden servir de base para los proyectos
de desarrollo para mejorar la salud y la seguridad pblica. Los proyectos
propuestos incluyen uno que mostraba la forma de mejorar la seguridad pblica
mediante el seguimiento de los datos del telfono celular para mapear donde la
Gabriela Rodrguez Rojas
gente iba tras una emergencia; otra mostr cmo usar los datos celulares para la
contencin de la enfermedad.
El ritmo de creacin de datos seguramente aumentar, sobre todo porque las
comunicaciones de mquina a mquina se vuelven ms baratas y ms comunes.
Piense en la cantidad de datos todas esas redes de sensores, alarmas antirrobo y
los sistemas telemticos vehculo va a crear.
Segn IBM, cada da creamos 2,5 trillones de bytes de datos. IBM sostiene que el
crecimiento exponencial de los datos significa que el 90 por ciento de los datos
que existe en el mundo de hoy se ha creado en los ltimos dos aos. "Estos datos
vienen de todas partes: sensores utilizados para recopilar informacin sobre el
clima, los mensajes de los sitios de medios sociales, fotos digitales y videos,
registros de transacciones de comercio electrnico, y las coordenadas de GPS del
telfono celular, para nombrar unos pocos.
"Por supuesto, es importante recordar que en la historia humana temprana, algo
tan efmero como un tweet simplemente no habra sido registrado, por lo que estas
comparaciones slo puede ser tomada hasta el momento.
Para poner la explosin de datos en contexto, considere esto.
Cada minuto de cada da creamos ms de 204 millones de mensajes de correo
electrnico
Ms de 2 millones consultas Google de bsqueda.
48 horas de nuevos vdeos de YouTube.
684.000 bits de contenido compartido en Facebook.
Ms de 100.000 tweets.
$ 272.000 gastados en el comercio electrnico.
3600 nuevas fotos compartidas en Instagram.
Casi 350 entradas del blog nuevo WordPress.

Gabriela Rodrguez Rojas

Big Data
Toma de decisiones
Almacena y
analizar
90% de datos ultimos
dos aos
Analisis de alto
rendimiento
Integridad
Disponibilidad
Responder preguntas
Dificil en software
tradicional
Terabytes
Petabytes
Redes sociales
Dispositivos moviles
Aplicaciones
Salud
Geografia
Finanzas
Origenes en la web
Datos
Estructurados
No estructurados
Empresa
Mejor serviicio
Mayor
productividad
Volumen masivo de
datos

You might also like