You are on page 1of 13

Bases de datos de Arrays

Jeison Sánchez
Daniel Martínez
Omar Oviedo
Santiago Agudelo
Arrays (matrices)

Los Arrays (matrices o arreglos) permiten agrupar


valores que de alguna forma necesitamos que
estén relacionados entre sí.

Una matriz es una estructura de datos que


contiene una serie de variables denominadas
elementos de la matriz.
Definición de Bases de datos de Arrays
Los sistemas de administración de bases de datos
(DBMS) proporcionan servicios de base de datos
específicamente para matrices, es decir:
colecciones homogéneas de elementos de
datos, sentados en una cuadrícula regular de
uno, dos o más dimensiones. A menudo, las
matrices se usan para representar datos de
sensores, simulaciones, imágenes o estadísticas.
Tales matrices tienden a ser Big Data , con objetos
individuales que con frecuencia oscilan en
Terabyte y luego en tamaños de Petabyte
¿Por qué una base de datos Arrays?
 Los grandes datos se refieren a nuevos tipos de datos y
análisis complejos
 Los análisis complejos trasladan los conocimientos mucho
más allá del análisis BI o SQL tradicional
 Desafíos en hacer análisis complejos a escala
 El valor real de los datos vendrá del contexto
 una base de datos de Arrays realiza consultas basadas
en contexto 50 a 100 veces más rápido
 El aumento significativo en los datos científicos ocurridos
en la última década, como el crecimiento de archivos de
la NASA de unos cien Terabytes en los 2000 a 32
Petabytes
Desde hace décadas, SQL ha demostrado su valor
en servicios de datos de cualquier tamaño en
empresas y en la administración pública. Parte de
este éxito es la versatilidad del enfoque del lenguaje
de consulta, así como el grado de libertad de los
proveedores para mejorar el rendimiento a través
de los métodos de escalabilidad del lado del
servidor.
Lamentablemente, los entornos
científicos y de ingeniería podrían
beneficiarse solo de forma limitada.
¿Por qué no utilizar la representación de
Arrays de la Base de datos?
En algunos SGBD (sistema de gestión de base de datos) como PostgreSQL existe
un tipo de datos Array para una columna.

No es recomendado en utilizar estos tipos de columnas al desarrollar


aplicaciones web. La representación por parte del SGBD no suele dar buenos
resultados y algunos casos podríamos resolverlo mucho más rápido con un
simple parseo de los campos del Array a una cadena de texto de valores
separados por coma: 1, 33, hola, test, mundo.

Agregar (y explicar) desventajas .


Arquitecturas de base de datos de
matriz
 Almacenamiento
Los patrones de acceso en las matrices
están fuertemente vinculados a la sección
euclidiana de celdas de matriz (figura), por
lo tanto, debe ser un objetivo principal de
cualquier motor de almacenamiento
conservar la proximidad en el
almacenamiento persistente mediante una
agrupación espacial adecuada. Por lo
tanto, es común dividir matrices nD en sub-
arrays nD llamadas tiles o fragmentos que
luego forman la unidad de acceso al
almacenamiento persistente.
Mosaico de muestras de matrices en 2-D y 3-D (izquierda) y estrategias de mosaico
rasdaman (motor Array Analytics Engine, servicios de datos escalables para ciencia,
ingeniería y más) áreas de interés, regular y direccional (derecha)
Dominios de aplicación
Las matrices, también llamadas "datos de trama" o "datos
de cuadrícula" o, más recientemente, "cubos de datos" ,
constituyen una abstracción que aparece en
prácticamente todas las áreas de la ciencia y la
ingeniería, e incluso más allá:
 Ciencias de la tierra: geodesia / mapeo, teledetección,
geología, oceanografía, hidrología, ciencias
atmosféricas, ciencias criosféricas
 Ciencias del espacio: ciencias planetarias, astrofísica
(observaciones ópticas y de radiotelescopios,
simulaciones cosmológicas)
 Ciencias de la vida: datos genéticos, microscopía
confocal, escaneos CAT
 Ciencias sociales: cubos de datos estadísticos
 Negocio: OLAP, almacenamiento de datos
Lista de Array DBMS

Oracle GeoRaster
MonetDB / SciQL
PostGIS
rasdaman
SciDB
 Agregar (y explicar si se puede) un ejemplo de uno de esos manejadores
de bases de datos de la pagina anterior.
Cibergrafía

 https://www.rd-alliance.org/group/array-database-assessment-
wg/wiki/introduction-array-databases
 https://en.wikipedia.org/wiki/Array_DBMS
 http://www.rasdaman.com/

You might also like