You are on page 1of 16

Materia:

Base de Datos Distribuidas.

Profesor: Lic. Oscar Hernndez Morales. Unidad II Diseo de bases de datos distribuidas. Objetivo: Disear bases de datos distribuidas.

2.1 Consideraciones del diseo de un sistema de bases de datos distribuidas. A los problemas que presentamos en el diseo de las Bases de Datos Centralizadas (BDC) se le aaden otros nue os cuando diseamos Bases de Datos Distribuidas (BDD) entre los cuales se destacan la distribuci!n !ptima de datos " de las aplicaciones en los di#erentes sitios. $l problema de diseo de bases de datos distribuidos se re#iere% en &eneral% a 'acer decisiones acerca de la ubicaci!n de datos " pro&ramas a tra (s de los di#erentes sitios de una red de computadoras. $ste problema deber)a estar relacionado al diseo de la misma red de computadoras. La decisi!n de donde colocar a las aplicaciones tiene que er tanto con el so#t*are del +MBDD como con las aplicaciones que se an a e,ecutar sobre la base de datos. Cuando pensamos en el diseo de las bases de datos distribuidas debemos tener en cuenta la ubicaci!n de los pro&ramas que accedern a las bases de datos " sobre los propios datos que constitu"en la base de datos% en di#erentes puntos de una red. +obre la ubicaci!n de los pro&ramas supondremos que tenemos una copia de ellos en cada mquina donde se necesite acceder a la base de datos. +in embar&o el problema radica en c!mo ubicaremos los datos en la red% e-isten di#erentes #ormas de repartir los datos. $n solo una mquina que almacene todos los datos " se encar&ue de responder a todas las consultas del resto de la red (sistema centralizado)% /bicar)amos la base de dato en cada mquina donde se utilice% o pensar)amos en repartir las relaciones por toda la red. La or&anizaci!n de los sistemas de bases de datos distribuidos se 'a clasi#icado tradicionalmente sobre el ni el de compartici!n% caracter)sticas de acceso " ni el de conocimiento de los datos. 1. Inexistencia. Los datos " pro&ramas se e,ecutan en un ordenador sin que e-ista comunicaci!n entre ellos. 2. Se com arten datos ! no ro"ramas. $-iste una r(plica de los pro&ramas de aplicaci!n en cada mquina " los datos ia,an a tra (s de la red.(+$ COM0A12$3 LO+ DA2O+ 4 3O 01O51AMA+) ($+ /3 AMB6$32$ CL6$32$ +$176DO1)

#. Se com arten datos ! ro"ramas. Los datos " pro&ramas se reparten por los di#erentes sitios de la red% dado un pro&rama ubicado en un determinado sitio puede acceder a un ser icio a otro pro&rama de se&undo sitio solicitando acceder a los datos ubicados en un tercero.(AMB6$32$ D6+216B/6DO) $u licaci%n de los datos. La duplicaci!n de los datos ocurre si el sistema mantiene arias copias de una relaci!n 1% con cada copia almacenada en un sitio di#erente. $-isten dos modelos bsicos de replica. 1. Consistencia estrec&a. $ste modelo que &arantiza que todas las r(plicas sean constantemente id(nticas a la ori&inal% requiere una red de alta elocidad% disminu"e la disponibilidad de la base de datos. 2. Consistencia anc&a. $l modelo de consistencia anc'a permite un retardo entre el momento en que los datos ori&inales son modi#icados " las copias de los mismos son actualizadas% lo que permite que la base de datos est( disponible ms tiempo que el modelo de consistencia estrec'a. 0ermite cone-iones tanto rpidas como lentas soportadas en 8A3s o LA3s. La duplicaci!n se introduce para aumentar la disponibilidad del sistema. Cuando una copia no est disponible debido a un #allo de un sitio ser)a posible tener acceso a otra copia. Con la duplicaci!n tambi(n se me,ora el rendimiento puesto que las transacciones tienen ma"or probabilidad de encontrar una copia localmente. $l incon eniente est en el costo e-tra del almacenamiento adicional " del mantenimiento de la consistencia mutua entre las copias cuando tenemos replicaci!n. $l diseo de una BDD in olucra 9 pasos. 1. $iseo del es'uema conce tual: donde se describe la BD inte&ral (esto es% todos los datos que son utilizados por las aplicaciones que tienen acceso a las bases de datos). 2. $iseo de fra"mentaci%n. este se determina por la #orma en que las relaciones &lobales se subdi iden en #ra&mentos 'orizontales% erticales o mi-tos.

#. $iseo de la asi"naci%n de los fra"mentos: esto se determina en la #orma en que los #ra&mentos se mapean: a las im&enes #)sicas% en esta #orma% tambi(n se determina la solicitud de #ra&mentos. ( Mapean o mapear. 1epresentar las partes de un todo. Localizar " representar &r#icamente la distribuci!n relati a de las partes de un todo. ). $iseo de la *$ f+sica (trans#ormar los esquemas locales en reas de almacenamiento " determinar m(todos de acceso apropiados). mapear el esquema conceptual a las reas de almacenamiento " determinar los m(todos de acceso a las bases de datos. La #ra&mentaci!n " asi&naci!n de los datos caracterizan el diseo de BDD. ,a fra"mentaci%n. se ocupa #undamentalmente de los criterios l!&icos que moti an la di isi!n de relaciones &lobales en #ra&mentos. Mientras que la asi"naci%n. se ocupa de los aspectos #)sicos de su ubicaci!n " r(plicas en sitios. Aunque 'a" una di#erencia entre ambos procesos% su interrelaci!n es importante para obtener un diseo !ptimo. $n caso que tambi(n se distribu"an las aplicaciones debemos tener en cuenta el diseo de los esquemas% los requerimientos ms importantes de las aplicaciones tenemos las si&uientes. 1. +itio que comparte una aplicaci!n. 2. ;recuencia de acti aci!n de la aplicaci!n. #. Cantidad% tipo " distribuci!n estad)stica de los accesos de cada aplicaci!n a cada dato requerido. $n el diseo de un sistema de bases de datos distribuidas debemos tener en cuenta al&unas estrate&ias " ob,eti os " se deben en paralelo tomar decisiones sobre c!mo 'a" que distribuir los datos entre los sitios de la red. Objetivos del $iseo de la $istribuci%n de los $atos. $n el diseo de la distribuci!n de los datos% se deben de tomar en cuenta los si&uientes ob,eti os. Procesamiento local. La distribuci!n de los datos% para ma-imizar el procesamiento local corresponde al principio simple de colocar los datos tan cerca como sea posible de las aplicaciones que los utilizan. +e puede realizar el diseo de la distribuci!n de los datos para ma-imizar el procesamiento local a&re&ando el n<mero de re#erencias locales " remotas que le corresponden a cada

#ra&mentaci!n candidata " la localizaci!n del #ra&mento% que de esta #orma se seleccione la me,or soluci!n de ellas. $istribuci%n de la car"a de trabajo . La distribuci!n de la car&a de traba,o sobre los sitios% es una caracter)stica importante de los sistemas de c!mputo distribuidos. $sta distribuci!n de la car&a se realiza para tomar enta,a de las di#erentes caracter)sticas (potenciales) o utilizaciones de las computadoras de cada sitio% " ma-imizar el &rado de e,ecuci!n de paralelismo de las aplicaciones. +in embar&o% la distribuci!n de la car&a de traba,o podr)a a#ectar ne&ati amente el procesamiento local deseado. Costo de almacenamiento ! dis onibilidad . La distribuci!n de la base de datos re#le,a el costo " disponibilidad del almacenamiento en di#erentes sitios. 0ara esto% es posible tener sitios especializados en la red para el almacenamiento de datos. +in embar&o el costo de almacenamiento de datos no es tan rele ante si (ste se compara con el del C0/% 6=O " costos de transmisi!n de las aplicaciones. (no importa la cantidad sino las solicitudes " numero de entradas " salidas). (3O 0/$D$ $+2A1 2ODO $3 M$MO16A>) -nfo'ues al roblema de diseo de bases de datos distribuidas $-isten dos estrate&ias &enerales para abordar el problema de diseo de bases de datos distribuidas. 1. -l diseo de abajo &acia arriba .bottom/u 0. +e utiliza particularmente a partir de bases de datos e-istentes% &enerando con esto bases de datos distribuidas. $n #orma resumida% el diseo bottom?up de una base de datos distribuida requiere de la selecci!n de un modelo de bases de datos com<n para describir el esquema &lobal de la base de datos. $sto es posible que se utilicen di#erentes +MBD. Despu(s se 'ace la traducci!n de cada esquema local en el modelo de datos com<n " #inalmente se 'ace la inte&raci!n del esquema local en un esquema &lobal com<n. 2. -l enfo'ue de arriba &acia abajo .to /do1n0. $ste en#oque es ms apropiado para aplicaciones nue as " para sistemas 'omo&(neos. Consiste en partir desde el anlisis de requerimientos para de#inir el diseo conceptual " las istas de usuario. A partir de ellas se de#ine un esquema conceptual &lobal " los esquemas e-ternos necesarios. +e prosi&ue con el diseo de la #ra&mentaci!n de la base de datos% " de aqu) se contin<a con la localizaci!n de los #ra&mentos en los sitios% creando las im&enes #)sicas. $sta apro-imaci!n se completa e,ecutando% en cada sitio% @el diseo #)sico@ de los datos% que se localizan en (ste. $n la #i&ura de aba,o se presenta un dia&rama con la estructura &eneral del en#oque top?do*n. (nue as aplicaciones " sistemas 'omo&eneos.) Proceso de $iseo 2o 3 $o1n.

/n esquema de este proceso puede obser arse en la si&uiente #i&ura.

$l diseo de una base de datos distribuida% cualquiera que sea el en#oque que se si&a% debe responder satis#actoriamente a las si&uientes pre&untas.

A0or qu( 'acer una #ra&mentaci!n de datosB AC!mo realizar la #ra&mentaci!nB 0or lo tanto se debe #ra&mentar. AC!mo probar la alidez de una #ra&mentaci!nB AC!mo realizar la asi&naci!n de #ra&mentosB AC!mo considerar los requerimientos de la in#ormaci!nB

2.2 $iccionario de datos. /n diccionario de datos es un con,unto de metadatos: .dato sobre dato0( que contiene las caracter)sticas l!&icas de los datos que se an a utilizar en el sistema que se pro&rama% inclu"endo nombre% descripci!n% alias% contenido " or&anizaci!n.

$ICCIO456IO $- $52OS C-4265,I75$O 3ombre% tipo " tamao de los datos. 3ombre de las relaciones entre los datos. 1estricciones de inte&ridad sobre los datos. 3ombre de los usuarios autorizados a acceder a la base de datos. $squemas e-ternos% conceptuales e internos% " correspondencia entre los esquemas. $stad)sticas de utilizaci!n% tales como la #recuencia de las transacciones " el n<mero de accesos realizados a los ob,etos de la base de datos.

$ICCIO456IO $- $52OS $IS26I*UI$O $l diccionario de datos de las bases de datos distribuidos contienen in#ormaci!n sobre las #ra&mentaci!n% r(plica " distribuci!n de los datos $l diccionario de datos del +5BDD puede proporcionar la in#ormaci!n requerida sobre la localidad " la duplicaci!n mientras ase&ura que las actualizaciones se propa&an por todas las localidades apropiadas. $l diccionario esta inte&rado a la base de datos a la cual de#ine% e inclu"e por tanto su propia de#inici!n. 0uede realizar una copia completa del diccionario de datos que puede obtenerse 'aciendo la uni!n de los subcon,untos distribuidos. 5uardar in#ormaci!n sobre la /bicaci!n de los datos. 5uardar in#ormaci!n +obre los #ra&mentos de cada relaci!n. 5uardar in#ormaci!n +obre la duplicaci!n de los datos. +e almacena la de#inici!n de las estructuras de datos &lobales " su ubicaci!n en los nodos de la red de comunicaciones. Muestra qu( pro&ramas utilizan qu( partes de la base de datos. Cu( usuarios necesitan qu( in#ormes. $s una t(cnica de especi#icaci!n #ormal que sir e para representar los

requerimientos de una aplicaci!n. Oracle posee un diccionario de datosD es decir la manera de e-traer el catlo&o de ob,etos de una base de datos% nos re#eriremos a. tablas% usuarios% roles% istas% columnas de las tablas% secuencias% constraintEs% sin!nimos% )ndices% tri&&ers% #unciones etc..% esta in#ormaci!n se encuentra contenida en tablas " istas del sistema.

2.# 4iveles de trans arencia. $n un sistema de base de datos distribuidos% los datos se accedan sobre una red de computadoras% pero las aplicaciones no deben notar que e-isten. Desde el punto de ista del usuario de la base de datos distribuida% los detalles de c!mo " d!nde se encuentran almacenados #)sicamente los datos. A la capacidad de ocultar estos detalles por parte del sistema distribuido se le denomina transparencia de la red. La transparencia de la red tiene que apo"arse en los si&uientes aspectos. ? La denominaci!n de los elementos de datos. ? La r(plica de los elementos de datos. ? La #ra&mentaci!n de los elementos de datos.

? La ubicaci!n de los #ra&mentos " las r(plicas. Primer nivel. +e soporta la transparencia de red. Se"undo nivel. +e permite la transparencia de replicaci!n de datos. 2ercer nivel. +e permite la transparencia de la #ra&mentaci!n. Cuarto nivel. +e permite transparencia de acceso (por medio de un len&ua,e de manipulaci!n de datos).

2.#.1 2rans arencia de locali8aci%n. /na ez de#inidas las cantidades de r(plicas " #ra&mentos que se requieren para un sistema distribuido% es importante decidir en qu( localidades de la red con iene ubicarlas% para ello se toman en cuenta di#erentes aspectos% tales como las capacidades de c!mputo de los nodos% la cantidad " tipo de cone-iones que 'a" 'acia ellos% sus necesidades de acceso a datos del sistema " si su ubicaci!n pudiera considerarse estrat(&ica dentro de la red% es decir% que sean nodos cercanos a otros con necesidades similares o bien% que no sean nodos terminales de la red " que% pre#erente% no #un,an como un nodo puente entre di#erentes sectores de la misma. 2odo este traba,o corresponde al diseador de la BD " se lo debe in#ormar al pro&ramador del sistema% para que% #inalmente% entre los dos de#inan la manera en la que esta in#ormaci!n pueda quedar oculta a los usuarios #inales. Lo anterior es posible siempre que todas las re&las para la de#inici!n de las r(plicas " #ra&mentos queden <nicamente en arc'i os cu"o acceso sea de carcter restrin&ido "% adems% en t(rminos de pro&ramaci!n es con eniente

utilizar un arc'i o adicional a los c!di&os #uente% que conten&a las rutas espec)#icas de acceso a los datos.

2.#.2 2rans arencia de fra"mentaci%n. O#recer transparencia en la de#inici!n de r(plicas o #ra&mentos de una BDD implica un ma"or es#uerzo para su diseador " sobre todo para el pro&ramador del sistema que la a a manipularD el primero de ellos porque debe de#inir ciertas re&las que de al&una manera oculten las especi#icaciones de las r(plicas " #ra&mentos establecidas% mientras que el pro&ramador del sistema debe traba,ar directamente en las l)neas de c!di&o re#erentes a la apertura de la BD% el nombre " la ubicaci!n de los arc'i os de datos requeridos% incluso los nombres " ubicaciones de los arc'i os que #un&en como respaldo de los datos ante el posible #allo de la ubicaci!n por de#ault% lo que si&ni#ica un ries&o de perder transparencia al momento en que el pro&ramador muestra sus c!di&os #uente a al&uien ms. Como soluci!n a esto e-iste la posibilidad de controlar los accesos a los arc'i os de datos a tra (s de un arc'i o adicional a los c!di&os #uente% que es el <nico que contiene el nombre " ubicaci!n de las BD. $ste ni el de transparencia re#iere <nicamente al nombramiento de las r(plicas " #ra&mentos% as) como la de#inici!n de los criterios contemplados para la de#inici!n de dic'os #ra&mentos o r(plicas% no respecto a su ubicaci!n #)sica de la red.

2.#.# 2rans arencia de r9 lica. La r(plica proporciona. 7$32AFA+. GMa"or 0restaci!n. los datos son locales. GMa"or disponibilidad. los datos son accesibles siempre.

D$+7$32AFA+ GHa" que propa&ar las actualizaciones GLa creaci!n " destrucci!n de r(plicas debe 'acerse transparente al usuario.

2.) :ra"mentaci%n de datos. .;IS25S0 ;ra&mentaci!n es el proceso a tra (s del cual se realiza la lectura de ciertos datos de una BD (4a sea ciertos campos "=o re&istros)% con el ob,eti o de crear un nue o arc'i o de datos que contendr los datos de la consulta% pro ocando que la BD ori&inal se quede sin ellos. +e puede decir que este tema tiene el apro-imada de #ra&mentos. ob,eti o de identi#icar la cantidad

0ara empezar a de#inir la necesidad de #ra&mentaci!n se tiene que conocer lo si&uiente. Datos espec)#icos que contienen las consultas que usualmente demandan los usuarios. $structura interna de la BD% es decir% en qu( tablas se encuentran los datos ma"ormente demandados por los usuarios. 1elaciones que e-isten entre las tablas de la BD " que debern cuando se 'a&a distribuida. respetarse

+e debe conocer si las salidas de datos que demanda el usuario son para consulta o para operaciones de escritura% porque% al i&ual que en el punto anterior% si las operaciones comunes son de escritura% los #ra&mentos posibles se&uramente ser)an menos que los e#ectuados si la ma"or)a de las eces s!lo son consultas las que lle an a cabo. La #ra&mentaci!n de los datos permite di idir en H o ms se&mentos o #ra&mentos. $l ob,eto podr)a ser una base de datos de usuario% una base de datos de sistema o una tabla. Cada #ra&mento puede &uardarse en cualquier sitio en una red de computadoras. La in#ormaci!n de la #ra&mentaci!n de datos se &uarda en un catlo&o de datos distribuidos (DDC% por sus si&las en 6n&les)% desde donde es accesada por el procesador de transacciones para procesar las solicitudes de los usuarios. Alternati as sobre replicaci!n para el asi&namiento de #ra&mentos La replicaci!n de in#ormaci!n es de utilidad para obtener un me,or rendimiento " para o#recer un ma"or &rado de con#iabilidad (tolerancia a #allas). La replicaci!n se complica cuando es necesario 'acer actualizaciones a las copias m<ltiples de un dato. 0or tanto% respecto a la replicaci!n% en el asi&namiento de #ra&mentos se tienen tres estrate&ias.

3o soportar replicaci!n. Cada #ra&mento reside en un solo sitio. +oportar replicaci!n completa. Cada #ra&mento en cada uno de los sitios. +oportar replicaci!n parcial. Cada #ra&mento en al&unos de los sitios.

6e'uerimientos de informaci%n. Con el #in de realizar una #ra&mentaci!n adecuada es necesario proporcionar in#ormaci!n que a"ude a realizarla. $sta in#ormaci!n normalmente debe ser proporcionada por el usuario " tiene que er con cuatro tipos. 6n#ormaci!n sobre el si&ni#icado de los datos. 6n#ormaci!n sobre las aplicaciones que los usan. 6n#ormaci!n acerca de la red de comunicaciones. 6n#ormaci!n acerca de los sistemas de c!mputo.

Las estrate&ias de #ra&mentaci!n de los datos% estn basadas a ni el de tabla " consiste en di idir una tabla en #ra&mentos l!&icos. +e e-plorarn I tipos de estrate&ias de #ra&mentaci!n. HO16JO32AL% 7$126CAL 4 M$JCLADA (H)brida o Hetero&(nea).

2.).1 :ra"mentaci%n &ori8ontal. :ra"mentaci%n &ori8ontal rimaria. Consiste del particionamiento en tuplas de una relaci!n &lobal en subcon,untos% donde cada subcon,unto puede contener datos que tienen propiedades comunes " se puede de#inir e-presando cada #ra&mento como una operaci!n de selecci!n sobre la relaci!n &lobal. :ra"mentaci%n &ori8ontal derivada. La #ra&mentaci!n deri ada 'orizontal se de#ine partiendo de una #ra&mentaci!n 'orizontal. $n esta operaci!n se requiere de +emi?,unta (+emi?Foin) el cual nos sir e para deri ar las tuplas o re&istros de dos relaciones. /na #ra&mentaci!n 'orizontal de una relaci!n lo constitu"e un subcon,unto de tuplas de dic'a relaci!n. Las tuplas que pertenecen al #ra&mento 'orizontal se especi#ican por una condici!n en uno o ms atributos de la relaci!n.

2.).2 :ra"mentaci%n vertical. /na #ra&mentaci!n ertical de una relaci!n R produce #ra&mentos RK% RH% ...% Rr% cada uno de los cuales contiene un subcon,unto de los atributos de R as) como la lla e primaria de R. $l ob,eti o de la #ra&mentaci!n ertical es particionar una relaci!n en un con,unto de relaciones ms pequeas de manera que arias de las aplicaciones de usuario se e,ecutarn sobre un #ra&mento. $n este conte-to% una #ra&mentaci!n @!ptima@ es aquella que produce un esquema de #ra&mentaci!n que minimiza el tiempo de e,ecuci!n de las consultas de usuario. La #ra&mentaci!n ertical 'a sido estudiada principalmente dentro del conte-to de los sistemas de mane,o de bases de datos centralizados como una 'erramienta de diseo% la cual permite que las consultas de usuario traten con relaciones ms pequeas 'aciendo% por tanto% un n<mero menor de accesos a p&inas. La #ra&mentaci!n ertical es in'erentemente ms complicada que particionamiento 'orizontal "a que e-iste un &ran n<mero de alternati as para realizarla. 0or lo tanto% se utilizan 'eur)sticas para 'acer el particionamiento. Los dos en#oques bsicos son. 1. Agrupamiento. 6nicia asi&nando cada atributo a un #ra&mento% " en cada paso% al&unos de los #ra&mentos satis#aciendo al&<n criterio se unen para #ormar un solo #ra&mento. (+OLO $+ 6M0O12A32$ LA 016MA14)

2. Divisin. 6nicia con una sola relaci!n realizar un particionamiento basado en el comportamiento de acceso de las consultas sobre los atributos. 3os concentraremos aqu) al estudio del en#oque di isional "a que% por un lado% su aplicaci!n es ms natural al en#oque de diseo @top?do*n@. Adems% el en#oque di isional &enera #ra&mentos que no se traslapan mientras que el a&rupamiento t)picamente resulta en #ra&mentos traslapados. 0or supuesto% la no traslapaci!n no inclu"e a las lla es primarias. 6e'uerimientos de informaci%n ara la fra"mentaci%n vertical. Como en el caso de la #ra&mentaci!n 'orizontal% es necesario proporcionar in#ormaci!n para poder realizar una adecuada #ra&mentaci!n ertical. 4a que el particionamiento ertical coloca en un #ra&mento aquellos atributos que se

accesan ,untos% se presenta la necesidad de una medida que relacione la a#inidad de los atributos% la cual indica qu( tan relacionados estn los atributos. $sta medida se obtiene por datos primiti os. /n #ra&mento ertical de una relaci!n contiene solo ciertos atributos de la relaci!n que estn relacionados entre s) de al&una #orma.

2.).# :ra"mentaci%n &+brida. $n muc'os casos una #ra&mentaci!n 'orizontal o ertical de un esquema de una base de datos no ser su#iciente para satis#acer los requerimientos de aplicaciones de usuario. $n este caso% una #ra&mentaci!n ertical puede ser se&uida de uno 'orizontal% o ice ersa% produciendo un rbol de particionamiento estructurado. 4a que los dos tipos de particionamiento se aplican uno despu(s del otro% esta alternati a se le conoce como #ra&mentaci!n &+brida.

2.< $istribuci%n de datos. La distribuci!n de los datos se realiza sobre tres dimensiones. un primer ni el de compartici!n% un se&undo ni el% que muestra las caracter)sticas de acceso a los datos " el <ltimo ni el de conocimiento de esas caracter)sticas de acceso. $n el ni el de com artici%n se encuentran tres alternati as. una primera es la ine-istencia% es decir% cada aplicaci!n " sus datos se e,ecutan en un ordenador con ausencia total de comunicaci!n con otros pro&ramas u otros datosD una se"unda alternati a es que se com arten s!lo los datos " no los pro&ramas% en tal caso e-iste una r(plica de las aplicaciones en cada mquina " los datos ia,an por la redD " una tercera " <ltima alternati a se re arten datos " pro&ramas dado un pro&rama ubicado en un determinado sitio% (ste puede solicitar un ser icio a otro pro&rama. 1especto a las caracter)sticas de acceso a los datos e-isten dos alternati as principalmente. el modo de acceso a los datos que solicitan los usuarios puede ser est=tico% es decir% no cambiar a lo lar&o del tiempo% o bien% din=mico. $l lector podr comprender #cilmente la di#icultad de encontrar sistemas distribuidos reales que puedan clasi#icarse como est=ticos. +in embar&o% lo realmente importante radica% estableciendo el dinamismo como base% c!mo de din=mico es% cuntas

ariaciones su#re a lo lar&o del tiempo. $sta dimensi!n establece la relaci!n entre el diseo de bases de datos distribuidas " el procesamiento de consultas. La tercera clasi#icaci!n es el ni el de conocimiento de las caracter)sticas de acceso. /na posibilidad es% e identemente% que los diseadores carezcan de in#ormaci!n al&una sobre c!mo los usuarios acceden a la base de datos. $s una posibilidad te!rica% pero ser)a mu" laborioso abordar el diseo de la base de datos con tal ausencia de in#ormaci!n. Lo ms prctico ser)a conocer con detenimiento la #orma de acceso de los usuarios o% en el caso de su imposibilidad% con#ormarnos con una in#ormaci!n parcial de (sta. $l problema del diseo de bases de datos distribuidas podr)a en#ocarse a tra (s de esta trama de opciones. $n todos los casos% e-cepto aquel en el que no e-iste compartici!n% aparecern una serie de nue os problemas que son irrele antes en el caso centralizado.

A la 'ora de abordar el diseo de una base de datos distribuida podremos optar principalmente por dos tipos de estrate&ias. la estrate"ia ascendente " la estrate"ia descendente. Ambos tipos no son e-clu"entes% " no resultar)a e-trao a la 'ora de abordar un traba,o real de diseo de una base de datos que se pudiesen emplear en di#erentes etapas del pro"ecto una u otra estrate&ia. La estrate"ia ascendente podr)a aplicarse en aquel caso donde 'a"a que proceder a un diseo a partir de un n<mero de pequeas bases de datos e-istentes% con el #in de inte&rarlas en una sola. $n este caso se partir)a de los esquemas conceptuales locales " se traba,ar)a para lle&ar a conse&uir el esquema conceptual &lobal. Aunque este caso se pueda presentar con #acilidad en la ida real% se pre#iere pensar en el caso donde se parte de cero " se a anza en el desarrollo del traba,o si&uiendo la estrate&ia descendente. La estrate"ia descendente deber)a resultar #amiliar a la persona que posea conocimientos sobre el diseo de bases de datos% e-ceptuando la #ase del diseo de la distribuci!n. 0ese a todo% se resumirn bre emente las etapas por las que se transcurre. -strate"ia descendente. 2odo comienza con un anlisis de los requisitos que de#inirn el entorno del sistema en aras a obtener tanto los datos como las necesidades de procesamiento de todos los posibles usuarios del banco de datos. 6&ualmente% se debern #i,ar los requisitos del sistema% los ob,eti os que debe cumplir respecto a unos &rados de rendimiento% se&uridad% disponibilidad " #le-ibilidad% sin ol idar el importante aspecto econ!mico. Como puede obser arse% los resultados de este <ltimo paso

sir en de entrada para dos acti idades que se realizan de #orma paralela. $l diseo de las istas trata de de#inir las inter#aces para el usuario #inal "% por otro lado% el diseo conceptual se encar&a de e-aminar la empresa para determinar los tipos de entidades " establecer la relaci!n entre ellas. $-iste un )nculo entre el diseo de las istas " el diseo conceptual. $l diseo conceptual puede interpretarse como la inte&raci!n de las istas del usuario% este aspecto es de ital importancia "a que el modelo conceptual deber)a soportar no s!lo las aplicaciones e-istentes% sino que deber)a estar preparado para #uturas aplicaciones. $n el diseo conceptual " de las istas del usuario se especi#icarn las entidades de datos " se determinarn las aplicaciones que #uncionarn sobre la base de datos% as) mismo% se recopilarn datos estad)sticos o estimaciones sobre la acti idad de estas aplicaciones. Dic'as estimaciones deber)an &irar en torno a la #recuencia de acceso% por parte de una aplicaci!n% a las distintas relaciones de las que 'ace uso% podr)a a#inarse ms anotando los atributos de la relaci!n a la que accede. Desarrollado el traba,o 'asta aqu)% se puede abordar la con#ecci!n del esquema conceptual &lobal. $ste esquema " la in#ormaci!n relati a al acceso a los datos sir en de entrada al paso distinti o. el diseo de la distribuci!n. $l ob,eti o de esta etapa consiste en disear los esquemas conceptuales locales que se distribuirn a lo lar&o de todos los puestos del sistema distribuido. +er)a posible tratar cada entidad como una unidad de distribuci!nD en el caso del modelo relacional% cada entidad se corresponde con una relaci!n. 1esulta bastante #recuente di idir cada relaci!n en sub?relaciones menores denominadas #ra&mentos que lue&o se ubican en uno u otro sitio. De a')% que el proceso del diseo de la distribuci!n conste de dos acti idades #undamentales. la fra"mentaci%n ! la asi"naci%n . $l <ltimo paso del diseo de la distribuci!n es el diseo #)sico% el cual pro"ecta los esquemas conceptuales locales sobre los dispositi os de almacenamiento #)sico disponibles en los distintos sitios. Las entradas para este paso son los esquemas conceptuales locales " la in#ormaci!n de acceso a los #ra&mentos. 0or <ltimo% se sabe que la acti idad de desarrollo " diseo es un tipo de proceso que necesita de una monitorizaci!n " un a,uste peri!dico% para que si se lle&an a producir des iaciones% se pueda retornar a al&una de las #ases anteriores.

You might also like