Professional Documents
Culture Documents
DATOS
Mejorar el rendimiento de las consultas
Si una base de datos de produccin contiene datos obsoletos que no se utilizan nunca o slo
en raras ocasiones, la ejecucin de las consultas puede llevar mucho tiempo. Esto se debe a
que las consultas tambin realizan bsquedas en los datos obsoletos. Para mejorar el
rendimiento, puede mover los datos obsoletos de la base de datos de produccin a otro
servidor y, si es necesario, ejecutar las consultas desde este ltimo.
Disminuir el uso de espacio en Disco
Los datos obsoletos ocupan una gran cantidad de espacio en disco. El archivado de estos
datos permite liberar este espacio para utilizarlo con otros propsitos. Si los datos obsoletos
se almacenan en un costoso sistema de disco, como una red de rea de almacenamiento
(SAN), el archivado de estos datos puede ayudar a reducir considerablemente los costos de
almacenamiento.
Reducir la ventana de mantenimiento
Realizar operaciones de mantenimiento, como volver a indizar o desfragmentar, en tablas
de gran tamao con una gran cantidad de datos obsoletos puede llevar mucho tiempo. Con
el archivado de datos se puede reducir el tiempo necesario para estas operaciones, as como
para la copia de seguridad y la restauracin de bases de datos.
Requisitos reguladores
Las regulaciones empresariales pueden estipular durante cunto tiempo debe estar
disponible en lnea la informacin. Por ejemplo, en muchos pases, la ley exige a los bancos
mantener en lnea determinados datos de clientes durante un nmero especfico de aos.
Por tanto, es necesario considerar el efecto de los requisitos reguladores a la hora de
determinar los datos que se pueden almacenar sin conexin. Asimismo, se debe tener en
cuenta el tiempo que los datos estarn disponibles en lnea, si as se solicita.
Granularidad de los datos para archivo
Es posible que no necesite contar con datos detallados una vez transcurrido cierto tiempo.
En estos casos, puede mantener en lnea tablas de resumen y archivar los datos detallados
en un almacenamiento sin conexin.
Utilice las siguientes directrices para determinar los requisitos de accesibilidad de los datos
archivados:
Identificar los datos a los que no se tiene acceso. Puede resultar difcil realizar un
seguimiento del uso de ciertos datos despus de un perodo de tiempo especfico.
Para ello, puede utilizar herramientas como Traza de SQL y Analizador de SQL
Server. Estas herramientas permiten determinar si los usuarios han tenido acceso a
una tabla concreta o a un conjunto de filas de una tabla durante un perodo dado.
Cuando utilice estas herramientas, puede que necesite examinar los argumentos de
bsqueda de las consultas para conocer los datos a los que los usuarios tienen
acceso. Asimismo, puede determinar los requisitos de accesibilidad de los datos
mediante procedimientos almacenados para registrar los argumentos de bsqueda al
consultar determinadas tablas.
Requisito de
accesibilidad
Acceso en 24
horas
Acceso en dos
horas
Acceso
inmediato
varias tablas, as como agregar y quitar tablas de una particin. Una vez que se quita una
tabla de una particin, la tabla y su ndice se pueden mover al destino de archivo. De forma
predeterminada, un ndice que se crea en una tabla con particiones utiliza la misma funcin
de particin. Como resultado, el ndice se alinea con la tabla, lo que simplifica la
administracin de los datos. Puede cambiar la configuracin predeterminada y alinear el
ndice con otra funcin de particin, o bien decidir no crear particiones en el ndice. Sin
embargo, estas estructuras dificultan la tarea de archivar los datos.
Ejemplo
Una compaa necesita conservar las facturas del mes actual para que se puedan modificar,
as como las de los ltimos cinco aos para posibles consultas. En este caso, el
administrador de bases de datos puede crear una tabla con particiones que incluya dos
grupos de archivos. Se puede utilizar un grupo de archivos de lectura y escritura para
almacenar las facturas del mes actual y un grupo de slo lectura para archivar las facturas
de los cinco aos anteriores hasta el mes pasado completo. Al final de cada mes, se deben
realizar operaciones como las de procesos por lotes de Transact-SQL para mover los datos
desde la particin del mes actual a la particin de archivo.
Normalizadas
El archivado de datos relacionados mantiene el contexto histrico de los datos y evita la
duplicacin. Para realizar esta operacin, puede emplear tablas normalizadas para
estructurar los datos para archivo. Al utilizar estas tablas, debe asegurarse de que en ellas
puede incluir cambios en los valores de bsqueda o tablas relacionadas. Una forma de
lograrlo es mediante la adicin de la validez de intervalo de fechas a las tablas
normalizadas. A continuacin, puede especificar los intervalos de fechas para los valores de
bsqueda vlidos.
Ejemplo
En el procesamiento de pedidos, es necesario que el archivo tenga una tabla Customers con
datos relacionados como CustomerID, CustomerName, CustomerFiscalID, Address, etc.
Habr tambin una tabla Orders que contenga campos como OrdersID, CustomerID,
OrderDate y Notes, as como una tabla OrderDetails que incluya campos como OrderID,
LineNumber, ProductID, Quantity, UnitPrice, Discount, adems de otra informacin
necesaria.
No normalizadas
Si no es posible archivar todos los datos relacionados, puede utilizar tablas no normalizadas
para conservar el contexto histrico de los datos. Estas tablas almacenan valores reales en
lugar de referencias a los datos actuales. Por tanto, resultan ms tiles para optimizar
consultas que incluyan combinaciones complejas.
Adems de las tablas no normalizadas, puede utilizar vistas indizadas para cancelar la
normalizacin de los datos. Debido a que las tablas no normalizadas conservan los datos
fsicamente, stos se pueden recuperar ms rpidamente que desde las vistas indizadas. Sin
embargo, las tablas no normalizadas requieren espacio en disco adicional. Adems, se
deben volver a crear peridicamente y no se actualizan de forma automtica como las vistas
indizadas. Tambin es probable que necesite modificar la aplicacin original y los informes
para consultar las tablas no normalizadas.
Ejemplo
Si no es posible archivar todos los datos relacionados, puede utilizar tablas no normalizadas
para conservar el contexto histrico de los datos. Estas tablas almacenan valores reales en
lugar de referencias a los datos actuales. Por tanto, resultan ms tiles para optimizar
consultas que incluyan combinaciones complejas.
Adems de las tablas no normalizadas, puede utilizar vistas indizadas para cancelar la
normalizacin de los datos. Debido a que las tablas no normalizadas conservan los datos
fsicamente, stos se pueden recuperar ms rpidamente que desde las vistas indizadas. Sin
embargo, las tablas no normalizadas requieren espacio en disco adicional. Adems, se
deben volver a crear peridicamente y no se actualizan de forma automtica como las vistas
indizadas. Tambin es probable que necesite modificar la aplicacin original y los informes
para consultar las tablas no normalizadas.
Creacin de particiones
archivado de datos
de
tablas
en
una
estrategia
de
Una organizacin de venta directa precisa mantener en lnea los datos de ventas de los 12
meses anteriores por motivos de consulta y de elaboracin de informes. Los datos restantes
se pueden archivar en una base de datos independiente en un servidor de archivos de
almacenamiento.
Para poder estructurar y archivar correctamente la tabla de ventas, el administrador de bases
de datos crea particiones mensuales de la misma.
Posteriormente, el administrador de bases de datos crea una tabla de archivos de
almacenamiento de la que crea particiones mensuales, al igual que hizo con la de ventas. En
esta tabla se almacenan datos anteriores a 12 meses.
A final de cada mes, el administrador de bases de datos transfiere los datos de ventas del
mes ms antiguo a la tabla de archivos de almacenamiento. Este mtodo de creacin de
particiones de tablas se conoce como tcnica de ventana deslizante.
Por ejemplo, a final del mes de julio de 2006, el administrador de bases de datos desea
archivar los datos de ventas de agosto de 2005.
En primer lugar, crea una particin vaca para agosto de 2006 en la tabla de ventas.
A continuacin, separa la particin para agosto de 2005.
Seguidamente, el administrador de bases de datos copia los datos de ventas de agosto de
2005 en una tabla en la base de datos de archivo.
Luego agrega esta tabla como nueva particin en la tabla de archivos de almacenamiento.
Por ltimo, elimina los datos de agosto de 2005 de la tabla de ventas.
en lnea para tener acceso a ellos resulta ms costoso que almacenarlos sin conexin.
Cuando se utilizan tablas no normalizadas para los datos archivados, se necesita espacio
adicional en disco, lo que genera un aumento en los costos de almacenamiento. Para reducir
los costos de hardware, puede guardar en lnea slo los datos de resumen y almacenar sin
conexin los detallados. No obstante, el almacenamiento sin conexin puede implicar
ciertos costos no contemplados, como los de transporte o de recuperacin que cargan las
compaas de mensajera externas. Asimismo, necesita tener la garanta de que no se pone
en peligro la seguridad de los datos que se almacenan sin conexin.
Nota
Si la estructura de los datos para archivo difiere de los datos de origen en lnea, es probable
que tambin haya gastos adicionales para desarrollar aplicaciones e informes que permitan
tener acceso a los datos archivados.
El formato de almacenamiento es el tipo de medio que se utiliza para almacenar los datos
archivados. La eleccin de este formato viene determinada por los requisitos de
accesibilidad y estructura de los datos para archivo.
En funcin de los requisitos establecidos, se puede almacenar la informacin en cintas o en
medios pticos o magnticos de bajo costo. Tambin es posible almacenarla en una base de
datos independiente en el servidor de produccin o utilizar un servidor dedicado para ello.
Desarrollar una estrategia de movimiento de datos
La estrategia de movimiento de datos describe la forma en la que se pueden trasladar los
datos para archivo desde el servidor de produccin al formato de almacenamiento de
destino. Al desarrollar la estrategia, debe tener en cuenta la frecuencia del movimiento de
los datos y su efecto en el trfico de red.
Si necesita mover los datos a un servidor de archivos de almacenamiento, determine si
precisa utilizar la transferencia de datos directa o indirecta; el modelo de transferencia
necesario depender del tipo de conexin entre el servidor de produccin y el servidor de
archivos de almacenamiento. Por ltimo, debe considerar los riesgos de seguridad que
conlleva el movimiento de los datos y definir las medidas necesarias para protegerlos
durante esta operacin
archivar datos que slo ocupen una pequea cantidad de espacio en disco. Al calcular el
ahorro en el costo de espacio en disco, debe tambin considerar que al archivar los datos se
consiguen archivos de copia de seguridad ms pequeos, lo que reduce an ms el uso del
espacio en disco y otros medios de almacenamiento
Calcular las ventajas en rendimiento
El archivado de datos ayuda a reducir el uso del disco, la memoria y la CPU. Puede utilizar
Monitor de sistema para determinar la mejora del rendimiento que experimentan los
recursos del sistema cuando se utiliza el archivado. Tampoco debe olvidar el impacto que
tiene archivar datos en las tareas de mantenimiento, como volver a indizar o desfragmentar
y realizar copias de seguridad
Determinar el intervalo de archivos
Puede determinar el intervalo de archivado en funcin de las necesidades empresariales y la
naturaleza de los datos. Por ejemplo, si necesita conservar en lnea los datos de los ltimos
13 meses, puede archivarlos a intervalos mensuales. Del mismo modo, si tiene que
mantener en lnea los datos del presente ao hasta la fecha, puede archivarlos a intervalos
anuales
Nota
En la actualidad hay disponibles dispositivos de cintas paralelas que ofrecen
mejoras considerables en los tiempos de acceso, aunque su costo es elevado.
Vida til. La vida til hace referencia a la duracin del formato de almacenamiento.
Por ejemplo, las cintas tienen una vida til ms larga que los discos y los medios
pticos. Numerosos formatos de almacenamiento electrnico, como los DVD, son
relativamente nuevos, por lo que no se puede determinar fcilmente su vida til.
Debe asegurarse de seguir las recomendaciones del proveedor para almacenar los
datos archivados en condiciones ambientales adecuadas.
Sugerencia
Puede crear una tabla comparativa en la que se tengan en cuenta estas consideraciones. Esta
tabla le servir de ayuda para seleccionar el formato de almacenamiento adecuado de los
datos para archivo
Utilice la siguiente tabla para comparar los formatos de almacenamiento en funcin de las
consideraciones que se deben tener en cuenta.
Formato de
almacenamiento
Cinta
Disco
Almacenamiento ptico
Costo Accesibilidad
Vida
til
Confiabilidad y
durabilidad
Seguridad
Utilice las siguientes directrices para desarrollar una estrategia de movimiento de datos para
archivo.
Especificar la frecuencia del movimiento de los datos
Los datos para archivo se pueden mover desde el servidor de produccin al formato de
almacenamiento de destino de forma programada o arbitraria. El movimiento de datos con
una programacin establecida permite crear un proceso que se automatiza y prueba
fcilmente y que, por lo tanto, causa menos errores
Minimizar el impacto del movimiento de los datos
Al elegir la frecuencia de archivado, es preciso considerar el impacto del movimiento de
datos. Es necesario porque determinados tipos de informes de datos podran interferir con el
archivado de datos programado. Por ejemplo, una organizacin genera informes de ventas
por cada producto trimestralmente. Si el administrador de bases de datos archiva los datos
cada trimestre, este movimiento de datos programado no debe afectar a la generacin de
informes.
El movimiento de datos se debe programar cuando la carga de usuarios sea baja. Adems,
se recomienda mover peridicamente conjuntos pequeos de datos en lugar de conjuntos de
gran tamao.
Asegrese de que los datos para archivo se trasladan desde el servidor de produccin al
formato de almacenamiento de destino de forma ptima. Por ejemplo, puede mover primero
los datos a un servidor con un buen rendimiento de disco para que el impacto en el de
produccin sea mnimo. A continuacin, puede copiar los datos en un servidor de archivos
de almacenamiento sin que se vea afectado el servidor de produccin.
Decidir entre transferencia directa e indirecta
Si necesita mover los datos a un servidor de archivos de almacenamiento, debe tener en
cuenta el tipo de conexin entre el servidor de produccin y el de archivos de
almacenamiento.
Si hay una conexin directa, puede utilizar herramientas como SQL Server Integration
Services (SSIS) y la rplica para la transferencia de los datos. Tambin puede emplear
consultas para transferir datos entre los servidores vinculados.
Si la conexin es indirecta, necesita almacenar los datos en un formato intermedio, como
una cinta o un DVD, antes de moverlos al servidor de archivos de almacenamiento. Para la
transferencia indirecta de datos se emplean herramientas como SSIS y la utilidad bcp.
Tambin puede utilizar el comando Backup que proporciona SQL Server.
Garantizar la seguridad de los datos durante el movimiento
Debe asegurarse de que todos los formatos de almacenamiento y las conexiones de red
implicadas en el movimiento de datos sean seguros.
Por ejemplo, suponga que los datos para archivo se trasladan de un servidor de produccin
a una cinta a travs de un servidor intermedio. En este caso, el administrador de datos debe
confirmar que los dos servidores y la ubicacin de almacenamiento de cinta sean seguros y
que las conexiones de red entre ellos estn protegidas. Tambin debe comprobar que las
conexiones de red entre la ubicacin y los dos servidores son seguras, as como las propias
conexiones de red entre los servidores.
Los datos almacenados en un formato porttil, como una cinta, resultan ms vulnerables a
los ataques de seguridad que los almacenados en un servidor de archivos de
almacenamiento de un centro de datos seguro. Para conseguir mayor proteccin, se puede
utilizar la transferencia de datos cifrados y archivos cifrados.
Recomendar los pasos para la comprobacin de los datos
Debe asegurarse de que los datos para archivo se han copiado correctamente en el formato
de almacenamiento de destino antes de eliminar los datos de origen. Por tanto, la estrategia
de movimiento de datos tambin debe incluir pasos para la comprobacin de los datos.
Por ejemplo, si utiliza cintas para almacenar los datos para archivo, es necesario que
recupere los datos para comprobar que se han copiado correctamente. De la misma forma,
puede comprobar los datos copiados en discos o medios pticos simplemente
consultndolos.
Laboratorio
Escenario
Fabricacin
Ventas
Contabilidad
Sucursales
Los servidores de bases de datos de las dos sucursales almacenan slo datos de ventas. Al
final de cada da, los nuevos datos de ventas de las dos sucursales se cargan en el servidor
OLTP. Las sucursales se comunican con las oficinas centrales por medio de dos lneas T1
dedicadas. Adems, las oficinas centrales y las sucursales emplean una conexin de 100
MB para la comunicacin interna.
Configuracin de los servidores
En la siguiente tabla se presentan los datos de configuracin del servidor OLTP en las
oficinas centrales y de los servidores en las sucursales:
Ubicacin
Servidor de
bases de datos
Configuracin
4 CPU
4 GB de RAM
Oficinas
centrales
AWDB01
Estocolmo
Bangalore
STAWDB01
STAWDB02
2 CPU
4 GB de RAM
1 CPU
4 GB de RAM
Problemas de infraestructura
Los problemas siguientes se refieren especficamente al servidor de bases de datos OLTP:
Las unidades de disco estn cargadas y el depsito RAID externo se est quedando
sin espacio.
El uso de la CPU llega a casi el 95% de media durante una jornada laboral normal.
Todos los informes se ejecutan actualmente desde el servidor OLTP, lo que le agrega
ms carga.
En este laboratorio, disear una estrategia para archivar los datos obsoletos almacenados
en el servidor OLTP.
Recursos
Requisitos de archivado
La base de datos almacena 15 aos de datos. Sin embargo, los usuarios slo
necesitan actualizar y consultar los datos de ventas de los ltimos 13 meses.
Los informes sobre los datos archivados deben estar disponibles al siguiente da
laboral una vez se solicitan.
stas son las respuestas del patrocinador del proyecto a las preguntas del
administrador de bases de datos.
Los contables de Adventure Works Cycles necesitan que se almacenen los ltimos
siete aos de datos, tanto en lnea como archivados, para que se puedan realizar
consultas y elaborar informes.
Hay suficiente presupuesto para adquirir un nuevo servidor para almacenar los datos
archivados.
La base de datos almacena 15 aos de datos. Sin embargo, los usuarios slo
necesitan actualizar y consultar los datos de ventas de los ltimos 13 meses.
Los informes sobre los datos archivados deben estar disponibles al siguiente da
laboral una vez se solicitan.
Se deben almacenar los ltimos 7 aos de datos, tanto en lnea como archivados,
para consultas y elaboracin de informes.
Hay suficiente presupuesto para adquirir un nuevo servidor para almacenar los datos
archivados.
Archivados
Sin conexin
Requisito de accesibilidad
Formato de almacenamiento
Movimiento de datos
Frecuencia