You are on page 1of 4

BD1 2006-2007

I2. evolucin de las tcnicas de


procesamiento electrnico de la
informacin

I2.1. sistemas de informacin mecanizados


tradicionales.
Veamos ahora, de una forma muy sucinta, cuales fueron los inicios de los
sistemas de informacin mecanizados. stos han ido evolucionando hasta el
presente al ritmo de las innovaciones tecnolgicas tanto en hardware como
en software. El hecho de disponer de una determinada tecnologa siempre
conlleva ciertas ventajas sobre los sistemas anteriores, y una serie de
limitaciones impuestas por las posibilidades de la tcnica de ese momento.
Todo se traduce en una carrera en la que se solucionan problemas y
carencias para mejorar la calidad, prestaciones, flexibilidad y seguridad de
nuestro sistema de informacin, a la vez que la mayor exigencia y las nuevas
necesidades de los usuarios plantea nuevos problemas no previstos o no
abordables en un momento dado.
Los sistemas de informacin basados en archivo convencional se apoyan
en las distintas organizaciones de fichero: secuenciales, directos
(direccionamiento directo, calculado), indexados, invertidos... Estas
organizaciones llevan aparejados unos mtodos de acceso a los registros
particulares: el acceso secuencial recorre todos los registros hasta encontrar
el buscado; el indexado puede acceder en un solo paso al registro si estamos
buscando por un campo clave. Para el manejo de estos ficheros los sistemas
operativos llevan integradas rutinas que facilitan las operaciones bsicas:
insercin, borrado, modificacin y recuperacin.
Para entender mejor el origen y necesidad de las bases de datos es
interesante analizar las caractersticas del sistema tradicional. La
caracterstica bsica de estos sistemas es que los ficheros se diseaban para
un programa concreto. Esto los hace muy eficientes en principio, pero los
problemas aparecen cuando hay que ampliar o modificar el sistema inicial.
Puesto que la definicin de los datos est dentro de cada programa de
aplicacin, cualquier alteracin de la estructura de los ficheros que manejan
nos obliga a recompilar todos los programas que utilicen esos ficheros, o bien
construir nuevos programas que utilicen nuevos ficheros con informacin
replicada o calculada en base a los antiguos.
La solucin ms rpida y fcil suele ser construir nuevos programas y ficheros
con informacin redundante, ms si se piensa en sistemas grandes donde
cada departamento representa un conjunto de usuarios con una visin parcial
de la Organizacin (la que es necesaria para su propio cometido), y por lo
tanto, con un conocimiento parcial del sistema global.
Por ejemplo, en una Universidad, la seccin de Personal, la secretara del
Centro y el Departamento tienen una visin distinta de los datos almacenados
sobre un empleado docente, algunos comunes a todos (nombre, direccin,
categora, ...), pero otros nicamente tiles para una de ellos. La informacin
sobre cuenta bancaria, estado civil o nmero de hijos es necesaria para
Personal, pero no las asignaturas impartidas por el profesor o su horario. Esta
distinta perspectiva de la organizacin es la que conduce en muchos casos a
desarrollar aplicaciones separadas con ficheros propios.

8
Introduccin a las bases de datos

En definitiva, todos ellos manejan informacin que pertenece a la


organizacin, pero el desarrollo de los tratamientos de esos datos se realiza
independientemente de los otros usuarios, de tal forma que cada aplicacin
es un objeto autnomo.
Puestas as las cosas, es fcil que nos encontremos, en un sistema de
informacin mecanizado basado en archivo convencional, con los siguientes
problemas:
Redundancia de datos.
Dependencia de los programas respecto de los datos.
Insuficientes medidas de seguridad en tres aspectos:
control de accesos simultneos
recuperacin de ficheros
control de autorizaciones

Pasamos ahora a describir cada uno de estos puntos.

I2.2. deficiencias de los sistemas basados en


archivo convencional

Redundancia de datos.
El desarrollo de las aplicaciones no termina nunca. Las necesidades de la
organizacin son cambiantes y evolucionan con el tiempo. Esto quiere decir
que siempre se estn creando nuevas aplicaciones y modificando las
existentes. En un sistema de ficheros tradicional, cada programa lleva su
propia definicin de datos y maneja sus propios ficheros. Adems, suelen ser
varios los programadores que las realizan, bien en el mismo perodo de
tiempo, o porque se van sustituyendo unos a otros.
El resultado fue, habitualmente, que muchos ficheros utilizados por diversos
programas almacenaban la misma informacin. Y no solo eso, sino que la
mayora de las veces no reciban el mismo nombre ni coincidan los tipos de
datos. Por ejemplo, un campo ciudad (cadena de 20 caracteres de longitud)
en un fichero, se llamaba localidad en otro y poda tener una longitud mayor
que la primera.
Evidentemente, es la falta de control sobre los datos que generaba la
empresa lo que llevaba a estas situaciones. Una persona o equipo que se
dedicara a supervisar todas las aplicaciones podra intentar mejorar este
problema. En realidad, estos sistemas no son los adecuados para la tarea por
lo costoso que resultara tal control (y as aparecern las tcnicas bases de
datos).
Aunque cada aplicacin gestiona informacin propia, siempre hay datos
comunes a varias aplicaciones. Al estar estos datos almacenados en ficheros
independientes se produce redundancia dentro del sistema de informacin, lo
que genera situaciones indeseables:
inconsistencia: al tener almacenada la misma informacin en
varios sitios, es difcil mantenerlos en el mismo estado de
actualizacin (que en todo lugar tenga el mismo valor), pudiendo
producir informacin incorrecta.
laboriosos programas de actualizacin: no es lo mismo modificar
el valor de un dato una sla vez que tantas veces como se halle
duplicado.

9
BD1 2006-2007

mayor ocupacin de memoria.

Dependencia de los programas respecto de los datos.


En los sistemas clsicos la descripcin de los ficheros usados por un
programa, con informacin sobre formato de los registros, organizacin y
modo de acceso, localizacin del fichero, etc., forma parte del cdigo del
programa.
Esto significa que cualquier cambio realizado en alguno de estos tres
aspectos obliga a reescribir y recompilar todos los programas que utilicen el
fichero modificado. Pinsese, por ejemplo, si se cambiara la organizacin de
un fichero de secuencial a indexado, o que se aadiera un campo a un
registro para una aplicacin nueva, hecho ste que, en teora, no tendra que
afectar a las antiguas.
Podemos decir que los programas son completamente dependientes de los
datos, lo que provoca:
poca flexibilidad del sistema de informacin frente a futuras
variaciones en los requerimientos de informacin.
alto coste de mantenimiento del software.

Insuficientes medidas de seguridad:


control de accesos simultneos
El acceso simultneo de dos o ms programas a unos mismos datos
puede conducir a errores en la informacin almacenada.
Supongamos dos procesos que deben acceder al mismo dato, que en
ese instante vale 100, y lo hacen concurrentemente, de tal forma que el
primero suma al valor ledo 200 y el segundo 500, por lo que finalmente
deberamos obtener un valor de 800 y almacenarlo.
Supongamos que el primer proceso llega antes que el segundo. Las
respectivas transacciones comprenden una operacin de lectura del
dato almacenado y la posterior escritura del dato incrementado (la
transaccin est formada por dos operaciones atmicas).
Cuando el primero ha terminado de leer (y obtiene el valor 100) y antes
de actualizar el dato (sumndole 100), el segundo proceso tambin
efecta una operacin de lectura recuperando el mismo valor. Debido a
la secuencia de operaciones en el tiempo, la actualizacin del proceso
1 se pierde puesto que, inmediatamente despus, el proceso 2 modifica
el mismo dato pero con una suma errnea. Es como si el proceso 1
nunca se hubiera ejecutado.
t
proceso 1
leer escribir
(100) (100+200)

proceso 2
leer escribir
(100) (100+500)

recuperacin de ficheros
En el caso de procesos de actualizacin incompletos o errneos hace
falta devolver los ficheros a un estado anterior correcto a partir del cual
se puedan repetir, ahora correctamente, los procesos de actualizacin

10
Introduccin a las bases de datos

rechazados. Tradicionalmente se recurre a copias de seguridad de los


ficheros afectados.

Control de autorizaciones
No todos los usuarios deben poder acceder a los mismos datos, por
motivos de privacidad de la informacin, ni pueden acceder de la
misma forma, por permisos a la hora de realizar recuperaciones,
actualizaciones, etc. En los sistemas clsicos, al tener aplicaciones
independientes, el volumen de informacin y el nmero de usuarios de
cada una era reducido, pudiendo aplicarse estas medidas de seguridad
a nivel humano.
A medida que fueron creciendo los sistemas se vio la necesidad de que
el software dispusiese de mecanismos de seguridad adecuados a estos
niveles.

En resumen, las caractersticas de los sistemas basados en archivo


convencional adolecen de los siguientes problemas al incrementarse las
exigencias y el volumen de datos:
Pobre control de los datos: los datos pueden estar replicados
innecesariamente, llamarse de distinta forma y tener distintas
definiciones en diferentes ficheros.
Capacidades de manipulacin de los datos inadecuadas: las
organizaciones de ficheros no son adecuadas para cierto tipo de
operaciones que impliquen acceder a los datos para obtener
informacin elaborada (o simplemente, en el mejor de los casos,
que el criterio de bsqueda no est indexado).
Excesivo esfuerzo de programacin: en entornos de este tipo, la
programacin de nuevas aplicaciones obligaba a construir de
nuevo las definiciones de fichero y rutinas de acceso en la
mayora de los casos.

Podemos decir que esta situacin es la que obliga a replantear la forma de


gestionar grandes volmenes de datos, buscando principalmente la
independencia de las aplicaciones respecto de la representacin fsica de los
datos almacenados. Nacen entonces las tcnicas de bases de datos, que
se abordan en el siguiente tema.

11

You might also like