Professional Documents
Culture Documents
Este esfuerzo se hizo posible con el concurso de los autores del libro: Genaro Mosquera,
José de Jesús Rivero, Jesús Salomón, Conrado Valhuerdi, Antonio Torres y Manuel
Perdomo. Alrededor de ellos, un entusiasta grupo de colaboradores en las respectivas
instituciones permitió darle forma a tan particular tema de investigación; en Venezuela,
vale la pena destacar a los ingenieros Luis A. Martínez y Carlos Alezones quienes desde
la Gerencia de Sistemas y la Escuela de Ingeniería de la Universidad, permitieron
concretar este proyecto de publicación en beneficio de tantos usuarios de nuestras
universidades y de la comunidad profesional y científica internacional.
Los autores de esta obra desean manifestar público reconocimiento al Ing. José Guillermo
Nápoles (g), a quien se debe el inicio de los estudios de APS en América Latina y el
desarrollo del sistema computarizado ARCON.
Marzo de 1995.
I. Gerencia de los sistemas de mantenimiento.
1.1. Consideraciones generales.
"La probabilidad que un sistema opere a toda capacidad durante un período de tiempo
determinado"
1.2. Costos asociados.
Por otro lado, la caída de un sistema por fallas del mismo o de sus componentes,
inducirá un costo de penalización como consecuencia de la pérdida del valor de la
producción no colocada en los mercados o comprometida; así se desprende que este
costo está exponencialmente asociado al tiempo fuera de servicio y que sumarizado con
el costo de mantener determina que el costo directo de mantener se incremente. El
costo total, función a su vez del esfuerzo de mantener, tendrá un entorno óptimo, que
habrá que determinar técnicamente con la ayuda del análisis de los parámetros de
mantenimiento los cuales contribuyen a mantener la efectividad del sistema preparado
para su operación en un período de tiempo determinado.
"la probabilidad que un sistema, subsistema o equipo este disponible para su uso
durante un tiempo dado".
"la probabilidad que un equipo no falle mientras esté en servicio durante un período de
tiempo dado".
"la probabilidad que un sistema, subsistema o equipo que ha fallado pueda ser
reparado dentro de un período de tiempo determinado".
Falla: Suceso después del cual el sistema tecnológico deja de cumplir (total o
parcialmente) sus funciones. La falla es la alteración de la capacidad de trabajo
del componente o sistema.
Las fallas pueden ser clasificadas de acuerdo con una serie de índices, que se
recogen de manera general en la tabla 2.1.1.
Las fallas estables son aquellas que se eliminan sólo con la reparación o la
regulación, o bien sustituyendo al elemento que falló. Las fallas temporales
pueden desaparecer espontáneamente sin la intervención del personal de servicio
debido a la desaparición de los motivos que la provocaron. Las causas de tales fallas
frecuentemente son los regímenes y condiciones de trabajo anormales. Las fallas
temporales que se repiten muchas veces se denominan intermitentes o alternantes.
Ellas atestiguan la existencia de anormalidades en la calidad del equipamiento o en
regímenes y condiciones de trabajo.
Las fallas primarias son intrínsecas del elemento y responden a sus características
internas. Las fallas secundarias son debidas a condiciones ambientales o tensiones
operativas excesivas impuestas a un elemento desde el exterior. Las fallas comando son
las originadas por la operación indebida o la no operación de un elemento iniciador
(elemento que controla o limita el flujo de energía que llega al elemento considerado).
Dentro de las fallas secundarias y comando se pueden definir las fallas modo o causa
común que son aquellas en que fallan varios elementos, producto de una misma causa.
dN/dt
f(t) = -- [2.1.2]
N0
N(t)
Ps(t) = [2.1.3]
N0
N0 - N(t)
Pf(t) = - [2.1.4]
N0
Por tanto, la densidad de fallas puede expresarse en función de Ps(t) o Pf(t), de la forma
siguiente:
dPf(t) dPs(t)
f(t) = = - [2.1.5]
dt dt
dN/dt N(t)
f(t) = - •
N(t) N0
resulta que
f(t)
R(t) = “ [2.1.7]
Ps(t)
- Tiempo medio de operación o servicio (tiempo medio de trabajo sin fallas): número
medio de horas de trabajo de un componente hasta la primera falla. Lo denotaremos
como TMS (tiempo medio de servicio). Este se puede hallar aproximadamente como:
N
Σ ti
i=1
TMS = [2.1.9]
N
K
Σ ti
i=1
TPPR = [2.1.10]
K
Donde:
1
=
µ
TPPR
t
Ps ( t ) = Exp ( − ∫ R ( τ ) d τ ) [2.1.11]
0
t
Pf(t) = ∫ f (τ)dτ [2.1.14]
0
t [2.1.15]
Ps(t ) = 1 − ∫ f (τ)dτ
0
De [2.1.7] se obtiene:
f(t) = R(t).Ps(t)
y sustituyendo Ps(t) por [2.1.11] arribamos a:
t
f (t ) = R (t ).Exp(− ∫ R(τ )dτ ) [2.1.16]
0
∞
TMS = − ∫ Ps (t )dt
0
∞
TMS = ∫ Exp(− Rt )dt
0
∞
TMS = ∫ tdPs (t ) [2.1.17]
0
La curva de R(t) en función del tiempo para un elemento dado sigue en la mayoría de
los casos un comportamiento típico como el mostrado en la figura 2.1.1, que por su
forma característica recibe el nombre de "curva de la bañera". Esta curva puede
dividirse en tres partes. La primera parte es el período inicial de trabajo del elemento
donde pueden producirse fallas tempranas debido a deficiencias en el control de la
calidad. Los fabricantes acostumbran someter a prueba los elementos durante este
período para corregir tales fallas tempranas. La segunda parte se caracteriza por una
rata de fallas aproximadamente constante. En esta parte de la curva podemos
considerar las fallas como aleatorias e independientes del tiempo. Este es el período de
vida útil del elemento, al cual podemos asociar una distribución de probabilidad de falla
de tipo exponencial como la expresada por [2.1.13] La tercera parte de la curva, en la
que se produce un aumento sostenido de R(t) corresponde a la salida de servicio
acelerada de los elementos debido al desgaste y el envejecimiento.
N
M = Σ x P(x) [2.2.1]
x=0
mientras la varianza, que mide la desviación de los valores alrededor de la media, es:
N
V(x) = Σ (x-M)2 P(x) [2.2.2]
x=0
- Distribución Binominal.
En el más simple de los sistemas hay sólo dos salidas, o el sistema funciona a la
demanda o falla. Estas dos probabilidades son complementarias por lo que:
[P(D)+P(D)]N = 1 [2.2.4]
Sea q = P(D) la probabilidad de falla e introduzcamos la variable aleatoria discreta x,
definida como el número de demandas para las que el sistema falla. Esta variable
sigue la distribución binomial, con parámetro q e índice N. La probabilidad de que
ocurran x fallas, es obtenida seleccionando al término apropiado del desarrollo binomial
de la ecuación [2.2.4] y tiene la forma:
N!
P(x) = qx(1-q)N-x [2.2.5]
x! (N-x)!
M = Nq [2.2.6]
Z
P(x ≤ Z)= Σ P(x) [2.2.8]
x=0
Así la probabilidad de que el sistema falle para Z+1 o más demandas sería, el
complemento de P(x>=Z),
Z
P(x > Z)= 1 - Σ P(x) [2.2.9]
x=0
Una segunda aplicación de esta distribución para análisis de fallas se refiere al caso
de N componentes idénticos, con una probabilidad de falla q igual para todos. Entonces
P(x) describe la probabilidad de que fallen x de los N componentes del sistema.
- Distribución de Poisson.
EXP(-M).EXP(M) = 1 [2.2.10]
EXP(-M).Mx
P(x) = x = 0,1,2,3,... [2.2.11]
x!
Z EXP(-M).Mx
P(x ≤ Z)= Σ [2.2.12]
x=0 x!
Para análisis de fallas los valores de la variable aleatoria tiempo hasta la falla se
encuentran en el intervalo [0,ì“]. En este caso el valor medio de una distribución está
dado por:
∞
M = ∫ tf (t )dt
0 [2.2.13]
y la varianza
∞
V = ∫ (t − M ) 2 f (t)dt [2.2.14]
0
- Las distribuciones de Erlang y Exponencial.
R.(Rt)x-1.EXP(-Rt)
f(t)= R>0 , x>0 [2.2.15]
(x-1)!
1 1
M = , V(t) = [2.2.18]
R R2
1 ln2 (t/β)
f(t)= EXP(-) [2.2.19]
½
(2π) αt 2 α2
1
Pf(t) = [ 1 – erf (z) ] para t<β
2
1
= [ 1 + erf(z) ] para t>β [2.2.20]
2
ln(t / β ) [2.2.21]
Z=
2α
M = β EXP( α2/2 )
La distribución logaritmo normal se aplica con frecuencia para describir las fallas en los
análisis de confiabilidad y riesgo de sucesos raros (de baja probabilidad), en los que la
información estadística limitada hace que las ratas de falla varíen por factores. Por
ejemplo una rata de fallas estimada en 10-6/h puede variar de 10-5 a 10-7/h si el factor
de error es 10. Cuando la rata de fallas se expresa como 10-x, donde x es un cierto
exponente, el uso de la distribución logaritmo normal implica que el exponente satisface
una distribución normal. Así, se puede ver la distribución logaritmo normal como
apropiada para situaciones en las que hay incertidumbres grandes en los parámetros
de fallas.
k −1
K t t [2.2.23]
f (t ) = Exp −
v v v
k −1
K t
R(t ) = [2.2.27]
v v
Así pues, el modelo de Weibull es el apropiado para el ajuste de datos en los que la
probabilidad condicional de fallas R(t) satisface una ley de potencia del tiempo. Ratas
de fallas de este tipo se ilustran en la figura 2.2.3.
Fig. 2.2.2. Densidad de probabilidad de fallas según la distribución de Weibull.
K t
f(t) = . t EXP [ - ()K ]
K-1
para t>0,K>0,v>0
vK v
Como "Log L" presenta un máximo al mismo valor de "A", la ecuación a resolver es:
dLog L
= 0
dA
L(x1,x2,x3,...xn) = f(x1,A).f(x2,A).f(x3,A)...f(xn,A)
Si los valores de la muestra han sido dados y la función de "L" es de una variable "A",
la función de verosimilitud para la muestra completa utilizando la función de Weibull es:
N K ti
L(t1,t2,...tn) = Π . ti. EXP [- () K]
K-1
[2.2.28]
I=1 v K v
Eliminando V y simplificando:
1 n 1 n n
K
Σ ln ti = - + Σ ti ln ti / Σ ti
n i=1 K i=1 i=1
nti K
v = [Σ ] 1/K [2.2.29]
i=1
n
Por iteraciones sucesivas, al efecto, una estimación de "K" se puede obtener mediante el
método de Newton-Raphson cuya técnica numérica permite encontrar la raíz de una
función F(x), y eliminar el error asegurando el valor de "K". Bajo estas condiciones si
Ki es la aproximación de una raíz, una nueva estimación está dada por:
F(Ki)
Ki+1 = Ki - F(Ki) ≠ 0 [2.2.30]
F'(Ki)
1 1
F(k) = Σ (ti) .lnti - Σ ti - Σ lnti.ti K
K K
k n
1 1
F'(x) = Σ (ti) .(lnti) - Σ lnti.ti + Σ ti K -...
K 2 K
K K2
1
- Σ ln ti Σ lnti.ti K [2.2.31]
n
donde:
El modelo PARAMAN determina la rata de fallas, el factor "k" que establece el ciclo de
vida del equipo, la edad característica de corrida, y evalúa las probabilidades de
supervivencia y de falla. Estos elementos entran en el cálculo de los tiempos medios
entre paradas y su respectiva varianza.
En (7) podrá encontrar una información más detallada sobre el sistema PARAMAN.
Para ello juega un papel importante el llamado Teorema de Bayes de la Teoría de las
Probabilidades.
- Teorema de Bayes.
P(Ai) P(B/Ai)
P(Ai/B) = [2.3.1]
P(B)
Ejemplo 2.3.1: Supongamos que queremos estimar la rata de fallas de una bomba de
baja presión empleada en un sistema de enfriamiento. De la literatura internacional
conocemos que las ratas de fallas para bombas similares en otras industrias oscilan en
los órdenes 10-3, 10-4, 10-5 [1/h] . De la experiencia de explotación de la tecnología
propia se tiene que para una muestra dada de bombas del tipo analizado no se han
producido fallas durante 500 horas de trabajo en regímenes de prueba.
El suceso B será el que nos aporta la experiencia propia: 500 horas de trabajo sin falla.
Si la rata de fallas fuese 10-3/h, la probabilidad de B (500 horas de trabajo sin fallas) sería:
Cálculos similares permiten obtener los valores restantes de P(B/Ai) que se presentan
en la tabla 2.3.1. Estos valores contienen el dato de la experiencia propia que
combinado con las probabilidades P(Ai) asumidas de otras fuentes conducen a las
probabilidades condicionales P(Ai/B).
Si para las probabilidades P(Ai) se asume una distribución uniforme tal que P(Ai)=1/3,
aplicando [2.3.2] podemos hallar las probabilidades de que la rata da fallas de la bomba
de nuestra industria sea 10-3, 10-4 o 10-5 dada la evidencia B de que no se producen
fallas en 500h de trabajo. Estas son las probabilidades condicionales P(Ai/B) de la
tabla 2.3.1 para la distribución previa uniforme.
I 1 2 3
Distribución previa
uniforme
Distribución previa
no uniforme
Los resultados de la tabla 2.3.1 nos permiten concluir que para la bomba del ejemplo
2.3.1 debe adoptarse una rata de fallas entre 10-4 y 10-5, más próxima a 10-5, como
podría ser 3.10-5.
Una mayor certeza inicial podría obtenerse con un mejor conocimiento de las
características y condiciones de trabajo de las bombas cuyas ratas de falla se tabulan
en la literatura, lo que permitiría asociar mayores valores de probabilidad P(A) a las ratas
de aquellas cuyas características y condiciones de trabajo se asemejen más a la propia.
Las ratas de fallas utilizadas para modelar los componentes deben estar diferenciadas
de acuerdo con su régimen de trabajo. Así existen ratas de falla a la espera y ratas
de fallas en operación.
- Componentes a la espera.
Los componentes tipo 1 se emplean para modelar aquellos modos de falla, cuya
probabilidad es uniforme en el tiempo, así como en aquellos casos en que no se
cuenta con información suficiente para determinar una ley de variación de la
indisponibilidad en el tiempo de acuerdo a otro modelo.
Un modo de falla al cual se aplica este modelo es al error humano, por ejemplo, el
suceso de una válvula manual dejada en posición incorrecta después de un
mantenimiento. En este caso un valor típico es q=2.10-2, lo que representa que en 100
demandas al componente, éste se encontrará como promedio 2 veces en posición
incorrecta (indisponible), por el error humano.
_ 1
q = 1 - {EXP[-RTpr] - EXP[-R(Tpr+T)]} + qad [2.4.4]
RT
R
q(t) = { 1 - EXP[-( R + µ ) t ] } + qad [2.4.6]
R+µ
_ R
q = + qad [2.4.7]
R+µ
Este es el caso de los componentes cuyo estado se comprueba cada cierto tiempo Tp
mediante una prueba o ensayo de duración τ que permite detectar las fallas del
componente. En los casos en que el componente se encuentra fallado se procede a su
reparación.
La prueba puede tener una cierta ineficiencia, de modo que de la rata de fallas total sólo
se detecta una fracción que llamaremos ineficiencia de la prueba y denotaremos por Inef.
Así, la rata de fallas se desdobla en dos componentes, la rata de fallas detectables
Rdet y la rata de fallas no detectables Rno, cuyas expresiones son:
τ
qp = pnt [2.4.10]
Tp
Tr
qr = Rdet(Tp- τ) [ .( 1 - phe) + phe ] [2.4.11]
Tp- τ
donde
Tr es el tiempo medio de reparación del componente(=1/µ); phe es la probabilidad
de error humano total, que incluye tanto la probabilidad de no detectar la falla por error
en la prueba phep como la probabilidad de que el componente quede indisponible
por un error en la reparación pher.
qr = Rdet.Tr [2.4.13]
1 Tp − τ
Tp − τ ∫0
q OC = R det tdt
1
qoc = Rdet (Tp- τ) [2.4.14]
2
_ τ
q = pnt + Rdet [ Tr + phe .(Tp - τ - Tr) ] +...
Tp
1
+ Rdet(Tp - τ) [2.4.15]
2
_ τ 1
q = pnt + Rdet[Tr + phe .(Tp - τ - Tr)] + Rdet(Tp- τ) +...
Tp 2
1
+ 1 - { 1 - EXP[- Rno T] } + qad [2.4.16]
RnoT
En [2.4.16] se incluyó como último término la probabilidad de falla adicional a la
demanda por carga de impacto.
El sistema ARCON tiene además la posibilidad de ajustar las ratas de fallas de la fórmula
[2.4.16] para tomar en cuenta los casos en que la prueba degrada al componente e
incrementa su rata de fallas. Este es el caso típico de los generadores diesel que se
emplean en la industria para asegurar el suministro eléctrico en condiciones de avería.
Con este fin el sistema emplea un dato adicional para los componentes tipo 4, el factor
de degradación de la prueba, expresado como el % de incremento de la rata de fallas
en cada prueba. Estas expresiones tienen cierta complejidad y no se han incluido
en el presente material.
_ τm
q = [2.4.17]
Tm
Rop
Pop = [2.4.19]
Rop+ µ
Con este fin, se requiere la construcción de un modelo que contemple tanto las fallas
de equipo como las debidas a errores humanos, así como la influencia de los
procedimientos de operación, prueba y mantenimiento del sistema.
El árbol de fallas es un modelo lógico deductivo, que parte del suceso tope para el cual
se produce la falla del sistema. De una forma sistemática se va desarrollando el suceso
tope en los sucesos intermedios que conducen a éste, y a su vez los sucesos
intermedios en otros de menor jerarquía, hasta llegar a los sucesos primarios,
determinados por el nivel de resolución del análisis posible o deseable. Este se
establece atendiendo a los datos de fallas de que se dispone y/o al alcance que se
pretende lograr de acuerdo con los objetivos del estudio.
Compuerta OR: El estado fallado de cualquiera de los sucesos que entran a ella
produce el estado fallado a la salida.
Los sucesos primarios son puntos terminales del árbol que no se continúan
desarrollando. De ellos los sucesos básicos corresponden generalmente a modos
de falla propios de componentes (por ejemplo falla de una válvula a la apertura o al
cierre), mientras que el suceso desarrollado es un suceso complejo que no se desdobla
en sucesos básicos de menor jerarquía, por no contarse con la información
necesaria o porque resulta conveniente desarrollarlo aparte como un árbol
independiente. Este último es el caso de los sistemas de apoyo (por ejemplo la falla de la
alimentación eléctrica), que se acostumbra a modelar en árboles de fallas
independientes para después acoplarlos (integrarlos) a los árboles de los diversos
sistemas a los cuales este sistema de apoyo presta servicio.
Los símbolos de transferencia permiten conectar un subárbol en varios puntos del árbol
principal sin necesidad de repetir varias veces la misma información, así como establecer
cortes y divisiones del árbol cuando por sus dimensiones no puede representarse
completamente en una hoja de papel. Este es el caso del árbol de fallas que aparece
posteriormente en la figura
3.1.4.
La técnica de árboles de fallas permite modelar los sistemas con un alto grado de
flexibilidad, pero deben tenerse en cuenta las siguientes premisas fundamentales:
2. Los sucesos básicos tienen que ser estadísticamente independientes, lo cual es una
exigencia del método que se emplea para calcular la probabilidad de falla del sistema
a partir de los resultados de la evaluación cualitativa del árbol de fallas. La existencia
de modos de falla dependientes se toma en cuenta cuando un mismo suceso
intermedio o primario aparece repetido en el árbol de fallas, como contribuyente a
varios sucesos intermedios.
Al desarrollar el árbol desde el suceso tope hasta llegar a los sucesos primarios, es
necesario identificar en cada paso todas las contribuciones o caminos que pueden
conducir al suceso intermedio. De modo general, para la falla de cada componente
existen al menos 5 posibilidades:
2. El equipo no recibe servicio de algún sistema de apoyo, necesario para su trabajo. (Ej.
: alimentación eléctrica, enfriamiento, lubricación, etc.).
Existe un grupo de reglas básicas que se recomiendan para asegurar el desarrollo del
árbol de fallas con la calidad requerida, lo que constituye un aspecto importante para su
posterior revisión y fácil comprensión por parte de otros especialistas.
2. Todas las entradas de una compuerta deben estar completamente definidas antes de
pasar a modelar otras compuertas.
En la figura 3.1.2 (a) se muestra el árbol de fallas del disparo de un circuito interruptor. La
falla se produce por tres causas, cualquiera de las cuales, de modo independiente, puede
dar lugar al suceso tope. Por esta razón se emplea una compuerta OR. Los sucesos
primarios que entran a la compuerta OR son el desperfecto en el propio interruptor, la
ausencia de la señal de disparo y, eventualmente, el daño por incendio, un suceso
externo que provoca condiciones ambientales severas y conduce a la rotura del
elemento. Este es un modo de falla del tipo causa común, pues se trata de un suceso
único que suele afectar a varios componentes (todos fallan por una causa común).
(a)
(b)
En la figura 3.1.2 (b) continua el árbol a partir del suceso B, que en la figura 3.1.2 (a)
aparecía como un suceso desarrollado. Para esto se toma en cuenta que la señal de
disparo se produce por la apertura de uno de dos "relays" conectados en serie. Bajo estas
condiciones, la falla de la señal de disparo tiene lugar cuando ambos "relays" B1 y B2
fallan cerrados, puesto que con sólo uno que abra sus contactos, el circuito de control
queda desenergizado y se produce la señal. Por ello al reemplazar el suceso B por B1 y
B2 se ha empleado una compuerta AND.
Ejemplo 3.1.1: La figura 3.1.3 muestra un sistema con un tanque a presión al cual se
inyecta un gas desde un depósito mediante un compresor accionado por un motor
eléctrico. En cada ciclo el operador echa a andar un "timer" T y el tanque se llena durante
un cierto tiempo hasta que abren los contactos del "timer", mucho antes de que se cree
una condición de sobrepresión. Después de cada ciclo el gas comprimido se descarga
abriendo la válvula Vd destinada a este fin. Cuando el tanque queda vacío se cierra
nuevamente Vd y todo está listo para dar inicio a un nuevo ciclo.
(a)
(b)
(c)
(d)
Fig. 3.1.4. Arbol de fallas del sistema del ejemplo 3.1.1. (continuación).
(e)
(f)
Fig. 3.1.4. Arbol de fallas del sistema del ejemplo 3.1.1. (continuación).
En la figura 3.1.4 se muestra el árbol de fallas del suceso no deseado rotura del tanque
en condiciones de carga normal o por sobrepresión. La rotura del tanque en condiciones
de carga normal se representa mediante un suceso primario, pues con la información
disponible no es posible desarrollarlo más. En cambio, la rotura por sobrepresión puede
tener lugar al combinarse la falla de la protección por sobrepresión del tanque (válvula de
alivio Va) con el suceso intermedio trabajo del compresor durante un tiempo excesivo. La
necesidad de ocurrencia simultánea de ambos determina el empleo de una compuerta
AND.
Se produce cuando el manómetro M se traba o indica por debajo del valor real de presión
(el operador no se percata del peligro y no actúa), o bien no se logra abrir el interruptor I2
por falla del equipo, o bien la acción del operador no se produce o resulta tardía. La falla
del interruptor puede ser por un problema intrínseco o provocada por una sobrecorriente
SC en el circuito que dejen "pegados" los contactos. Este último suceso es una falla
causa común que deja "pegados" los contactos del "relay" R y además inhabilita la acción
mitigadora de apertura del interruptor I2. Por esta razón, la falla por sobrecorriente
aparece como un suceso primario repetido que contribuye a la ocurrencia de dos sucesos
intermedios diferentes del árbol.
El árbol de fallas tiene, según hemos visto hasta este punto, un carácter totalmente
cualitativo. Sin embargo, aún antes de realizar evaluación numérica alguna, ya el propio
árbol hace una contribución significativa a nuestro conocimiento del sistema o de la
industria. Buscando los posibles modos de falla, logramos dominar con profundidad sus
características técnicas de diseño, de funcionamiento y los procedimientos de operación,
pruebas y mantenimiento. El método nos va conduciendo a los puntos débiles, a las
diversas formas en que puede fallar.
La resolución del árbol de fallas consta de dos etapas principales, la evaluación cualitativa
consistente en la determinación de todas las combinaciones de sucesos primarios que
hacen fallar el sistema y la evaluación cuantitativa, paso en el cual se determina la
probabilidad de falla del sistema a partir de las probabilidades de todos los caminos
posibles que conducen al suceso tope no deseado.
Así pues, la evaluación cualitativa tiene como objetivo central la determinación de todos
los llamados conjuntos mínimos de corte del árbol de fallas. Un conjunto mínimo de corte
o simplemente conjunto mínimo (CM) es un conjunto de sucesos primarios que no puede
ser reducido en número y cuya ocurrencia determina que se produzca el suceso tope. En
el ejemplo de la figura 3.1.2 (b), las fallas {A} y {C} son CM de orden 1, pues con sólo
ocurrir la falla intrínseca del interruptor o el daño por incendio ya tiene lugar el suceso
tope no deseado. El otro CM de este ejemplo sería {B1, B2}, en este caso de orden 2
pues se necesita que ambos "relays" fallen cerrados para que se produzca el suceso
tope. {B1} no sería un CM, pues con esta falla única no se produce el suceso tope. En
cambio {A, C} aunque da lugar al suceso tope no es CM, pues puede ser reducido en
número, es decir, sólo es necesaria la falla de A o de C para que se produzca el suceso
tope, no se requiere que fallen ambos.
El árbol de fallas es una estructura lógica integrada por sucesos primarios binarios. Esto
hace que para su evaluación cualitativa se requiera el empleo de las reglas del álgebra de
Boole, que exponemos brevemente a continuación, sobre la base de los sucesos de falla
genéricos X, Y, Z.
El método consiste en la sustitución paulatina de las compuertas por sus entradas, desde
la compuerta tope hasta llegar a los sucesos primarios, dando prioridad a las compuertas
AND y n/m ("majority") con respecto a las compuertas OR, lo que contribuye a evitar una
expansión excesiva del número de combinaciones de sucesos. En varias partes del
proceso se realiza lo que se conoce como reducción booleana, es decir, la eliminación de
combinaciones booleanas de fallas que no resultan mínimas. Esto asegura que al final del
proceso se obtengan de forma explícita todos los conjuntos mínimos de corte, que
constituyen los modos de falla del sistema.
Si C1 representa el suceso tope, este puede representarse a partir de sus entradas como:
C1=Tpn+C2 [3.2.1]
donde Tpn es el suceso primario rotura del tanque a presión normal y C2 es el suceso
intermedio rotura del tanque por sobrepresión.
C1=Tpn+Va.C3 [3.2.2]
Nótese como en la expresión [3.2.1] la sustitución se hace como una unión(+) de los
sucesos de falla Tpn y C2, interconectados en el árbol mediante una compuerta OR. En
cambio, al sustituir la compuerta C2 en la expresión [3.2.1] para obtener la [3.2.2], Va y
C3 se sustituyen como una intersección de sucesos de falla, en correspondencia con la
compuerta AND de la cual ambos son entradas en el árbol de fallas.
C1=Tpn+Va.C4.C5 [3.2.3]
C1=Tpn+Va.C4.(R+SC+C6) [3.2.4]
C1=Tpn+Va.C4.(R+SC+T.C7) [3.2.5]
C1=Tpn+Va.(M+E+I2+SC).{R+SC+T.(M+E+I1)} [3.2.6]
Aplicando la ley distributiva de forma sucesiva, tendremos que:
C1=Tpn+Va.(M+E+I2+SC).(R+SC+T.M+T.E+T.I1) [3.2.7]
C1=Tpn+Va.(M.R+M.SC+M.T.M+M.T.E+M.T.I1+E.R+E.SC+E.T.M+E.T.E+
+E.T.I1+I2.R+I2.SC+I2.T.M+I2.T.E+I2.T.I1+SC.R+SC.SC+
+SC.T.M+SC.T.E+SC.T.I1)
[3.2.8]
C1=Tpn+Va.(M.R+M.SC+M.T+M.T.E+M.T.I1+E.R+E.SC+E.T.M+E.T+E.T.I1+
+I2.R+I2.SC+I2.T.M+I2.T.E+I2.T.I1+SC.R+SC+SC.T.M+
+SC.T.E+SC.T.I1)
[3.2.9]
M.SC+E.SC+I2.SC+SC.R+SC+SC.T.M+SC.T.E+SC.T.I1=SC [3.2.10]
M.T+M.T.E+M.T.I1+I2.T.M=M.T [3.2.11]
E.T.M+E.T+E.T.I1+I2.T.E=E.T [3.2.12]
C1=Tpn+Va.(M.R+M.T+E.R+E.T+I2.R+I2.T.I1+SC) [3.2.13]
De orden 1: 1 Tpn
De orden 2: 1 Va.SC
De orden 3: 5 Va.M.R
Va.M.T
Va.E.R
Va.E.T
Va.I2.R
De orden 4: 1 Va.I2.T.I1
Total :8
Para árboles de cierta complejidad, con cientos o miles de compuertas y sucesos básicos,
la determinación de los CM sólo es posible mediante un software potente y una
computadora rápida con suficiente memoria operativa y en disco. La inmensa mayoría de
los programas de APS de uso actual están soportados en computadoras "Mainframe" y
una buena parte de los que trabajan en computadoras personales (PC) confronta serias
limitaciones de memoria y velocidad. No obstante, el creciente desarrollo de los PC ha
propiciado el surgimiento de algunos sistemas capaces de manejar árboles de fallas
complejos en PC, como es el caso de ARCON (ver Anexo B).
3.3. Evaluación cuantitativa de las fallas.
Sean CM1 y CM2 dos CM del árbol de fallas. La probabilidad de que ocurra el modo de
falla CM1 o el modo de falla CM2, es decir, la probabilidad de falla del sistema por una de
estas dos vías será:
P(CM1+CM2)=P(CM1)+P(CM2)-P(CM1.CM2) [3.3.1]
P(CM1+CM2+CM3)=P(CM1)+P(CM2)+P(CM3)-P(CM1.CM2)-P(CM2.CM3)-
-P(CM1.CM3)+P(CM1.CM2.CM3)
[3.3.2]
N N N N
P( Σ CMi)= Σ P(CMi) - Σ Σ P(CMi) P(CMj) +
i=1 i=1 i=1 j=i+1
N N N
Σ Σ Σ P(CMi) P(CMj) P(CMk) - ...
i=1 j=i+1 k=j+1
N
N+1
+(-1) Π P(CMi) [3.3.3]
i=1
Para industrias de elevada confiabilidad y bajos niveles de riesgo, la expresión [3.3.3]
puede simplificarse notablemente tomando en cuenta que la probabilidad de un CM es un
valor mucho menor que 1, lo que se conoce como aproximación de sucesos raros. Bajo
estas condiciones, en la expresión [3.3.3] los términos de segundo orden y superiores
pueden ser despreciados frente al primer sumando que hará la contribución fundamental,
con lo que se obtiene la expresión:
N N
P( Σ CMi)= Σ P(CMi) [3.3.4]
i=1 i=1
Esto equivale a suponer que los CM son mutuamente excluyentes, es decir, que se
considera sumamente improbable la ocurrencia simultánea de varios CM (la ocurrencia
de un CM excluye la posibilidad de ocurrencia de cualquiera de los otros).
Si comparamos las fórmulas [3.3.3] y [3.3.4] es fácil comprobar que el valor dado por
[3.3.4] sobrestima el valor real, por cuanto los términos que se desprecian van siendo
menores en la medida que aumenta su orden y los signos alternos comienzan
precisamente con una resta. De esta forma, la contribución que se elimina al pasar de
[3.3.3] a [3.3.4] tiene signo negativo y conduce a una sobreestimación de la probabilidad
de falla en [3.3.4]. Esta es una ventaja de la expresión, pues al aplicarla sabemos que
estamos siendo conservadores. Sin embargo, para aquellos casos en que las
probabilidades de falla son elevadas y deja de cumplirse la aproximación de sucesos
raros la sobreestimación puede ser considerable hasta el punto de obtenerse
probabilidades de falla del sistema mayores que 1.
Veamos a continuación otra expresión para evaluar la probabilidad de falla del sistema.
En este caso se parte del supuesto de que los CM son sucesos independientes, es decir,
se asume que la ocurrencia de un CM no modifica la probabilidad de ocurrencia de los
restantes. Esta suposición resulta válida cuando los sucesos básicos son independientes
y de baja probabilidad, pues cada CM contiene uno o varios componentes que lo
diferencian del resto y bajo estas condiciones la modificación de la probabilidad de un CM
por la ocurrencia de otro resulta pequeña.
La fórmula que se emplea en este caso para hallar la probabilidad de falla del
sistema (Pf) es:
N
Pf= 1 - Σ [ 1 - P(CMi) ] [3.3.5]
i=1
Hagamos seguidamente el análisis cuantitativo de las fallas del sistema del ejemplo 3.1.1,
a partir de los CM dados por [3.2.13] mediante las fórmulas de cálculo [3.3.4] y [3.3.5].
Para ello tendremos que hallar primeramente las probabilidades de falla de cada uno de
los sucesos primarios, determinar seguidamente las probabilidades de cada uno de los
CM, y, finalmente, la probabilidad de falla del sistema.
Con excepción del suceso primario E, que representa un error humano por la no -
actuación a tiempo del operador, todos los modos de falla se considerarán en esta fase
del análisis como no controlables, es decir, que durante 1 año de trabajo (aprox. T=8000h
) los componentes se explotan ininterrumpidamente entonces son sometidos a un
mantenimiento anual que renueva sus propiedades y reduce la probabilidad de falla al
valor inicial 0.
1) Tpn - Rotura del tanque a presión normal
Modo de falla no controlado con rata de fallas 1E-8/h. Aplicando la expresión [2.4.4] y
considerando T=8000h como el tiempo total de trabajo hasta que el sistema se somete
a mantenimiento, así como también qad=0 y Tpr=0 se obtiene:
qTpn = 1 - { 1 - EXP( -1E-8 x 8000 ) } / ( 1E-8 x 8000 ) = 4.00E-5
Modo de falla no controlado, con rata de fallas 1E-5/h y T=8000h. De forma análoga a los
casos anteriores, se obtiene:
Modo de falla no controlado, con rata de fallas 2.7E-7/h y T=8000h. De forma análoga a
los casos anteriores, se obtiene:
Modo de falla no controlado, con rata de fallas 1E-8/h y T=8000h. De forma análoga a
los casos anteriores, se obtiene:
Modo de falla no controlado, con rata de fallas 1E-4/h y T=8000h. De forma análoga a
los casos anteriores, se obtiene:
% % Acum.
1) Va.M.T 7.54E-3 77.06 77.06
2) Va.E.T 1.94E-3 19.78 96.84
3) Va.I2.T.I1 1.90E-4 1.94 98.78
4) Tpn 4.00E-5 0.42 99.20
5) Va.M.R 2.61E-5 0.27 99.47
6) Va.SC 2.48E-5 0.25 99.72
7) Va.I2.R 2.10E-5 0.21 99.93
8) Va.E.R 6.70E-6 0.07 100.00
9.78E-3 100.00
En estos resultados se aprecia como más del 95% de las fallas del sistema se concentran
en los 2 primeros CM. Como era de esperar, la falla de la válvula de alivio, que aparece
prácticamente en todos los CM es un suceso básico clave para la falla del sistema.
Es importante que notemos la importante contribución que hace la falla de los contactos
del "timer" a la apertura, que conjuntamente con la falla de la válvula de alivio forma parte
de los 3 CM más importantes con un aporte del 98.78% de la probabilidad de falla total.
El error humano por acción tardía del operador, aunque reviste cierta importancia pues
forma parte del CM #2 que aporta el 19.78%, no constituye un foco de atención vital para
reducir la probabilidad de falla de este sistema. La vía a seguir debe ser tratar de elevar la
confiabilidad de la válvula de alivio Va y del "timer" T.
Una alternativa puede ser realizar una prueba mensual del estado de estos
componentes para proceder al mantenimiento correctivo cuando la prueba detecte
alguna insuficiencia. Realizando estas pruebas periódicas, sólo a dichos componentes,
podemos reducir sustancialmente la probabilidad de falla del sistema y el peligro de rotura
del tanque.
Modo de falla controlado periódicamente, con rata de fallas 3E-4/h y tiempo entre
pruebas de 720h.
Modo de falla controlado periódicamente, con rata de fallas 1E-4/h y tiempo entre
pruebas de 720h. De forma análoga al caso anterior, se obtiene:
2.47E-4 100.00
Por ejemplo, si empleamos un "timer" con rata de fallas inferior en un orden (1E-5/h), la
probabilidad de falla de este componente se reduce a 3.90E-2 y la del sistema disminuye,
consecuentemente, al valor 1.32E-3/año. El tiempo medio hasta la falla para estas
condiciones es de 758 años.
1.32E-3 100.00
Esta mejora incorpora un nuevo componente y, por tanto, modifica tanto los datos de
confiabilidad como la propia estructura del árbol de fallas. Donde antes aparecía el
suceso básico T (los contactos del "timer" fallan cerrados), ahora se incluye en su lugar
una compuerta AND cuyas entradas son la falla por contactos cerrados de los dos
"timers" en serie T1 y T2. Bajo estas condiciones, es necesario realizar la evaluación
cualitativa del nuevo árbol de fallas y determinar sus CM. Sin embargo, dada la
simplicidad de la modificación realizada en este caso específico, resulta evidente que los
nuevos CM pueden obtenerse de forma sencilla, reemplazando el suceso básico original
T, por el suceso compuesto T1.T2, que representa la falla simultánea de los dos "timers"
en serie.
% % Acum.
1) Va.M.T1.T2 2.35E-3 75.05 75.05
2) Va.E.T1.T2 6.03E-4 19.27 94.32
3) Va.I1.I2.T1.T2 5.92E-5 1.89 96.21
4) Tpn 4.00E-5 1.28 97.49
5) Va.M.R 2.61E-5 0.83 98.32
6) Va.SC 2.48E-5 0.79 99.12
7) Va.I2.R 2.10E-5 0.67 99.79
8) Va.E.R 6.70E-6 0.21 100.00
3.13E-3 100.00
Veamos, por último, un nuevo enfoque del proceso que tiene lugar en el ejemplo 3.1.1.
Hasta ahora consideramos de forma deductiva, mediante la técnica de árboles de fallas,
todas las combinaciones de sucesos primarios que conducen al suceso tope no deseado,
rotura del tanque en condiciones de carga normal o por sobrepresión. Si analizamos los
sucesos primarios considerados, llegaremos a la conclusión de que estos pueden ser de
dos tipos:
Iniciadores: Fallas de equipo, errores humanos o sucesos externos que crean una
condición de peligro de daño al sistema y requieren la acción de medios protectores o
acciones del operador para contrarrestarlos o mitigar sus efectos.
En el ejemplo existen 3 posibles iniciadores de una avería que conduzca a la rotura del
tanque por sobrepresión, que es el estado final no deseado. Ellos son:
Los facilitadores, que podrían conducir a la rotura del tanque si ocurriera alguno de los
iniciadores anteriores son:
En la figura 3.4.1 se muestran los árboles de sucesos para cada uno de los 3 iniciadores
posibles. Los encabezamientos del árbol de sucesos son funciones necesarias para la
protección del tanque contra la rotura por sobrepresión, que implican el funcionamiento de
componentes, equipos o el éxito de determinadas acciones del operador. En ocasiones
una función se desdobla en varias acciones o en la actuación de varios sistemas, como
ocurre en la figura 3.4.1 a), donde la función desconexión por el operador se ha
desdoblado en dos actividades, la desconexión del circuito de potencia y la desconexión
del circuito de control. Para las acciones o sistemas en el encabezamiento del árbol de
sucesos se producen, cuando corresponde, bifurcaciones en dos caminos posibles, el
éxito que va conduciendo a un estado final seguro, o la falla, que nos lleva al estado final
no deseado. El árbol de sucesos se va ramificando para dar lugar a un conjunto de
secuencias, que se diferencian por la condición de éxito o falla de las funciones
protectoras en cada caso.
En el árbol de sucesos se marcan con la letra D aquellas secuencias en que la
combinación de fallas de las funciones protectoras conducen al estado final no deseado
(daño), mientras que con la letra E se señalan los estados finales exitosos. En el ejemplo,
existe una sola secuencia de daño para cada árbol de sucesos, pues en las restantes
secuencias se garantiza un estado final seguro del tanque. Sin embargo en los casos
reales más complejos, pueden ser varias las secuencias de daño en cada árbol de
sucesos.
Por otra parte, no siempre se produce la bifurcación del árbol en cada sistema o acción
protectora. En el árbol de sucesos de la figura 3.4.1 a) se aprecia como, por ejemplo, si
tiene éxito la interrupción de la corriente en el circuito de potencia no se da ninguna
alternativa para las restantes acciones protectoras (interrupción de la corriente en el
circuito de control y alivio de presión en el tanque), pues la primera ya garantiza la
integridad del tanque y no se requieren otras acciones. Existen otros casos en que
determinadas funciones son alternativas a la falla de una función anterior y sólo se
modelan opciones para ellas en los casos en que la función precedente no ha sido
exitosa.
Para hallar la probabilidad del suceso final no deseado, es preciso hallar las
probabilidades de todas las secuencias que conducen al daño y sumarlas, teniendo en
cuenta las contribuciones de todos los iniciadores posibles. La evaluación de la
probabilidad de cada secuencia se realiza formando el árbol de fallas de la secuencia,
que une con una compuerta AND a todos los árboles de fallas de las acciones protectoras
que no tienen éxito en la secuencia. En la figura 3.4.2 se muestra el árbol de fallas de la
secuencia que conduce al daño del tanque por sobrepresión, para el iniciador T - Los
contactos del "timer" fallan cerrados. La única modificación con respecto al árbol de fallas
de la figura 3.1.4 es que no se incluye el suceso primario sobrecorriente en el circuito de
potencia SC como modo de falla del interruptor I2, porque SC es otro iniciador y la
probabilidad de ocurrencia simultánea de dos iniciadores (en este caso T y SC) es
despreciable.
Fig. 3.4.2. Arbol de fallas de la secuencia que conduce al daño del tanque por
sobrepresión, para el iniciador T - Los contactos del "timer" fallan cerrados.
CM Prob.
T.M.Va 7.54E-3
T.E.Va 1.94E-3
T.I1.I2.Va 1.90E-4
Total 9.67E-3
CM Prob.
R.M.Va 2.61E-5
R.I2.Va 2.10E-5
R.E.Va 6.70E-6
Total 5.38E-5
- Iniciador SC - sobrecorriente en el circuito de potencia
CM Prob.
SC.Va 2.48E-5
Total 2.48E-5
La probabilidad de daño al tanque por sobrepresión puede hallarse como la suma de las
probabilidades de daño para cada uno de los iniciadores posibles, teniendo en cuenta que
éstos se consideran sucesos mutuamente excluyentes.
Se puede apreciar como estos resultados concuerdan con los obtenidos por la técnica de
árboles de fallas para el suceso no deseado rotura del tanque por sobrepresión, que
excluye el suceso primario Tpn - Rotura del tanque a presión normal.
Para cada uno de los iniciadores se desarrollan los árboles de sucesos que conducen a
un estado final de daño, previamente definido de acuerdo con los objetivos del estudio y
que puede ser solamente de carácter económico o incluir además posibles efectos
nocivos sobre el personal de la industria y/o el medio ambiente. En los árboles de
sucesos se modela el comportamiento de las funciones protectoras previstas en cada
caso y se determinan las secuencias cuyo estado final es el daño.
Este aporte se expresa de forma cuantitativa por medio de las medidas de importancia
En general las medidas de importancia (conocidas más de una decena en la literatura)
evalúan el impacto que un determinado factor tiene sobre el riesgo global.
De modo general, tres de las medidas de importancia más empleadas en estos análisis,
son :
ΣQcmi
FV = [4.1.1]
Qm
donde:
Qmedia
RRW = [4.1.2]
Qmedia(Pi= 0)
donde
Esta medida debe ser siempre mayor que cero. En el caso que sea igual a cero, significa
que el componente objeto de análisis no está presente en ninguno de los conjuntos
mínimos del sistema. Cuanto menos aporte relativo tenga el componente en el sistema,
menor será el valor de la importancia. Esta medida de importancia proporciona una
información muy útil en el proceso de selección de los componentes y en el
establecimiento de la configuración de los sistemas durante la etapa de diseño, pues
permite agrupar en un orden jerárquico el grupo de elementos cuya mejora aporta un
beneficio sustancial en la disminución del riesgo global de los sistemas analizados.
4.1.1.3. Medida de importancia de incremento del riesgo.
Esta medida de importancia da un criterio de cuanto puede aumentar el riesgo global, si el
componente objeto de análisis es totalmente imperfecto, o sea, suponiendo que su
probabilidad de falla es igual 1.
- cociente,
Qmedia(Pi= 1)
RAW = [4.1.4]
Qmedia
- resta,
Ambas expresiones son útiles para evaluar el aporte relativo de cada uno de los
componentes por separado al incremento del riesgo de un sistema, partiendo de que
estos componentes se encuentran fallados o fuera de servicio. En la práctica esta
medida permite dirigir los esfuerzos hacia aquellos elementos de mayor impacto sobre el
riesgo (indisponibilidad) durante la actividad de explotación.
Esto significa, que en los estudios de priorización generalmente realizados, basta con
seleccionar para los análisis aquellos componentes, cuyas características corresponden
al atributo por el que se prioriza; mientras que en ARCON, adicionalmente a lo anterior, el
sistema realiza (de forma automática) la selección en el modelo de indisponibilidad media
de los componentes sujetos a priorización de los términos que corresponden al atributo
en cuestión.
R
Tipo 3 Qcomp = (ver [2.4.7])
R + µ
donde:
Rdet=(1-Inef).R;Rno=Inef.R;
Phe=Phet+(1-Phet)Phem
Tipo 6 Qcomp= ç“m/Tm
Los estudios de priorización por importancia, que se han previsto dentro del sistema
ARCON como una opción particular del Análisis de Importancia, fueron enumerados en el
desarrollo de este aspecto.
Las ventajas que reporta el análisis dentro del sistema son evidentes:
A continuación se presenta una tabla de priorización por tiempo entre pruebas para un
sistema de seguridad de una Central Nuclear.
COMPONENTES RRW % RRW %Acum
38 LF-TH23S01-O 9.69E-6 17.33 9.96E-6 17.33
12 LF-TH43S01-O 9.69E-6 17.33 1.93E-5 34.66
20 LF-TH63S01-O 9.69E-6 17.33 2.90E-5 51.99
5 LF-TH21D01-S 8.60E-6 15.38 3.76E-5 67.38
27 LF-TH41D01-S 8.60E-6 15.38 4.62E-5 82.76
45 LF-TH61D01-S 8.60E-6 15.38 5.48E-5 98.14
6 LF-TH20S04-O 1.84E-7 0.33 5.50E-5 98.47
28 LF-TH40S04-O 1.84E-7 0.33 5.52E-5 98.80
Para que estos análisis tengan un resultado apreciable, deben realizarse a los
componentes que más contribuyen a la indisponibilidad total de los sistemas, cuestión
que se logra dirigiendo los estudios a los componentes más importantes, obtenidos de los
análisis de importancia.
En el caso más complejo, el resultado del estudio de sensibilidad es una gráfica de una
familia de curvas cuyas características son:
Fig. 4.1.1. Estudio de sensibilidad del comportamiento de la variación de la rata de fallas ( variable parámetro ) y la
variación de los tiempos entre pruebas (variable estudiada) en un sistema con trenes redundantes.
Para analizar el comportamiento de la variación de estos y otros parámetros (por
ejemplo, ineficiencia de las pruebas, envejecimiento debido a pruebas, escalonamiento de
pruebas y mantenimientos, etc.), estos estudios deben realizarse sobre la base de
modelos de indisponibilidad instantánea, que ofrecen un resultado más realista e integral
sobre el comportamiento temporal y medio de la indisponibilidad del sistema.
4.2. Análisis de Indisponibilidad Instantánea.
Por esta razón, son poco frecuentes los estudios de confiabilidad basados en
indisponibilidad instantánea, siendo más generalizada esta aplicación a estudios de
sistemas aislados.
Sin embargo, los análisis de indisponibilidad instantánea aportan una información más
completa sobre las características de diseño, operación, pruebas y mantenimiento
de los sistemas, que permite dirigir los esfuerzos de una manera más eficaz sobre
las áreas sensibles de los sistemas más importantes resultantes del APS.
La generación de los CM de árboles de fallas suele ser en muchos casos un proceso para
el que se requiere un gran tiempo de máquina, por lo que su realización de forma
repetida, es una tarea que en la práctica sería ineficiente y poco competitiva. La
reducción booleana dinámica permite dar respuesta con efectividad a este problema y
como consecuencia la obtención de una información más real del comportamiento de los
sistemas analizados, que es el objetivo final de estos estudios. Se demuestra que los
cálculos tradicionales por parámetros medios e instantáneos (sin reducción booleana
dinámica), bajo las mismas condiciones de partida sobrevaloran el comportamiento de la
indisponibilidad del sistema, y en algunos casos distorsiona también el comportamiento
real de determinados parámetros de fiabilidad. En particular, con respecto a los valores
de indisponibilidad media estos pueden llegar a una sobreestimación de un 30-40 %, e
incluso mayor.
De forma análitica:
1 T
T ∫o
Qmed = q(t )dt
donde:
q(t) - función de indisponibilidad instantánea.
T- tiempo de observación.
- Indisponibilidad máxima: El valor máximo que alcanza la indisponibilidad en un instante
de tiempo, dentro del intervalo de observación.
Qmax= q(t1)
q(t1) - función de indisponibilidad instantánea.
t1 - tiempo donde se obtiene el valor máximo de indisponibilidad.
Junto a estos, hay otro grupo de parámetros específicos de componentes, definidos en
el epígrafe 2.4 (tiempo entre prueba, tiempo de duración de las pruebas-mantenimiento,
tiempo permisible con el componente fuera de servicio, tiempo hasta la primera prueba-
mantenimiento, tiempo de reparación y otros), cuyo comportamiento aproximado se
refleja en las curvas de indisponibilidad instantánea, brindando además una información
muy útil para el análisis detallado del sistema.
Fig. 4.2.1. Estudio de indisponibilidad instantánea para el caso base del ejemplo 3.1.1.
4.2.2. Análisis de sensibilidad por indisponibilidad instantánea.
Otras variantes de aplicación, tomando como ejemplo 3.1.1, se presentan en las fig.
4.2.3 y 4.2.4.
En el primer caso, se compara el caso base con respecto a otra variante con introducción
de una mejora o cambio de equipamiento en la válvula de alivio, siendo la variación de la
rata de fallas, el parámetro que representa esta modificación.
Fig. 4.2.3. Gráfico comparativo entre dos variantes del estudio 3.1.1, caso base y variante
con cambio o mejora de la válvula de alivio del sistema. Valor inicial de la rata de fallas
(caso base), valor modificado (variante de cambio o mejora).
En el segundo caso, la comparación se realiza contra un ejemplo donde se modifica la
configuración del sistema. Esta consiste en la adición de un segundo timer con idéntica
función. En este caso, es necesario variar el árbol de fallas del sistema, así como agregar
un elemento en la base de datos de confiabilidad.
En cada uno de estos ejemplos, resulta fácil reconocer la característica del
comportamiento de cada parámetro de fiabilidad en el sistema, así como diferenciar
de manera simple, un caso con respecto a otro. En este aspecto, la forma de la curva,
tiene el peso fundamental en la información que se brinda en el gráfico de
indisponibilidades instantáneas, y de aquí su utilidad en los estudios comparativos.
Fig. 4.2.4. Gráfico comparativo entre caso base y variante con dos timer.
El análisis de la influencia de la estrategia de las pruebas y mantenimientos, en la
actividad
de planificación para garantizar índices elevados de confiabilidad y seguridad, es una
aplicación de extrema importancia. Sólo mediante la aplicación de estos estudios es
posible conocer el comportamiento temporal de estos índices de confiabilidad y
seguridad de la instalación, en dependencia del comportamiento de la estrategia de
pruebas y mantenimientos.
En la figuras 4.2.9 y 4.2.10 se presentan los gráficos de contribución NRS de cada caso
respectivamente.
Fig. 4.2.6. Curva de distribución NRS del ejemplo 3.1.1 con las
pruebas concentradas.
Fig. 4.2.9. Curva de contribución NRS del ejemplo 3.1.1 con las
pruebas concentradas.
Fig. 4.2.10. Curva de contribución NRS del ejemplo 3.1.1 con las
pruebas distribuidas.
Este tipo de estudio es de gran utilidad, pues a partir de los resultados de los estudios
de instantánea, es posible analizar el comportamiento de la indisponibilidad del sistema
en una zona específica de interés. La necesidad del estudio de estas zonas puede
estar motivada por diferentes causas, por ejemplo, comportamientos anómalos
(por asimetrías no esperadas) del sistema, precisión de los valores de indisponibilidad
en zonas de salto (puntos de inflexión) y zonas de valores interpolados, conocimiento
del comportamiento del sistema en períodos de pruebas y mantenimientos, etc.
Por ejemplo, en la tabla 4.2.1 se presenta un listado reducido del estudio de importancia
de conjuntos mínimos más importantes realizado en un punto aislado del tiempo (7201
horas), con vista a la determinación de las combinaciones mínimas que más aportan, en
el momento en que la indisponibilidad instantánea se hace igual a 1, de acuerdo al
comportamiento de la curva de indisponibilidad instantánea de la figura 4.2.12.
Este cambio ha ido convirtiendo el APS en una herramienta dinámica cuyos resultados se
aplican normalmente en la industria de alto riesgo para la toma de decisiones.
Aunque el campo de aplicaciones de los APS tiene un espectro amplio, debido a los
objetivos de este curso, se hace énfasis en sus aplicaciones dirigidas al mantenimiento.
Algunas de las aplicaciones más útiles de los APS están dirigidas a la optimización del
mantenimiento. Entre las mismas se destacan:
- Control de configuración.
- Priorización por mantenimientos.
- Priorización por AOT.
- Optimización de especificaciones técnicas.
- Optimización del monitoreo
- Optimización del inventario de piezas de repuesto.
- Estudio de la influencia del envejecimiento de los
componentes sobre la disponibilidad de la instalación.
- Indicadores basados en riesgo.
- APS dinámico.
5.1. Control de configuración.
Teniendo en cuenta que en los estudios, más frecuentes de APS, se parte del estudio de
las múltiples configuraciones posibles que pueden conducir a la indisponibilidad de una
instalación (representada por los CM) estamos ante la herramienta idónea para realizar el
control de configuración.
Como resultado de un estudio de APS es común disponer de los listados de los CM más
importantes categorizados según su probabilidad de ocurrencia. Los equipos hacia
donde se dirigen los esfuerzos iniciales estarán precisamente incluidos en las
combinaciones mínimas más importantes, pues cualquier proceso que degrade su
funcionamiento, o que afecte la disponibilidad del equipamiento en cuestión estará
aumentado la probabilidad de ocurrencia de la configuración indeseada.
Un problema adicional con las posibles configuraciones críticas se produce cuando se
explota una instalación en estado degradado, o sea, que durante un intervalo de tiempo
se trabaja con determinada combinación de equipos fuera de servicio. Esto provoca que
como consecuencia de la degradación puedan aumentar en importancia determinadas
posibles configuraciones no consideradas importantes en el estado nominal de la
instalación, pero que en este estado degradado comienzan a convertirse en críticas.
Es por ello importante limitar también sobre la base del riesgo y a la disponibilidad de la
instalación, los tiempos permisibles fuera de servicio de estos equipos. Sobre este
aspecto se amplía en el epígrafe “Priorización por tiempo fuera de servicio (AOT)”. Como
se aprecia en los estudios de control de configuración, se analiza el mantenimiento por su
influencia negativa, o sea, por su efecto al sacar un equipo fuera de servicio.
Utilizando las técnicas actuales de APS es posible estudiar y optimizar los tiempos entre
mantenimientos y la duración de los mismos (análisis de sensibilidad), para lograr las
menores influencias en el riesgo por determinadas configuraciones donde participan
equipos en mantenimientos.
Otra vertiente del estudio puede ser la determinación de los componentes más
importantes en el instante de tiempo en cuestión. Esto se puede lograr utilizando también
las facilidades que oferta el sistema ARCON.
Esta aplicación garantiza que los esfuerzos del mantenimiento se centren en los equipos
más importantes, que son los que mayor reducción al riesgo pueden aportar y no desviar
los mismos hacia puntos en los que no se esperan aportes elevados a la indisponibilidad
de la instalación. Para la aplicación de la priorización por mantenimiento es indispensable,
tal como se explicó en 4.1.1.4, separar del modelo de la instalación aquellos elementos
relacionados con el mantenimiento. Ahora la conclusión que de estos análisis se obtiene
no puede ser en ninguna forma que el aumento de los tiempos de mantenimiento o el
incremento de su frecuencia sobre estos equipos conllevará al aumento de la
disponibilidad. En este aspecto hay que ser muy cuidadoso pues de adoptarse medidas
de esa índole los resultados pueden ser totalmente contrarios. Ello se explica ya que
cuando se saca para mantenimiento un equipo importante se está acercando la
configuración en el que el mismo participa a un estado crítico. Esta cuestión debe
evaluarse por tanto tomando una solución de compromiso entre los beneficios (reducción
del riesgo) que son de esperar del mantenimiento y el tiempo fuera de servicio (aumento
del riesgo) a que se somete la instalación cuando el equipo está en mantenimiento.
5.3. Priorización por AOT.
Esta cuestión garantiza, que utilizando esta medida, sea posible ordenar el aporte de los
equipos fuera de servicio y obtener resultados recomendatorios sobre el tiempo fuera de
servicio basado en riesgo (AOT) con el que los mismos se deben explotar. Es común en
las especificaciones técnicas de la instalación, donde no se han usado estas técnicas,
encontrar tiempos fuera de servicio, para algunos equipos importantes, que superan el
límite establecido por el AOT basado en riesgo. En este sentido los resultados del APS
aplicados a la instalación pueden ser en ocasiones sorprendentes.
3- Las técnicas de priorización por mantenimiento y por AOT tienen una consecuencia
directa en el mejoramiento de las especificaciones técnicas, por cuanto se pueden
ordenar los mantenimientos según su impacto sobre la disminución del riesgo y por
tanto el aumento de la disponibilidad de la instalación. Los estudios de priorización por
AOT permiten establecer una base real de este parámetro para cada equipo, de
acuerdo a la influencia que ejerce el tiempo fuera de servicio, sobre el riesgo o la
disponibilidad. Los resultados de los estudios de priorización brindan una posibilidad
apreciable de corregir las especificaciones técnicas.
5.5. Optimización del Monitoreo.
De aquí que dirigir los esfuerzos, en la realización del diagnóstico hacia aquellos equipos,
cuyo aporte por el factor de reducción del riesgo sea mayor, conllevará a la optimización
del monitoreo.
Desde el punto de vista económico aparece también un impacto positivo doble, ya que
por un lado, se obtiene un mayor beneficio por aumento de la disponibilidad de la
instalación, y por otro, disminuyen los costos al reducir la aplicación de estas técnicas
(relativamente costosas) a los puntos donde su influencia es verdaderamente
significativa.
La realización de los estudios de priorización por tiempo entre pruebas, tiempo permisible
fuera de servicio y mantenimiento permite determinar los componentes, que atendiendo a
estos criterios, tienen un impacto significativo en el aumento de la disponibilidad y
reducción del riesgo residual en la industria. Consecuentemente con los resultados de
este primer nivel de análisis, los esfuerzos dirigidos a optimizar el inventario de piezas de
repuesto, se centran en un grupo muy reducido de sistemas y elementos de la instalación
y no en todo el complejo.
El análisis se realiza afectando linealmente la rata original de fallas, de los equipos que
deben ser cuantificados, por un factor que toma en cuenta este efecto de envejecimiento.
El resultado del estudio se puede expresar en curvas de indisponibilidad versus tiempo
de observación.
A pesar del desarrollo actual de los medios de cómputo, el peso fundamental de esta
diferencia está en la capacidad limitada de los programas para la manipulación de
grandes volúmenes de información de forma operativa, como demanda la propia
dinámica de la explotación.
La introducción de los resultados del APS en la industria implica, como primer paso, la
propia realización del estudio, y a partir de sus resultados, contando con los modelos de
sistemas y de planta, realizar entonces, la implementación de las aplicaciones
industriales.
En estos estudios, con vistas a reducir los esfuerzos y garantizar su máxima calidad, es
necesario cumplir determinadas reglas.
De forma resumida los pasos, que como regla general se siguen para cumplir un estudio
de APS, son:
En la torre (To) se realiza la separación de los productos ligeros y pesados. Los productos
más ligeros se extraen por los puntos altos de la torre y se pasan a un condensador (Co)
donde se enfrían con agua técnica. A continuación, los productos ligeros, se introducen
en un tambor separador (Ta), separándose en este, los gases no condensables que se
destinan al Flare, otros gases combustibles que se incorporan al colector de gases (CG)
de servicio de planta y el agua que se drena por la parte inferior del tambor.
A partir del esquema de la fig 6.2.1, la descripción del proceso y las consideraciones
A partir de los datos anteriores y del árbol de fallas se elabora la lógica de fallas para
entrada al sistema ARCON, que quedará de la siguiente forma:
NoC- Número de orden de la compuerta. Este dato se utiliza para identificar las
compuertas en el campo de lógica de fallas.
Y- compuerta AND.
O- compuerta OR.
Orden Cantidad
1 11
2 0
3 8
Total 19
De la tabla 6.2.7 es posible concluir que los tiempos fuera de servicio, inicialmente
considerados para las bombas, están subestimados y es posible sin afectar
sensiblemente la disponibilidad de la instalación, aumentar los mismos.
Por ejemplo, afectando la rata de fallas de los componentes más importantes de este
análisis que son, de acuerdo a la tabla 6.2.4, los componentes 4,5 y 17 (Flare, Torre
despojadora y sistema de combustible respectivamente), lo que significa sustituirlos por
otros de mayor calidad, se puede lograr la mejoría de disponibilidad que refleja la curva
de la fig. 6.2.3. Este caso se evalúa considerando la disminución de la rata de fallas de
cada componente (4,5 y 17) en un orden (desde 1E-6 hasta 1E-7).
Fig. 6.2.4. Gráfica de sensibilidad variando las ratas de fallas y tiempo entre pruebas de
las bombas probadas periódicamente.
El análisis de las curvas muestra, que la incidencia sobre estos parámetros no reporta
mejoras notables en la disponibilidad de la instalación. Ello se debe a que se ha afectado
la fiabilidad de equipos cuya importancia en la instalación es insignificante (veáse la tabla
6.2.4).
Sin embargo hay un detalle en dichas curvas que debe ser destacado. Cuando se
aumenta el tiempo entre pruebas aparecen dos efectos contrapuestos: el primero es el
aumento de la contribución de las fallas ocultas y el segundo es la disminución de la
contribución de la indisponibilidad durante las pruebas.
Esto explica que la variación de la indisponibilidad para tiempos entre pruebas mayores
(1440 y 2160 h) es más sensible a la variación de la rata de fallas que los casos de menor
tiempo entre pruebas.
Como tendencia general se observa que para bajas ratas de fallas el aporte de las
indisponibilidades por pruebas es determinante, mientras que para mayores ratas
predomina el aporte de las fallas ocultas. Esto significa que cuando se trabaje con
bombas de alta fiabilidad debe prestarse especial atención a la duración de las pruebas,
mientras que para bombas de menor calidad es importante prestar más atención a los
intervalos entre pruebas.
Existen algunas cuestiones del caso de estudio hasta el momento no abordadas, por
ejemplo el análisis de los resultados de la indisponibilidad instantánea, que como se
explicó puede mostrar aspectos hasta ahora enmascarados en los análisis por
parámetros medios. El análisis de la indisponibilidad instantánea de este sistema se
muestra en la figura 6.2.5:
Fig. 6.2.9. Gráfica de indisponibilidad instantánea del caso base con reducción del
tiempo entre pruebas a 360 horas.
Como se observa en este caso mientras más se prueba (aumento de la frecuencia de
pruebas) el área que aportan los picos de indisponibilidad por pruebas es mayor y los
valores de homogeneidad (fig 6.2.10) por tanto son menores.
Los análisis en puntos aislados del tiempo permiten descubrir los mayores contribuyentes
en puntos aislados del tiempo, y tomar medidas sobre los mismos encaminadas a
disminuir sus aportes. Por ejemplo, del análisis del instante 720 horas, partiendo del caso
base, se obtienen las tablas 6.2.8 y 6.2.9 de conjuntos mínimos importantes (CMI) y de
importancia RRW, respectivamente.
Este análisis demuestra que el aporte pronunciado de indisponibilidad en los picos, lo
produce la ocurrencia de un reordenamiento de los mayores contribuyentes a la
indisponibilidad de la instalación en los intervalos de duración de las pruebas, donde
pasan a ser más importantes los aportes de las bombas en operación cuya rata de fallas
es significativamente superior comparada con las de otros contribuyentes que resultan
Esta cuestión indica que deben tomarse medidas encaminadas a disminuir las
indisponibilidades durante las pruebas. Otro detalle de interés en este caso, es que para
los períodos de pruebas aparecen también nuevas configuraciones críticas que difieren
del ordenamiento vigente en casi todo el intervalo. Esto se puede apreciar comparando
Es importante concluir que aún fuera de estos intervalos de pruebas cualquier alteración
del proceso tecnológico, que saque de servicio un equipo, aunque no implique la parada
de la instalación, puede generar configuraciones críticas que difieren por el
reordenamiento de los contribuyentes, de las inicialmente detectadas.
La estimación de los dos últimos tipos de datos es objeto de estudio por otras actividades
de análisis (Análisis de Fiabilidad Humana y Análisis de Fallas Causa Común,
respectivamente).
A.2. Interfases del análisis de datos con el análisis de sistemas. Sucesos básicos.
El analista de sistemas finaliza el desarrollo del modelo en sucesos básicos típicos para
los que es factible la obtención de datos estadísticos. Estos sucesos básicos representan
el agrupamiento de todos los posibles modos de falla de un componente en un número de
categorías limitadas.
(Los códigos que aparecen entre paréntesis acompañando cada modo de falla son
códigos estandarizados para los modos de falla, que conjuntamente con los códigos de
proyecto de los componentes a que se refieren conforman los códigos que identifican los
sucesos básicos en los modelos de sistemas).
- Falla al arranque (S)
- Aplicable a todos los componentes que realizan su función por movimiento continuo.
- Obstrucción (Q)
or
Falla suministro
Bomba falla al Bomba falla en eléctrico de C.A. al
arranque operación interruptor 1
or or
1
Falla de suministro
eléctrico de C.A. al
interruptor
or
En las figuras A.1 y A.2 se ilustran estos límites para una bomba y una válvula
motorizadas, así como los sub-árboles de falla de estos componentes que se
corresponden con los mismos. Las fallas dentro de las fronteras definidas se consideran
en los modelos de los componentes como "fallas locales" y son las que deben disponer
de datos para la estimación de su probabilidad. ” A continuación se describen los límites
que normalmente se consideran para algunos componentes importantes.
- Generadores diesel.
Los límites físicos de los generadores diesel incluyen: cuerpo del generador,
generador/accionador, sistema de lubricación (local), sistema de gas-oil (local),
componentes de refrigeración (locales), sistema de aire de arranque, sistema de aire de
combustión y gases de escape, sistema de control individual del generador diesel,
interruptor de suministro a las barras de los consumidores y su circuito de control local
asociado, con excepción de todos los contactos y relays que interaccionan con otros
sistemas eléctricos o de control.
- Bombas motorizadas.
- Turbobombas.
- Válvulas motorizadas.
- Válvulas electromagnéticas.
- Interruptores de potencia.
- Libros de operación
- Informes periódicos
Hay que destacar que si en el caso de las ratas de fallas se puede partir de datos
genéricos, en los casos de indisponibilidades por pruebas y mantenimientos se trata de
datos intrínsecos de cada planta y no procede su extrapolación de una planta a otra, por
la flexibilidad con que se definen las políticas de mantenimiento, su dependencia de las
características de diseño de las plantas, etc.
Las bases de datos de fiabilidad normalmente recogen para los diferentes casos típicos
de componentes (mecánicos, eléctricos y e I&C) y modos de fallas, los siguientes
índices:
- Factores de Error.
Los datos específicos son los que se obtienen directamente de la experiencia operacional
de la planta de interés. Sin embargo, es difícil encontrar el caso de una planta cuyos
datos estén comprendidos completamente en esta categoría. En general la información
de una planta no es suficiente desde el punto de vista estadístico para desarrollar una
base de datos específica por sí misma. Por ello se parte de datos genéricos, los cuales
se ajustan con la experiencia operacional propia para obtener así una base específica.
Así, por datos genéricos se identifican los que no provienen de componentes de la planta
propia, sino que se adoptan de componentes análogos de otras plantas. El denominado
Análisis Bayesiano permite la adecuación de estos datos a la experiencia operacional
propia cuando existe evidencia (registros) apropiada de la misma.
Otra fuente de incertidumbre puede ser la no clara definición de las fronteras de los
componentes en la base genérica de partida, lo que puede determinar la falta de
correspondencia con respecto a los límites establecidos para los componentes propios
(ver A2.2).
No obstante, las incertidumbres que pueden derivarse del uso de datos genéricos no
restan validez a los resultados de los estudios realizados, cuando estos se refieren a las
valoraciones de tipo comparativo, que sirven de base a la proposición de mejoras y
establecimiento de prioridades en su implementación, como por ejemplo:
Por último, existen técnicas para la valoración del impacto de estas incertidumbres en los
resultados del análisis (análisis de incertidumbres, análisis de sensibilidad), con vistas a
su consideración en la toma de decisiones.
Durante estos años se han sucedido diversas versiones del sistema, donde se han
ampliado sustancialmente sus capacidades e introducido nuevas y potentes opciones. La
más reciente versión 5.0 permite resolver los árboles de fallas muy complejos que se
generan a partir de las secuencias accidentales de un APS.
Ejemplo B.1: Modelo simplificado del sistema de inyección de alta presión de la Central
Electronuclear (CEN) de Juraguá en Cuba, para el suceso iniciador de avería Pérdida del
suministro eléctrico exterior. Para este iniciador, la función del sistema es reponer la
pequeña pérdida de inventario de agua que se produce en el circuito primario, debido al
disparo de las válvulas de seguridad del compensador de presión en los primeros
instantes de la avería.
El sistema consta de 3 líneas independientes para la inyección del agua al primario, con
dos bombas de alta presión por cada uno de los 3 trenes redundantes. Para este iniciador
el criterio de éxito es que se logre inyectar el gasto nominal de una de las bombas por
alguna de las 3 líneas existentes. El suceso tope no deseado es el evento complemento
de éste, es decir, que no se logre inyectar agua con ninguna de las bombas.
La figura B.1 muestra una de las pantallas del árbol de fallas, obtenida mediante el
sistema ARCON. Se aprecia que la información de los sucesos intermedios se refleja en
forma de códigos de las compuertas, que permiten describir los sucesos que ellas
representan de manera compacta y uniforme. Con esto se facilita la interpretación y
revisión de los modelos de árboles de fallas por otros especialistas.
Fig. B.1. Pantalla del árbol de fallas del sistema de inyección de alta
presión de la CEN de Juraguá, obtenida mediante el sistema ARCON.
A continuación mostramos una tabla resumen que facilita ARCON con las cantidades de
CM que genera este árbol de fallas.
Conjuntos Mínimos
1 5
2 0
3 3375
4 45225
5 266805
6 922843
7 2093472
8 3267364
9 3538944
10 2592768
11 1179648
12 262144
Total 14172493
Por supuesto que sería absurdo e inútil someter a análisis esta enorme cantidad de CM.
La tarea básica que realiza el sistema es, entonces, cuantificar la probabilidad de falla
del sistema a partir de todos estos CM y determinar cuáles de ellos son los mayores
contribuyentes a dicha probabilidad de falla, que es nuestro interés principal. Esto
último lo ofrece ARCON en una tabla como la que mostramos a continuación.
Llama la atención el CM #2, que es de orden 1. Este representa la falla modo común de
la alimentación eléctrica a los 3 trenes redundantes, lo que indispone completamente al
sistema. Una de las tareas importantes de un APS es, precisamente, identificar la
susceptibilidad de los sistemas y de la industria a este tipo de falla dependiente y
cuantificar los aportes que se producen por esta causa. Generalmente entre los CM más
importantes se hallan presentes las fallas modo común de componentes redundantes (ver
anexo D).
A pesar de la pequeña contribución individual, de cada CM separado, los primeros 20
representan algo más del 40% de la probabilidad total de falla del sistema, que es de
7.4E-4 por demanda (se trata de un sistema a la espera, que entra en funcionamiento
sólo cuando es demandado por la ocurrencia del suceso iniciador de avería). Si
continuáramos examinando los CM, veríamos que los 600 CM más importantes
representan ya alrededor del 96% de la indisponibilidad o probabilidad de falla por
demanda del sistema. En la práctica, los contribuyentes más significativos nunca
sobrepasan la cifra de 2000. Sin embargo, esto no simplifica la tarea, porque los 2000
hay que encontrarlos entre cientos y miles de millones. Para ello se requiere un software
eficiente.
Todas estas opciones se acompañan de un potente soporte gráfico para el análisis de los
resultados y la documentación de las tareas.
Durante estos años se han sucedido diversas versiones del sistema, donde se han
ampliado sustancialmente sus capacidades e introducido nuevas y potentes opciones. La
más reciente versión 5.0 permite resolver los árboles de fallas muy complejos que se
generan a partir de las secuencias accidentales de un APS.
Ejemplo B.1: Modelo simplificado del sistema de inyección de alta presión de la Central
Electronuclear (CEN) de Juraguá en Cuba, para el suceso iniciador de avería Pérdida del
suministro eléctrico exterior. Para este iniciador, la función del sistema es reponer la
pequeña pérdida de inventario de agua que se produce en el circuito primario, debido al
disparo de las válvulas de seguridad del compensador de presión en los primeros
instantes de la avería.
El sistema consta de 3 líneas independientes para la inyección del agua al primario, con
dos bombas de alta presión por cada uno de los 3 trenes redundantes. Para este iniciador
el criterio de éxito es que se logre inyectar el gasto nominal de una de las bombas por
alguna de las 3 líneas existentes. El suceso tope no deseado es el evento complemento
de éste, es decir, que no se logre inyectar agua con ninguna de las bombas.
La figura B.1 muestra una de las pantallas del árbol de fallas, obtenida mediante el
sistema ARCON. Se aprecia que la información de los sucesos intermedios se refleja en
forma de códigos de las compuertas, que permiten describir los sucesos que ellas
representan de manera compacta y uniforme. Con esto se facilita la interpretación y
revisión de los modelos de árboles de fallas por otros especialistas.
Fig. B.1. Pantalla del árbol de fallas del sistema de inyección de alta
presión de la CEN de Juraguá, obtenida mediante el sistema ARCON.
A continuación mostramos una tabla resumen que facilita ARCON con las cantidades de
CM que genera este árbol de fallas.
Conjuntos Mínimos
1 5
2 0
3 3375
4 45225
5 266805
6 922843
7 2093472
8 3267364
9 3538944
10 2592768
11 1179648
12 262144
Total 14172493
Por supuesto que sería absurdo e inútil someter a análisis esta enorme cantidad de CM.
La tarea básica que realiza el sistema es, entonces, cuantificar la probabilidad de falla
del sistema a partir de todos estos CM y determinar cuáles de ellos son los mayores
contribuyentes a dicha probabilidad de falla, que es nuestro interés principal. Esto
último lo ofrece ARCON en una tabla como la que mostramos a continuación.
Llama la atención el CM #2, que es de orden 1. Este representa la falla modo común de
la alimentación eléctrica a los 3 trenes redundantes, lo que indispone completamente al
sistema. Una de las tareas importantes de un APS es, precisamente, identificar la
susceptibilidad de los sistemas y de la industria a este tipo de falla dependiente y
cuantificar los aportes que se producen por esta causa. Generalmente entre los CM más
importantes se hallan presentes las fallas modo común de componentes redundantes (ver
anexo D).
A pesar de la pequeña contribución individual, de cada CM separado, los primeros 20
representan algo más del 40% de la probabilidad total de falla del sistema, que es de
7.4E-4 por demanda (se trata de un sistema a la espera, que entra en funcionamiento
sólo cuando es demandado por la ocurrencia del suceso iniciador de avería). Si
continuáramos examinando los CM, veríamos que los 600 CM más importantes
representan ya alrededor del 96% de la indisponibilidad o probabilidad de falla por
demanda del sistema. En la práctica, los contribuyentes más significativos nunca
sobrepasan la cifra de 2000. Sin embargo, esto no simplifica la tarea, porque los 2000
hay que encontrarlos entre cientos y miles de millones. Para ello se requiere un software
eficiente.
Todas estas opciones se acompañan de un potente soporte gráfico para el análisis de los
resultados y la documentación de las tareas.
- sistemas de fluidos;
- sistemas eléctricos;
- sistemas de instrumentación y control;
- sistemas de ventilación y aire acondicionado.
Para una mejor comprensión de esta técnica se definen los siguientes conceptos:
- Modo de falla: forma en la que puede fallar la función de un componente (p.e., válvula
falla al cierre, ruptura de tubería, interruptor falla al mantenimiento de la posición
requerida).
- Efecto de la falla: consecuencias positivas o negativas de una falla sobre un subsistema,
un sistema o la planta en general. La relación entre el mecanismo, modo y efecto de una
falla es que los mecanismos de fallas que actúan sobre un componente provocan la falla
del componente en un modo dado, que se refleja con determinados efectos sobre el
sistema y la instalación en general.
Antes de ejecutar un FMEA el analista debe definir qué constituye el sistema que va a ser
analizado (fronteras interior y exterior del sistema). Esta definición incluye:
- establecimiento claro de las fronteras físicas y funcionales del sistema y las interfases
con otros sistemas,
3. Usando el formato de la fig. C.1, identificar para cada componente los posibles modos
de falla con sus causas probables.
Durante este proceso identificar otras fallas con efectos e indicaciones muy similares.
5. Comprobar las acciones de diagnóstico necesarias para identificar los efectos dados
con un modo de falla particular.
7. Repetir los pasos (4), (5) y (6) para cada conjunto de condiciones que modifiquen los
efectos del modo de falla (*),
8. Cuando el proceso esté completo al nivel del sistema, identificar los efectos de la
falla al nivel de otros sistemas y la planta en su conjunto.
Los resultados del análisis se presentan en forma resumida en una tabla con el formato
que se ilustra en la figura C.1.
POSIBILIDADES DE
RECUPERACION
COMENTARIOS
METODO DE
DETECCION
DESCRIPCION
UBICACIÓN
SISTEMAS
MODO DE
SISTEMA
ESTADO
CODIGO
PLANTA
OTROS
FALLA
Fig. C.1. Formato de presentación del FMEA.
donde:
CAUSAS DE FALLA: se refiere a las causas posibles que pueden originar la falla del
componente.
EFECTOS: se refiere a los efectos que tiene la falla sobre el sistema a que pertenece el
componente, sobre otros sistemas con él relacionados y sobre la planta (p.e., disparo de
turbina, disparo del generador, ningún efecto apreciable, etc.).
El tratamiento de las fallas dependientes tiene una importancia crucial en los análisis
de fiabilidad de sistemas y Análisis Probabilistas de Seguridad (APS). Esto se debe a
que existen mecanismos que provocan la ocurrencia de múltiples fallas de
componentes producto de una única causa o varias que coexisten al mismo tiempo y de
no considerarse se obtendría como consecuencia una subestimación de los resultados
cuantitativos del análisis y por lo tanto una caracterización erróneamente optimista de
la disponibilidad de los sistemas y de la seguridad de la instalación.
Las fallas dependientes son el resultado de la coexistencia de dos factores: uno que
proporciona la susceptibilidad del elemento a la falla (causa raíz) y un mecanismo de
acoplamiento que crea las condiciones de fallas múltiples de componentes. De acuerdo
con la estrategia de defensa incorporada en el proyecto del sistema puede
considerarse posible o no la ocurrencia de la falla dependiente.
Atendiendo a estas cuestiones existen tres direcciones sobre las que se enfoca el
análisis de las fallas dependientes:
Ingeniería Operación No
(E) (O) Indentificadas
Limitac. en
el Diseño Interferenc.
Fuentes
Químicas
b) Mecanismo de acoplamiento entre fallas individuales.
Equipamiento ubicado dentro del mismo local, dentro de las mismas barreras
contra incendio, contra inundaciones o contra impacto de objetos. (Proximidad
espacial).
c) Estrategia defensiva.
Entre las medidas que pueden tomarse contra este tipo de fallas están:
- Establecimiento de barreras.
- Control de la calidad.
- Redundancia.
AND
OR OR
10- J. Rivero, J. Salomón, A. Torres, M. Perdomo. El programa ARCON 4.1 para análisis
probabilista de seguridad de nivel I. Memorias del II Congreso Regional de ARCAL. México,
1993.
12- R. W. Randall. FTAP: Computer Aided Fault Tree Analysis. Operational Research Center,
University of California, Berkeley, ORC 78-14, 1978.
14- R. Nakai, Y. Kani. A Living PSA System LIPSAS for an LMFBR. Power Reactor and Nuclear
Fuel Development Corporation. Narita, O-arai,Ibaraki,311-13. Japan, 1991.
15- S. Haddad, S. Hirschberg. PSA in the Nuclear and Process Industry: Opportunities for
Interchange of Experience. International Atomic Energy Agency (IAEA). Vienna, Austria, 1991.
16- GDA/APS. Grupo de desarrollo y aplicaciones de APS. Manual de Usuario del Código ARCON
versión docente. Cuba, 1993.
17- STI/PUB/759. IAEA, Safety Aspects of the Ageing and Maintenance of Nuclear Power Plants.
Viena, 1988.
21- Workshop "PSA based optimization of tasks and procedures in NPP operation", Mexico, 1993.
23- Mc Cormick. Reliability and risk analysis. Methods and nuclear power applications. 1983.
24- 24-IAEA-TECDOC-590. Case study on the use of PSA methods: Determinig safety importance
of systems and components at nuclear power plants. April, 1991.
25- IAEA-TECDOC-508. Survey of Ranges of Component Reliability Data for Use in Probabilistic
Safety Assessment. IAEA, Vienna, 1989.
26- IAEA Safety Series No. 50-P-4. Procedures for Conducting Probabilistic Safety Assessment of
Nuclear Power Plants. IAEA, 1992.
27- NUREG/CR-4780. Procedures for Treating Common Cause Failures in Safety and Reliability
Studies. USNRC, 1988.
29- Castillo Guilarte, Manuel. Sistematización del Departamento Técnico de Continuidad Absoluta,
Caracas, 1981, pág. 92
30- Estava Moreno, Nicolás. Mantenimiento y Subdesarrollo, Caracas, Editorial Principios, pág.
233.
31- Foster, Caxton. Real Time Programming. Philippines, Editorial Addiso-Wesley, Publishing
Company, 1981, pág. 190.
32- Glass, Robert y Noiseux, Rolan. Software Maintenance Guidebook, New Jersey, Editorial
Prentice-Hall Inc., 1981, pág. 193.
33- Goldeman, S.A. y Slattery, T.B., Maintainability: A mayor element of System Effectiveness,
Newe York, Editorial John Wiley & Sons Inc., 1964, pág. 282.
34- Gumbel, Emil Julius, Statistics of Extremes, 3ra. Ed., Editorial Columbia University Press,
1066, pág. 375.
35- Jelen, F.C., Const and Optimization Engineering, New York, Editorial Mc-Graw Hill Book
Company, 1970, pág. 490
38- Bain, Lee y Antle, Charles, Estimation of Parameters in the Weibull Distribution,
Technometrics, Vol. 9, No. 4, Nov. 1967, págs. 621-627.
39- Beichelt, F. Y Fisher, K., On a basic Equation of Reliability Theory, Microelectronics Reliability,
Vol.`19, No. 1979, págs. 367-369.
40- Bosch, G., Model for Failure Rate Curves, Microelectronics Reliability, Vol.`19, No. 1979, págs.
579-588.
41- Cohen, Clifford A., Maximum Likelihood Estimation in the Weibull Distribution based on
Censored and on Complete Data, Technometrics, Vol. 7, No. 4, Nov. 1965, págs. 579-588
42- Finley, Howard, Total Life Cycle Costs of Plant and Equipment, Canadian Society for Chemical
Engineering, 20th Conference, Paper 65, Oct. 1970.
44- Finley, Howard, High Technology Maintenance Management, National Petroleum Refiners
Association, Atlanta, Sept. 1976.
45- Johnson, L.G., Statistical Treatment of Failure Experiments, Transactions of the 22nd Technical
Conference of Quality Control., págs. 113-140.
46- Latour, P.R., On-Line Computer Optimization: What is it and where to do it, Hydrocarbon
Processing, Jun. 1979, págs. 73-82.
48- Qureisi, A.S., The Discrimination between two Weibull Processes, Technometrics, Vol. 6, No.1
Feb, 1964, págs. 57-75.
49- Redding, J.H. y Maynard, H.B., Can a Computer Reduce your Maintenance?, Hydrocarbon
Processing, January 1980, págs. 78-91.
50- Trotter, J.A., Reduce Maintenance Costs with Computers, Hydrocarbon Processing, January
1979, págs. 133-140.