Está en la página 1de 32

Pontificia Universidad Catlica de Valparaso Renato Allende Olivares

Instituto de Estadstica Humberto Villalobos Torres


i
ANEXO A: ORGANIZACIN DE DATOS EN INTERVALOS DE
DISTINTA AMPLITUD

Los siguientes datos corresponden a los ingresos mensuales de pesos de una
muestra de profesionales que se desempean laboralmente en la ciudad de Santiago.

Ingresos (pesos)
8800000 230000 760000 790000 700000 285000 690000 680000
5900000 280000 790000 750000 640000 350000 660000 280000
6200000 360000 840000 650000 250000 1750000 260000 900000
5500000 210000 850000 1420000 330000 1700000 820000 220000
7300000 380000 1150000 2130000 280000 995000 320000 770000
6900000 350000 1450000 780000 280000 630000 342000 750000
4900000 270000 240000 1800000 350000 1300000 790000 680000
1750000 1720000 202000 1450000 250000 780000 640000 650000
1800000 1700000 260000 490000 380000 320000 250000 190000
1600000 360000 270000 380000 280000 270000 770000 195000
2000000 1600000 298000 1600000 270000 250000 280000 850000
2160000 1300000 1900000 1700000 1200000 360000 250000 375000
1900000 1000000 900000 1900000 740000 710000 850000 330000
1600000 1000000 700000 775000 770000 660000 790000 320000
1700000 1300000 1100000 990000 870000 1150000 670000 800000
1700000 1450000 730000 670000 780000 660000 890000 360000
2200000 1100000 1224700 680000 780000 720000 1100000 1050000
663000 280000 870000 1100000 670000 950000 940000 690000
790000 1200000 1000000 1170000 840000 875000 1000000 680000
650000 955000 1100000 650000 870000 691300 960000 980000
930000 1000000 1200000 835000 120000 978000 1910000 1800000
890000 420000 270000 748000 327000 370000 340000 360000
2300000 835000 1010000 1160000 770000 990000 1500000 640000
1800000 814000 1300000 640000 2390000 1650000 1830000 780000
320000 752000 725000 950000 1500000 1600000 1900000 1610000


I. Construccin de la Tabla de Frecuencia

1. Rango de la Muestra (R
M
):

Mximo {x
i
} Mnimo {x
i
} = 8800000 120000 = 8680000

2. N de Clases (K):

1 + 3.322
x
log (n) = 1 + 3.322
x
log (200) 8.66 (Impar cercano 9)

R
M
+ 100 8680000 + 100
3. Amplitud (a) =
11
=
11
789100
Pontificia Universidad Catlica de Valparaso Renato Allende Olivares
Instituto de Estadstica Humberto Villalobos Torres
ii
4. Rango de la Tabla (R
T
): K
x
a = 11
x
789100 = 8680100

5. Diferencia (d) = R
T
- R
M
= 8680100 8680000 = 100

6. Clculo del Lmite Inferior de la primera clase (LI
1
) y el Lmite Superior de la
primera clase (LS
1
):

d
LI
1
= Mnimo {x
i
}
2
= 120000 50 = 119950

LS
1
= LI
1
+ a = 119950 + 789100 = 909050


Tabla de Frecuencias Relativas y Absolutas

Frecuencias Frecuencias Acumuladas
Ingresos (pesos)
Marca de
Clase Absoluta Relativa Absoluta Relativa
| 119950 909050 |
514500 121 121/200 121 121/200
| 909050 1698150 |
1303600 48 48/200 169 169/200
| 1698150 2487250 |
2092700 24 24/200 193 193/200
| 2487250 3276350 |
2881800 0 0 193 193/200
| 3276350 4065450 |
3670900 0 0 193 193/200
| 4065450 4854550 |
4460000 0 0 193 193/200
| 4854550 5643650 |
5249100 2 2/200 195 195/200
| 5643650 6432750 |
6038200 2 2/200 197 197/200
| 6432750 7221850 |
6827300 1 1/200 198 198/200
| 7221850 8010950 |
7616400 1 1/200 199 199/200
| 8010950 8800050 |
8405500 1 1/200 200 200/200


Como se puede apreciar un alto porcentaje de las clases de la tabla no contiene
elementos asociados, razn por la cual, la organizacin propuesta no muestra mayor
aporte al anlisis de los datos. En sta circunstancias, es recomendable utilizar tablas
de frecuencia de distinta amplitud, cuyo principal efecto en la grfica del histograma
de frecuencia, cuyas barras se ajustan de acuerdo a la amplitud de la clase.

La bibliografa recomienda que cuando una clase posee un porcentaje
alrededor del cuatro por ciento de la poblacin, un porcentaje arbitrario y discutible,
la clase debe ser anexada a la clase adyacente con menor frecuencia. En caso de que
el nmero de clases se reduzca demasiado (menos de cinco clases), tambin es
recomendable que las clases con mayor frecuencia sea divididas.
Pontificia Universidad Catlica de Valparaso Renato Allende Olivares
Instituto de Estadstica Humberto Villalobos Torres
iii
Tabla de Frecuencias Relativas y Absolutas Ajustadas

Frecuencias Frecuencias Acumuladas
Ingresos (pesos)
Marca de
Clase Absoluta Relativa Absoluta Relativa
| 119950 514500 |
317225 53 53/200 53 53/200
| 514500 909050 |
711775 68 68/200 121 121/200
| 909050 1303600 |
1106325 35 35/200 156 156/200
| 1303600 1698150 |
1500875 13 13/200 169 169/200
| 1698150 2092700 |
1895425 18 19/200 188 188/200
| 2092700 2487250 |
2289975 6 5/200 193 193/200
| 2487250 8800050 |
5643650 7 7/200 200 200/200


Ajustes para el Histograma de Frecuencias


Ingresos (pesos)
Amplitud (a
i
)
f
i
f
i
/ a
i
( f
i
/ a
i
) / f
i
/ a
i
| 119950 514500 |
394550 0,265 0,000000672 0,274
| 514500 909050 |
394550 0,340 0,000000862 0,352
| 909050 1303600 |
394550 0,175 0,000000444 0,181
| 1303600 1698150 |
394550 0,065 0,000000165 0,067
| 1698150 2092700 |
394550 0,090 0,000000241 0,098
| 2092700 2487250 |
394550 0,003 0,000000063 0,026
| 2487250 8800050 |
6312800 0,035 0,000000006 0,002



Pontificia Universidad Catlica de Valparaso Renato Allende Olivares
Instituto de Estadstica Humberto Villalobos Torres
iv
ANEXO B: EXACTITUD Y PRECISIN ESTRATIFICACIN Y
OTROS TPICOS


I.- EXACTITUD Y PRECISIN

Al recopilar datos, la cantidad de cifras de stos estar en funcin del uso que
se le piense dar. Por ejemplo al recopilar datos sobre la vida til de focos de luz, es
aceptable registrar un valor de 995,6 horas; sin embargo, registrar un valor de
995,632 horas resulta excesivamente exacto pero innecesario. Asimismo la
especificacin de una llave establece como lmite inferior 9,52 mm. (0,375 pulgadas)
y un lmite superior de 9,58 mm. (0,77 pulgadas); al recolectar datos se deben
considerar hasta al 0,001 mm. ms cercano y redondearlo al valor de 0,01 ms
cercano. En general, cuantas ms cifras haya a la derecha del punto decimal, ms
complejo deber ser el instrumento de medicin utilizado.

En muchas ocasiones no es posible tener mediciones fidedignas debido a
problemas de diversa ndole propios de los datos que se estn analizando, por
ejemplo, en el caso de utilizar instrumentos de medicin mecnicos: stos se pueden
descalibrar (por uso y falta de control); mal manejo de los aparatos; inadecuada
instalacin de stos, etc. Mayor es el problema cuando el instrumento de medicin
depende necesariamente de criterios o factores humanos, pues la subjetividad propia
del ser siempre afecta las mediciones.

En este sentido, en la toma de datos se deben tener presentes dos conceptos
bsicos importantes y diferentes, que son la exactitud y precisin de la medicin.
Particularmente cuando la poblacin en estudio esta claramente estratificada, stos
conceptos son de gran utilidad en la comparacin de los estratos. La exactitud, esta
relacionada con el grado de cercana que tienen las mediciones con respecto a un
valor objetivo que no necesariamente debe ser el promedio, aunque sea este ltimo
una buena medida para medir la exactitud del estrato. La precisin de las mediciones
esta relacionada con el grado de dispersin presente en los datos recopilados. Estos
conceptos se pueden apreciar esquemticamente en la siguiente figura.

De estos conceptos se deben desprender dos aspectos importantes. El primero
es que no se puede hablar de exactitud y precisin en datos que no sean
Pontificia Universidad Catlica de Valparaso Renato Allende Olivares
Instituto de Estadstica Humberto Villalobos Torres
v
cuantitativos. Si bien es cierto en el pasado se definieron medidas como la desviacin
modal, no es sensato determinar sta en datos ordinales o nominales, pues las
caractersticas que cumplen estos datos no son de distancia, por tanto difcilmente se
podra hablar de dispersin.

El segundo, es que cuando se habla de la precisin en las mediciones, es decir,
la dispersin de presente stas, pero dispersin respecto a que? comnmente la
varianza es una buena medida, sin embargo, dado que se est en una poblacin
estratificada, no sera extrao en ningn caso que se obtengan promedios distintos en
cada estrato, por lo tanto si la dispersin es distinta en cada estrato, no habra de
extraarse que la varianza tambin sea distinta en cada estrato. En este sentido una
medida de variabilidad de gran uso y utilidad en la comparacin de poblaciones o
subpoblaciones en el caso de estratos, est dada por el coeficiente de variacin (CV),
que indica la magnitud relativa de la desviacin estndar con respecto a la media de la
distribucin. La frmula de clculo se expresa por:

Poblacin CV =

Muestra CV =
x
s


AP LI CACI N 1 : Para 2 acciones de empresas de la industria electrnica, el
precio promedio de cierre en el mercado de valores durante un mes fue, para la accin
A, de $15.000, con desviacin estndar de $500. Para la accin B, el precio promedio
fue de $5.000, con desviacin estndar de $300. Haciendo una comparacin absoluta
result ser superior la variabilidad en el precio de la accin A, debido a que muestra
una mayor desviacin estndar. Pero con respecto al nivel de precios, deben
compararse los respectivos coeficientes de variacin:

CV (A) =
15000
500
= 0,033 y CV(B) =
5000
300
= 0,060

Puede concluirse que el precio de la accin B ha sido casi 2 veces ms
variable que la accin A (entonces ms riesgosa?).

Nota: El coeficiente de variacin permite comparar poblaciones aunque estn en
distintas unidades.


Sin embargo en muchas ocasiones se ha mencionado que la media como la
desviacin estndar no son buenos indicadores de tendencia central y dispersin, pues
ante la presencia de datos extremes estos son fuertemente influenciados. En estas
situaciones es til, un indicador resistente (robusto) a la presencia de datos extremos
conocido como coeficiente de variacin robusto (CVR), el cual se conforma a traves
de los cuarteles uno y tres, y es representados por:

CVR =
3 1
3 1
Q Q
Q Q

+

Pontificia Universidad Catlica de Valparaso Renato Allende Olivares
Instituto de Estadstica Humberto Villalobos Torres
vi
Este indicador en muchas ocasiones requerido para la comparacin de la
variabilidad de los datos en el centro de estos, dado que la presencia de datos
extremadamente grandes o pequeos, se encuentran en los extremos y no son
capturados por los cuarteles centrales.

AP LI CACI N 2 : Se toman dos muestras de materiales fabricados con tipos
distintos de acero para analizar la resistencia a la ruptura. Los siguientes grficos
resumen los tiempos mximos que soportan dichos materiales antes de fragmentarse,
cuando son sometidos a la tensin:

Acero Tipo I
0,10
0,20
0,30
0,25
0,15
0,0
0,1
0,2
0,3
0,4
0,5
0 - 4 4 - 8 8 - 12 12 - 16 16 - 20
Resitencia [ua]

Acero Tipo II
0,10
0,50
0,25
0,10
0,05
0,0
0,1
0,2
0,3
0,4
0,5
0 - 4 4 - 8 8 - 12 12 - 16 16 - 20
Resistencia [ua]


Claramente se puede apreciar que la distribucin de los datos dentro del rango
de la tabla no es distinta para ambos tipos de acero, es ms se puede observar una
clara simetra positiva en el acero tipo 2. Los clculos de las medidas utilizadas para
el coeficiente de variacin y el coeficiente de variacin robusto son:


1
10, 60 x = s
1
= 4,779 CV
1
= 45,08%

2
8, 00 x = s
2
= 3,899 CV
2
= 48,74%


11
Q = 7,00
31
Q = 14,40 CVR
1
= 34,58%

12
Q = 5,20
32
Q = 10,40 CVR
2
= 33,33%

Claramente se puede apreciar que la presencia de los datos extremos afectan la
comparacin de la variabilidad y variabilidad relativa, al analizar la dispersin de
ambos tipos de acero, incluso al tener resultados contradictorios entre el CV y el
CVR, determinado posteriormente.


En muchas ocasiones se desea obtener la precisin mediante la dispersin de
las mediciones respecto a un valor objetivo, particularmente en control de calidad no
es de inters comparar los resultados de las mediciones respecto a las tradiciones
medidas de tendencia central, sino respecto a un estndar ofrecido por especificacin,
por ejemplo, peso neto de un producto. Una medida de variabilidad directa para la
comparacin de las poblaciones o estratos en cuestin respecto a este valor objetivo,
Pontificia Universidad Catlica de Valparaso Renato Allende Olivares
Instituto de Estadstica Humberto Villalobos Torres
vii
generalmente conocido como un valor target, es representada por la desviacin
objetivo, la cual es expresada por:


2
t
S =

n
i
i
n
t x
1
2
) (
t = valor Objetivo

Se utiliza con mayor frecuencia la raz cuadrada de sta, representada por
t
S .

AP LI CACI N 3 : A fin de controlar la calidad de un particular tipo de hilo
producido en serie, los ingenieros de control de calidad toman una muestras al azar de
tamao 7, correspondientes a cada uno de los cuatro turnos que los operarios realizan
y se mide la resistencia a la tensin [en libras], cuyos datos se muestran a
continuacin. Se tiene que la media por especificaciones debe ser de 48.01 [libras].

Observacin 1 2 3 4 5 6 7
Turno 1 44 46 48 52 49 47 48
Turno 2 44 43 42 43 46 45 44
Turno 3 42 48 46 53 54 49 44
Turno 4 51 52 48 49 47 47 50


En la siguiente tabla se muestran algunas medidas de resumen de cada turno
asociado al problema antes expuesto. En sta sin duda alguna se puede observar que
la exactitud del turno 3 es el ms adecuado. Totalmente discutible sera discutir la
solucin al problema de la inexactitud de los otros turnos, algunos pueden dar
preferencia en mejorar la exactitud del turno 2 por estar ste aberrantemente alejado
del valor objetivo. Sin embargo, otros preferiran mejorar en primera instancia los
turno ms cercanos, pero cual, el turno 1 que se encuentra ms cerca y no cumple con
los requisitos de resistencia, por lo cul no es un buen producto, o bien el turno 4 que
se encuentra ms alejado que el turno 1 del valor objetivo, pero con la caracterstica
especial que ste resiste ms de lo especificado (con un respectivo costo de por
medio).

Observacin Media
Desviacin
estndar
Coeficiente de
variacin
t
S
Turno 1 47,71 2,50 5,23% 2,33
Turno 2 43,86 1,35 3,07% 4,34
Turno 3 48,00 4,43 9,24% 4,11
Turno 4 49,14 1,95 3,97% 2,13


Ahora bien cuando se entra a discutir la precisin de la resistencia de los hilos
el problema es ms agudo, pues el coeficiente de variacin nos presenta una
alternativa bastante distinta de
t
S . Luego cul turno es el ms preocupante y el
Pontificia Universidad Catlica de Valparaso Renato Allende Olivares
Instituto de Estadstica Humberto Villalobos Torres
viii
menos preocupante? la respuesta depende de los requerimientos de importancia que
asigne el encargado de control de calidad (escala de necesidades de ste).


II.- MEDIA Y VARIANZA PONDERADA

Como se observ en los casos anteriores cuando la variable de estudio est
claramente dividida en estratos, y en cada uno de stos se pueden obtener medidas de
tendencia central y dispersin (exactitud y precisin), o bien cuando se tiene
informacin (medidas de resumen) slo de los estratos por separado y no se cuenta
con los datos (ver figura), buenas medidas de resumen de la poblacin total que se
obtienen de resmenes anteriores de la poblacin (medias y desviaciones estndar de
cada estrato) son la media y varianza total, tambin llamadas media y varianza
ponderada.



1.- La Media Ponderada: La media ponderada o promedio ponderado es una
media aritmtica, en la cual se considera a cada uno de los valores de acuerdo
con su importancia en el grupo. Las frmulas para la media ponderada
poblacional y muestral son idnticas y estn dadas por:

=
=

=
h
1 i
i
h
1 i
i i
p
p
p

=
=
=
h
i
i
h
i
i i
p
p
x p
x
1
1



Pontificia Universidad Catlica de Valparaso Renato Allende Olivares
Instituto de Estadstica Humberto Villalobos Torres
ix
donde la importancia del grupo en la poblacin total est dada por los pesos
expresados por p
i
, que generalmente se escogen de acuerdo al tamao del grupo.

AP LI CACI N 4 : En una compaa que maneja 4 productos, los mrgenes de
utilidad correspondientes a cada uno de ellos durante el ao fiscal anterior fueron:
Producto A, 4,2%; Producto B, 5,5%; producto C, 7,4%; y producto D, 10,1%.

El margen de utilidad promedio, no ponderado, es:

% ,
,
8 6
4
2 27
= =

Sin embargo, este promedio no ponderado es incorrecto porque se vendieron
cantidades distintas de los 4 productos.

Suponiendo los totales de ventas y margen de utilidad que aparecen en la
Tabla siguiente, se encuentra que el promedio ponderado describe en forma correcta
el promedio global.

Producto
Margen de
utilidades (%)
Ventas (p) pX
A 4,2 $ 30.000.000 $ 1.260.000
B 5,5 $ 20.000.000 $ 1.100.000
C 7,4 $ 5.000.000 $ 370.000
D 10,1 $ 3.000.000 $ 303.000

=
=

=
h
1 i
i
h
1 i
i i
p
p
p
=
3.033.000
5,2%
58.000.000
=

De manera anloga se puede obtener una ponderacin de acuerdo a las ventas
por producto, obtenindose idntico resultado.

Producto Margen de
utilidades (%)
Ventas (p) p
i

A 4,2 $ 30.000.000 0,5173
B 5,5 $ 20.000.000 0,3448
C 7,4 $ 5.000.000 0,0862
D 10,1 $ 3.000.000 0,0517


Si se consideran los datos del Aplicacin 3, donde la ponderacin de acuerdo
Pontificia Universidad Catlica de Valparaso Renato Allende Olivares
Instituto de Estadstica Humberto Villalobos Torres
x
a la muestra tomada en cada estrato se puede percibir que el promedio ponderado es
igual al promedio aritmtico de las cuatro medias de los turnos como se observa a
continuacin.

Estrato Tamao Muestra Ponderacin Media
Turno 1 7 7/28 47,71
Turno 2 7 7/28 43,86
Turno 3 7 7/28 48,00
Turno 4 7 7/28 49,14

=
=
4
1
4

i
i
x
x = 47,18 [Libras]

=
=
=
4
1
4
1


i
i
i
i i
p
p
x p
x =
1.00
47.18
= 47,18 [Libras]


2.- La Varianza Ponderada: La varianza ponderada es una varianza descompuesta
y ponderada, en la cual se considera a cada una de las medidas de dispersin de
los estratos de acuerdo con su importancia en el grupo, adems de una
descomposicin de la variabilidad debido a la variabilidad propia del estrato,
tambin llamada variabilidad dentro o Intra, y una variabilidad propia entre los
estratos, tambin llamada variabilidad entre o Inter. Las frmulas para la
varianza ponderada poblacional y muestral son idnticas y estn dadas por:


= =
+ =
h
i
p i i
h
i
i i p
p p
1
2
1
2 2
) (

= =
+ =
h
i
p i i
h
i
i i p
x x p s p S
1
2
1
2 2
) (

donde:


1
2

=

h
i
i i
p

=
h
i
i i
s p
1
2
= Representa la variabilidad Dentro.

=

h
i
p i i
p
1
2
) (

=

h
i
p i i
x x p
1
2
) ( = Representa la variabilidad Entre.


Por esta descomposicin de la variabilidad total, se pueden obtener los
porcentajes de variabilidad debido a la variabilidad propia de los estratos y a la
variabilidad propia de la estratificacin qu porcentaje debe ser el mayor? la
respuesta, depende del problema que se este estudiando.
Pontificia Universidad Catlica de Valparaso Renato Allende Olivares
Instituto de Estadstica Humberto Villalobos Torres
xi
Considerando las medidas de resumen del ejemplo 2 resistencia de los hilos
en libras se obtiene que el mayor aporte (en porcentaje) a la variabilidad esta dada
por la variabilidad propia de la resistencia de los hilos. sto es bueno o malo?

Estrato Tamao Muestra Ponderacin Media Varianzas
Turno 1 7 7/28 47,71 [2,50]
2

Turno 2 7 7/28 43,86 [1,35]
2

Turno 3 7 7/28 48,00 [4,43]
2

Turno 4 7 7/28 49,14 [1,95]
2



2
T
S = Dentro + Entre

2
T
S = 7,881 + 3,963

2
T
S = 11,844 [libras]
2


Dentro 66,5% Entre 33,5%


Ahora bien, si considerando las medidas de resumen del ejemplo 4 Margen
de utilidad y volumen de ventas para 4 productos se obtiene que el mayor aporte (en
porcentaje) a la variabilidad esta dada por la variabilidad propia del margen de
utilidad. sto es bueno o malo?, Es razonable?.

Producto
Margen de
utilidades (%)
Ventas (p) Varianza (%)
P
i

A 4,2 $ 30.000.000 4,02 0,5173
B 5,5 $ 20.000.000 5,20 0,3448
C 7,4 $ 5.000.000 6,85 0,0862
D 10,1 $ 3.000.000 9,08 0,0517


2
T
S = Dentro + Entre

2
T
S = 4,934 + 2,206

2
T
S = 7,140 [%]
2


Dentro 69,1% Entre 30,9%



III.- CAMBIOS DE ESCALA (VALORES ESTNDARIZADOS)

Otras de las tcnicas muy utilizadas en la comparacin de estratos est dada
por la determinacin de los valores estandarizados de la medida de tendencia central
utilizada para medir exactitud cada una de las poblaciones o subpoblaciones
Pontificia Universidad Catlica de Valparaso Renato Allende Olivares
Instituto de Estadstica Humberto Villalobos Torres
xii
(estratos). El objetivo de esta estandarizacin, es realizar un cambio de escala en las
medidas de resumen de cada estrato con el fin particular de medir y comparar la
exactitud y precisin de stos.

Se entender por estandarizacin a la transformacin que cumple con: restar a
cada medida de tendencia de una subpoblacin la media general y a esta diferencia
divide por la desviacin estndar general. Esta transformacin es expresada por:


s
x x
z
i
i

=

donde z
i
, representa la transformacin de la i-sima medida de tendencia (notar que se
utiliz el promedio, pero no tiene porque ser ste) respecto de la poblacin total.


AP LI CACI N 4 : Una importante multitienda est interesado en la demanda
anual de ciertos artefactos. Para esto se seleccionaron al azar algunos meses en tres
tiendas, en la cuales se obtuvo que la demanda mensual de los artefactos fueron:

Demanda Multitienda
1 2 3
40 60 77
45 75 43
50 65 70
55 95 115
60 69 83
70 65 136
65 67 127
65 100 76
75 86 42
75 79 45
80 67 91
100 71 49
90 73 37
95 90 43
85 91 120

Promedio 70,00 76,87 76,93
Desviacin 18,13 12,53 34,33
C.V. 25,90% 16,31% 44,62%
z
i
-0,1979 0,0975 0,1004





Pontificia Universidad Catlica de Valparaso Renato Allende Olivares
Instituto de Estadstica Humberto Villalobos Torres
xiii
ANEXO C: ESTIMACIN DE PARMETROS Y PRONSTICOS


I INTRODUCCIN


La estadstica tiene como uno de sus grandes objetivos describir y predecir
eventos del mundo real a travs de mtodos lo ms objetivos e imparciales posibles.
Con el fin de predecir, se plantean habitualmente expresiones matemticas
(ecuacin), que de alguna manera logren relacionar cantidades del mundo real en
expresiones medibles en el abstracto mundo de la matemtica.

Los anlisis de regresin, son modelos que cuentan con una expresin
matemtica sencilla que relaciona una variable de inters con otras, llamadas
variables explicativas, pero que adicionalmente agrega una componente estocstica
que explique las variaciones existentes entre las variables observadas y las esperadas
a travs del modelo matemtico propuesto, donde se deber encontrar la funcin
matemtica que ajuste de manera razonablemente bien a un conjunto de datos, a partir
de algunos mtodos de estimacin entre los que se destaca el de mnimos cuadrados.

Sus aplicaciones en la actualidad son de toda ndole, desde estimaciones de
resistencia en ingeniera, rentabilidades y consumos en administracin, hasta
pronsticos de fechas de nacimiento en la medicina, que proporcionan una adecuada
prediccin en la regin predeterminada por los datos asociados a la funcin de
pronstico

La palabra regresin parte en 1822, por Sir Francis Galton (1822 1911),
primo de Charles Darwin. Galton que estudiaba la eugenesia, trmino tambin
introducido por s mismo para definir el estudio de la mejora de la raza humana a
partir de los rasgos hereditarios.

Galton estudi la altura de los hijos con relacin a la altura de sus padres, y
prob que la altura de hijos altos regresaba hacia el promedio de la altura de la
poblacin a lo largo de sucesivas generaciones. En otras palabras, hijos de padres
extraordinariamente altos tendan a ser en promedio ms bajos que sus padres, e hijos
de padres muy bajos tendan a ser en promedio ms altos que sus padres. Galton, en
su estilo aristocrtico, la llam una regresin hacia la mediocridad.

Pontificia Universidad Catlica de Valparaso Renato Allende Olivares
Instituto de Estadstica Humberto Villalobos Torres
xiv
Con anterioridad a Galton, Legendre y Gauss, haba introducido el mtodo de
los mnimos cuadrados en 1805 utilizndolo para definir la longitud de un metro
como una diez millonsima parte del arco meridional, a datos astronmicos,
usualmente medidos en cantidades continuas tal como la posicin o magnitud de un
cuerpo celeste. Ellos definen los errores en una estimacin con el signo opuesto al
que generalmente se conocen, es decir &
i
=
i
Y

Y
i
, donde
i
Y

representa la estimacin
de la variable aleatoria Y
i
. Posteriormente, en 1809, Gauss introduce la distribucin
Normal con media cero y varianza constante para los errores, la cual en 1821
abandon, debido a que la propiedad importante del mtodo de mnimos cuadrados
no es que los datos provengan de una distribucin Normal, sino, de la suposicin de
varianza constante.

En la actualidad, el trmino de regresin se utiliza siempre que se busca
estudiar la explicacin de una variable en trminos de otras variables llamadas
explicativas, es decir, predecir una variable en funcin de otra(s), y no implica que se
est estudiando si se est produciendo una regresin a la media.

La idea consiste en establecer una relacin entre la variable explicada, y una o
ms variables explicativas. La variable a explicada acua nombres tales como:
variable predecida, variable dependiente; variable endgena, variable objetivo,
variable regresiva, mientras que respectivamente, las variables explicativas acuan
nombres tales como: variables predictoras, variables independientes; variables
exgenas, variables de control, variables regresoras.

Luego se establece una relacin funcional entre la variable endgena y la o las
variables exgenas, a la cual se le asigna una componente estocstica, de tal forma
que el modelo que explica la relacin es expresado por:

Modelo : Y
i
= f(x; ) + &
i
= + &
i
i = 1, ... , n,

donde:

Y
i
:= Variable respuesta, que se considera como una variable aleatoria
observable.
f(x; ) := Funcin conocida que representa la relacin entre el valor esperado de Y
i

y el correspondiente valor de x
i
.
&
i
:= Variable aleatoria no observable, cuyo valor esperado es cero y cuya
varianza es finita y constante.
Pontificia Universidad Catlica de Valparaso Renato Allende Olivares
Instituto de Estadstica Humberto Villalobos Torres
xv
La funcin f(x) caracteriza al problema de regresin, que est compuesta por
parmetros desconocidos y una o ms variables exgenas que es una variable
matemtica, es decir, una variable observable supuestamente sin error. Luego se
pueden distinguir los siguientes casos a partir de esta funcin:

1.- f(x; ) lineal en los parmetros.

2.- f(x; ) no es lineal en los parmetros.

En este caso se distinguen dos grupos:

2.1.- f(x) linealizable mediante alguna transformacin.
2.2.- f(x) no linealizable.


Si bien es cierto el uno central, es proporcionar una expresin matemtica que
relacione de la forma ms precisa posible a un conjunto de variables regresoras con
una variable de regresiva, no es posible establecer con certeza una relacin causa
efecto entre ambas, ya que esta relacin se encuentra ms all de alcance de los
anlisis de regresin.


Regresin Lineal Simple

Considere un experimento, en el cual se considera slo una variable
independiente, la cual trata de explicar una variable a predecir, que se encuentra
asociada a un mismo elemento, en este sentido se tiene el hecho de la relacin de dos
mediciones realizadas simultneamente a un elemento, que conforman dos variables
x e y para un rango de diferentes condiciones experimentales. Si se hacen n
mediciones, stas se pueden expresar por:

(x
i
, y
i
) con i = 1 , . . . , n ,

denota los correspondientes n pares ordenados de observaciones. Se construye un
modelo estadstico paramtrico para esta situacin, proponiendo una relacin
funcional f(x; ) entre x e y es considerada o se aproxima a una linealidad.

A menudo la variable x representa las condiciones experimentales, y la
variable y es la respuesta del experimento y corresponde a la variable dependiente,
Pontificia Universidad Catlica de Valparaso Renato Allende Olivares
Instituto de Estadstica Humberto Villalobos Torres
xvi
con los supuestos planteados anteriormente para el error . Se asume que y
i
son
observaciones de variables aleatorias independientes Y
i
. En contraste, los valores de x
i

son considerados constantes, no aleatorios, al menos en un primer desarrollo, la
variable x es denominada independiente o explicativa.

Como ya se mencion, el primer paso en el anlisis, es realizar un grfico de
dispersin de y versus x, si el grfico muestra una relacin lineal aproximada entre las
dos variables se puede considerar un modelo estadstico adecuado para esta relacin.
En este caso se estudia el modelo de regresin lineal clsico.




En esta situacin el modelo estadstico a utilizar est dado por:

Modelo : Y
i
= f(x) + &
i
= "
0
+ "
1
x
i
+ &
i
. i = 1, ... , n,

En estricto rigor se considera que las variables Y
i
, son variables aleatorias, que
para poder encontrar la relacin entre las variables se realiza un proceso de medicin
para logras establecer la relacin de las variables a travs de un conjunto de datos.


Pontificia Universidad Catlica de Valparaso Renato Allende Olivares
Instituto de Estadstica Humberto Villalobos Torres
xvii
Adems, es posible realizar supuestos distribucionales verificables
estadsticamente acerca de los
i
, en particular que poseen una distribucin Normal.
Que es la base para poder llegar a realizar inferencias respecto al modelo, sus
parmetros y sus predicciones. A partir de estos supuestos es posible visualizar a
partir del siguiente diagrama de dispersin estos conceptos.




Estimacin de Parmetros


El mtodo comnmente usado para la estimacin de parmetros en los
modelos de Regresin Lineal es denominado Mnimos Cuadrados Ordinarios
(MCO), aunque este mtodo coincide con la estimacin de los parmetros "
0
y "
1
del
modelo lineal a travs del mtodo de Mxima Verosimilitud (MV), que se basa en
supuestos distribucionales de la variable respuesta. Sin embargo, la estimacin de la
varianza 5
2
, de la variable respuesta, que para el caso de la MV es un estimador
sesgado, a travs de MCO se obtiene un estimador insesgado de sta.


Mnimos Cuadrados Ordinarios

Este es un mtodo descriptivo, que a partir de un modelo de Regresin Lineal
Simple de la forma:

Y
i
= "
0
+ "
1
x
i
+ &
i
(8.1)
Pontificia Universidad Catlica de Valparaso Renato Allende Olivares
Instituto de Estadstica Humberto Villalobos Torres
xviii
Se busca determinar los estimadores "
0
y "
1
que minimicen &
i
cuadrticos.
Esto se resuelve mediante las derivadas parciales, con respecto a cada parmetro, que
son igualadas a cero, es decir:

) (
2
i
g =

= =
=
n
i
i i
n
i
i
x y
1
2
1 0
1
2
) (

tal que:

=

=
0
1
2

n
i
i

=

n
i
i i
x y
1
1 0
) ( 2 , y =

=
1
1
2

n
i
i
i
n
i
i i
x x y ) ( 2
1
1 0

=


las soluciones para las ecuaciones normales son:


0 0
1
1
2
0
1
2
= =


= =

n
i
i
n
i
i
& &
y


las segundas derivadas de ) (
2
i
g son definidas negativas. Por lo tanto, los
estimadores MCO de
0
y
1
son:

( )( )
( )
"



1
1
2
1
=

=
=
=

y y x x
x x
S
S
i i
i
n
i
i
n
x y
x x


" "
0 1
= - y x

A travs de las estimaciones de mnimos cuadrados ordinarios se pueden tener
pronsticos de la variable respuesta, que slo garantizan la minimizacin la funcin
) (
2
i
g , que estar bien acodada por el recorrido de los datos. Sin embargo, estas
estimaciones pueden no ser las ms adecuadas, como tampoco que el modelo sea
adecuado para realizar buenos pronsticos, pues para lograr inferencias respecto a la
adecuidad del modelo, sus parmetros o sus pronsticos, son necesarios
distribuciones de probabilidad.
Pontificia Universidad Catlica de Valparaso Renato Allende Olivares
Instituto de Estadstica Humberto Villalobos Torres
xix
El modelo de regresin lineal ajustado a travs de los estimadores de mnimos
cuadrados ordinarios, mediante igualdades bsicas es posible escribirlo de forma
idntica por las siguiente ecuaciones de regresin ajustadas.


i i
x y
1 0

+ = (8.2)


i i
x x y y
1 1

+ =

) (

1
x x y y
i i
+ = (8.3)

La ecuacin (8.3), muestra la clara evidencia de la importancia del parmetro

1
en la ecuacin de regresin. Es decir, una estimacin
1
de muy cercana a cero,
implicara la poca relacin lineal entre la variable endgena y exgena.

Adems recordando conceptos bsicos de estadstica descriptiva en cuanto a
indicadores de asociacin lineal, se tiene que el coeficiente
1
posee una estrecha
relacin con el coeficiente de asociacin lineal de Pearson, como se visualiza a
continuacin:


1
2 2
1 1
( )( )
( ) ( )
n
i i
i
p
n n
i i
i i
y y x x
r
x x y y
=
= =

=


=
2
1 1
2 2 2
1 1 1
( ) ( )( )
( ) ( ) ( )
n n
i i i
i i
n n n
i i i
i i i
x x y y x x
x x y y x x
= =
= = =







2
1 1
2
2
2
1
1
( ) ( )( )
( )
( )
n n
i i i
i i
p
n
n
i
i
i
i
x x y y x x
r
y y
x x
= =
=
=

=
| |

|
|
\ .

=
=

=
n
i
i
n
i
i
y y
x x
1
2
1
2
1
) (
) (

y
x
s
s
=
1
,

de esta relacin se obtiene que el estimador del coeficiente
1
se escribe a travs del
estimador del coeficiente de asociacin lineal de Pearson como:


p
r =
y
x
s
s
1


x
y
p
s
s
r =
1



) ( x x
s
s
r y y
i
y
x
p i
+ = (3.4)
Pontificia Universidad Catlica de Valparaso Renato Allende Olivares
Instituto de Estadstica Humberto Villalobos Torres
xx
A travs de las ecuaciones de regresin ajustadas (3.2), (3.3) y (3.4) se
obtienen idnticas estimaciones, que adems ayudarn, cuando se realicen supuestos
distribucionales, para realizar inferencias respecto al modelo a travs del coeficiente

1
o la verdadera relacin lineal .

APLICACIN 3.1: La Gerencia de Airlines S.A., una aerolnea transportadora
considera que existe una relacin directa entre los gastos publicitarios, en miles de
US$ (P [M/US$]), y el nmero de pasajeros, en miles de pasajeros (Q [M/US$]), que
escogen viajar con Airlines S.A. Para determinar si esta relacin existe.

P [M/US$] 10 12 8 17 10 15 10 14 19 10 11 13 16 10 12
Q [M/US$] 15 17 13 23 16 21 14 20 24 17 16 18 23 15 16

A travs de un diagrama de dispersin, se puede visualizar el tipo de relacin
que existe entre ambas variables, como se observa a continuacin:
Modelo Propuesto: Y
i
=
0
+
1
x
i
+ &
i


S
xx
=


2
) ( x x
i
= 137,7333 S
yy
=


2
) ( y y
i
= 171,7333

S
xy
=

) )( ( x x y y
i i
= 148,9333 y = 17,8667 x = 12,4667
Con los datos se puede obtener:

1
=
xx
xy
S
S
= 1,0813
0
= y - Bx = 4,3865
p
r =
xx yy
xy
S S
S
= 0,9684

Luego los modelos de regresin ajustados estaran dados por:


i
y = 4,3865 + 1,0813 x
i
(8.2)


i
y = 17,8667 + 1,0813 (x
i
12, 4667) (8.3)
Diagrama de Dispersin
10
14
18
22
26
7 9 11 13 15 17 19 21
P[M/US$]
Q
[
M
/
U
S
$
]
Pontificia Universidad Catlica de Valparaso Renato Allende Olivares
Instituto de Estadstica Humberto Villalobos Torres
xxi


i
y = 17,8667 + 0,9684
7333 , 137
7333 , 171
(x
i
12, 4667) (8.4)

Con cualquiera de las ecuaciones anteriores se puede visualizar que para un
gasto en publicidad de 9 [M/US$], se tendra una estimacin del el nmero de
pasajeros que viajara de:


i
y = 17,8667 + 1,0813 (9 12, 4667) = 14,1182 US$.


APLICACIN 3.2: Los datos a continuacin representan una muestra reducida de
los tiempos de transporte y el porcentaje de capacidad no utilizada por camiones de
una empresa de transporte.

% de Capacidad 7,75 18,75 11,15 14,95 10,85 8,05 14,10 12,55
Transporte 60,505 1,315 15,055 2,145 17,050 53,145 1,495 5,050


% de Capacidad 13,60 8,35 15,55 16,70 22,45 9,10 11,65
Transporte 7,550 41,470 0,450 0,250 3,745 20,310 4,595

A travs de un diagrama de dispersin, se puede visualizar el tipo de relacin
que existe entre ambas variables, como se observa a continuacin:

Modelo Propuesto: Y
i
= exp { ("
0
+ "
1
x
i
+ &
i
)}

ln (Y
i
) = ("
0
+ "
1
x
i
+ &
i
)

ln
|
|
.
|

\
|
i
Y
1
= "
0
+ "
1
X
i
+ &
i



*
i
Y = "
0
+ "
1
X
i
+ &
i

*
i
Y = ln
|
|
.
|

\
|
i
Y
1

Con los datos se puede obtener:
Diagrama de Dispersin
0
20
40
60
80
7 9 11 13 15 17 19 21 23
% de Capacidad no Utilizada
T
i
e
m
p
o
s

d
e

T
r
a
n
s
p
o
r
t
e
Pontificia Universidad Catlica de Valparaso Renato Allende Olivares
Instituto de Estadstica Humberto Villalobos Torres
xxii

=
=

=
15
1
15
1
2 2
* *
1

i
i
i
i i
x n x
x y n x y
=
2
) 0367 , 13 ( 15 1975 , 2796
0367 , 13 7400 , 1 15 1626 , 265




=
8773 , 246
0986 , 75
= 0,304

x
*
i 1 0

= = 1,7400 0,30413,0367 = 5,706




con los datos se puede obtener la ecuacin de regresin ajustada entre el porcentaje
de capacidad no utilizada y el logaritmo del inverso del tiempo de transporte, la cual
est dada por:


*

i
y
i
x 0,304 706 , 5 + =


Adems, a travs la estimacin del coeficiente de
1
se puede obtener el grado
de asociacin lineal entre el porcentaje de capacidad no utilizada y el logaritmo del
inverso del tiempo de transporte, el cul est dado por:


p
r =
y
x
s
s
1

= 0,304
8356 , 2
6341 , 17
= 0,7581


Luego con la ecuacin de regresin ajustada se puede realizar una estimacin
para el logaritmo del inverso del tiempo de transporte, cuando se tiene el porcentaje
de capacidad no utilizada del camin del 19,5%, la cual est dada por:

= 5,706 + 0,30419,5 = 0,222

luego,


*
i
Y = ln
|
|
.
|

\
|
i
Y
1
= 0,222 = y exp{ 0,222} = 0,80 [u.t.]
Pontificia Universidad Catlica de Valparaso Renato Allende Olivares
Instituto de Estadstica Humberto Villalobos Torres
xxiii
APLICACIN 3.3: La rentabilidad promedio semanal, de la accin XY en el tiempo,
est dada para las ltimas 16 semanas por los valores expresados por la Tabla 1.

Tiempo 1988 1989 1990 1991 1992 1993 1994 1995
Rentabilidad 6,0 7,1 10,7 7,0 11,9 13,5 9,2 15,8


Tiempo 1996 1997 1998 1999 2000 2001 2002 2003
Rentabilidad 17,8 13,2 21,4 17,0 25,1 21,4 27,8 16,6

A travs de un diagrama de dispersin, se puede visualizar el tipo de relacin
que existe entre ambas variables, sin embargo, como se observa en la grfica de
dispersin los tiempos son transformados a la escala 1, , n, particularmente para
las estimaciones de los parmetros:

Modelo Propuesto: Y
i
=
0
+
1
x
i
+ &
i


=
=

=
15
1
15
1
2 2
* *
1

i
i
i
i i
x n x
x y n x y
=
2
) 5 , 8 ( 16 1496
094 , 15 5 , 8 16 7 , 2451


=
00 , 340
92 , 398
= 1,1733
x
1 0

= = 15,094 1,1733
x
8,5 = 7,767

con los datos se puede obtener la ecuacin de regresin ajustada a la rentabilidad de
la accin en el tiempo, la cual est dada por:


i
y
i
x 1,1733 767 , 7 + =

Luego si se desea estima la rentabilidad de la accin para el ao 2004, se debe
tener especial cuidad en el reemplazo del ao codificado (17) en la ecuacin anterior,
es decir:
17
y 7 1 1,1733 767 , 7 + = = 27,71%.

Diagrama de Dispersin
0
10
20
30
0 2 4 6 8 10 12 14 16 18
Tiempo
R
e
n
t
a
b
i
l
i
d
a
d
Pontificia Universidad Catlica de Valparaso Renato Allende Olivares
Instituto de Estadstica Humberto Villalobos Torres
xxiv
APLICACIN 3.4: El porcentaje de humedad en la Mortadela es una medida de
calidad, cantidad y estabilidad del alimento y tiene una importancia tanto econmica,
como de procesamiento de ste. El ingeniero encargado del control de calidad tiene la
creencia de que este indicador se encuentra estrechamente relacionado con el
porcentaje de lpidos. La siguiente tabla muestra los anlisis qumicos de una muestra
de 120 unidades.

% de Humedad % de Lpidos (marca de clase)
(marca de clase) 17,12 18,76 20,4 22,04 23,68
60,69 --- --- --- 2 4
61,82 --- --- --- 6 1
62,95 --- 1 2 8 9
64,08 --- 6 34 5 1
65,21 2 2 12 --- ---
66,34 --- 9 --- --- ---
67,47 15 1 --- --- ---

En el caso de datos agrupados, no es posible la realizacin de una grfica de
dispersin, por lo tanto slo por la configuracin de los datos en la tabla conjunta se
propone y ajusta un modelo de pronstico.

Modelo Propuesto: Y
i
=
0
+
1
x
i
+ &
i


60,69 6+ ... +67,47 16
X =
120

=64,36
120
15 68 , 23 ... 17 12 , 17
Y
+ +
= = 20,37


2
2 2
2
36 , 64
120
16 47 , 67 ... 6 69 , 60

+ +
=
x
S = 3,34

2
2 2
2
37 , 20
120
15 68 , 23 ... 17 12 , 17

+ +
=
y
S = 3,87


rk
ij
j i ij
m m f =
120
69 , 60 68 , 23 4 ... 47 , 67 12 , 17 15 21 , 65 12 , 17 2 + + +
= 1308,33


2
1308,33 64, 36 20, 37
=
3,87 3,34
p
r

= 0,746
2
2
2
+ ( )
x
p i
y
S
y y r x x
S
=

Luego si se desea estimar el % de humedad en la mortadela cuando el % de
lpidos es de 23,58%, entonces se tiene que: 61, 78% y = .
Pontificia Universidad Catlica de Valparaso Renato Allende Olivares
Instituto de Estadstica Humberto Villalobos Torres
xxv
ANEXO D: INTRODUCIN A CONFIABILIDAD DE SISTEMAS


INTRODUCCIN

Cada producto tcnico se caracteriza por su calidad, eficiencia,
durabilidad, costo, versatilidad y confiabilidad, pues en todo proceso de produccin
estar sujeto a fallas y todo diseo ser susceptible de mejoras, siendo la seguridad de
que el producto cumpla los requerimientos mnimos de durabilidad (confiabilidad)
uno de ellos.

La confiabilidad es la caracterstica que nos inquieta de todo producto
por simple que ste sea, en la medida que nos interese que cumpla su labor y cun
satisfactoriamente la realice. La confiabilidad de un producto puede ser observada a
travs de ste como un todo, la cul se considera como sistema simple de un
componente, o bien, puede ser observada por la interaccin de las confiabilidades de
los diversos componentes que componen el producto, la cul se considera como
sistema compuesto.

La aplicacin del concepto confiabilidad en la actividad humana, es
una realidad inmemorial, sin embargo desde un punto de vista ingenierl se constituye
como un nuevo factor de inters desde la revolucin industrial en la fabricacin de un
producto, aunque su mayor auge lo logra a partir de la Segunda Guerra Mundial, por
la necesidad urgente de la fabricacin de instrumentos blicos de alta durabilidad en
optimo desempeo.

Cuantitativamente podemos pensar la cantidad de confiabilidad como
alta si el artculo cumple con su funcin exitosamente y baja si falla. Luego, la
medicin de confiabilidad sera anloga a la de xito, contraria a la de fracaso, de la
actividad realizada por el sistema.

Histricamente, la relacin entre mediciones de xito y confiabilidad
se fue desarrollando de la siguiente manera: un producto fabricado, como por
ejemplo, el motor de un avin, entendiendo a ste como un sistema simple. La
confiabilidad se meda inicialmente observando que motor funcionaba mejor
mediante pruebas o ensayos. No obstante, con el tiempo hubo mayor nmero de
motores activos por suficiente perodo como para tener datos numricos de motores
fallidos en un instante de tiempo dado, relacionndose de esta manera la
desconfiabilidad del sistema con un promedio de fallas de ste, y desarrollndose as
ndices y normas sobre la confiabilidad necesaria, expresada en fallas relativas. Como
dato real; en los aos cuarenta se exiga que la desconfiabilidad media en los motores
de avin fuera inferior a una falla por cada cien mil horas de vuelo.

La medicin e implementacin de la confiabilidad fue tomando
importancia bajo el punto de vista de costos y mantencin, a medida que la relacin
Pontificia Universidad Catlica de Valparaso Renato Allende Olivares
Instituto de Estadstica Humberto Villalobos Torres
xxvi
de costos iniciales, costos de mantencin y grados de disponibilidad logrados oblig a
comerciantes, industriales, F.F.A.A. y consumidores en general a determinar los
intervalos de reposicin y mantencin ms econmicos.

Valores numricos en confiabilidad comenzaron a aparecer, por
ejemplo en contratos donde se exiga cierto grado de confiabilidad al producto o
servicio transado, castigando con multas el no cumplimiento. En la dcada de los
cincuenta, la industria nuclear se desarrollo rpidamente y gran importancia ha
cobrado en ella el ndice de desconfiabilidad. Como cifra representativa, las
exigencias de seguridad del reactor eran de una falla en diez mil ocasiones.

La industria energtica (suministro de energa elctrica) utiliza
estimaciones de confiabilidad para determinar costos de suministro y disponibilidad
de ellos para los consumidores. La disponibilidad apara un consumidor en particular,
por ejemplo en los aos ochenta, se puede expresa en un promedio de treinta minutos
perdidos por ao de consumo, claro est que hoy en da las compaas elctricas de
distribucin deben compensar por la ocurrencia de fallas no programadas debiendo
pagar a los consumidores las consecuencias de sta, ya sea en descuentos en tarifas
por el tiempo de falla, o reparacin de artefactos que se hayan inutilizados producto
de sta falla.

Tratndose de problemas ingenieriles, el nfasis est puesto en la
aplicacin de sistemas tcnicos, desarrollndose mtodos y conceptos para medir y
aumentar la confiabilidad de todo tipo de sistemas. En algunos casos, la confiabilidad
ser incluso el factor primordial de cierta operacin, por ejemplo, cuando hay vidas
humanas en juego. En este mbito, se involucran todos los instrumentos mdicos,
donde una alta desconfiabilidad, tiene consecuencias fatales en la vida humana. Es por esta
razn que tales sistemas (instrumentos mdicos) requieren de una alta confiabilidad sin ser sta libre de
falla.

La necesidad de conocer la confiabilidad de un sistema exige que sta
sea medible, para as poder desarrollar mtodos o tcnicas que puedan caracterizar las
variables que influyen de mayor o menor forma en la confiabilidad del sistema. La
aleatoridad de las variables medibles involucradas en describir caractersticas de un
sistema relacionados con su confiabilidad exige una base estadstica y probabilstica
fundamental para la teora de anlisis de confiabilidad.


CLASES DE FALLAS

Causas de Falla.

a. Desgaste: El fallo se produce por cansancio despus de soportar
adecuadamente las fuerzas aplicadas.
b. Debilidad: El fallo se produce por debilidad del producto con
relacin a las fuerzas aplicadas.

Pontificia Universidad Catlica de Valparaso Renato Allende Olivares
Instituto de Estadstica Humberto Villalobos Torres
xxvii
Modo de Presentarse.

a. Gradual: El fallo puede ser previsto con anterioridad.
b. Repentino: El fallo no puede ser previsto con anterioridad.

Intensidad.

a. Parcial: El producto puede continuar el servicio, aunque en
forma imperfecta.
b. Completo: El producto cesa en sus funciones totalmente.

Modo de Presentarse la Intensidad.

a. Degradacin: Fallo, a la vez gradual y parcial.
b. Catastrfico: Fallo, a la vez repentino y completo.

Perodo.

a. Infantil: Debilidad prematura, en rodaje.
b. Accidental: Repentino y aleatorio, en cualquier perodo de
tiempo.
c. Senil: Agotamiento general, vejez


CLCULO DE LA CONFIABILIDAD


Definicin 1: La confiabilidad de un sistema, sea simple o compuesto, en el tiempo
t, Simbolizada por e(t), est definida como e(t) = [T > t], donde T
es la duracin del sistema y e(t) se denomina funcin de
confiabilidad.


Definicin 2: La tasa de falla de un sistema, sea simple o compuesto, en el tiempo
t, Simbolizada por r(t), est definida como la proporcin de unidades
que fallan en el intervalo de tiempo (t, t + t). cuyo clculo
matemtico esta dado por:

r(t) =
) (
) (
T
t
t f
e


donde, f
T
(t), es la funcin de densidad de probabilidad asociada a la variable
aleatoria T antes definida. Claramente la tasa de falla es una probabilidad asociada a
un sistema como se muestra a continuacin:

Pontificia Universidad Catlica de Valparaso Renato Allende Olivares
Instituto de Estadstica Humberto Villalobos Torres
xxviii

[t < T < t + t]
r(t) = [T < t + t / T > t] =
[T > t]

[t < T < t + t] 1

) (
0
t r lim
t
=
0 t
lim
[T > t]

t

F
T
(t + t) F
T
(t) 1
=
0 t
lim
1 F
T
(t)

t

1 F
T
(t + t) F
T
(t)
=
1 F
T
(t)
0 t
lim
t

1
F
T
(t)
r(t) =
1 F
T
(t)

t
=
) (
) (
T
t
t f
e


Tambin es posible determinar la funcin de densidad de una variable
en cuestin a travs de una tasa de falla.

e(t) = [T > t] e(t) = 1 [T t]

e(t) = 1 F
T
(t)

d e(t)
d t
=
f
T
(t)
e(t) =
f
T
(t)

r(t) =
) (
) (
T
t
t f
e
r(t) =
) (
) (
t
t
e
e


( )
t
Inf
r x dx

=
( )

( )
t
Inf
x
dx
x

e
e

( )
t
Inf
r x dx

=
t
Inf
x ln )) ( (e
( )
t
Inf
r x dx

= ln(e(t)) + ln(e(Inf))
( )
t
Inf
r x dx

= ln(e(t)) + ln(1)
Pontificia Universidad Catlica de Valparaso Renato Allende Olivares
Instituto de Estadstica Humberto Villalobos Torres
xxix
exp ( )
t
Inf
r x dx

`

)

= e(t)
exp ( )
t
Inf
r x dx

`

)

= 1 F
T
(t)


d F
T
(t)
d t
=
f
T
(t)
=
F
T
(t)
=
1 exp ( )
t
Inf
r x dx

`

)



r(t) exp ( )
t
Inf
r x dx

`

)





TIPOS DE SISTEMAS

I. Sistemas con Componentes en Paralelo

Suponga que un sistema est compuesto por n componentes, que funcionan de
manera independiente, entonces un configuracin en paralelo es aquella que se
representa por la siguiente figura 1:












En este tipo de sistemas, se pueden considerar dos situaciones: la primera,
cuando el sistema funciona cuando al menos uno funciona; la segunda, cuando el
sistema funciona cuando al menos k componentes funcionan.

En la primera situacin, el sistema funciona si al menos un componente
funciona, si se puede establecer condiciones de independencia en el funcionamiento
de los componentes, y adems suponer que todos ellos se encuentran gobernados por
la misma confiabilidad, entonces la confiabilidad del sistemaest dada por:

e
s
(t) = [T > t] = [C
1
> t C
2
> t ... C
n
> t]



C
1





C
2





.
.
.


C
n



Figura 1: Sistema en Paralelo
Pontificia Universidad Catlica de Valparaso Renato Allende Olivares
Instituto de Estadstica Humberto Villalobos Torres
xxx
= 1 [(C
1
> t C
2
> t ... C
n
> t)
c
]

= 1 [C
1
< t C
2
< t ... C
n
< t]

= 1 ([C
1
< t][C
2
< t] ... [C
n
< t])

= 1

=
n
i 1
[C
i
< t]
= 1

=

n
i
i
t
1
)) ( (1 e
= 1 (1 e(t))
n


En la segunda situacin, el sistema funciona si al menos k componentes
funcionan, si se puede establecer condiciones de independencia en el funcionamiento
de los componentes, y adems suponer que todos ellos se encuentran gobernados por
la misma confiabilidad, entonces la confiabilidad del sistema est dada por:

e
s
(t) = [T > t] =

|
|
.
|

\
|
n
k x
x n x
t t
x
n


)) ( 1 ( )) ( ( e e

Es fcil observar que si todos los componentes se encuentran gobernados por
la misma confiabilidad y siendo stos independientes, la confiabilidad de cada uno de
estos esta dada por e(t). Por lo tanto, es natural observar que la confiabilidad del
sistema se convierta en una distribucin binomial.


II. Sistemas con Componentes en Serie

Suponga que un sistema est compuesto por n componentes, que funcionan de
manera independiente, entonces una configuracin en serie es aquella que se
representa por la siguiente figura 2:



C
1


C
2


C
3


. . . . . . . .

C
n



Figura 2: Sistema en Serie


Si se puede establecer condiciones de independencia en el funcionamiento de
los componentes, y adems suponer que todos ellos se encuentran gobernados por la
misma confiabilidad, entonces la confiabilidad del sistema est dada por:

e
s
(t) = [T > t] = [C
1
> t C
2
> t ... C
n
> t]
Pontificia Universidad Catlica de Valparaso Renato Allende Olivares
Instituto de Estadstica Humberto Villalobos Torres
xxxi
= [C
1
> t][C
2
> t] ... [C
n
> t]

= e
1
(t) e
2
(t) ... e
n
(t)

=

=
n
i
i
t
1
) ( e

= (e(t))
n



III. Sistemas Mixtos

Suponga que un sistema est compuesto por n componentes, que funcionan de
manera independiente, entonces un configuracin en serie es aquella que se
representa por la siguiente figura 3:

Suponga que el tiempo de vida T (en das) de un componente electrnico esta
modelado en forma independiente por la siguiente funcin de densidad:

20 ) (
1) (
T
+
= t t f , t > 20 y > 0.

Suponga que un sistema esta compuesto por cuatro componentes del
mismo tipo que funcionan independientemente, con la siguiente configuracin:

C
3
C
4

C
1

C
2


Determine e interprete la tasa de falla del segundo componente y realice un bosquejo
aproximado de ella.

r(t) =
) (
) (
T
t
t f
e
e(t) = [T > t] = 1 F
T
(t)

F
T
(t) =
T
20
( )
t
f t dt


=
( 1)
20
20
t
t dt
+

=
|
|
|
.
|

\
|
+ +
+ +
t
t
20
1 1) (

1 1) (
20


= 1

|
.
|

\
|
t
20

Pontificia Universidad Catlica de Valparaso Renato Allende Olivares
Instituto de Estadstica Humberto Villalobos Torres
xxxii

r(t) =
) (
) (
T
t
t f
e
=

1) (
20
20

+
t
t

=
t





Determine la funcin de confiabilidad del sistema y determine la probabilidad
de que el sistema dure ms de 80 das si = 0.8.

e
s
(t) = [C
1
> t ((C
3
> t C
4
> t) C
2
> t)]

= [C
1
> t] [(C
3
> t C
4
> t) C
2
> t]

= [C
1
> t] (1 [(C
3
< t C
4
< t) C
2
< t])

= [C
1
> t] (1 ([C
3
< t C
4
< t] [C
2
< t]))

= [C
1
> t] (1 (1 [C
3
> t C
4
> t]) (1 [C
2
> t])))

= [C
1
> t] (1 (1 [C
3
> t] [C
4
> t]) (1 [C
2
> t])))

= e(t) (1 (1 e
2
(t)) (1 e(t)))

= 0,8


e(80) =
0.8
80
20
|
.
|

\
|
|
|
.
|

\
|
|
|
.
|

\
|
|
.
|

\
|

|
|
.
|

\
|
|
.
|

\
|

0.8 1.6
80
20
1
80
20
1 1 = 0,1329


t
r(t)

También podría gustarte