Documentos de Académico
Documentos de Profesional
Documentos de Cultura
El campo de la Estadística
Recopilación,
Presentación,
Análisis y
Uso de Información para resolver
problemas, tomar decisiones, hacer
estimaciones y diseñar productos y
procedimientos
La variabilidad
La Estadística sirve para presentar,
describir y entender la variabilidad
Un proceso produce un resultado, al
repetirse un proceso, los resultados
cambian a pesar de que el proceso se
reprodujo aparentemente en las
mismas circunstancias.
Población
Colección de mediciones de un universo
respecto al cual queremos obtener
conclusiones o tomar decisiones.
Ej. Conjunto de valores de consumo de
energía (KWH) facturados en el primer
bimestre de 2008
Tipos de datos
Datos numéricos (continuos o discretos)
Datos categóricos (Ej. Sexo, marca, ..)
Datos identificadores de unidades
Muestreo de datos
Muestreo aleatorio
Muestra Población
* * ** * * ** * * + + + + + ++ + + +
* = Mortero modificado
+ = Mortero sin modificar
Graficas de dispersión
Gráfica de dispersión
Grafica de dispersión 3D
Gráfica de burbujas
Ejemplo: Resistencia a la tensión de 80
muestras de aleación Aluminio-Litio
105 221 183 186 121 181 180 143 97 154 153 174 120 168
167 141 245 228 174 199 181 158 176 110 163 131 154 115
160 208 158 133 207 180 190 193 194 133 156 123 134 178
76 167 184 135 229 146 218 157 101 171 165 172 158 169
199 151 142 163 145 171 148 158 160 175 149 87 160 237
150 135 196 201 200 176 150 170 118 149
Diagrama de tallos y hojas
Tallo Hoja Frecuencia
7 6 1
8 7 1
9 7 1
10 5 1 2
11 5 8 0 3
12 1 0 3 3
13 4 1 3 5 3 5 6
14 2 9 5 8 3 1 6 9 8
15 4 7 1 3 4 0 8 8 6 8 0 8 12
16 3 0 7 3 0 5 0 8 7 9 10
17 8 5 4 4 1 6 2 1 0 6 10
18 0 3 6 1 4 1 0 7
19 9 6 0 9 3 4 6
20 7 1 0 8 4
21 8 1
22 1 8 9 3
23 7 1
24 5 1
Tallos y Hojas ordenado
Tallo Hoja Frecuencia
7 6 1
8 7 1
9 7 1
10 1 5 2
11 0 5 8 3
12 0 1 3 3
13 1 3 3 4 5 5 6
14 1 2 3 5 8 6 9 9 8
15 0 0 1 3 4 4 6 7 8 8 8 8 12
16 0 0 0 3 3 5 7 7 8 9 10
17 0 1 1 2 4 4 5 6 6 8 10
18 0 0 1 1 3 4 6 7
19 0 3 4 6 9 9 6
20 0 1 7 8 4
21 8 1
22 1 8 9 3
23 7 1
24 5 1
Los datos ordenados
76 87 97 101 105 110 115 118 120 121
123 131 133 133 134 135 135 141 142 143
145 146 148 149 149 150 150 151 153 154
154 156 157 158 158 158 158 160 160 160
163 163 165 167 167 168 169 170 171 171
172 174 174 175 176 176 178 180 180 181
181 183 184 186 190 193 194 196 199 199
200 201 207 208 218 221 228 229 237 245
25
20
15
10
0
70 90 110 130 150 170 190 210 230 250
Cajas con bigotes
Presenta al mismo tiempo una medida de dispersión, de
tendencia central y de valores extremos
Se debe determinar la mediana, el primero y el tercer cuartil y
los valores máximo y mínimo
Rango Intercuartílico RIC=Q3-Q1
Las gráficas de Caja son útiles
para hacer comparaciones
Supongamos que El desplazamiento
un corredor entrena de las gráficas de
para una caja hacia la
determinada carrera izquierda indica que
y se toman los el entrenamiento ha
tiempos que dado resultado, ya
necesita para que se tardan
recorrer los 100m, menos segundos en
durante 10 días recorrer la misma
consecutivos (cada distancia, siendo la
día se toman varios diferencia entre el
tiempos y se máximo y el mínimo
calculan mediana, menor, como así
cuartiles, valores también la
mínimo y máximo) diferencia
intercuartílica
Ejemplo
En un diario presentan el siguiente gráfico de caja y bigotes. La
variable en estudio es “calificación en un examen de ingreso”
Vuelos 25 37 45 50 32 40 30
Defecto en vidrio 5
TOTAL 110
Diagrama de Pareto
Serie de tiempo
300
Resist a la tensión
250
200
150
100
50
0
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
5
Descripción numérica de los
datos
Media
Varianza
Moda
Mediana
Sesgo
Curtosis
Covarianza
Factor de correlación
La media
La media muestral
x1 + x2 +... + xn 1 n
x= = å xi
n n i=1
La media de la población
N
1
N
x
i 1
i
La media geométrica
n
Mg n x
i 1
i n x1 x2 ...xn
La varianza
La varianza muestral
1æ ö
n n n 2
sxx = å(xi - x ) = å x - çå xi ÷
2 2
i
i=1 i=1 n è i=1 ø
La varianza de la población
N
1
2
N
i
( x
i 1
) 2
Varianzas muestrales, Covarianza
muestral y correlación muestral
n æ n ö
sx = sxx = å(xi - x ) = çå xi ÷ - nx
2 2 2 2
i=1 è i=1 ø
n æ n ö
sy2 = syy = å(yi - y)2 = çå yi2 ÷ - ny 2
i=1 è i=1 ø
n æn ö
sxy = å(xi - x )(yi - y) = çå xi yi ÷ - nxy
i=1 è i=1 ø
S xy
rxy
SxS y
La varianza muestral no-sesgada
n
sxx
å i
(x - x ) 2
én æ n ö
2ù
å xi - çå xi ÷ ú
1 ê 1
s =
2
= i=1
= 2
n -1 n -1 n -1 êë i=1 n è i=1 ø úû
n i
( x x ) 3
sesgo i 1
(n 1)( n 2) s 3
n(n 1) i
( x x ) 4
curtosis i 1
(n 1)( n 2)( n 3) s4
Regresión lineal
i 0 1i
i 1
( 2
y
i 1
x ) 2
Regresión lineal simple
Para minimizar el error derivamos e
igualamos a ncero respecto a 0
2 ( yi 0 1 xi ) 0
i 1
De la misman manera derivando respecto a 1
2 ( yi 0 1 xi ) xi 0
i 1
Simplificando estas dos ecs:
n n
n 0 1 xi yi
i 1 i 1
n n n
0 xi 1 x yi xi
2
i
i 1 i 1 i 1
Regresión lineal simple
1 n 1 n
Reconociendo que x xi y yi
n i 1 n i 1
n n
La ecuación n 0 1 xi yi
i 1 i 1
Se convierte en 0 y 1 x
Esto lo reemplazamos en
n n n
0
x
i 1
i x2
1
i 1
i yx
i 1
i i
Para obtener
n n n
( y 1 x ) xi 1 x yi xi
2
i
i 1 i 1 i 1
Regresión lineal simple
n n n
De la ecuación ( y 1 x ) xi 1 xi2 yi xi
i 1 i 1 i 1
Despejamos 1 n
n n
2
n
y xi 1 x xi xi yi xi
i 1 i 1 i 1 i 1
n n
Para obtener y x y x
i i i
1 i 1
n
i 1
n
x xi xi2
i 1 i 1
Regresión lineal simple
n n
Es lo mismo que
å yi xi - y å xi
b1 = i=1
n
i=1
n
-x å xi + å xi2
i=1 i=1
n n n n
å yi xi - n å yi å xi å(yi - y )(xi - x ) S
1
b1 = i=1 i=1 i=1
= i=1
n
= xy
é ù Sxx
2
å i
n n
å xi - n êå xi ú -
2 1 (x x ) 2
n 10 x i 1450 y
i 1
i 673
i 1
x 145 y 67.3
10 10 10
x
i 1
2
i 218,500 y
i 1
2
i 47,225 x y
i 1
i i 101,570
2
10
1 10
(1450) 2
S xx xi2 xi 218,500 8,250
i 1 10 i 1 10
10
1 10 10 (1450)(673)
S xy xi yi xi yi 101,570 3,985
i 1 10 i 1 i 1 10
Finalmente
S xy 3985
1 0.483
S xx 8250
MES fallas 7
ENERO 2
FEBRERO 5 6
MARZO 7
ABRIL 8 5
Fallos
MAYO 7 Serie1
Serie2
JUNIO 6 4
JULIO 5
AGOSTO 4 3
SEPTIEMBRE 3
OCTUBRE 1
2
TOTAL 48
1
0
ENERO FEBRERO MARZO ABRIL MAYO JUNIO JULIO AGOSTO SEPTIEMBRE OCTUBRE
Meses
En estudios de mantenimiento necesitamos pasar del anterior histograma a funciones
continuas, debido que la variable tiempo de fallo es continua. Esta funciones nos dan una
idea clara de la distribución de fallos. Empezamos por la f(t) ó pdf que indica la densidad
probable de fallas en cada intervalo t.
t2
f (t ) f (t )d (t )
8
7 t1
f(t)
Serie1
3
0
ENERO FEBRERO MARZO ABRIL MAYO JUNIO JULIO AGOSTO SEPTIEMBRE OCTUBRE
Meses
t
F (t ) f (t )dt el área bajo la curva - transcurrido t (Función Repartición ) cdf=14/48
9
f(t)
0
ENERO FEBRERO MARZO ABRIL MAYO JUNIO JULIO AGOSTO SEPTIEMBRE OCTUBRE
Meses
9 R(t ) f (t )dt
t
8
f(t)
0
ENERO FEBRERO MARZO ABRIL MAYO JUNIO JULIO AGOSTO SEPTIEMBRE OCTUBRE
Meses
Tiempo t
La tasa de falla del intervalo t1 a t2 se define como
R(t ) R(t2 ) 1
TF (t1 , t2 ) 1 t t
R (t1 ) 2 1
f (t ) e t
h(t ) t
R(t ) e
(t)
DOMINIO ELECTRONICO
desclasificación
Hipótesis exponencial
constante
1 2 3
Edad t
desarrollo obsolescencia
Madurez (fallos aleatorios)
Inicio utilización
Función de Riesgo típica
DOMINIO MECANICO
(t)
Influencia del desgaste
Curva debida a los sobre (t)
fallos precoces
desclasificación
Madurez
1 2 3
Edad t
Puesta en servicio rodaje obsolescencia
f (t ) f (t )
h(t )
R (t ) 1 F (t )
Cuando la tasa de fallo del elemento responde a la curva de la bañera es
conveniente realizar un ensayo acelerado del mismo (en condiciones de stress)
para que supere la zona de mortalidad infantil o fallas infantiles.
– determinar cuando comienza la vida útil del producto y ofrecer a los clientes una
garantía de funcionamiento durante ese periodo de funcionamiento problemático.
– Una vez superado el periodo crítico, la empresa está razonablemente segura de que el
producto tiene una posibilidad de fallos reducida
La distribución de fallas de diferentes tipos de maquinaria no son las
mismas. Aun varían en una misma maquina durante su operación. Sus
formas pueden ser estudiadas a partir de las funciones pdf, cdf y tasa de
falla de los datos reales de mantenimiento o de ensayos de fiabilidad. Estos
dan forma a determinadas expresiones matemáticas conocidas como
distribuciones obteniendo:
•Dist. Exponencial
•Dist. Normal
•Dist. Lognormal
•Dist. Weibull
EL MODELO EXPONENCIAL
e t
=0, 1
t
5x)
=3,6 f (t )
=1
f
x) =2,
(x)
5x) parámetro de forma > 0;
=2
x) parámetro de escala > 0;
parámetro de posición - < < +
t
(t) t
=4 F (t ) 1 e
3
2
2
1
1,5
0,
5 1
0,5t
t
Las características de la distribución de Weibull
Las características de la distribución de Weibull
Las características de la distribución de Weibull
2 < 0 t -- si < 0, los fallos han empezado antes del origen del
2 = 0 2 > 0
tiempo.
Ejemplo
Obtención de la fiabilidad de neumáticos a través del
Análisis de la degradación
F(t) = 1 - exp(-t), t 0
Degradación Critica y= 2 mm