Está en la página 1de 89

Estadística Básica

Estadística Básica

• Población: es la colección de todas las


posibles mediciones u observaciones
que pueden hacerse de una variable
bajo estudio.
Estadística Básica

• Muestra:
– es un conjunto de mediciones u
observaciones tomadas a partir de una
población.
– es un subconjunto de la población.

Tema 1. Introducción
Estadística Básica
Población
Se usan muestras por problemas de
costos, tiempo y algunas serian
imposibles tomar el 100%
Muestras

La muestra debe representar la población o proceso.


Las decisiones se toman según la muestra.
Calidad es mejor que cantidad.
Los datos se grafican y se analizan.
Si no hay datos, se debe poner en acción y plan para
recolectarlos.
Estadística Básica
Promedio = El valor promedio (el Mediana = el punto de 50%, (o el
“Centro de Gravedad”) (MEAN)  “número del medio”) (MEDIAN)

Para encontrar la Mediana de un conjunto


Suma de los puntos de datos de datos,
=
X Número de puntos de datos
(1) ordene los datos en el orden de
menor a mayor
(2) el número del medio es la mediana!

- Usa todos los puntos de datos 1, 2, 3, 14, 85


- Fuertemente influenciado por
valores extremos
La mediana e 3
-No fuertemente influenciado por valores
extremos
-Cuando hay números pares, la mediana
es la suma de los números céntricos
dividido entre 2
Dónde está el Centro de los Datos
Estadística Básica
Como jefe del Dpto. de Comunicación de la universidad, le fue pedido resumir la media de los
sueldos iniciales de los formados.

$10, 20, 30, 40, 50 ($ mil)

Cual es el sueldo promedio


(o “centro de gravedad”)? Cual es el sueldo Mediano?

30 30

Entretanto, siguiendo el consejo del Dpto. de Relaciones Públicas usted considera incluir un
de sus antiguos estudiantes: Shaquille O’Neal (estrella del básquet)

$10, 20, 30, 40, 5000 ($ mil)

Cual es el sueldo promedio Cual es el sueldo Mediano?


(o “centro de gravedad”)?

1020 30
Estadística Básica

Para ilustrar:
Tenemos A: 30 40 50 60 70 tiene promedio = 50 y mediana = 50

Tenemos B: 30 40 50 60 700 tiene promedio = 176 y mediana = 50


Estadística Básica
Moda: El valor que ocurre c/ más frecuencia. La moda puede no existir y caso exista, puede
no ser única.

Más enfocada para conjuntos de datos atributos, aunque el uso independa de los tipos de
datos disponibles

25
Valor de acontecimientos más elevado: 14
20 (esa es la moda del conjunto de datos)

15
Frequency

10

0
10 12 14 16 18
Estadística Básica
Medidas de dispersión
- Rango (Range) = R , es la diferencia entre la mayor y la menor
observación

- Desviación Estándar = s, es el promedio de la variación de los


puntos al promedio de ellos mismos. Considera
todos los puntos.

- Variancia = s2 (simplemente el cuadrado del desviación estándar,


utilizada para auxilio
en los cálculos involucrando desviación estándar)

- Porcentajes, Cuartiles y Deciles


Estadística Básica
Desviación Estándar y Variancia
X  X X  X
2
X X
5 2 4
4 1 1
3 Media = 3 0 0
1 Suma de los puntos de datos
-2 4
=
2 X Número de los puntos de datos -1 1

Suma de la
última columna
= 10
S  S2 S2
Raíz Cuadrada de la Divide la Suma
Variancia por (n-1):
= Desv.Pa. = S = Variancia = S2
= 1,58 = 2,5
Estadística Básica N

X i
Promedio de la  = i 1
Población N
N

Desviación Estándar
 i
(X   ) 2

de la Población = i =1
N
n

Promedio de la
x
i=1
i

Muestra x=
n
N

 i 
2
(X X )
Desviación Estándar i=1
de la Muestra s=
n -1
Estadística Básica
Porcentajes, Cuartiles, Deciles – Percentiles –
Medidas de Posición
Porcentaje del valor “x” = número de valores inferiores a “x” x 100%
número total de valores

Ejercicio : Retome los datos colectados sobre la altura de las personas en la sala.
Una persona con 1,70m en esa clase se encuentra en cual porcentaje ?

1er. Cuartil P25


2do.Cuartil P50 (Mediana)
3er Cuartil P75
Estadística Básica
Consideraciones Importantes:

• Siempre que este trabajando con una distribución simétrica


y sin valores extremos, el promedio y desviación estándar
son excelentes indicadores de tendencia central y dispersión,
respectivamente.

• Cuando las distribuciones son asimétricas y tienen valores


extremos, los mejores indicadores de tendencia central y
dispersión son, respectivamente, la mediana y cuartiles y
percentiles
Estadística Básica
Tipos de Datos – MUY IMPORTANTE
Datos Atributos - Los datos son discretos (contados). Resultados de la
utilización de los instrumentos de medición “pasa no pasa”, o de la
inspección de defectos visuales, problemas visuales, piezas faltando, o de
decisiones pasar/fallar o si/no. Entre dos puntos cualquier posibilidades de
otros puntos. Entre dos puntos hay un número finito de posibilidades.
Normalmente números enteros.

Datos Variables - Los datos son continuos (medidos). Resultados de la


real medición de una característica tal como la impedancia de una bobina
de motor, fuerza de tracción del acero, diámetro del tubo, peso de una
persona, tiempo para ejecutar una tarea, etc. Entre dos puntos, hay
infinitas posibilidades.
Tipos de Datos
 DATOS ATRIBUTOS (o DISCRETOS)

 (#1) BINOMIAL - Número de Ítems en una Categoría (Proporciones Basado en Conteo)

 Cara/Corona (i.e., conteo de # de Caras y # de Coronas)


 Si/No (Pedido llenado c/exactitud o no)
 Paso/Fallo; Bueno/Malo (Cobranza Exacta/Cobrado a Más)

 (#2) POISSON - Conteo de Acontecimientos Discretos en un Evento Continuo

 # de Arañones en la Capot del Motor del Carro


 # de Errores en el Formulario
 # de Fallas de Aisladamente en una Bobina de Cable
 # de Veces que el Cliente Colgó Antes de ser Atendido

 DATOS VARIABLES (o CONTINUOS) – DATOS MEDIBLES

 (#3) CONTINUOS
 Subdivisiones Decimales son Significativos.
 Ex: Tiempo p/atender teléfono (# exacto de seg. por llamada)

Diferentes Tipos de Datos Requieren Diferentes Herramientas de Análisis


Estadística Básica
Proceso de Manufactura: Chapas de Vidrio
Tipos de Datos
Muestra #1 Muestra #2 Muestra #3 Muestra #4
“Estoy contando algo?”
ATRIBUTOS

Distribución
TIPO-I

Binomial
Tiene Burbujas?
(aceptar / rechazar
(Datos Discretos)

el ítem todo)

Rechazar Rechazar Aceptar Rechazar


DATOS

TIPO-II

Distribución
Número de

Poisson
Burbujas?

3 2 0 4
DATOS VARIABLES

(Datos mensurables)
(Datos Continuos)

Distribución Normal
Peso del
Vidrio

u Otra
Peso = 12.2 Peso = 12.4 Peso = 11.9 Peso = 12.1
Estadística Básica
Tipos de Datos Proceso Comercial : Número de errores en la Factura
Form. #1 Form. #2 Form. #3 Form. #4
“Estoy contando algo?”
ATRIBUTOS

Distribución
TIPO-I

Binomial
Tiene Errores?
(aceptar / rechazar
(Datos Discretos)

el ítem todo)

Rechazar Rechazar Aceptar Rechazar


DATOS

TIPO-II

Distribución
Número de

Poisson
Errores en el
formato?
3 2 0 4
DATOS VARIABLES

(Datos mensurables)
(Datos Continuos)

Distribución Normal
Tiempo p/
Rembolsar
Funcionario

o Otra
34 horas 23 horas 4 horas 2 horas
Estadística Básica
Distribuciones de Probabilidad para Datos Variables

• La mayoría de los datos variables en la naturaleza y en el


ambiente de trabajo tiene distribuciones de probabilidad que son
semejantes a una campana. Esta distribución se llama distribución
normal y en todos los proyectos donde estemos tratando con una
distribución de datos variables, se trata de la primera distribución
que iremos tratar encajar el proceso siendo estudiado

• Siempre que sea posible en los proyectos tratar los datos como
datos continuos. La riqueza de las informaciones compensa el
hecho de que es un poco más complicado para colectar datos
continuos cuando comparado a los datos discretos
Estadística Básica
Histograma
Da idea de centrado y da idea de variación. También muestra como
están distribuidos los datos.

25

20

15
Frequency

10

0
10 12 14 16 18
Estadística Básica
Histograma
Hacer el Histograma para la vida de baterías de un automóvil ( en años)

Tomar como intervalos lo


siguiente:
Estadística Básica
Histograma
Reliasoft 2007
Reliasoft 2007
Reliasoft 2007
Reliasoft 2007
Reliasoft 2007
Reliasoft 2007
Reliasoft 2007
Reliasoft 2007
Reliasoft 2007
Entrenamiento Reliasoft 2007
CDF (Cumulative Distribution Function) para la longitud de un eje.

El área sombreada de la PDF (probability density function) en la figura es de 0.2525,


el cual corresponde a la CDF (cumulative distribution function) a X=190mm.
La CDF es igual a la integral de la PDF a la izquierda de X
QCI Primer 2009
Entrenamiento Reliasoft 2007
La función de confiabilidad
LA función de confiabilidad es el complemento de la Función de distribución acumulada
(CDF). LA CDF representa la probabilidad de falla y la función de confiabilidad representa
la función de sobrevivencia

QCI Primer 2009


Entrenamiento Reliasoft 2007
Practical Reliability Engineering: Patrick D.T. O Connor
Practical Reliability Engineering: Patrick D.T. O Connor
Distribución Weibull
Función densidad de probabilidad
Weibull
• La distribución Weibull es una de las
distribuciones mas utilizadas en la Ingeniería
de la Confiabilidad, debido a su capacidad de
cambiar de forma dependiendo de la variación
del valor del parámetro de forma β.
• Puede modelar una gran variedad de datos y
características de vida.
Distribución Weibull
Wallodi Weibull 1887-
1979

La pdf de la distribución Weibull con tres


parámetros esta dada por:

 1  T  
 T   
 

f (T )    e 
  
 : Parámetro de forma
 : Parámetro de escala
 : Parámetro de ubicación
Analizando β
• β es el parámetro de forma o inclinación (en
un papel de probabilidad Weibull) de la
distribución Weibull.
• La forma de la pdf es alterada cambiando el
valor β.
• β es un número adimensional.
Efecto de  en la pdf
ß = 0.5
ß = 5.0 =0

ß = 3.44
ß = 2.5

f(t)

ß = 1.0

0
0 t
Efecto de  en la pdf
Una de las Ventajas de la distribución de Weibull es la FLEXIBILIDAD. Por ejemplo
en el caso de:

1. β=1 LA ditribución Weibull se reduce a una distribución exponencial.


2. Cuando β=2 La distribución Weibull de parece a la distribución Rayleigh.
3. En el caso de que β=3.5 el pdf Weibull es cercanamente parecida a la curva
normal

Practical Reliability Engineering: Patrick D.T. O Connor


Efecto de β en la cdf
Efecto de β sobre la Confiabilidad
Efecto de  sobre el riesgo de fallas
 = 2.5
Riesgo de falla, r(t)

 = 1.0

 = 0.5
? t
Efecto de  sobre el riesgo de fallas
B=1; Una parte vieja es tan buena como una nueva.
Riesgo de falla, r(t)

Fallas aleatorias independientes del tiempo.


Se debe a errores de mantenimiento, humanos, y eventos
abusivos, causas de la naturaleza, etc. Combinación de 3
o más modos de falla con diferentes betas, sistemas de
varios componentes.

 = 1.0

? t
Efecto de  sobre el riesgo de fallas
1<B<4 Indica desgaste temprano,
Bajo ciclo de fatiga ( 2.5 a 4.0)
 = 2.5 Fallas de rodamientos de bolas =B(2)
Riesgo de falla, r(t)

Fallas de rodamientos de cilindros b=1.5


Corrosión o erosión ( b=2 a 3.5)
Esfuerzo por corrosión ( B>5)
Fajas en “V” = B=2.5

 = 1.0

? t
Efecto de  sobre el riesgo de fallas
B>4
Envejecimiento operacional, desgaste
Riesgo de falla, r(t)

rápido.
>4 Modos de falla típicos con
envejecimiento operacional.
Corrosión por esfuerzo.
Propiedades de los materiales.
Materiales quebradizos (tipo cerámico).
Algunas formas de erosión.

? t
Efecto de  sobre el riesgo de fallas
Si β< 1 Indica disminución de la tasa de fallas, usualmente asociado
a la mortalidad infantil, algunas veces es llamada Fallas Prematuras.
Esto corresponde a fallas relacionadas con la fallas en la fabricación
y generalmente estas fallas son dadas después de producirlas.

Si β= 1 Es una tasa de fallas constante asociado con la vida útil. La


tasa de fallas constante corresponde a la vida central del producto y
son fallas aleatorias o modos de falla mixtos.

Si . β> 1 Indica incremento de la tasa de fallas asociadas con


desgaste, corresponde al fin de la vida del producto con fallas
cercanas. Si esto lo registramos al inicio de la vida del producto
puede tener un serio problema de diseño o problemas con los
datos.
Practical Reliability Engineering: Patrick D.T. O Connor
Efecto de  sobre el riesgo de fallas
Si β> 6 Es tiempo de sospechar, β> 6 no es común, refleja una
acelerado ratio de fallas y acelerado desgaste, el cual es común
para componentes frágiles, algún tipo de erosión, fallas en
componentes viejos. Algunos sistemas biológicos y químicos
pueden tener β> 6, Por ejemplo la mortalidad humana, la caída
de la visocidad del aceite. Para esta fase siempre es bueno
reevaluar el análisis.

Si β> 10 Es tiempo de sospechar más. Es raro ver ese valor. Hay


un extremo desgaste.
Sin embargo puede ser resultado donde hay muchos datos
sensurados y pocas fallas. Por ejemplo puede tener β> 10
pruebas de sobretensión de un componente,
Practical Reliability Engineering: Patrick D.T. O Connor
Analizando η
• Es el parámetro de escala de la distribución
Weibull, y tiene las mismas unidades de T,
como horas, Kilómetros, ciclos, actuaciones,
etc.
Efecto de  en la pdf

Vida Característica R( )  36.8%

1 < 2
ß = 2.5,
f(t) =0
ß = 2.5,
=0

1 2

0
0 t
Analizando γ
• Es el parámetro de localización de la
distribución Weibull y tiene la misma unidad
de T.
• Representa un desplazamiento en el eje x, es
decir, cambiar el punto de inicio de la
distribución a un valor diferente a cero.
• Esto puede ser aplicada a otras distribuciones.
Parámetro de localización, 
Vida mínima

ß = 2.5
f(t)


0
0 t
γ Positivo
• Un valor positivo para el parámetro de
localización indica que las fallas solo ocurrirán
después de tiempo equivalente a γ, en otras
palabras, hasta el tiempo γ la Confiabilidad es
igual a 100%
γ negativo
• Un valor negativo para el parámetro γ indica
que los ítems poseen una Confiabilidad menor
que 100% para el tiempo igual a cero. Esto
puede ocurrir debido al método utilizado para
registrar el tiempo, o puede indicar algún
modo de falla que ocurre debido al
transporte, degradación del ítem por estar en
stock, por cuestiones de manufactura, etc.
Análisis Weibull
• El análisis Weibull requiere el tiempo para la falla
como dato.
• Una falla debe ser un evento definido y no solo
una valoración subjetiva de perdida de
rendimiento.
• Los datos deberán ser estadísticamente una
muestra al azar de la población.
• Emplear la medida de utilización adecuada para
el equipo y el mayor modo de falla.
• Revisar otros factores tales como posición
instalada, mal uso, incorrecto diagnostico de falla,
etc.
El Papel Weibull

  t    
F(t )  1  exp    
    
 1 
ln ln    ln(t   )   ln 
 1 F(t ) 

Sobre un papel Weibull, el eje vertical está en escala


lnln y el eje horizontal está en escala ln.
Papel
Weibull

Función
exponencial
Ejercicio 3: Análisis Weibull
 Se ha obtenido datos de 10 items, seleccionados
aleatoriamente y todos los cuales han fallado. El tiempo
para la falla del equipo fue:
410, 1050, 825, 300, 660, 900, 500, 1200, 750, 600

Paso 1 Ordenar los datos en orden ascendente


Paso 2 Tabular con el valor correspondiente F(t)
para una muestra de 10, empleando la Tabla de
la Línea Media.
Aproximación de Bernard para el
ploteo de probabilidades

𝑗−0.3
F(t)=
𝑁+0.4
Ejercicio 3:Análisis Weibull
Número Horas para Línea Media
Falla la Falla % Acum Falla
(i) (ti ) F(t )
1 300 6.7
2 410 16.2
3 500 25.9
4 600 35.5
5 660 45.2
6 750 54.8
7 825 64.5
8 900 74.1
9 1050 83.8
10 1200 93.9
2.4
Estimación de
720 830
0
Factores

Vida Mínima, 
Factor Forma, 
Vida Característica, 

Vida Media, 

Vida Promedio

Vida Bq
Vida Característica

f(t)

 = 2.4
63.2%

 = 830 tiempo
Vida Media

f(t)

 = 2.4
52.7%

 = 740 tiempo
Vida Mediana

f(t)

 = 2.4
50%

tiempo
B50 life = 720
Ejercicio
N T(horas)
1 2820
2 3564
3 3852
4 3852
5 4320
6 4332
7 4332
8 4668 Ventilador bóxer
de 12V CD
9 4728
10 4728
11 4908
Repaso para
reforzamiento de
curva Weibull
IV. Distribución Weibull 2, 3 parámetros y mixta.

4.1 Weibull de dos parámetros:


A continuacion presentaremos la simple version de 2 parámetros
que es la “ cumulative failure distribution function F(t):
𝑡
−(𝜂)𝛽
F(t)= 1 − 𝑒
Donde:
t= tiempo.
β= Pendiente Weibull ( la pendiente de la linea de falla en el
grafico Weibull, también conocida como “parámetro de forma”.
η= Vida característica, o el tiempo por el cual el 63.2% de la
población fallaría. También conocida como parámetro de escala
IV. Distribución Weibull 2, 3 parámetros y mixta.
4.1.1 Papel de probabilidad de Weibull:
4.2 Ejemplos de “probability density function” formas:
IV. Distribución Weibull 2, 3 parámetros y mixta.

4.3 Weibull de tres parámetros:


A continuación presentaremos la simple version de 3 parámetros que es la
“cumulative failure distribution function” F(t):
𝑡−γ
−( 𝜂 )𝛽
F(t)= 1 − 𝑒
Donde:
t= tiempo.
β= Pendiente Weibull ( la pendiente de la línea de falla en el grafico
Weibull, también conocida como “parámetro de forma”.
η= Vida característica, o el tiempo por el cual el 63.2% de la población
fallaría. También conocida como parámetro de escala.
γ = Vida mínima esperada, también conocido como parámetro de
localización, porque define la ubicación de partida del gráfico PDF a lo largo del eje “X”.

• Otras literaturas consideran X0, t0, ρ, en lugar de γ.

• Para asumir Weibull 3 parámetros, ninguna falla debe ocurrir antes de γ


4.3 Weibull de tres parámetros:
Para graficar Weibull con 3 parámetros, no puede ser presentada
por una línea recta. La curva es una escala logarítmica.
Lo mejor es graficar con ayuda de un software que te da más
precisión y certeza.
4.3 Weibull de tres parámetros:
• γ puede ser positivo o negativo.
o Para un γ positivo indica que para esa distribución la
confiabilidad es siempre 100%.
o Si el parámetro de localización es negativo implica que las
fallas teóricamente ocurren antes del tiempo cero. En la
realidad si γes negativo indica que hubo fallas antes de ser
usado el producto, o hubo fallas de manufactura).

• Debemos tener cautela cuando analizamos una distribución curva,


ya que puede ser una distribución mixta.
• Algunas veces γ es estimado por el conocimiento del producto o
la aplicación.
• Por ejemplo para datos de falla por fatiga la curva de 3 parámetros
se adapta bien.
4.3 Weibull de tres parámetros:
Aproximación de Bernard para el
ploteo de probabilidades

𝑗−0.3
F(t)=
𝑁+0.4
Parámetro de Localización
Ploteando la Probabilidad del
Parámetro de Localización
• El tercer parámetro de la distribución Weibull es utilizado
cuando no es posible trazar una recta, y obtenemos un desvío
cóncavo para abajo o para arriba.
• Para poder utilizar el método de ploteo de probabilidad, se
utiliza la siguiente formula para determinar un nuevo valor de
γ:

 
 T2 
T3  T2 T2  T1 
T3  T2   T2  T1 
• Restar de cada dato el valor de γ* y plotear la
correspondiente recta.
Estimación del Factor de Ubicación

(t 3  t 2 )(t 2  t1 )
  t2 
(t 3  t 2 )  (t2  t1 )
a

t1 t2 t3 tiempo
Ejercicio 4: Ploteo de Probabilidad (con
Weibull 3P)
• Seis ítems idénticos, están siendo probados en
las mismas condiciones de aplicación y
exigencia.
• Todos los ítems fallan durante el ensayo
siguiendo los siguientes numero de horas:
48;66;85;107;125 y 152 horas.
• Encuentre los parámetros de la distribución
Weibull 3P (tres-parámetros) usando el
método de ploteo de probabilidad.
Resultado:
Probabilidad - Weibull
99. 000

90. 000

Datos
Datos
ajustado por γ
D e sc o n f ia b ilid a d , F ( t )

originales

50. 000

  1.95
  92.32
10. 000
10. 000 100. 000   17.26
1000.000
Tiempo, (t)
Ejercicio 4: Análisis de Weibull 3P

Número Horas para la Línea Media


Falla Falla % Acum Falla
(i) (ti ) F(t )
1 1000 9.4
2 1300 22.8
3 1550 36.4
4 1850 50.0
5 2100 63.6
6 2450 77.2
7 3000 90.6
Respuesta Ejercicio Nr4:
Estimación del factor de Ubicación
Desde los datos: t1 = 810 horas
t2 = 1500 horas
t3 = 4000 horas
(𝑡3 − 𝑡2 ) ∗ (𝑡2 − 𝑡1 ) (4000 − 1500) ∗ (1500 − 810)
𝛾 = 𝑡2 − = 1500 − = 547
(𝑡3 − 𝑡2 ) − (𝑡2 − 𝑡1 ) (4000 − 1500) − (1500 − 810)

Replanteando:ti  
t1  1000 – 547 = 453 horas
t2  1300 – 547 = 753 horas
t3  1550 – 547 = 1003 horas, etc.
Ejercicio 4: Análisis Weibull 3P
Número Horas para Línea Media
Falla la falla % Acum Falla
(i) ajustadas F(t )
1 453 9.4
2 753 22.8
3 1003 36.4
4 1303 50.0
5 1553 63.6
6 1903 77.2
7 2453 90.6

El ajuste del tiempo para la falla es ahora lineal


Resultado:
Probabilidad - Weibull
99. 000

90. 000

Datos Corregidos
Datos Originales
50. 000
D e sc o n f ia b ilid a d , F ( t )

10. 000

5. 000
Beta = 1.85
Eta = 1538.7
Gamma = 558.5

1. 000
100. 000 1000.000 10000. 000
Tiempo, (t)
Efecto del Factor de Ubicación

f(t)

 = 1.9
63.2%

 = 547 1560 tiempo


nuevo  =
547+1560

También podría gustarte