Está en la página 1de 74

MTODOS ESTADSTICOS

Resumen

Objetivo
Revisar los mtodo estadsticos descriptivos e inferenciales ms comunes para analizar la calidad de los procesos para una toma de decisiones informada y soportada por datos.

Contenido
Concepto de variabilidad y estadstica Elementos de la estadstica Medidas estadsticas Mtodos grficos Pruebas de hiptesis

Qu es la estadstica?
Es el arte de tomar decisiones acerca de un proceso o una poblacin con bases en un anlisis de la informacin contenida en una muestra tomada de tal poblacin.

Qu mide la estadstica?
Ubicacin

Consistencia
FO

R MA

Poblacin
El estudio estadstico involucra el estudio a un conjunto de personas o cosas.
Este conjunto es la poblacin.

A las personas o cosas de una poblacin se les llama elementos.


Los elementos de una poblacin tienen caractersticas que pueden ser estudiadas, a estas caractersticas se les llama caracteres:
Sexo, edad, numero de hijos, color, altura.

Poblacin
Una poblacin puede ser finita o infinita. Ejemplo de poblaciones:
Los estudiantes de nuevo ingreso de la UANL en el ao 2012. Defectos encontrados en la lnea de ensamblaje de la empresa ACME.

Muestra
Subconjunto de elementos de una poblacin. Se desea que la muestra sea representativa de la poblacin.

Variacin
No existen dos hojas iguales en el mundo, la variacin es inevitable. Igual que las hojas, dos productos o servicios no son iguales, siempre existirn diferencias.

La variacin es el gran enemigo de los procesos.

Variable Aleatoria

Variables y Atributos
Los caracteres de un elemento se pueden clasificar en dos clases
1. Variables cualitativas: se describen por medio de nmeros.

2. Variables cuantitativas o atributos: requieren palabras y no se les puede asignar nmeros.

Discusin
En la empresa ACME midieron la altura en la que posicionaban las varillas en un proceso de soldadura, sin embargo definieron a esta variable como cuantitativa discreta, y el asesor de estadstica dijo que estaba bien como es posible, si la altura es una variable naturalmente continua, pues puede obtener cualquier valor entre cero e infinito?

Parmetro vs. Estadstico


Parmetro: caracterstica de una poblacin. Se emplean para describirla. Suelen ser representados por letras griegas.
Ej. , , 2

Estadstico: medias que describen a una muestra. Tambin se les llama estimadores, porque su intencin es la de estimar el verdadero valor de los parmetros. Son representados por letras de nuestro alfabeto.
Ej. X, s, s2

Estadstica descriptiva vs. inferencial


Las maneras clsicas de dividir la estadstica es: Estadstica descriptiva
Se utiliza para describir caractersticas de poblaciones

Estadstica inferencial
Se encarga de emitir conclusiones sobre poblaciones usando los datos obtenidos de una muestra sacada de esa poblacin.

Estadstica descriptiva vs. inferencial


Ya que la poblacin generalmente no se conoce en su totalidad, de ella se obtienen muestras que se miden para analizarse y hacer inferencias sobre la misma.

2 ,, Poblacin

Muestra

Anlisis de datos usando frecuencias


Frecuencia absoluta
Es la cantidad de datos en un conjunto de datos.

Frecuencia relativa
Representa la cantidad de datos en tantos por 1 o porcentaje de datos dentro de un conjunto con respecto al total.

Frecuencia absoluta acumulada


Teniendo distintos conjuntos agrupados de datos de una poblacin o muestra, la frecuencia absoluta acumulada representa la cantidad de datos en la suma de los conjuntos.

Frecuencia relativa acumulada


Representa la cantidad de datos en tantos por 1 o porcentaje de una frecuencia absoluta acumulada.

Ejemplo
Valor 1 2 3 4 5 6 7 8 9 10 11 12 Suma:

Frecuencia Frecuencia Frecuencia Acumulada Relativa 8 8 0.125 14 22 0.219 12 34 0.188 8 42 0.125 6 48 0.094 4 52 0.063 3 55 0.047 3 58 0.047 2 60 0.031 2 62 0.031 1 63 0.016 1 64 0.014 64 1.000

Frecuencia Relativa Acumulada 0.125 0.344 0.532 0.657 0.751 0.814 0.861 0.908 0.939 0.970 0.986 1

Medidas estadsticas
Las medidas estadsticas permiten resumir la informacin de la muestra de datos para obtener un mejor conocimiento de la poblacin.
1. 2. 3. 4. Tendencia central Dispersin Locacin Simetra

Medidas de tendencia central


Media
Promedio aritmtico de los datos

Mediana
El punto central de los datos Los datos se ordenan del menor al mayor. La mediana ser el dato que este al centro. Si existen dos datos al centro se tomara promedio.

Moda
Es el valor que mas se repite en un conjunto de datos

Clculo de la Media
Valor Frecuencia 1 8 2 14 3 12 4 8 5 6 6 4 7 3 8 3 9 2 10 2 11 1 12 1 Suma: 64

Frecuencia Relativa 0.125 0.219 0.188 0.125 0.094 0.063 0.047 0.047 0.031 0.031 0.016 0.014 1.000

Frecuencia Relativa Acumulada 0.125 0.344 0.532 0.657 0.751 0.814 0.861 0.908 0.939 0.97 0.986 1

Moda
V X FR

0.125 0.438 0.564 0.5 0.47 0.378 0.329 0.376 0.279 0.31 0.176 0.168 4.113

Mediana

Histograma
16 14 12 10 8 6 4 2 0 1 2 3 4 5 6 7 8 9 10 11 12

Media

Medidas de dispersin
Rango
El mximo valor los datos menos el valor mnimo.

Cuartiles
Ordenados los datos de manera ascendente, el primer, segundo y tercer cuartil dividen en cuatro partes iguales el conjunto de datos.

Varianza de poblacin
Cuadrado de la desviacin media de los datos.

Desviacin estndar
Raz cuadrada de la varianza.

Rango
En un conjunto de mediciones, es la diferencia entre el valor mayor y el mejor de los datos. Es muy fcil de calcular engaarnos, ejemplo: 4,5,5,5,6,7,8,9,9,9 4,9,9,9,9,9,9,9,9,9 pero puede

Rango=9-4=5 Rango=9-4=5

Varianza
Varianza de la poblacin
Suma de las desviaciones cuadradas de la media por la frecuencia de ocurrencia

2 =
=1

Por facilidad de calculo se ocupara la siguiente formula

2 =

2 =1 ( =1 )2

2 =

=1

Estimador de la varianza 2
Suma de las desviaciones cuadradas de la media entre los grados de libertad de la muestra (n-1)
2 =
=1

Desviacin Estndar
Desviacin estndar de la poblacin ( )
Es la raz cuadrada de la varianza de la poblacin, o sea:

= 2

Estimador de la desviacin estndar (s)


Es la raz cuadrada de la varianza de la muestra, o sea:

s = 2

Desviacin Estndar

Medidas de localizacin
Cuartiles
Ordenados los datos de manera ascendente, el Primer, segundo y tercer cuartil dividen en cuatro partes iguales el conjunto de datos.

Percentiles:
Dividen a la poblacin en 100 partes iguales.

Cuartiles
Primer cuartil (Q1)
Punto abajo del cual se encuentra el 25% de los datos que han sido ordenados ascendentemente.

Segundo cuartil (Q2)


Punto abajo del cual se encuentra el 50% de los datos que han sido ordenados ascendentemente. Equivale a la mediana de los datos.

Tercer cuartil (Q3)


Punto abajo del cual se encuentra el 75% de los datos que han sido ordenados ascendentemente.

2,3,3,3,4,4,4,6,6,7,8,9,10,10,10,10,11,12,14 Q1=4 Q3=10 Q2=mediana=7 Mediana de


la primer mitad

Mediana de la segunda mitad

Percentiles
Datos en bruto
Densidad 4.5 3.8 7.6 3.5 7.8 5.6 4.6 3.5 6.7 9.1 7.6 4.8

Jerarqua de los Datos segn el orden

i 1 2 3 4 5 6 7 8 9 10 11 12

Densidad Percentil 3.5 4.17 3.5 12.50 3.8 20.83 4.5 29.17 4.6 37.50 4.8 45.83 5.6 54.17 6.7 62.50 7.6 70.83 7.6 79.17 7.8 87.50 9.1 95.83

Datos ordenados 28 ascendentemente Percentil =100*(i-0.5)/n

Medidas de forma
Asimetra o sesgo
Decimos que una distribucin es simtrica, cuando su media aritmtica y su moda coinciden.

Sesgo o asimtrica a la izquierda


Cuando las frecuencias de la distribucin descienden mas lentamente a la izquierda que a la derecha.

Apuntamiento o curtosis
Miden que tantos datos estn agrupados alrededor de la moda.

Medidas de forma
Ejemplos de formas segn sus simetra:
Distribucin con sesgo a la izquierda: sesgo <0 Distribucin simtrica =0 Distribucin con sesgo a la derecha: sesgo >0

0 =
3 ( ) =1 = 3

Media Moda Mediana

Media Mediana Moda 30

Moda Media Mediana

Medidas de forma
Ejemplos de formas segn su curtosis
Leptocurtica
Apuntamiento mayor al de una distribucin normal (curtosis >1)

Mesocurtica
Apuntamiento similar al de una distribucin normal (curtosis=1)

Platicurtica
Apuntamiento menor al de una distribucin normal (curtosis<1)

Leptocurtica

Mesocurtica

Platicurtica

Ejercicio 1: Complete la tabla


X X-barra (X-Xbarra)^2 16 9

17
12 22 13 8 15 19 11

Total: N: Moda: Media: Sigma^2: Sigma: S^2: S: Mnimo: Primer Cuartil: Mediana: Tercer Cuartil: Mximo:

TOTAL

Ejercicio 2: Reclamos de seguros


Reclamo 1 2 3 4 5 6 7 8 9 10 Dias 48 41 35 36 37 26 36 46 35 47 Reclamo 11 12 13 14 15 16 17 18 19 20 Dias 35 34 36 42 43 36 56 32 46 30 Reclamo 21 22 23 24 25 26 27 28 29 30 Dias 37 43 17 26 28 27 45 33 22 27 Reclamo 31 32 33 34 35 36 37 38 39 40 Dias 16 22 33 30 24 23 22 30 31 17

n: Moda: Media: Sigma^2: Sigma: S^2:

S: Mnimo: Primer Cuartil: Mediana: Tercer Cuartil: Maximo:

Respuesta
Estadstica Descriptiva: Das
Variable Das Variable Das N 40 Q3 40.00 Mean 33.25 Maximum 56.00 StDev 9.37 Range 40.00 Variance 87.88 Skewness 0.17 CoefVar 28.19 Kurtosis -0.32 Sum 16.00 Minimum 26.25 Q1Median 33.50

Qu ves en la figura?

Qu ves en la figura?

Qu ves en la figura?

Qu ves aqu?

Qu ves aqu?

Qu ves aqu?

Qu ves aqu?

Qu ves aqu?

Diagrama de tallos y hojas


Stem-and-Leaf Display: Das Stem-and-leaf of Das N Leaf Unit = 1.0
3 Mediana 8 13 (8) 19 10 6 1 1 1 2 2 3 3 4 4 5 5 677 22234 66778 00012334 555666677 1233 56678 6

Nombre de variable = 40

Cantidad de Datos
Unidad de medida de las hojas

Tallos Hojas Frecuencia

Histograma
1. El primer paso para crear un histograma es dividir el rango de los datos en intervalos, tambin llamados intervalos de clase. De ser posible, hacer que los intervalos sean todos del mismo tamao. Generalmente entre 5 y 20 intervalos de clase son suficientes. La raz cuadrada de n nos puede servir de referencia para determinar la cantidad de intervalos. La altura de las barras corresponde a la frecuencia o cantidad de datos dentro de cada intervalo. Tambin puede utilizarse la frecuencia relativa.

2.

3.
4. 5.

6.

Diagrama de Caja

MIN{Q3+1.5RI; Dato mayor)


Rango Inter- cuartilico: RI=Q3-Q1 MAX{Q211.5RI;Dato menor) Valor Extremo Valor fuera de los limites de los bigotes del diagrama de caja

Ejercicio 3: Grosor en semiconductores


Elaborar un Diagrama de Tallos y hojas, un Histograma y un Diagrama de Caja con los siguientes datos: Layer Thickness on Semiconductor Wafers 438 450 487 451 452 441 444 461 432 471 413 450 430 431 465 444 471 453 431 458 444 450 446 444 466 458 471 452 455 445 468 459 450 453 473 454 458 438 447 463 445 466 456 434 471 437 459 445 454 423 472 470 433 454 464 443 449 435 435 451 474 457 455 448 478 465 462 454 425 440 454 441 459 435 446 435 460 428 449 442 455 450 423 432 459 444 445 454 449 441 449 445 455 441 464 457 437 434 452 439

El valor Z
Poblacin

Muestra

El valor z no es mas que la cantidad de desviaciones estndares a la que se encuentre un dato de media. A la distribucin de los valores le llamamos distribucin normal estndar. Nos permite comparar elementos de distintas poblaciones entre si.

Ejercicio 4: Calcule Z
Tomando en cuenta los datos del ultimo ejercicio, calcule el valor z para de los valores 450, 438 y 431.

Distribucin normal estndar y calculo de probabilidades


Una de las ventajas del valor z, es que al estandarizar los valores de una distribucin, se nos facilita el calculo de la probabilidad de ocurrencia de un intervalo de valores utilizando tablas de probabilidades pre calculadas. En este caso, podemos utilizar la tabla Z.

Tabla Z
reas bajo la curva normal estndar. Los valores de la tabla que no se muestran en negrita representan la probabilidad de observar un valor menos o igual a z. La cifra entera y el primer decimal de z se buscan en la primera columna, y el segundo decimal en la cabecera de la tabla.
P(Z z)=

z 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0 3.1 3.2 3.3 3.4

0.00 0.5000 0.5398 0.5793 0.6179 0.6554 0.6915 0.7257 0.7580 0.7881 0.8159 0.8413 0.8643 0.8849 0.9032 0.9192 0.9332 0.9452 0.9554 0.9641 0.9713 0.9772 0.9821 0.9861 0.9893 0.9918 0.9938 0.9953 0.9965 0.9974 0.9981 0.9987 0.9990 0.9993 0.9995 0.9997

0.01 0.02 0.5040 0.5080 0.5438 0.5478 0.5832 0.5871 0.6217 0.6255 0.6591 0.6628 0.6950 0.6985 0.7291 0.7324 0.7611 0.7642 0.7910 0.7939 0.8186 0.8212 0.8438 0.8461 0.8665 0.8686 0.8869 0.8888 0.9049 0.9066 0.9207 0.9222 0.9345 0.9357 0.9463 0.9474 0.9564 0.9573 0.9649 0.9656 0.9719 0.9726 0.9778 0.9783 0.9826 0.9830 0.9864 0.9868 0.9896 0.9898 0.9920 0.9922 0.9940 0.9941 0.9955 0.9956 0.9966 0.9967 0.9975 0.9976 0.9982 0.9982 0.9987 0.9987 0.9991 0.9991 0.9993 50 0.9994 0.9995 0.9995 0.9997 0.9997

Segunda cifra decimal del valor de z 0.03 0.04 0.05 0.06 0.5120 0.5160 0.5199 0.5239 0.5517 0.5557 0.5596 0.5636 0.5910 0.5948 0.5987 0.6026 0.6293 0.6331 0.6368 0.6406 0.6664 0.6700 0.6736 0.6772 0.7019 0.7054 0.7088 0.7123 0.7357 0.7389 0.7422 0.7454 0.7673 0.7704 0.7734 0.7764 0.7967 0.7995 0.8023 0.8051 0.8238 0.8264 0.8289 0.8315 0.8485 0.8508 0.8531 0.8554 0.8708 0.8729 0.8749 0.8770 0.8907 0.8925 0.8944 0.8962 0.9082 0.9099 0.9115 0.9131 0.9236 0.9251 0.9265 0.9279 0.9370 0.9382 0.9394 0.9406 0.9484 0.9495 0.9505 0.9515 0.9582 0.9591 0.9599 0.9608 0.9664 0.9671 0.9678 0.9686 0.9732 0.9738 0.9744 0.9750 0.9788 0.9793 0.9798 0.9803 0.9834 0.9838 0.9842 0.9846 0.9871 0.9875 0.9878 0.9881 0.9901 0.9904 0.9906 0.9909 0.9925 0.9927 0.9929 0.9931 0.9943 0.9945 0.9946 0.9948 0.9957 0.9959 0.9960 0.9961 0.9968 0.9969 0.9970 0.9971 0.9977 0.9977 0.9978 0.9979 0.9983 0.9984 0.9984 0.9985 0.9988 0.9988 0.9989 0.9989 0.9991 0.9992 0.9992 0.9992 0.9994 0.9994 0.9994 0.9994 0.9996 0.9996 0.9996 0.9996 0.9997 0.9997 0.9997 0.9997

0.07 0.5279 0.5675 0.6064 0.6443 0.6808 0.7157 0.7486 0.7794 0.8078 0.8340 0.8577 0.8790 0.8980 0.9147 0.9292 0.9418 0.9525 0.9616 0.9693 0.9756 0.9808 0.9850 0.9884 0.9911 0.9932 0.9949 0.9962 0.9972 0.9979 0.9985 0.9989 0.9992 0.9995 0.9996 0.9997

0.08 0.5319 0.5714 0.6103 0.6480 0.6844 0.7190 0.7517 0.7823 0.8106 0.8365 0.8599 0.8810 0.8997 0.9162 0.9306 0.9429 0.9535 0.9625 0.9699 0.9761 0.9812 0.9854 0.9887 0.9913 0.9934 0.9951 0.9963 0.9973 0.9980 0.9986 0.9990 0.9993 0.9995 0.9996 0.9997

0.09 0.5359 0.5753 0.6141 0.6517 0.6879 0.7224 0.7549 0.7852 0.8133 0.8389 0.8621 0.8830 0.9015 0.9177 0.9319 0.9441 0.9545 0.9633 0.9706 0.9767 0.9817 0.9857 0.9890 0.9916 0.9936 0.9952 0.9964 0.9974 0.9981 0.9986 0.9990 0.9993 0.9995 0.9997 0.9998

Ejercicio 5: Clculo de probabilidades


Teniendo una distribucin normal con media de 150 y desviacin estndar de 15, calcule lo siguiente:

1. 2. 3. 4. 5. 6. 7.

La probabilidad de obtener valores menores a 150. La probabilidad de obtener valores mayores a 150. La probabilidad de obtener valores entre 135 y 165. La probabilidad de obtener valores entre 120 y 180. La probabilidad de obtener valores menores a 105. La probabilidad de obtener valores mayores a 195. La probabilidad de obtener 120.

Ejercicio 6: Comparacin de Observaciones


En dos procesos, A y B, se mide una caracterstica de calidad que presenta las siguiente medias y desviaciones estndares: Proceso A = 10 =2 Proceso B =5 =1

Del Proceso A se obtuvo una pieza cuya caracterstica de calidad tenia valor de a = 13, y del proceso B se medio una pieza b = 2. Que pieza, a o b es mas representativa a la poblacin a la que pertenece?

Inferencia estadstica
Estudia como sacar conclusiones generales para toda poblacin a partir del estudio de una muestra de la misma. Existen dos formas para hacer inferencia estadstica:
Estimacin de parmetros (puntual o por intervalo). Las pruebas de hiptesis.

Estas tcnicas exigen que la muestra sea representativa de la poblacin, y para ello procuraremos que se haya tomado de manera aleatoria, donde cada dato de la poblacin tiene la misma probabilidad de pertenecer a la muestra.

Estimacin puntual de parmetros


En general, los parmetros de una poblacin no los conocemos, pero podemos conocer la familia a la que pertenece (normal, binomial, etc).

Para calcular los parmetros necesitaramos todos los elementos de la poblacin, y como no es posible, nos limitamos a inferirlos a partir de una muestra.

Estimacin puntual de parmetros


El problema de la estimacin del parmetro se resuelve conociendo la distribucin muestral del estadstico que se este utilizando. Estimacin: Proceso por medio del cual se trata de estimar el parmetro por medio de un estadstico.

Estadstico: es la variable aleatoria que depende nicamente de la muestra aleatoria.

Ejemplo: Estimacin de parmetros


Si una poblacin se sabe que es normal con media y varianza 2 entonces, y ambos parmetros son desconocidos, los estimadores de estos parmetros son:
=
1 =1 1 =1

2 = 1

Si x es el nmero de xitos en una poblacin que tiene distribucin Binomial con parmetros n y p, con p desconocida, una forma de estimar p es mediante:
=
1 =1

Estimacin por intervalos


La estimacin puntual presenta un problema innato, existe un error de estimacin.

La nica forma de conocer el verdadero valor del parmetro es conociendo toda la poblacin, lo cual raramente se puede.
Una forma de tomar en cuenta el error de la estimacin es mediante la estimacin por intervalo.

Estimacin por intervalos


Al definir un intervalo de estimacin para un parmetro poblacional, se declaran tres elementos:
Un lmite inferior Un lmite superior Un nivel de confianza

El nivel de confianza indica la probabilidad de que el verdadero valor del parmetro poblacional se encuentre contenido dentro de los lmites expuestos.

Intervalos de la media de una distribucin normal


Si nuestra poblacin es normal con media desconocida y varianza conocida 2 , el intervalo de confianza de la media es:
IC 1 %=
2

, con nivel de confianza 1

Si la varianza es desconocida y se tiene que estimar por medio de s.


IC 1 % = ,1
2

, con nivel de confianza 1

Ejemplo: IC para media


Se toma una muestra n = 25 datos de una poblacin normal 2 = 100 y se obtiene un promedio de = 50. Calcule el IC 95% de la media:
= 0.05 = 0.025 =1.96 (segn tabla Z)
2

IC 95% = 501.96

10

25

= 46.08, 53.92

Pruebas de hiptesis
La prueba de Hiptesis es un procedimiento estadstico usado para tomar una decisin, con base en una muestra, en cuanto al valor que puede tener algn parmetro (media, varianza, proporcin), so sobre la distribucin que puede tener la poblacin de donde provienen los datos

Pruebas de hiptesis
Los elementos de una prueba de hiptesis son: Las hiptesis. La que se desea probar (Ho) y su complemento (Ha). La(s) muestra(s). La informacin que se obtiene de la poblacin o poblaciones. El estadstico de prueba (EP). Es una variable aleatoria que resume la informacin de la muestra. La regin de rechazo de Ho. Es una parte de la distribucin de referencia en la cual si el EP se encuentra ah, se rechaza Ho. La decisin. Decidir si se rechaza o no a Ho. El nivel de confianza de la prueba (1-).

Tipos de error
Los tipos de errores y sus probabilidades son:
= P(Error tipo I) = P(rechazar Ho|Ho verdad) = P(Error tipo II) = P(aceptar Ho|Ho falso)

PH e IC para una media


Hiptesis Estadsticas: H0 : = 0 H1 :
Estadstico de Prueba: a) para n 30
Regin de Rechazo de H0

> 0 ------------------ > < 0 ------------------ > 0 ------------------ > /2

> ,1 < ,1 > ,1


2

EP: =

IC=
2

b) Para n <30, poblacin normal


b1) Varianza conocida
EP:

b2) Varianza desconocida


IC =
2

Z=

EP:

t=

IC = ,1
2

PH e IC para la diferencia de medias


Hiptesis Estadsticas: H0 : 1 = 2 H1 : Regin de Rechazo de H0 > 0------------------- > > ,1+22 < 0------------------- > < ,1+22 0------------------- > > ,1 +22
2 2

Estadstico de Prueba: a) b) Para 1 ,2 30 EP: =


1 2 (1 2 )
2 2 1 + 2 1 2

IC = (1 2 )
2

2 1

+ 2

2
2

Para 1 ,2 < 30, poblacin normal y varianzas desconocidas b2) 1 2


1 1 + 1 2

b1 ) 1 = 2

EP: t=

1 2 (1 2 )

IC= ,1+22
2

1 1

1
2

EP: t=

1 2 (1 2 )
2 2 1 + 2 1 2
2

IC= ,
2

2 1

+ 2

2
2

2 +( 1) 2 1 1 2 2

1 +2 2

gl=

1 2 2 2 (1 )2 (2 )2 1 + 2 1 1 2 1

( 1 + 2 )2

Considerar estos grados de


libertad (gl) para determinar la Regin de Rechazo

PH e IC para la diferencia de medias (observaciones en pareja)


Hiptesis Estadsticas: H0 : 1 = 2 H1 : Regin de Rechazo de H0 > 0------------------- > > ,1+22 < 0------------------- > < ,1+22 0------------------- > > ,1 +22
2 2

Estadstico de Prueba: a) b) Para 1 ,2 30 EP: =


1 2 (1 2 )
2 2 1 + 2 1 2

IC = (1 2 )
2

2 1

+ 2

2
2

Para 1 ,2 < 30, poblacin normal y varianzas desconocidas b2) 1 2


1 1 + 1 2

b1 ) 1 = 2

EP: t=

1 2 (1 2 )

IC= ,1+22
2

1 1

1
2

EP: t=

1 2 (1 2 )
2 2 1 + 2 1 2
2 1 1 2

IC= ,
2
2

2 1

+ 2

2
2

2 +( 1) 2 1 1 2 2

1 +2 2

gl =

2 1 1

2 2 2 2

1 1

2 2 2

2 1

Considerar estos grados de libertad (gl) para determinar la Regin de Rechazo

PH e IC para una proporcin


Aproximacin a la normal
30 0.1 0.9

Hiptesis Estadsticas: H0 : = 0

H1 :

Regin de Rechazo de H0 > 0 --------------------- > < 0 --------------------- > 0 --------------------- > 2

Estadstico de Prueba:
+0.5 0 0 (10 ) 0.5 0 0 (10 )

, < 0 IC = 2 , > 0
(1)

EP: =

PH e IC para una proporcin


Aproximacin a la normal
1 ,2 30 Hiptesis Estadsticas: H0 : 1 = 2 H1 : Regin de Rechazo de H0 1 > 2 --------------------- > 1 < 2 --------------------- > 1 2 --------------------- > 2
1 (11 ) 1 2 (12 ) 2

Estadstico de Prueba: EP: Z =


1 2 (1)(
1 1 + ) 1 2

: 1 2 2

1 = 1

2 = 2

1+2
1 +2

PH e IC para varianzas
Hiptesis Estadsticas: H0 : 2 = 2 0 H1 :
Estadstico de Prueba: EP: =
1 2 , 2
Regin de Rechazo de H0
2 > 2 0 --------------- > 2 < 2 0 --------------- > 2 2 0 --------------- > /2

= 1

2 1 2 1 IC = 2 < 2 < 2 , 1 1 , 1 2 2

PH e IC para razn de varianzas


Hiptesis Estadsticas: H0 : 2 = 2 0 Regin de Rechazo de H0
H1 : 2 > 2 0 -------------- F > F 2 < 2 0 -------------- F > F 2 2 0 -------------- F > F/2

Estadstico de Prueba:
2 1 2 1 EP: F = 2 2 , = 1 1, 2 1 2 2 2 1 1 21 < 2 < 2 , 1 1, 2 1 2 , 1, 1 2 2 1 2 2

21 IC = 2 2

Se pueden obtener estos limites de confianza correspondientes de 1 obteniendo


las races cuadradas de los lmites de confianza de 2 1
2

Grfica Cuantil-Cuantil
Salvo por la prueba de diferencia de proporciones, todas estas pruebas asumen que los datos provienen de una distribucin normal. Una forma rpida de validar si los datos provienen de una distribucin normal es mediante el uso de grficas cuantil-cuantil

Si la grfica muestra una lnea aproximadamente recta, se puede asumir que los datos tienen un comportamiento razonablemente normal.

Grfica Cuantil-Cuantil
1. 2. Ordenas los residuos del menor al mayor Calcular el valor del cuantil de cada dato usando la ecuacin = + 0.5 /, donde es la cantidad de observaciones con valores menores a la observacin , es la cantidad de empates con la observacin (si no hay empates = 1), es el total de datos. Calcular el cuantil de una distribucin normal estndar usando como probabilidad acumulada, es decir, obtener el valor que cumple = , donde ~ 0,1 Estimar la media y la desviacin estndar de los datos originales. Calcular = Graficar vs.
2.5

1.5

3.

0.5 zi 0 0.00 -0.5 0.20 0.40 0.60 0.80 1.00 1.20 -1

4. 5. 6.

-1.5

-2

qi

La prueba de Hiptesis de valor probabilstico: Un procedimiento de cinco pasos


1. El inicio: 1. Describir el parmetro poblacional de inters. 2. Expresar la hiptesis nula 0 y la hiptesis alternativa 1 . Criterios de prueba de hiptesis: 1. Comprobar las suposiciones. 2. Identificar la distribucin de probabilidad y la estadstica de prueba a usar. 3. Determinar el nivel de significacin, . La evidencia muestral: 1. Recolectar la informacin muestral. 2. Calcular el valor de la estadstica de prueba. La distribucin de probabilidad: 1. Calcular el valor para la estadstica de prueba. 2. Determinar si el valor es o no es menor que . Los resultados: 1. Expresar la decisin acerca de 0 . 2. Expresar la conclusin acerca de 0 .

2.

3.

4.

5.

La prueba clsica de hiptesis: Un procedimiento de cinco pasos.


1. El inicio: 1. Describir el parmetro poblacional de inters. 2. Expresar la hiptesis nula 0 y la hiptesis alternativa 1 . Criterios de prueba de hiptesis: 1. Comprobar las suposiciones. 2. Identificar la distribucin de probabilidad y la estadstica de prueba a usar. 3. Determinar el nivel de significacin, . La evidencia muestral: 1. Recolectar la informacin muestral. 2. Calcular el valor de la estadstica de prueba. La distribucin de probabilidad: 1. Determinar la regin critica y valor(es) critico(s). 2. Determinar si la estadstica de prueba calculada est o no est en la regin critica. Los resultados: 1. Expresar la decisin acerca de 0 . 2. Expresar la conclusin acerca de 0 .

2.

3.

4.

5.

También podría gustarte