Resumen Prueba de Hipótesis

PRUEBA DE HIPÓTESIS
INSTITUTO TECNOLÓGICO DE ORIZABA
ESTADÍSTICA INFERENCIAL
Dr. Mario Leoncio Arrioja Rodríguez

M.C. Jorge Luis Hernández Mortera
• Introducción y Conceptos básicos.

• Prueba de Hipótesis para un parámetro.
• Prueba de Hipótesis para dos parámetros.
• Prueba de Hipótesis de distribución libre.
• Prueba de Hipótesis no paramétricas.
2
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
INTRODUCCIÓN Y
CONCEPTOS BÁSICOS
CLASIFICACIÓN DE LA ESTADÍSTICA INFERENCIAL
Estadística Inferencial
Teoría de •Trata de los métodos para obtener la

estimación de parámetros, a partir
estimación del análisis de muestras aleatorias.
•Trata de los métodos para comprobar

Prueba de una hipótesis sobre uno o mas
Hipótesis parámetros, a partir del análisis de
muestras aleatorias.
4
INTRODUCCIÓN: CONCEPTO
La Hipótesis es una afirmación (suposición o conjetura)

que se hace, en este caso, sobre la distribución o el
valor de un parámetro de una o más poblaciones. La
cual se busca evaluar en base a la información obtenida
de una muestra aleatoria de la(s) población(es) bajo
estudio.
El nombre completo de esta técnica es Prueba de
Hipótesis Estadística, pero por comodidad se le llama
simplemente Prueba de Hipótesis.
Muchos problemas de decisión pueden plantearse como
problemas de prueba de hipótesis, por ello es una de las
técnicas estadísticas más útiles.
5
INTRODUCCIÓN: CLASIFICACIÓN DE LAS PRUEBAS
Suponen normalidad en la
población y requieren estimar
parámetros
No necesitan del supuesto de

normalidad en la población y
no en todos los casos
requieren estimar parámetros
6
INTRODUCCIÓN: CLASIFICACIÓN DE LAS PRUEBAS
Para m con varianza conocida
Para m con varianza desconocida
Para s2 de una población normal
Para p de una población binomial
Para m1-m2 con varianza conocida

Para m1-m2 con varianza desconocida
Para s12/ s22 de poblaciones normales
Para p1-p2 de poblaciones binomiales
Análisis de Varianza (ANDEVA / ANOVA)
Prueba de Bondad de Ajuste

Tablas de Contingencia
Prueba de Kolmogorov - Smirnov

Prueba de Wilcoxon para muestras
independientes
Prueba de los Signos
Prueba del Orden de los Signos, etc.
7
INTRODUCCIÓN: FASES DE LA PRUEBA DE HIPÓTESIS
La realización de una prueba de hipótesis implica dos fases:
• El establecimiento de la hipótesis
• El procedimiento para comprobarla
La primera fase se determina en una de tres maneras
diferentes:
1.Puede ser resultado de la experiencia o del conocimiento
del proceso, entonces el objetivo de la prueba usualmente
es determinar si ha cambiado el valor del parámetro.
2.Puede obtenerse a partir de alguna teoría o modelo que se
relaciona con el proceso bajo estudio. En este caso, el
objetivo de la prueba es verificar la teoría o modelo.
3.Cuando el valor del parámetro proviene de consideraciones
externas, tales como las especificaciones de diseño o de
ingeniería o de obligaciones contractuales. En esta
situación, el objetivo usual de la prueba es probar el
cumplimiento de las especificaciones. 8
INTRODUCCIÓN: ESTABLECIMIENTO DE LA HIPÓTESIS
La hipótesis debe expresarse en términos de dos eventos

mutuamente excluyentes y complementarios, los cuales
simbólicamente serían:
H: afirmación sobre el parámetro
H’: complemento de la afirmación sobre el parámetro
Posterior a esto, se debe decidir cual de ellas será la
llamada Hipótesis Nula, representada por H0: y cual es la
Hipótesis Alternativa, representada por H1:
Para ello, generalmente lo que interesa se pone como H1 y
lo contrario como H0, con la condición que la igualdad
siempre se pone en H0, de ahí sus nombres: la que se
desea anular a favor de la alternativa. No se puede
rechazar H0 hasta que las evidencias muestrales sean
suficientemente claras.
9
INTRODUCCIÓN: ESTABLECIMIENTO DE LA HIPÓTESIS
Finalmente, el problema deberá quedar en la forma de
alguna de las expresiones siguientes:
• Bilateral:
H0: θ = Valor
H1: θ ≠ Valor Dado que H1 es la que
identifica el tipo de
•Unilateral prueba, en ciertos casos
oSuperior: H0: θ ≤ Valor H0 se expresa, para
todos los casos, como
H1: θ >Valor igualdad:
H0: θ = Valor
oInferior : H0: θ ≥ Valor
H1: θ < Valor
Una vez establecido el problema, se pasa al procedimiento
de comprobación de la hipótesis.
10
INTRODUCCIÓN: COMPROBACIÓN DE LA HIPÓTESIS
Para poder comprobar la hipótesis planteada, se requiere

establecer un Estadístico de Prueba, que se calculará a
partir de los datos de una muestra aleatoria.
Así mismo se deberá definir una regla, que establezca los
valores del estadístico de prueba a partir de los cuales se
rechazará H0, a los cuales se denomina Zona Crítica o Zona
de Rechazo. Esta corresponde a los valores fuera del
intervalo de confianza del parámetro, así el intervalo de
confianza es la Zona de No Rechazo de H0.
Sólo cuando se tiene el Estadístico de Prueba y la Zona
Crítica es que se tiene completamente definida una prueba
de hipótesis.
Convencionalmente todas las conclusiones se dan siempre
en términos de H0, no en términos de H1, aun cuando sean
equivalentes.
11
INTRODUCCIÓN: POSIBLES RESULTADOS DE UNA PRUEBA
Las situaciones en las que se puede estar, al finalizar una

prueba de hipótesis, depende de:
• La conclusión a que se haya llegado y
• Del verdadero valor del parámetro (Estado de la
Naturaleza).
Expresadas en palabras estas situaciones son:

• Error tipo I : Rechazar una hipótesis verdadera
• Error tipo II: No Rechazar una hipótesis falsa
• Potencia de la Prueba: Rechazar una hipótesis falsa
12
INTRODUCCIÓN: POSIBLES RESULTADOS DE UNA PRUEBA
Se considera que el Error Tipo I es el mas grave de todos, ya
que ocurre cuando se encuentran pruebas de que H1 es
cierta, cuando en realidad no lo es y por ello es el que más
se evitar reducir.
Las probabilidades de estar en las situaciones planteadas
anteriormente son:
• : Probabilidad de cometer
Error tipo I
• : Probabilidad de cometer
1- 
Error tipo II
 1-
• = 1-  : Probabilidad de la
Potencia de la Prueba
Una manera de evaluar el comportamiento de una prueba de
hipótesis, es obtener la llamada Curva de Operación
Característica a partir de las probabilidades anteriores.
13
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez
INTRODUCCIÓN: OBTENCIÓN DE LA CURVA OC
Al establecer una prueba de hipótesis, tal como:
𝐻 0: 𝜃 = 𝑝
𝐻 1: 𝜃 > 𝑝
Se calculan las probabilidades de rechazar H0, para todos los
posibles valores del parámetro bajo análisis, al graficarlas se
obtendría la curva de operación característica:
A esta curva también se le conoce como curva de potencia o

simplemente curva de operación y se abrevia OC. 14
INTRODUCCIÓN: INTERPRETACIÓN DE LA CURVA OC
Si al establecer una prueba de hipótesis, tal como:
Probabilidad Inicial
𝐻0: 𝜃 = 𝛼 Cuando no se rechaza H0 y este es el verdadero
Estado de la Naturaleza, se está en lo correcto.
𝐻1: 𝜃 > 𝛼 Esta es la situación en la que se está al iniciar la
prueba de hipótesis, el área verde por encima de
Se calculan las probabilidades de rechazar H , para todos los
la curva, en la parte de0 H0, representa esta
posibles valores del parámetro bajo análisis,
probabilidad, que no tieneal graficarlas
un nombre se en
obtendría una curva como particular.
la siguiente:

simplemente como curva de operación y se abrevia OC. 15
Si al establecer una prueba de hipótesis,
Probabilidadtalde
como:
Error Tipo I: 
𝐻0: 𝜃 = 𝛼 Rechazar H0 cuando este es el verdadero Estado
de la Naturaleza es el Error Tipo I, la
𝐻1: 𝜃 > 𝛼 probabilidad de cometerlo está representado por
el área roja, bajo la curva en la parte de H0. El
Se calculan las probabilidades de rechazar H0, para
valor que se toma en cuenta
todos los
es el máximo que
posibles valores del parámetro
puede bajo
ocurrir,análisis, al graficarlas
que está entre los límites de Hse
0 y
obtendría una curva como laH1.siguiente:

𝐻0: 𝜃 = 𝛼 Probabilidad de Error Tipo II: 
No rechazar H0 cuando el verdadero Estado de la
𝐻1: 𝜃 > 𝛼 Naturaleza es H1 es el Error Tipo II, la
probabilidad de cometerlo está representado por
Se calculan las probabilidades
el áreade rechazar
amarilla, sobre laHcurva
0, para
en latodos
parte delos
H1.
El valorbajo
que seanálisis, al graficarlas
toma en cuenta se
se obtiene para
un valor dado de  en la parte de H1.
obtendría una curva como la siguiente:

Si al establecer una prueba de hipótesis,
Potencia detal como:
la Prueba:
𝐻0: 𝜃 = 𝛼 Rechazar H0 cuando el verdadero Estado de la Naturaleza
es H1 se llama Potencia de la Prueba, es la probabilidad de
𝐻1: 𝜃 > 𝛼 rechazar H0 cuando esta es falsa, está representado por el
área verde claro, bajo la curva en la parte de H1. El valor
que se toma en de rechazar
cuenta se obtieneHpara
0, para todos
un valor los
dado de
posibles valores delenparámetro
la parte de H1, bajo
por elloanálisis, aligualdad:
se maneja la graficarlas se
obtendría una curva como la siguiente: = 1 - 

𝐻0: 𝜃 = 𝛼 Comparación de Curvas OC
𝐻1: 𝜃 > 𝛼 Las curvas mostradas, permiten ver como al
cambiar la probabilidad de cometer el error
Tipode rechazar
I, la H0de
probabilidad , para todos
cometer los
el error
Tipo bajo análisis,
II cambia al graficarlas
de manera inversamente se
proporcional.

𝐻0: 𝜃 = 𝛼 Curva OC Ideal
𝐻1: 𝜃 > 𝛼 La única forma de disminuir ambos errores
simultáneamente es aumentando el tamaño
de de rechazar
muestra, H0, separa
entre mas todos
acerque estalos
al
posibles valores del parámetro bajodeanálisis,
tamaño al graficarlas
la población, la curva se se
asemejará mas a la que aquí se muestra.

Si la prueba es bilateral, la curva OC se vería con la

distribución del estimador, su forma también dependería del
tipo de probabilidad que se eligiera para graficarla.
H0:  = Valor
H1:   Valor
La utilidad de la curva OC es que permite analizar como se

comportará una prueba y así elegir los valores mas
adecuados de ,  y n.
21
DETERMINACIÓN DEL TAMAÑO DE MUESTRA
Uno de los aspectos a resolver, antes de realizar la
prueba, es determinar el tamaño de muestra, esto es
importante ya que:
a) A mayor tamaño de muestra menores serán las
probabilidades de error Tipo I y de error Tipo II.
b) A mayor tamaño de muestra mayor será el costo
de la misma.
Para conciliar estos aspectos antagónicos, se debe elegir
el menor tamaño de muestra que permita los niveles de
error mas bajos.
Las curvas OC son una alternativa para poder hacer esto,
no siempre es necesario construirlas ya que en algunas
fuentes bibliográficas existen curvas estandarizadas que
facilitan este proceso.
22
OBTENCIÓN DE DATOS Y ESTABLECIMIENTO DE CONCLUSIONES
Como en todas las técnicas de estadística inferencial, una
de las condiciones para que las conclusiones sean válidas
al nivel de precisión estadística que se estableció, es decir
los valores de las probabilidades de error Tipo I y de error
Tipo II, es que los datos se obtengan aleatoriamente.
La técnica de muestreo probabilístico que se utilizará, en
una prueba en particular, depende de las características de
la población que se esté analizando, de los recursos
técnicos y económicos con los que se cuente y sobre todo
de la experiencia del responsable de la realización del
trabajo.
Lo adecuado de la técnica seleccionada, del número y
calidad de los datos, así como de la experiencia de los
involucrados, serán los factores que permitan tener éxito
en su realización.
23
INTRODUCCIÓN: TÉCNICA DE LA PRUEBA DE HIPÓTESIS
Elección del parámetro mas representativo del problema
Determinación del tipo de Hipótesis (Bilateral o Unilateral)
Elección de la Hipótesis Nula y de la Hipótesis Alternativa
Establecimiento del nivel de significancia y tamaño de muestra
Determinación de la zona crítica o de rechazo
Obtención de una muestra aleatoria
Cálculo del estadístico de prueba
Comparación del estadístico vs. valor crítico o del valor P vs. 
Interpretación de los Resultados

24
Actividades Recomendadas
• Estudiando de todas las fuentes disponibles sobre
introducción y conceptos básicos de Prueba de Hipótesis
• Aportar fuentes de información confiables
• Propuestas de Problemas inventados para comprender
mejor como
o Seleccionar H0 y H1
o Obtener y analizar curvas OC que permitan:
▪ Establecer la zona crítica
▪ Identificar, para cada caso, los mejores valores de:

,  y 
• RESOLUCIÓN DE LA GUÍA DE ESTUDIO
o Usando palabras clave y no oraciones completas
o Poniendo referencias a fuentes de información

mayo de 2020
confiables Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com 25
PARA UN PARÁMETRO
PRUEBA DE HIPÓTESIS PARA LA MEDIA (MUESTRA GRANDE)
1) Planteamiento de la Hipótesis
Bilateral Unilateral Superior Unilateral Inferior

H0: m = m0 H0: m ≤ m0 H0: m ≥ m0
H1: m ≠ m0 H1: m > m0 H1: m < m0
2) Estadístico de Prueba 3) Elegir  / Zona Crítica
Muestra X - m0 Bilateral: | Z |> |Z/2 |
Grande / Z=
Varianza s Unilateral Superior: Z > Z 
Unilateral Inferior: Z < -Z 
Conocida n
P(Z 0 >Z) <  o /2
Para utilizar estas fórmulas estos datos se obtienen:

• Del Usuario : m0 ,  y s
• De la Muestra : X y n
• De Tablas : Z  / 2 o Z
Práctica: EI-PH-01
27
PRUEBA DE HIPÓTESIS PARA LA MEDIA (EJEMPLO 1)
Se desea comprobar, con un nivel de significancia de 2%, si un
nuevo equipo de cómputo tiene un mejor rendimiento que el que
actualmente se tiene, ya que de ser así se adquirirán 500
equipos, para ello se eligen, mediante muestreo aleatorio simple,
35 equipos de las bodegas del proveedor y se ejecuta un
programa de gráficos, obteniéndose un tiempo promedio de 4.9
minutos. Se sabe, de acuerdo al Departamento de Sistemas, que
los equipos de cómputo existentes tienen un tiempo promedio de
5.6 minutos con 1.7 de desviación estándar.
Ho: m ≥ 5.6 Zona Crítica: Z<-Z
H1: m < 5.6
-Z0.02= DISTR.NORM.ESTAND.INV(0.02) =-2.054
X - m0 4.9 - 5.6
Z= = = -2.436
s 1.7
n 35
:· Se rechaza Ho
28
Otra alternativa para tomar la decisión acerca de una prueba
de hipótesis, es el cálculo del llamado Valor P (P Value). Este
valor representa la probabilidad de estar cometiendo error Tipo
I en base a la muestra obtenida. Si esta probabilidad es menor
que el nivel de significancia preestablecido: α, H0 se puede
rechazar.
Ho: m ≥ 5.6 Zona Crítica: P < 

H1: m < 5.6
4.9 - 5.6
Z= = -2.436
1.7
35
P= DISTR.NORM.ESTAND(-2.436) =0.0074
P(Z<-2.436) = 0.0074
= 0.02 :· Se rechaza Ho
29
Una alternativa mas, para tomar la decisión acerca de una
prueba de hipótesis, puede hacerse a partir de comparar el
estimador obtenido de la muestra contra el intervalo de
confianza del parámetro bajo análisis. Si el estimador cae
fuera de dicho intervalo esto permitiría concluir que se puede
rechazar H0. s
 
 X - Z   m  = 1-
Ho: m ≥ 5.6  n 
H1: m < 5.6 -Z0.02= DISTR.NORM.ESTAND.INV(0.02) =-2.054
 1.7 
 5.6 - 2.054  m  = 0.98
 35 
(5.01  m ) = 0.98
X = 4.9
:· Se rechaza Ho
30
Para verificar si los equipos a las que se les ha dado
mantenimiento han cambiado su desempeño inicial en el que
al ejecutar una cierta operación tardaba 45 segundos, se han
elegido 40 equipos mediante un muestreo aleatorio simple, el
cual ha dado como resultado un tiempo medio de 47 segundos
con una desviación estándar de 5. Se quiere un nivel de
significancia del 1%.
Ho: m = 45 Zona Crítica: |Z| > Z/2 Zona Crítica: P<
H1: m ≠ 45 Z/2 = Z0.01/2 = Z0.005 = 2.576 Z=
X - m0 47 - 45
=
s = 2.53
DISTR.NORM.ESTAND.INV(0.005)=2.576 5 40
n
DISTR.NORM.ESTAND.N(-2.53,1)*2=0.0114
One-Sample Z
Test of mu = 45 vs not = 45
The assumed standard deviation = 5 :· No se rechaza Ho
N Mean SE Mean 99% CI Z P
40 47.0000 0.7906 (44.9636, 49.0364) 2.53 0.011
31
PRUEBA DE HIPÓTESIS PARA LA MEDIA: CÁLCULO DE BETA
Si al concluir una prueba de hipótesis, esta no rechaza H0, es
importante examinar la probabilidad del error tipo II:
β = P(Error Tipo II) = P(No rechazar Ho/Ho es falsa)
Para calcular β se debe tener una hipótesis alternativa específica;
esto es, debe tenerse un valor particular del parámetro. Por
ejemplo, supóngase que es importante rechazar la hipótesis nula
Ho: μ = 50 si la rapidez promedio de combustión es μ > 52 cm/s o
es μ < 48 cm/s.
Ahora puede responderse a ¿Cómo trabajará el procedimiento de
prueba si se desea rechazar Ho, para un valor medio de μ = 52 o
de μ = 48. Dada la simetría, sólo es necesario evaluar uno de los
dos casos. Suponiéndose que se desea evaluar para un tamaño
de muestra de 10, con una desviación estándar de la población de
2.5 cm/s y un nivel de significancia de 0.06.
Ho: μ = 50
H1: μ ≠ 50 32
PRUEBA DE HIPÓTESIS PARA LA MEDIA: CÁLCULO DE BETA
Z / 2s
XL = m 
n
Z (2.5) (1.88)(2.5)
= 50  0.03 = 50 
10 10
= 50  1.487 = (48.513  m  51.487)
Para poder comprender X -m

Z=
mejor el cálculo del  se s
n
delimitará el área de la
región de aceptación con 51.5 - 52
Z= = -0.63
dos líneas ya que es 2.5
10
bilateral y se evaluará la P( Z  -0.63) = 0.2643
probabilidad de caer en esa

área cuando la media tiene 48.5 - 48
Z= = 0.63
un valor de 52 y cuando esta 2.5
10
es de 48 P( Z  0.63) = 0.2643
33
PRUEBA DE HIPÓTESIS PARA LA MEDIA: CÁLCULO DE 
Una muestra aleatoria de 100 muertes registradas en un país el año

pasado muestra una vida promedio de 71.8 años. Suponga una
desviación estándar poblacional de 8.9 años. ¿esto parece indicar
que la vida media hoy en día es mayor que 70 años? Usando un
nivel de significancia de 0.05, evaluar el  si las verdaderas medias
son: μ = 70.5, 71, 71.5, 72, 72.5, …
Datos:
μ = 70
σ = 8.9 Hipótesis:
Ẋ = 71.8 H0: μ = 70
N = 100 H1: μ > 70
α = .05
Cálculo del valor estadístico límite:

Z / 2s Z (8.9) (1.645)(8.9)
XL = m  = 70 + 0.05 = 70 + = 71.46
n 100 100
34
PRUEBA DE HIPÓTESIS PARA LA MEDIA: CÁLCULO DE 
Realizando un cálculo similar a los anteriores, se estiman los  para
cada m:
Entre más se
Z / 2s
XL = m 
n
aleja el valor
verdadero de la
media del valor
de H0, menor es
, para un
tamaño de
muestra y nivel
de significancia
dadas.
35
PRUEBA DE HIPÓTESIS PARA LA MEDIA: CURVA OC
Si se grafican todas las probabilidades de no rechazar H0
calculadas para diferentes valores de m, se obtiene la curva
OC para la prueba.
36
En algunos libros de estadística existen curvas OC para
diferentes tamaños de muestra para algunos a, los mas
comunes son α = 0.05 y α = 0.01.
Para poder utilizar las curvas se define un parámetro
llamado d, que estandariza para cualquier valor de μ y σ:
m - m0 
d= =
s s
Si se quisiera consultar en una gráfica de curvas OC,
¿Cuál es la probabilidad de cometer el error tipo II
o β cuando la media verdadera es de 72?, se tendría que
calcular d y buscar en las curvas la que pertenezca a un
tamaño de muestra de 100 con un α = 0.05:
37
Si en la gráfica de la curva OC anteriormente obtenida, se
cambian en el eje X los valores de las m por sus equivalentes
de d, se tendría:
38
Si en la gráfica anterior se agrega otra curva, para los mismos

valores dados anteriormente, pero con un tamaño de muestra
de 150, se observaría que disminuiría la probabilidad de .
Z s
=
n
 -d
Z0 =
s
n
 = P( Z  Z 0 )
39
Para obtener el tamaño de muestra óptimo, primero se debe
encontrar la gráfica que corresponda al parámetro, al nivel de
significancia establecido y al tipo de prueba que se desea
realizar. Posteriormente se busca la curva mas cercana a la
intersección de los valores de  y d.
Suponiendo que se desea
hallar el tamaño de muestra
óptimo para una prueba
bilateral con: =0.01, =60% y
d=1.
La curvas mas cercanas son
n=4 y n=5, generalmente se
elige la de mayor tamaño ya
que por la propiedad de
consistencia mejora el nivel de
estimación. 40
Suponiendo que se llevó a cabo una prueba, en la cual se

concluyó que dadas las evidencias muestrales no se rechaza
H0, en este caso es necesario evaluar la probabilidad de error
Tipo II. De igual modo lo primero es hallar la gráfica que
corresponda a los datos del problema.
Suponiendo que se usó un

tamaño de muestra de 30 para
una prueba bilateral con
=0.01y d=0.5.
El valor de  que corresponde
al cruce de la curva n=30 y
d=0.5 es de aproximadamente
0.44
41
PRUEBA DE HIPÓTESIS PARA LA MEDIA (FÓRMULAS)
1) Planeamiento de la Hipótesis
H0: m = m0 H0: m ≤ m0 H0: m ≥ m0
H1: m ≠ m0 H1: m > m0 H1: m < m0
Muestra X - m0 Bilateral: | t | > | t /2, n-1 |
Pequeña /
Varianza
t= S Unilateral Superior: t > t , n-1
Desconocida n Unilateral Inferior: t < - t , n-1
P(t 0 >t) <  o /2

• Del Usuario : m0 y 
• De la Muestra : X , S y n
• De Tablas : t / 2,n -1 o t ,n -1 Prácticas: EI-PH-02
42
Como parte de la búsqueda de una mejora continua se ha
encontrado un método de ejercicios que aumenta la velocidad
de lectura, se sabe que el método actual permite leer 120
palabras en un minuto. Para comprobarlo se eligen
aleatoriamente a 10 alumnos y se les imparte el curso, los
resultados que se obtienen son una velocidad promedio de
126 palabras con una desviación estándar de 5. A un nivel de
significancia del 2% ¿Cuál es la conclusión?
Ho: m ≤ 120 Zona Crítica: t = XS - m0
H1: m > 120 t > t, n-1
n
DISTR.T.INV(0.02*2,9) = 2.3984 126 - 120
t0.02,9 = 2.3984
t= 5
One-Sample T 10
Test of mu = 120 vs > 120
98% Lower t = 3.7947
N Mean StDev SE Mean Bound T P
10 126.000 5.000 1.581 122.208 3.79 0.002 :· Se rechaza Ho
43
Se desea comprobar si una variable cumple con los requisitos
de un cliente que ha determinado que tal variable debe tener
un valor promedio de 4.5, una muestra de 16 valores de esa
variable proporciona los siguientes resultados: 4.3, 4.9, 4.7,
3.9, 4.1, 4.2, 4.3, 4.8, 4, 5.1, 4.3, 4.2, 4.1, 4.8, 4.9, 4.1. Con un
nivel de significancia de 5% realice una prueba de hipótesis
apropiada.
En Minitab:
Test of mu = 4.5 vs not = 4.5
Variable N Mean StDev SE Mean 95% CI T P

C1 16 4.41875 0.38161 0.09540 (4.21541, 4.62209) -0.85 0.408
En Excel (para obtener el valor de P:

=DISTR.T(0.85,15,2) = (0.4086)
44
PRUEBA DE HIPÓTESIS PARA LA VARIANZA
H0: s2 = s20 H0: s2 ≤ s20 H0: s2 ≥ s20
H1: s2 ≠ s20 H1: s2 > s20 H1: s2 < s20
(n - 1) S 2      
2 2 2 2
Bilateral:  - ó - 2, n -1
 =
0 2, n 1 0 1
2
Un Parámetro
 02  2 ,n -1
0
s 2
0
Unilateral Superior:
Unilateral Inferior:  02  12- ,n -1

: s0 y
2
• Del Usuario
• De la Muestra : S 2 y n
• De Tablas  2
:  / 2,n -1 ó  2
 , n -1
Prácticas: EI-PH-03
45
PRUEBA DE HIPÓTESIS PARA LA VARIANZA: CURVAS OC
Las gráficas muestran

las curvas OC para la
prueba bilateral para un
= 0.05 y para la prueba
unilateral superior para
un =0.01.
Su uso es semejante a
las de la media, pero
para la varianza el
parámetro que se utiliza
es l: s
l=
s0
46
PRUEBA DE HIPÓTESIS PARA LA VARIANZA (EJEMPLO 5)
El supervisor sospecha que la línea está saliéndose de
control, por lo que obtiene una muestra sistemática de 26
empaques de donde obtiene que la desviación estándar es de
1.25 kg, ¿Cuál es la conclusión a un nivel de significancia de
4%?, si se sabe que el valor establecido para el proceso es de
1.1 kg. N Desv.Est. Varianza
26 1.25 1.56
s2
Ho: ≤ 1.21 96% Intervalos de confianza unilaterales
H1: s2 > 1.21 Límite Límite
inferior inferior
para para
Zona Crítica: Método Desv.Est. varianza
Chi-cuadrada 1.01 1.01
2 > 2, n-1
Pruebas
=PRUEBA.CHI.INV(0.04,25)=38.642 Estadística
Método de prueba GL Valor p
2 0.04, 25 = 38.642 Chi-cuadrada 32.28 25 0.150
(n - 1) S 2 (26 - 1)(1.25) 2
 =
2
 =
2
= 32.283 :· No Se rechaza Ho
0
s 02 0
1.21
47
PRUEBA DE HIPÓTESIS PARA LA PROPORCIÓN
H0: p = p 0 H0: p ≤ p 0 H0: p ≥ p 0
H1: p ≠ p 0 H1: p > p 0 H1: p < p 0
𝑝ො − 𝑝0 Bilateral: | Z | > |Z  /2 |
𝑍=
Un Parámetro 𝑝0 1 − 𝑝0 Unilateral Superior: Z > Z 
𝑛

• Del Usuario : p0 y 
• De la Muestra : pˆ y n
Prácticas: EI-PH-04
48
PRUEBA DE HIPÓTESIS PARA LA PROPORCIÓN (EJEMPLO 6)
Después de una remodelación a una vialidad de la ciudad, el
Departamento de Tránsito desea saber si ha cambiado el
porcentaje de accidentes que se registra en dicho lugar, de
sus registros históricos se sabe que el 3% de los 30 días de un
mes había accidentes, basado en lo ocurrido durante los
últimos seis meses el porcentaje de días con accidente es de
2.2%. ¿Qué conclusión se puede obtener a un nivel de
significancia de 8%?
pˆ - p0 0.022 − 0.03
Ho: p = 0.03 Z= 𝑍=
pˆ (1 - pˆ ) (0.03)(0.7)
H1: p ≠ 0.03 Zona Crítica:
n 180
|Z| >|Z/2|
Z0.04,= 1.75069 Z= -0.629
:· No Se rechaza Ho
49
• PRÁCTICAS:
o EI-PH-01, Prueba de Hipótesis para la media, muestra grande
o EI-PH-02, Prueba de Hipótesis para la media, muestra pequeña
o EI-PH-03, Prueba de Hipótesis para la Varianza
o EI-PH-04, Prueba de Hipótesis para la Proporción

o Poniendo referencias a fuentes de información confiables
• PROPUESTAS DE PROBLEMAS
o Enunciados reales que requieran realizar una prueba de
hipótesis de un parámetro,
o resueltos con Excel y Minitab.
• ESTUDIAR de todas las fuentes disponibles sobre Prueba de
Hipótesis para un parámetro.
50
PARA DOS PARÁMETROS
PRUEBA DE HIPÓTESIS PARA LAS m1-m2 MUESTRAS GRANDES

H0: m1 = m2 H0: m1 ≤ m2 H0: m1 ≥ m2
H1: m1 ≠ m2 H1: m1 > m2 H1: m1 < m2
Z=
( X 1 - X 2 ) - ( m1 - m2 ) Bilateral: | Z | > | Z  /2 |
Dos
Parámetros s 12 s 22 Unilateral Superior: Z > Z 
+
n1 n2 Unilateral Inferior: Z < -Z 

• Del Usuario :  , s 12 y s 22
• De la Muestra : X 1 , X 2 , n1 y n2
52
EJERCICIO
Un diseñador de productos está interesado en reducir el tiempo de
secado de una pintura. Se prueban dos fórmulas, la 1 tiene el
contenido químico estándar, y la 2 tiene un nuevo ingrediente que debe
reducir el tiempo de secado. De la experiencia se sabe que la
desviación estándar del tiempo de secado es 8 mins. Se pintan 10
piezas con la fórmula 1, y otros 10 con la fórmula 2. Los tiempos
promedio de secado muestrales son 121 min y 112 min
respectivamente. ¿A qué conclusión puede llegarse con un α = 0.05?
Hipotesis
Ya que se
H0: m1 = m2 supone
conocida s,
H1: m1 > m2 se decidió
Puesto que 2.52 >
usar la
normal, aun 1.645, se rechaza Ho, y
cuando la
muestra es se concluye con un
pequeña: nivel de significancia de
t0.5, 18=1.73 0.05 que la adición del
( x1 - x2 ) - ( m1 - m 2 ) (121 - 112) - 0 nuevo ingrediente a la
Z= = = 2.52 pintura si disminuye de
s 2
s 2 2
8 8 2
1
+ 2
+ P=0.0059
manera significativa el
n1 n2 10 10 tiempo promedio de
secado.
53
EJERCICIO
Hipotesis Puesto que 2.52 >

Ya que se 1.645, se rechaza Ho, y
H0: m1 = m2 supone
se concluye con un
conocida s,
H1: m1 > m2 se decidió nivel de significancia de
usar la
normal, aun 0.05 que la adición del
cuando la nuevo ingrediente a la
muestra es
pequeña: pintura si disminuye de
t0.5, 18=1.73 manera significativa el
( x1 - x2 ) - ( m1 - m 2 ) (121 - 112) - 0 tiempo promedio de
Z= = = 2.52 secado.
s 2
s 2 2
8 8 2
1
+ 2
+ P=0.0059
n1 n2 10 10
Z de una muestra
Para resolver este problema con Minitab
Prueba de μ = 121 vs. < 121
se usará la opción 1Z, pero debe La desviación estándar supuesta = 16
ajustarse el denominador del estadístico
Z, por lo que el tamaño de muestra se Error
sumará: n1+n2, que para este caso dará estándar Límite
de la superior
20, lo mismo para las varianzas que en
N Media media de 95% Z P
esta caso darán 16. 20 112.00 3.58 117.88 -2.52 0.006
54
55
PRUEBA DE HIPÓTESIS PARA LAS m1-m2, MUESTRAS PEQUEÑAS
H0: m1 = m2 H0: m1 ≤ m2 H0: m1 ≥ m2
H1: m1 ≠ m2 H1: m1 > m2 H1: m1 < m2
( X - X 2 ) - ( m1 - m2 ) Bilateral: | t | > | t /2, n + n -2 |

1 2
Dos Parámetros t= 1
Unilateral Superior: t > t , n + n -2
1 1
+
1 2
Sp
n1 n2 Unilateral Inferior: t < - t , n + n -2 1 2
(n1 - 1) S12 + (n2 - 1) S22

Sp =
(n1 + n2 - 2)

• Del Usuario : m1 , m 2 y 
2 2
• De la Muestra : 1 2 1 2 , n1 y n2
X , X , S , S
• De Tablas : t / 2,n1 + n2 - 2 o t ,n1 + n2 - 2
56
EJERCICIOS
Para investigar si un nuevo suero detiene la leucemia, se seleccionan
nueve ratones, todos con una etapa avanzada de la enfermedad. Cinco
reciben el tratamiento y cuatro no. Los tiempos de sobrevivencia en años, a
partir del momento en que comienza el experimento son los siguientes,
Con un nivel de significancia del 0.05 ¿El suero es efectivo? Suponga que
se distribuyen normalmente con varianzas iguales.
Hipótesis
Con tratamiento 2.1 5.3 1.4 4.6 0.9
Sin tratamiento 1.9 0.5 2.8 3.1 H0: m1 = m2
H1: m1 > m2
Como 0.699 es menor que 1.895, no se
rechaza Ho, y se concluye con un nivel de
significancia del 0.05 que no existe
suficiente evidencia para decir que el
suero detiene la leucemia.
( X 1 - X 2 ) - ( m1- m 2 ) (2.86 - 2.075) - 0

t= = = 0.699
1 1 1 1
SF + 1.6742 -
n1 n2 5 4
57
EJERCICIOS
Como 0.699 es menor que 1.895, no se

rechaza Ho, y se concluye con un nivel de
significancia del 0.05 que no existe
suficiente evidencia para decir que el
suero detiene la leucemia.
( X 1 - X 2 ) - ( m1- m 2 ) (2.86 - 2.075) - 0

t= = = 0.699
1 1 1 1
SF + 1.6742 -
n1 n2 5 4
Con Minitab
T de dos muestras para ConTratamiento vs. SinTratamiento
Error
estándar
de la
N Media Desv.Est. media
ConTratamiento 5 2.86 1.97 0.88
SinTratamiento 4 2.07 1.17 0.58
Diferencia = μ (ConTratamiento) - μ (SinTratamiento)

Estimación de la diferencia: 0.79
Límite inferior 95% de la diferencia: -1.34
Prueba T de diferencia = 0 (vs. >): Valor T = 0.70 Valor p = 0.254 GL = 7
Ambos utilizan Desv.Est. agrupada = 1.6742
58
59
60
PRUEBA DE HIPÓTESIS PARA LAS VARIANZAS

H0: s21 = s22 H0: s21 ≤ s22 H0: s21 ≥ s22
H1: s21 ≠ s22 H1: s21 > s22 H1: s21 < s22
2 Bilateral: F0  F 2, n -1 ó F0  F1- 2, n -1
S
Dos Parámetros F= 1
2
Unilateral Superior: F  F ,n -1,n -1 1 2
S 2 Unilateral Inferior: F  F ,n -1,n -1

1 2

• Del Usuario : 
• De la Muestra : S12 , S 22 , n1 y n2
• De Tablas : F / 2,n1 -1,n2 -1 ó F ,n1 -1,n2 -1
61
EJERCICIOS
La variabilidad en la cantidad de impurezas presentes en un lote de
productos químicos, utilizada para un proceso en particular, depende del
tiempo que tarda el proceso. Un fabricante que emplea dos líneas de
producción 1 y 2, hizo un pequeño ajuste al proceso 2, con la esperanza de
reducir la variabilidad, así como la cantidad media de impurezas en los
productos químicos. Muestras de n1=25 y n2=20 mediciones de dos lotes
produjeron las siguientes medias y varianzas. ¿Presentan los datos
evidencia suficiente para indicar que las variaciones del proceso son
menores para el 2? Realice una prueba con un = 0.05.
1-DISTR.F(2.04,24,19)=0.9416
Como 2.04 es menor que 2.11 no se rechaza Ho, y se concluye con un α =

0.05 que no existe suficiente evidencia para decir que la varianza del
proceso 2 es menor que la del proceso 1.
62
EJERCICIOS
En Minitab:
Prueba e IC para dos varianzas
Método
Hipótesis nula σ(Primero) / σ(Segundo) = 1
Hipótesis alterna σ(Primero) / σ(Segundo) < 1
Nivel de significancia α = 0.05
Se utilizó el método F. Este método es exacto sólo

para datos normales.
Estadísticas
Límite superior
de 95% para
Muestra N Desv.Est. Varianza Desv.Est.
Primero 25 1.020 1.040 1.343
Segundo 20 0.714 0.510 0.979
Relación de desviaciones estándar = 1.428

Relación de varianzas = 2.039
95% Intervalos de confianza unilaterales

Límite superior Límite superior
1-DISTR.F(2.04,24,19)=0.9416 para relación para relación
Método de Desv.Est. de varianza
F 2.040 4.160
Pruebas
Estadística
Método GL1 GL2 de prueba Valor p
F 24 19 2.04 0.941
63
Aquí se muestran gráficas

OC para el cociente de
varianzas, a la derecha
para una prueba unilateral
y abajo para la prueba
bilateral, para un =0.05
El parámetro para
obtenerlas es semejante
al de la prueba 2
64
PRUEBA DE HIPÓTESIS PARA LAS PROPORCIONES
H0: p1 = p2 H0: p1 ≤ p2 H0: p1 ≥ p2
H1: p1 ≠ p2 H1: p1 > p2 H1: p1 < p2
𝑝Ƹ1 − 𝑝Ƹ 2 − 𝜋1 − 𝜋2 Bilateral: | Z | > | Z  /2 |

Dos 𝑍=
𝑝Ƹ1 1 − 𝑝Ƹ1 𝑝Ƹ 1 − 𝑝Ƹ 2
Parámetros + 2 Unilateral Superior: Z > Z 
𝑛1 𝑛2
El denominador de Z, la proporción promedio, puede calcularse directamente de los resultados del

experimento mediante:
𝑋1 + 𝑋2 1 1
𝑝= y 𝑝(1 − 𝑝) +
𝑛1 + 𝑛2 𝑛1 𝑛2

• Del Usuario : 𝑝1 , 𝑝2 y 𝛼
• De la Muestra : 𝑝Ƹ1 , 𝑝Ƹ 2 , 𝑥1 , 𝑥2 , n1 y 𝑛2
65
EJERCICIOS
Se evalúan dos tipos de soluciones para pulir, para su posible uso en la fabricación
de lentes intraoculares. Se pulen 300 lentes con la primera solución y, de éstos, 253
no presentaron defectos inducidos por el pulido. Después se pulen otros 300 lentes
con la segunda solución, de los cuales 196 resultan satisfactorios. ¿Existe alguna
razón para creer que las dos soluciones para pulir son diferentes? Utilice α = 0.01
Datos:
p1= 253/300= 0.8433
p2 = 196/300= 0.6533
n1=n2 = 300
Prueba de hipótesis:
Ho; p1-p2 = 0
H1; p1-p2 ≠ 0
( p1 - p2 ) - (p 1 - p 2 ) (0.8433 - 0.6533) - 0
Z= = = 5.36
1 1  1 1 
pq +  (0.7483)(0.2517) + 
 n1 n2   300 300 
Puesto que 5.36 > 2.575, se rechaza la hipótesis nula y se concluye con un
nivel de significancia de 0.01 que los dos fluidos para pulir son diferentes.
66
EJERCICIOS
Datos:
p1= 253/300= 0.8433
p2 = 196/300= 0.6533
n1=n2 = 300
Prueba de hipótesis:
Ho; p1-p2 = 0
H1; p1-p2 ≠ 0
Puesto que 5.36 > 2.575, se rechaza la hipótesis nula y se concluye

con un nivel de significancia de 0.01 que los dos fluidos para pulir son
diferentes.
Test and CI for Two Proportions

Sample X N Sample p
1 253 300 0.843333
2 196 300 0.653333
Difference = p (1) - p (2)
Estimate for difference: 0.19
99% CI for difference: (0.100943, 0.279057)
Test for difference = 0 (vs not = 0): Z = 5.36 P-Value = 0.000
67
PRUEBA DE HIPÓTESIS PARA MUESTRAS APAREADAS

H0: µD = 0 H0: µD ≤ 0 H0: µD ≥ 0
H1: µD ≠ 0 H1: µD > 0 H1: µD < 0
Bilateral: | t | > |
t /2, n-1 |
Dos Parámetros Unilateral Superior: t > t , n-1
Unilateral Inferior: t < - t , n-1

• Del Usuario : 
• De la Muestra : d j , n
• De Tablas : t / 2 o t
68
EJERCICIOS
Considérese un experimento de prueba de dureza en el que se seleccionan ocho
ejemplares de metal, y cada ejemplar se prueba con otras puntas. Obtenga las
conclusiones del caso a los datos resultantes que se muestran en la siguiente tabla:
Ejemplar 1 2 3 4 5 6 7 8
Tipo 1 4 3 3 4 4 3 2 2
Tipo 2 3 3 5 3 4 2 4 2
Diferencia, dj 1 0 -2 1 0 1 -2 0
Ensayo de hipótesis
H0: µD = 0
H1: µD ≠ 0
2
𝑛 2
σ2𝑗=1 𝐷𝑗 −1 2
Puesto que -2.365 ≤ -0.284 ≤ 2.365,
σ𝑗=1 𝐷𝑗 − 11 −
𝑆𝐷2 = 𝑛 = 8 = 1.55 no se puede rechazar la hipótesis
𝑛−1 7 nula y se concluye con un nivel de
𝑑ҧ −0.125 significancia de 0.05 que las dos
𝑡= = = −0.284
𝑆𝐷 2 1.55 puntas producen las mismas lecturas
8 de dureza media.
𝑛
69
EJERCICIOS
Ensayo de hipótesis
H0: µD = 0
H1: µD ≠ 0
Puesto que -2.365 ≤ -028 ≤ 2.365, no se puede rechazar la hipótesis nula

y se concluye con un nivel de significancia de 0.05 que las dos puntas
producen las mismas lecturas de dureza media.
En Minitab:
Paired T-Test and CI: C1, C2
Paired T for C1 - C2
N Mean StDev SE Mean
C1 8 3.12500 0.83452 0.29505
C2 8 3.25000 1.03510 0.36596
Difference 8 -0.125000 1.246423 0.440677
95% CI for mean difference: (-1.167036, 0.917036)
T-Test of mean difference = 0 (vs not = 0): T-Value = -0.28 P-Value = 0.785
70
EJERCICIOS


confiables
• PROPUESTAS DE PROBLEMAS REALES que requieran
realizar una prueba de hipótesis de dos parámetros,
resueltos con Excel y Minitab.
• ESTUDIAR DE TODAS LAS FUENTES DISPONIBLES SOBRE
PRUEBA DE HIPÓTESIS PARA DOS PARÁMETROS
71
PRUEBA DE DISTRIBUCIÓN
LIBRE
PRUEBAS DE DISTRIBUCIÓN LIBRE
Las dos pruebas mas importantes de esta categoría, que no

requieren del supuesto de que la población con la que se
está trabajando es normal son:
• La prueba de Bondad de Ajuste, para probar el tipo
de distribución de probabilidad que tienen una
población, y
• Las Tablas de Contingencia, para probar si dos
características de una población son independientes
entre si.
Ambas pruebas están basadas en la varianza y por lo tanto
usan la distribución 2
Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com 73

mayo de 2020
PRUEBA DE BONDAD DE AJUSTE: TÉCNICA
Desarrollada por K. Pearson, puede utilizarse para pruebas de
distribuciones discretas o continuas, sus pasos son:
1. Establecer el modelo de probabilidad que se cree siguen la
población bajo estudio
2. Elegir el nivel de significancia de la prueba: 
3. Obtener una muestra probabilística de la población
4. Organizar los datos en una tabla de frecuencia con k
clases
5. Calcular la probabilidad de cada una de las k clases con el
modelo que se cree sigue la población, y posteriormente
los valores esperados para cada una de ellas.
6. Se calcula el estadístico de prueba y se compara con la
zona crítica: r c (O - E )2 Donde p es el número de
 = 
2 ij ij
  ,k - p -1
2 parámetros estimados
Eij para el calculo de las
i =1 j =1
probabilidad es.
74
PRUEBA DE BONDAD DE AJUSTE: EJEMPLO
En un estudio para evaluar el rendimiento de una nueva variedad
de maíz se consideró como variable de estudio el peso de la
mazorca (en grs.), a partir de los resultados obtenidos de una
muestra por conglomerados que dió 80 mazorcas.
H0: los datos siguen una distribución normal
H1: los datos no siguen una distribución normal
Peso en grs Mazorcas mi fi(mi- )2 Z1 Z2 P(Z<Z1) P(Z<Z2) P(Z1<Z<Z2) Ei X2

200.5 250.5 18 225 96250.78 -1.8197 -0.8925 0.0344 0.1861 0.15167 12.1337 2.8362
250.5 300.5 22 275 11764.84 -0.8925 0.03477 0.1861 0.5139 0.32779 26.2235 0.6802
300.5 350.5 28 325 20223.44 0.03477 0.962 0.5139 0.832 0.31811 25.4484 0.2558
350.5 400.5 9 375 53187.89 0.962 1.88922 0.832 0.9706 0.13859 13.2478 0.1175
400.5 450.5 3 425 48291.8 1.88922 2.81645 0.9706 0.9976 0.027
2 3.8898
Media 298.125 20.05,1 3.8415
53.9243 P 0.0486
(Oi - Ei ) 2
k
 =
2
 2 ,k - p -1 Dado que se cumple la zona crítica,
Ei se rechaza Ho, los datos no siguen
i =1
una distribución normal.
75
Realice un análisis para los siguientes datos Máximo=9.77
Mínimo=4.66
8.51 7.82 9.77 8.02 5.82 4.66 7.96 5.71 7.12 6.95
Rango=5.11
7.10 6.63 6.51 7.20 8.07 7.85 7.84 7.86 7.62 8.74
Media=7.364
8.05 7.03 6.67 7.50 7.80 5.39 8.52 6.26 7.11 7.62
Desv. Estd.=1.104
8.86 7.06 6.37 5.51 6.75 5.98 7.18 6.57 5.92 9.35
Intervalo=0.730
8.91 7.37 7.58 9.01 5.46 5.86 7.29 8.75 5.99 6.71
6.08 9.14 8.36 6.91 7.23 6.44 6.76 6.47 6.78 6.89 40
9.11 7.58 8.72 7.53 6.84 7.36 8.90 5.66 7.21 8.50 30
Valores
6.68 8.33 6.27 6.44 4.90 6.92 6.93 7.28 9.26 8.11 20 esperados
Valores
8.25 7.19 7.10 8.05 7.04 6.80 9.70 7.44 8.95 9.25 10 observados
7.57 6.90 9.64 6.13 7.55 8.33 7.33 7.25 7.66 6.53 0
4 9
Límites reales Límites f F Valores estandarizados Probabilidad Ei JI((O-E)^2/E)
4.625 5.365 4.63 5.36 2 2 -2.481 -1.811 0.0065 0.0351 2.8539 0.25550
5.365 6.105 5.37 6.10 11 13 -1.811 -1.140 0.0351 0.1270 9.1959 0.35394
6.105 6.845 6.11 6.84 18 31 -1.140 -0.470 0.1270 0.3191 19.2076 0.07592
6.845 7.585 6.85 7.58 30 61 -0.470 0.200 0.3191 0.5793 26.0197 0.60887
7.585 8.325 7.59 8.32 17 78 0.200 0.870 0.5793 0.8080 22.8656 1.50467
8.325 9.065 8.33 9.06 14 92 0.870 1.541 0.8080 0.9383 13.0338 0.07163
9.065 9.805 9.07 9.80 8 100 1.541 2.211 0.9383 0.9865 4.8171 2.10307
Ji calculado 4.97359
9.488
Dado que no se cumple la zona crítica con =5%, no se Ji tablas=
7.815
rechaza Ho, los datos siguen una distribución normal.
76
Realice un análisis para los siguientes datos Máximo=33.95
8.35 4.42 3.88 4.14 2.83 8.41 10.07 1.62 3.04 1.89 Mínimo=0.39
4.18 4.12 3.14 9.51 0.79 4.32 2.69 1.58 1.41 6.57 Rango=33.56
6.48 6.34 0.43 15.30 4.04 2.90 7.94 17.95 2.86 1.69 Media=8.41
15.56 4.93 10.06 0.43 20.07 1.89 16.09 1.06 8.00 9.11 Desv. Estd.=7.9835
2.83 2.76 13.36 11.85 13.69 15.16 5.47 7.20 4.13 20.80
50
9.76 6.98 17.98 3.26 8.80 0.84 19.25 2.13 0.65 0.98
40 Valores
6.55 3.47 18.56 3.18 33.28 8.22 5.75 7.42 3.64 32.31
30 esperados
5.48 6.14 23.10 5.43 4.95 8.64 14.98 1.25 0.50 10.92
8.78 0.39 8.25 9.22 3.25 25.67 3.29 4.43 1.90 1.30 20
Valores
1.32 32.92 14.05 8.72 33.95 3.47 5.73 27.90 12.50 22.11 10 observado
s
0
0 20 40
Límites reales
0.365 5.165
Límites
0.37 5.16
f
46
F
46
Prob.
0.4589
Ei
45.8900
JI((O-E)^2/E)
0.000
Dado que no se
5.165 9.965 5.17 9.96 27 73 0.2353 23.5300 0.512 cumple la zona
9.965 14.765
14.765 19.565
9.97 14.76
14.77 19.56
8
9
81
90
0.133
0.0752
13.3000
7.5200
2.112
0.291 crítica con =5%, no
19.565 24.365
24.365 29.165
19.57 24.36
24.37 29.16
4
2
94
96
0.0424
0.024
4.2400
2.4000
0.014
0.067
se puede rechaza
29.165 33.965 29.17 33.96 4 100 0.0312 3.1200 0.248 Ho, los datos siguen
0 1 Ji calculado 3.244
11.07 una distribución
ji de tablas= 9.49
7.81
exponencial.
77
Se considera hipotéticamente que el número de fallas por turno de
telares en una fábrica de tejidos sigue una distribución Poisson.
Se han obtenido los siguientes datos:
No. de fallas Frec. Observada
0 32
No. de fallas Prob. Frec. esperada
1 15
0 0.472 28.32
2 9
1 0.354 21.24
3 4
2 0.133 7.96
3 0.033 1.98
No. De Frec. Frec.

fallas observada esperada
0 32 28.32
1 15 21.24 Dado que no se cumple la zona de
≥2 13 9.98 rechazo, los datos siguen una
distribución Poisson.
78
TABLAS DE CONTINGENCIA
En un caso particular de la prueba de bondad de ajuste, cuya
técnica es:
1. Obtener una muestra aleatoria y registrar los datos en
una tabla de doble entrada, estos serán los datos
observados: Oij
2. Calcular las probabilidades marginales de cada una de
las variables: Pi y Pj
3. Obtener las probabilidades conjuntas de todos los valores
de las dos variables en una tabla similar a la de datos.
r c (O - Eij )
2
4. Calcular el estadístico de prueba:  2 =  ij
i =1 j =1 Eij
5. Comparar el estadístico de prueba contra el valor en
tablas, siendo la zona crítica:  2
  2
 ,( r -1)( c -1)
79
TABLAS DE CONTINGENCIA
La tabla de datos, llamada Tabla de Contingencia debe ser:
1 2 ⋯ c Total La probabilidad marginal
1 O11 O12 ⋯ O1c O1. será:
2 O21 O22 ⋯ O2c O2. •Renglones: Pi = Oi· / O··
⋮ ⋮ ⋮ ⋮ ⋮ •Columnas : Pj = O·j / O··
r Or1 Or2 ⋯ Orc Or.
La probabilidad conjunta
Total O.1 O.2 ⋯ O.c O..
será: Pij = Pi * Pj
De donde el valor esperado se obtiene mediante:
1 2 ⋯ c
1 E11 E12 ⋯ E1c
 Oi.  O. j  Oi.O. j
 
E ij = nPij = n Pi Pj = n    = 2 E21 E22 ⋯ E2c
 n  n  n
⋮ ⋮ ⋮ ⋮
r Er1 Er2 ⋯ Erc
80
TABLAS DE CONTINGENCIA: EJEMPLO
Se desea comprobar si hay independencia entre el tipo de

vehículo que se utilizar y el tipo de lesiones que sufren sus
ocupantes en caso de ocurrir un accidente, para ello se
obtiene una muestra aleatoria simple de los registros que
una aseguradora tiene, los datos son:
compacto mediano grande Oi. Esperados
graves 42 35 20 97 compacto mediano grande
leves 78 65 60 203 graves 38.800 32.3333 25.8667

O.j 120 100 80 300 leves 81.200 67.6667 54.1333
Estadístico de Prueba PRUEBA.CHI.INV(0.01,2)=9.210

20.01, 2 = 9.210
compacto mediano grande
graves 0.2639 0.2199 1.3306
0.1261 0.1051 0.6358
 2  2 ,( r -1)( c -1)
leves
 2 = 
r c (O ij - Eij )
2
= 2.6814
Dado que no se cumple la zona
Eij crítica no se puede rechazar Ho,
i =1 j =1
los datos son independientes.
81
TABLAS DE CONTINGENCIA: EJERCICIO
Una muestra de 200 adultos de más de 60 años. Se clasificó de

acuerdo a su educación y al número de hijos de cada uno de ellos:
Número de Hijos
Educación 0 a 1 2a3 más de 3
Primaria 14 37 32
Secundaria 19 42 17
Universitaria 12 17 10
¿Se puede decir que el número de hijos es independiente del nivel de

educación de los padres? Usar alfa 0.05 para establecer las
conclusiones.
r
 2 = 
c (O
ij - Eij )
2
 2  2 ,( r -1)( c -1)
i =1 j =1 Eij
82


confiables
• PROPUESTAS DE PROBLEMAS REALES que requieran
realizar pruebas de hipótesis de distribución libre,
resueltos con Excel y Minitab.
• ESTUDIAR DE TODAS LAS FUENTES DISPONIBLES SOBRE
PRUEBA DE HIPÓTESIS DE DISTRIBUCIÓN LIBRE BASADAS EN
C2
Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com 83

mayo de 2020
NO PARAMÉTRICAS
PRUEBA NO PARAMÉTRICAS
Como lo sugiere su nombre, no estiman parámetros para obtener el
estadístico de prueba, lo hacen observando alguna característica que se
comporta de manera análoga al parámetro que se está estimando.
Dentro de estas existe un gran número, algunas de las mas importantes
son:
• La prueba de Wilcoxon para muestras independientes, para probar
diferencia de medias
• La prueba de corrida o de rachas , para probar aleatoriedad
• La prueba de Kolmogorov-Smirnov, para probar si los datos siguen
una cierta función de densidad.
• La prueba de Kruskal-Wallis, para probar si k muestras provienen
de la misma población , etc.
85
PRUEBA DE WILCOXON PARA MUESTRAS INDEPENDIENTES
Permite probar si las medias de dos poblaciones que no son
normales son iguales entre si, utilizando muestras extraídas de
manera independiente de cada una de ellas. En caso de que sean
de tamaño diferente se considera que n1<n2.
Técnica
1. Ordenar en forma ascendente las n1+ n2 observaciones, sin
importar de que muestra sean pero manteniendo identificado a
cual pertenece cada dato.
2. Asignarle a cada dato su ordinal iniciando en 1 y promediando
los ordinales de aquellos valores que sean iguales.
3. Obtener la suma de los ordinales de cada muestra, los que se
representan por R1 y R2 y obteniendo R=min(R1, R2)
4. Se concluye comparando R con el valor R* , que se obtiene
de tablas especiales calculadas por Wilcoxon, siendo la zona
crítica: R < R*
86
PRUEBA NO PARAMÉTRICAS: TABLA DE WILCOXON 2 MUESTRAS
87
PRUEBA NO PARAMÉTRICAS: EJEMPLO WILCOXON
Al comparar los aciertos obtenidos por dos grupos diferentes de
alumnos, seleccionados al azar, se obtuvieron los siguientes datos,
¿Cuál es la conclusión final utilizando Wilcoxon?
Pob. Valor Ordinal Ajuste
1 15.3 1 1
Aciertos Promedio
Grupos 1 2 2 15.4 2 2
17.6 16.8 1 15.9 3 3
19.4 20.0 2 16 4 4
19.5 18.2 1 16.3 5 5
17.1 16.4 2 16.4 6 6
15.3 16.0 2 16.4 7 7 R1 158.5
15.9 15.4 2 16.5 8 8 R2 141.5
16.3 16.5 2 16.7 9 9
18.4 18.0 2 16.8 10 10 mínimo 141.5
17.3 16.4 1 17.1 11 11
19.1 20.1 1 17.3 12 12 Tablas 115
17.8 16.7 1 17.6 13 13
18.2 17.9 1 17.8 14 14
2 17.9 15 15
2 18 16 16
1 18.2 17 17.5
Cuando Rmin < R*0.05 se rechaza H0 2 18.2 18 17.5
1 18.4 19 19
1 19.1 20 20
Para el problema esto no se cumple, no 1 19.4 21 21
1 19.5 22 22
puede rechazarse H0 las medias son 2 20 23 23
iguales. 2 20.1 24 24
88
PRUEBA NO PARAMÉTRICA: PRUEBA DEL SIGNO
Se aplica a observaciones por pares extraídas de
poblaciones continuas. Sea (X1j, X2j), j = 1,2,…, n un conjunto
de observaciones por pares, y sean Dj = X1j – X2j, j = 1,2,…,n
las diferencias para cada par. La hipótesis que se desea
probar es que las diferencias Dj tienen una distribución
probabilística con mediana cero.
Técnica
1.Para cada diferencia Dj se registra el signo de la diferencia.
2.Calcule R+ como el número de signos positivos y R- como
el número de signos negativos.
3.Obtener R = min (R+, R-), cuando ocurran empates, se
elimina la diferencia, se reduce en uno n y la prueba se
aplicará al resto de los datos.
4.Se concluye comparando R con el valor R*, que se
obtiene de tablas, siendo la zona crítica: R < R* 89
PRUEBA NO PARAMÉTRICA: TABLA DE LA PRUEBA DEL SIGNO
Alfa (α) Alfa (α)

n n
0.1 0.05 0.01 0.1 0.05 0.01
5 0 23 7 6 4
6 0 0 24 7 6 5
7 0 0 25 7 7 5
8 1 0 0 26 8 7 6
9 1 1 0 27 8 7 6
10 1 1 0 28 9 8 6
11 2 1 0 29 9 8 7
12 2 2 1 30 10 9 7
13 3 2 1 31 10 9 7
14 3 2 1 32 10 9 8
15 3 3 2 33 11 10 8
16 4 3 2 34 11 10 9
17 4 4 2 35 12 11 9
18 5 4 3 36 12 11 9
19 5 4 3 37 13 12 10
20 5 5 3 38 13 12 10
21 6 5 4 39 13 12 11
22 6 5 4 40 14 13 11 90
PRUEBA NO PARAMÉTRICA: PRUEBA DEL SIGNO
Se desea comparar dos dispositivos de medición de inyección de
combustible seleccionados al azar, se obtuvieron los siguientes datos,
¿Cuál es la conclusión final utilizando la prueba del signo?
1 2 Signo
Bilateral 17.6 16.8 +
R+ 8
H0: m1 = m2 19.4 20 -
R- 4
19.5 18.2 +
H1: m1 ≠ m2 n 12
17.1 16.4 +
15.3 16 -
Estadístico
15.9 15.4 +
Rmin 4
16.3 16.5 -
18.4 18 +
Tablas 2
17.3 16.4 +
19.1 20.1 -
17.8 16.7 +
18.2 17.9 +
Como la zona crítica es: Rmin < R*0.05 , no puede

rechazarse H0, las medias son iguales
91
PRUEBA NO PARAMÉTRICA: WILCOXON DE RANGO CON SIGNO
Se aplica a observaciones por pares extraídas de poblaciones continuas

como en las pruebas anteriores. Sea (X1j, X2j), j = 1,2,…, n un conjunto de
observaciones por pares, y sean Dj = X1j – X2j, j = 1,2,…,n las diferencias
para cada par.
Técnica
1. Se calculan las diferencias Dj considerando el signo de la operación.
2. Se asigna un rango a las diferencias en orden ascendente de sus
valores absolutos.
3. Se asignan signos a los rangos de las diferencias. A los empates se les
asigna rangos promedio.
4. Calcule R+ la suma de los rangos positivos y R- el valor absolutos de la
suma de los rangos negativos.
5. Obtener R = min (R+, R-).
6. Se concluye comparando R con el valor R* , que se obtiene de tablas,
siendo la zona crítica: R < R*
92
PRUEBA NO PARAMÉTRICA: TABLA DE RANGO CON SIGNO
α Prueba Unilateral
0.025 0.01 0.005
n
α Prueba Bilateral
0.05 0.02 0.01
6 0 -- --
7 2 0 --
8 4 2 0
9 6 3 2
10 8 5 3
11 11 7 5
12 14 10 7
13 17 13 10
14 21 16 13
15 25 20 16
16 30 24 20
17 35 28 23
18 40 33 28
19 46 38 32
20 52 43 38
21 59 49 43
22 66 56 49
23 73 62 55
24 81 69 61
25 89 77 68 93
PRUEBA NO PARAMÉTRICAS EJEMPLO RANGO CON SIGNO
¿Cuál es la conclusión?
Auto 1 2 Diferencia Signo Auto Diferencia Rango con
1 17.6 16.8 0.8 + signo
Bilateral 2 19.4 20.0 -0.6 - 7 -0.2 -1
12 0.3 2
H0: m1 = m2 3 19.5 18.2 1.3 +
4 17.1 16.4 0.7 + 8 0.4 3
6 0.5 4
H1: m1 ≠ m2 5 15.3 16.0 -0.7 -
2 -0.6 -5
6 15.9 15.4 0.5 +
7 16.3 16.5 -0.2 - 4 0.7 6.5
8 18.4 18.0 0.4 + 5 -0.7 -6.5
9 17.3 16.4 0.9 + 1 0.8 8
10 19.1 20.1 -1.0 - 9 0.9 9
11 17.8 16.7 1.1 + 10 -1.0 -10
12 18.2 17.9 0.3 + 11 1.1 11
3 1.3 12
R+ 55.5
R- 22.5
n 12 Como la zona crítica es Rmin > R*0.05
Estadísticos: Para el ejemplo no se cumple. No se
Rmin 22.5
Tablas 14 rechaza H0 , las medias son iguales
Decisión:
No Rechazamos Ho
94
PRUEBA NO PARAMÉTRICA: KOLMOGOROV-SMIRNOV
Esta técnica también permite probar si una población sigue cierta
función de densidad a partir de los datos de una muestra
aleatoria, no puede aplicarse a funciones de probabilidad
discretas.
Se basa en probar el comportamiento de la muestra en relación a
la función de densidad acumulada F(x), comparando las
desviaciones en cada punto de la función escalonada.
Se calculan las diferencias

de la función acumulada a
probar con respecto a la
función escalonada, el
estadístico de prueba es la
diferencia mayor: a, y la
zona crítica es:
a > d(, k)
95
PRUEBA NO PARAMÉTRICA: TÉCNICA KOLMOGOROV-SMIRNOV
Se agrupan los datos en una tabla de frecuencia con k clases
Obtener los valores esperados con la función de densidad a probar f(x)
Calcular para cada clase la función acumulada Fi(k)

~
Obtener de los datos la frecuencia acumulada para cada clase Fi(k)
~ ~
Obtener los estadísticos: ai1=Fi(k)-Fi(k-1) y ai2=Fi(k)-Fi(k)
Obtener el estadístico de prueba: a=máximo(ai1, ai2)
Comparación del estadístico vs. valor de tablas: a > d(,k)
Interpretación de los Resultados

96
PRUEBA NO PARAMÉTRICA: TABLA KOLMOGOROV-SMIRNOV
97
PRUEBA NO PARAMÉTRICA: EJEMPLO KOLMOGOROV-SMIRNOV
Probar a un nivel de significancia del 5% si los resultados
registrados siguen una distribución normal
Oi
Clases fi P(Z<Z2) Fi Fi tilde a1 a2
0 10 7 0.01916629 7 0.02 0.01916629 0.00083371
11 20 13 0.05542458 20 0.05714286 0.03542458 0.00171828
21 30 35 0.13189126 55 0.15714286 0.07474841 0.02525159
31 40 42 0.26089034 97 0.27714286 0.10374749 0.01625251
41 50 53 0.43497957 150 0.42857143 0.15783671 0.00640814
51 60 70 0.62292886 220 0.62857143 0.19435743 0.00564257
61 70 50 0.78525793 270 0.77142857 0.1566865 0.01382935
71 80 44 0.8974165 314 0.89714286 0.12598793 0.00027364
81 90 25 0.95940823 339 0.96857143 0.06226537 0.0091632
91 100 11 0.98681613 350 1 0.0182447 0.01318387
350 a= 0.19435743
Media= 53.4329
DesvEstd= 20.9691 d(.05,k=10)= 0.409
Dado que no se cumple la zona de rechazo, se concluye que los datos
siguen una distribución normal.
98
Cierta empresa productora de champiñones ha registrado la
demanda diaria de champiñón fresco en toneladas, obteniéndose
los valores que se anexan. Utilizar la prueba Kolmogorov-
Smirnov para probar que la de manda diaria de champiñones tiene
una distribución normal con media de 50 y desviación estándar de
13, usando un nivel de significancia de 5%.
38 67 28 49 47 59 51 57 52 56
35 76 58 48 63 34 68 53 25 36
32 61 33 48 42 72 66 59 43 44
Ho: Los datos tienen distribución normal con media 50 y desviación

estándar 13.
H1: Los datos no tienen distribución normal con media 50 y
desviación estándar 13.
99
No se hacen clases, se usa el orden en su lugar y por lo mismo sólo se calcula a2
i X(i) S(x)=i/n Fo(x)=P(X<X(i) ǀ S(x) - Fo(x) ǀ
1 25 0.0333 0.0272 0.0061 16 51 0.5333 0.5307 0.0026
2 28 0.0667 0.0453 0.0214 17 52 0.5667 0.5611 0.0056
3 32 0.1 0.0831 0.0169 18 53 0.6 0.5913 0.0087
4 33 0.1333 0.0955 0.0378 19 56 0.6333 0.6778 0.0445
5 34 0.1667 0.1092 0.0575 20 57 0.6667 0.7049 0.0382
6 35 0.2 0.1243 0.0757 21 58 0.7 0.7308 0.0308
7 36 0.2333 0.1408 0.0925 22 59 0.7333 0.7556 0.0223
8 38 0.2667 0.178 0.0887 23 59 0.7667 0.7556 0.0111
9 42 0.3 0.2692 0.0308 24 61 0.8 0.8013 0.0013
10 43 0.3333 0.2951 0.0382 25 63 0.8333 0.8413 0.008
11 44 0.3667 0.3222 0.0445 26 66 0.8667 0.8908 0.0241
12 47 0.4 0.4087 0.0087 27 67 0.9 0.9045 0.0045
13 48 0.4333 0.4389 0.0056 28 68 0.9333 0.9169 0.0164
14 48 0.4667 0.4389 0.0278 29 72 0.9667 0.9547 0.012
15 49 0.5 0.4693 0.0307 30 76 1 0.9772 0.0228
Máximo= 0.0925
De donde Do,n = 0.093 Como n está cercano a 40 puede
De tablas Dn,α = D30,0.05 = 0.24 obtenerse aproximadamente el valor de
tablas por:
Y puesto que: Do,n = 0.093 < 0.24 = Dn,α

Ho no se rechaza
mayo de 2020
PRUEBA NO PARAMÉTRICA : PRUEBA DE ALEATORIEDAD
Un método no paramétrico para probar aleatoriedad es la prueba
de rachas, que se entiende como la secuencia de símbolos
idénticos contenidos entre dos símbolos diferentes o entre uno y
el inicio o el final de la secuencia.
a a b b b a b b a a a a a b b b a a a a
Si hay demasiados o muy pocas rachas (V), es indicio de falta de

aleatoriedad.
Para probarlo se requiere calcular la media y varianzas
muestrales, donde N1=número de elementos a, N2=número de
elementos b.
2 N1 N 2 2 N1 N 2 ( 2 N1 N 2 - N1 - N 2 )
mv = +1 s =2
+1
N1 + N 2 ( N1 + N 2 ) ( N1 + N 2 - 1)
v 2
V - mv
z=  Z 2
sv
101
EJEMPLO
Probar a un nivel de significancia del 5% si los resultados
registrados de lanzar una moneda son aleatorios:
A S S A S A A A S A A S S A S A S A A S S A S S A S AA S A S
Número de Rachas V=22, N1=16 y N2= 15

2 N1 N 2 2(16)(15)
mv = +1 mv = + 1 = 16.48
N1 + N 2 16 + 15
2 N1 N 2 ( 2 N1 N 2 - N1 - N 2 ) 2(16)(15)  2(16)(15) - 16 - 15

s =
2
s =2
= 7.476
( N1 + N 2 ) ( N1 + N 2 - 1) (16 + 15) (16 + 15 - 1)
v 2 v 2
V - mv 22 - 16.48 Z / 2 = Z0.05/ 2 = 1.96

z= = = 2.017
sv 2.734
Se rechaza Ho, no es aleatorio, hay demasiadas rachas
102
PRUEBA DE ALEATORIEDAD 2
Otro método no paramétrico para probar aleatoriedad, también

basada en las rachas, pero que en este caso puede aplicarse a
valores que no son de tipo Bernoulli, se obtienen mediante:
1. Ordenando los valores de menor a mayor, manteniendo
identificado de que población procede el dato
2. Identificar las rachas, de manera similar a la prueba anterior,
identificando cada vez que cambia de población, R.
3. Comparar si el estadístico de prueba R, si está fuera de los
límites obtenidos en la tabla correspondiente, se estará en la
zona crítica
Zona no crítica: Rmin < R* < Rmax
Si hay demasiados o muy pocas rachas (V), es indicio de falta de
aleatoriedad.
103
PRUEBA NO PARAMÉTRICAS: TABLA ALEATORIEDAD
104
PRUEBA NO PARAMÉTRICAS: PRUEBA DE ALEATORIEDAD 2
¿Cuál es la conclusión final utilizando aleatoriedad o rachas?
Auto 1 2
1 17.6 16.8
Bilateral 2 19.4 20.0
H0: m1 = m2 3 19.5 18.2
4 17.1 16.4
H1: m1 ≠ m2 5 15.3 16.0
6 15.9 15.4
7 16.3 16.5
8 18.4 18.0
9 17.3 16.4
10 19.1 20.1
11 17.8 16.7
12 18.2 17.9
Valor 15.3 15.4 15.9 16 16.3 16.4 16.4 16.5 16.7 16.8 17.1 17.3 17.6 17.8 17.9 18 18.2 18.2 18.4 19.1 19.4 19.5 20 20.1
Disp. 1 2 1 2 1 2 2 2 2 2 1 1 1 1 2 2 1 2 1 1 1 1 2 2
Rachas 12
Estadísticos:
Rmin 7
Rmax 19
Como la zona crítica es: Rmin < R*0.05 < Rmax , no puede
Decisión:
rechazarse H0, las medias son iguales
No se rechaza Ho
105
PRUEBA DE MANN-WHITNEY
Se aplica a observaciones por pares extraídas de poblaciones continuas
como en las pruebas anteriores. Sea (X1j, X2j), j = 1,2,…, n un conjunto de
observaciones por pares.
Técnica
1. Asigne rango a las (n1+n2) observaciones en orden de magnitud,
asignado un 1 a la observación más pequeña, un 2 a la siguiente, etc.
En caso de empate, se promedian los rangos que corresponderían.
2. Se calculan las sumas de los rangos TA y TB para las dos muestras.
3. Se calculan RA y RB :
n1 (n2 + 1)
RA = n1n2 + -T A
2
n1 (n2 + 1)
RB = n1n2 + -T B = n1n2 - RA
2
4. Obtener R = min (RA , RB ).
5. Se concluye comparando R con el valor R* , que se obtiene de tablas,
siendo la zona crítica: R < R*
106
EJERCICIOS
107
PRUEBA NO PARAMÉTRICAS: EJEMPLO MANN-WHITNEY
¿Cuál es la conclusión? Auto Inyección No
Auto 1 2 1 15.3 1
1 17.6 16.8 Bilateral 2 15.4 2
2 19.4 20.0 1 15.9 3
3 19.5 18.2 H0: m1 = m2 2 16 4
4 17.1 16.4
5 15.3 16.0 H1: m1 ≠ m2 1 16.3 5 TA= 158.5
6 15.9 15.4 2 16.4 6 TB= 141.5
7 16.3 16.5 2 16.4 7
8 18.4 18.0 2 16.5
n1 (n2 + 1) 8 RA= 63.5
9 17.3 16.4 RA = n1n2 + -T A 16.7
10 19.1 20.1 2 2 9 RB= 80.5
11 17.8 16.7 n (n + 1) 2 16.8 10
RB = n1n2 + 1 2 -T B = n1n2 - RA
1 17.1
12 18.2 17.9 2 11 Rmin 63.5
1 17.3 12
1 17.6 13 R0.05 37
1 17.8 14
2 17.9 15
2 18 16
Como la zona crítica Rmin < R*0.05 1 18.2 17.5
2 18.2 17.5
Para el ejemplo, No se rechaza H0 , 1 18.4 19
las medias son iguales 1 19.1 20
1 19.4 21
1 19.5 22
2 20 23
2 20.1 24 108
PRUEBA DE KRUSKALL-WALLIS
Es una prueba que compara tres o más poblaciones para determinar si existe una
diferencia en la distribución de las poblaciones. Es análoga a la prueba F utilizada en las
pruebas ANDEVA. No importa la restricción de que las poblaciones tienen que estar
distribuidas normalmente.
Las hipótesis son:
H0: Todas las k poblaciones tienen la misma distribución.
H1: No todas las k poblaciones tienen la misma distribución.
Técnica
1. Asigne rango a las observaciones en orden de magnitud, asignado un 1 a la observación
más pequeña, un 2 a la siguiente, etc. En caso de empate, se promedian los rangos que
corresponderían.
2. Se calculan las sumas de los rangos para las muestras.
3. Se calcula el valor estadístico de prueba:
12  Ri2 
K=  - 3(n + 1)
n(n + 1)  ni 
donde ni es el número de observaciones en la i-ésima muestra
n es el número total de observaciones en todas las muestras.
Ri es la suma de los rangos de la i-ésima muestra.
4. Comparar K con un valor crítico, su distribución es aproximada por una ji-cuadrada con
k – 1 grados de libertad. Si K > 2,k-1, se rechaza la hipótesis.
109
PRUEBA NO PARAMÉTRICAS: EJEMPLO KRUSKALL-WALLIS
Un nuevo gerente de Avon debe comparar el tiempo que les toma a tres clientes
pagar los envíos del nuevo producto New-Face Cream, ofrecido por la empresa.
Se seleccionan aleatoriamente varias compras de cada cliente, junto con el
número de días que cada uno se tomó en liquidar su cuenta.
Muestra 1 2 3 Muestra. Valor Ordinal Ajustado
1 28 26 37 2 11 1 1
1 13 2 2
2 19 20 28  02.05 ,2 = 5.99
3 13 11 26 2 14 3 3
4 28 14 35 1 19 4 4
5 29 22 31 2 20 5 5
6 22 21 1 21 6 6.5
7 21 2 21 7 6.5
1 22 8 8.5
Muestra Ri ni Ri2 / n i
2 22 9 8.5
2 26 10 10.5 1 62 7 549.143
3 26 11 10.5 2 34.5 6 198.375
H0: Las k poblaciones 1 28 12 13 3 74.5 5 1,110.05
1 28 13 13 18 1,857.57
provienen de la misma
población. 3 28 14 13
1 29 15 15
H1: Al menos una población
proviene de otra 3 31 16 16
3 35 17 17
población.
3 37 18 18
Como k = 8.18 > 5.99, se rechaza la hipótesis
 (62) (34.5) (74.5) 
2 2 2
nula de que no hay diferencia en el tiempo
 - 3(18 + 1) = 8.18 que toma a tres clientes pagar sus cuentas
12
K=  + +
18(18 + 1)  7 6 5 
con Avon.
110
PRUEBA DE KRUSKALL-WALLIS
En el caso de que se rechace la hipótesis nula, el siguiente paso lógico es determinar
cuáles diferencias son estadísticamente significativas y cuales se deben a un error de
muestreo.
Esto involucra una comparación de todos los pares posibles. Los pasos para la
comparación son los siguientes:
1.Calcular el rango promedio para 3 Obtención del valor crítico Ck:

cada muestra.
 n(n + 1)  1 1 
Ck = 2 ,k -1   + 
 12   ni n j 
62
R1 = = 8.86
7  (18)(19)  1 1 
= 5.99   +  = 7.27 Cliente 1 vs. 2
34.5  12   7 6 
R2 = = 5.75
6  (18)(19)  1 1 
Ck = 5.99   7 + 5  = 7.65 Cliente 1 vs. el 3
74.5  12  
R3 = = 14.9
5  (18)(19)  1 1 
Ck = 5.99   +  = 7.91 Cliente 2 vs. el 3
 12   6 5 
2. Calcular diferencias absolutas 4. Comparar contra los valores críticos
| R1 - R2 |=| 8.86 - 5.75 |= 3.11

| R1 - R3 |=| 8.86 - 14.9 |= 6.04
| R2 - R3 |=| 5.75 - 14.9 |= 9.15
111

o Poniendo referencias a fuentes de información confiables
• PROPUESTAS DE PROBLEMAS REALES que requieran realizar

pruebas de hipótesis no paramétricas y su solución detallada
mediante las técnicas no paramétricas analizadas
• ESTUDIAR DE TODAS LAS FUENTES DISPONIBLES SOBRE PRUEBA DE
HIPÓTESIS NO PARAMÉTRICAS
• CITAR AL MENOS UNA PRUEBA NO PARAMÉTRICA ENCONTRADA EN
LA LITERATURA Y NO MENCIONADA EN ESTE MATERIAL

mayo de 2020

Resumen Prueba de Hipótesis

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Resumen Prueba de Hipótesis

Cargado por

Copyright:

Formatos disponibles

PRUEBA DE HIPÓTESIS

INSTITUTO TECNOLÓGICO DE ORIZABA

Dr. Mario Leoncio Arrioja Rodríguez

• Introducción y Conceptos básicos.

INSTITUTO TECNOLÓGICO DE ORIZABA

Teoría de •Trata de los métodos para obtener la

•Trata de los métodos para comprobar

La Hipótesis es una afirmación (suposición o conjetura)

No necesitan del supuesto de

Para m1-m2 con varianza conocida

Análisis de Varianza (ANDEVA / ANOVA)

Prueba de Bondad de Ajuste

Prueba de Kolmogorov - Smirnov

La hipótesis debe expresarse en términos de dos eventos

Para poder comprobar la hipótesis planteada, se requiere

Las situaciones en las que se puede estar, al finalizar una

Expresadas en palabras estas situaciones son:

A esta curva también se le conoce como curva de potencia o

A esta curva también se le conoce como curva de potencia o

obtendría una curva como laH1.siguiente:

A esta curva también se le conoce como curva de potencia o

A esta curva también se le conoce como curva de potencia o

A esta curva también se le conoce como curva de potencia o

A esta curva también se le conoce como curva de potencia o

A esta curva también se le conoce como curva de potencia o

Si la prueba es bilateral, la curva OC se vería con la

La utilidad de la curva OC es que permite analizar como se

Elección del parámetro mas representativo del problema

Determinación del tipo de Hipótesis (Bilateral o Unilateral)

Elección de la Hipótesis Nula y de la Hipótesis Alternativa

Establecimiento del nivel de significancia y tamaño de muestra

Determinación de la zona crítica o de rechazo

Obtención de una muestra aleatoria

Cálculo del estadístico de prueba

Comparación del estadístico vs. valor crítico o del valor P vs. 

Interpretación de los Resultados

o Obtener y analizar curvas OC que permitan:

▪ Establecer la zona crítica

▪ Identificar, para cada caso, los mejores valores de:

o Poniendo referencias a fuentes de información

INSTITUTO TECNOLÓGICO DE ORIZABA

Bilateral Unilateral Superior Unilateral Inferior

Para utilizar estas fórmulas estos datos se obtienen:

Ho: m ≥ 5.6 Zona Crítica: P < 

Para poder comprender X -m

probabilidad de caer en esa

Una muestra aleatoria de 100 muertes registradas en un país el año

Cálculo del valor estadístico límite:

Si en la gráfica anterior se agrega otra curva, para los mismos

Suponiendo que se llevó a cabo una prueba, en la cual se

Suponiendo que se usó un

Para utilizar estas fórmulas estos datos se obtienen:

Test of mu = 4.5 vs not = 4.5

Variable N Mean StDev SE Mean 95% CI T P

En Excel (para obtener el valor de P:

Para utilizar estas fórmulas estos datos se obtienen:

Las gráficas muestran

2) Estadístico de Prueba 3) Elegir  / Zona Crítica

Para utilizar estas fórmulas estos datos se obtienen:

• RESOLUCIÓN DE LA GUÍA DE ESTUDIO

INSTITUTO TECNOLÓGICO DE ORIZABA

Bilateral Unilateral Superior Unilateral Inferior