Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tests Paramétricos
Las pruebas o tests de hipótesis son procedimientos o métodos estadísticos de estimación que
nos ayudan a la toma de decisiones sobre poblaciones, con base en la información que nos da
la muestra, es decir que permite decidir si a partir de una muestra se puede definir el
comportamiento de una población en términos de los parámetros de la misma.
Esta técnica consiste en suponer que uno o más parámetros que caracterizan e identifican una
variable aleatoria X tienen un cierto valor que tenemos a priori por información previa. A este
valor supuesto lo denominaremos Hipótesis Nula (H0) y la someteremos a una prueba de
resistencia estadística. Plantearemos esta prueba como un contraste entre nuestra Hipótesis
Nula (H0) y otra Hipótesis Alterna (Ha).
Las Hipótesis Estadísticas son entonces ciertos supuestos o conjeturas sobre el valor de los
parámetros de las poblaciones. Es decir que son aquellas suposiciones acerca del valor de uno
o más parámetros de una población que se consideran con el propósito de discutir su validez.
Dichas hipótesis se formularan sobre la media poblacional μ, la proporción poblacional p, la
varianza , la homogeneidad de dos varianzas y , una diferencia de medias , el
coeficiente de correlación de Pearson (concepto que veremos en breve), etc.
Media Poblacional (μ): esta medida resume en un valor las características de una constante
teniendo en cuenta a todos los casos y se utiliza con variables cuantitativas.
Si se tiene una muestra estadística de valores para una variable X con distribución de
probabilidad F(x, θ) (donde θ es un conjunto de parámetros de la distribución).
o también, e.g.
El siguiente paso es elegir un estadístico de contraste, al que llamaremos E, y del que tenemos
que conocer su distribución estadística como variable aleatoria. El estadístico E se calcula a
partir de los datos de una muestra (X1, X2,…,Xn) de la r.v. X bajo estudio. E es un número real.
Si se supone que la hipótesis nula es verdadera, pero encontramos que los resultados de una
muestra aleatoria difieren marcadamente de los esperados bajo la hipótesis nula (por sobre el
azar de la teoría del muestreo) podremos decir que las diferencias observadas son
significativas (demasiado grandes) y nos inclinamos a rechazar la hipótesis nula, o al menos a
no aceptarla debido a la evidencia obtenida.
V: verdadera F: falsa
Real
Test H0 (V) H0 (F)
Generalmente el error más grave que se puede cometer en un test o prueba es el del Tipo 1.
Por ejemplo, si una persona acude a un hospital porque sospecha que tiene una enfermedad
infecciosa altamente contagiosa, y en el hospital le realizan una prueba, análisis o test, y el
resultado es negativo siendo que en realidad ha contraído esa enfermedad (Error Tipo 1), la
persona seguirá su vida normal pensando que no está infectada y contagiará a todo su
entorno. Por otra parte, si no está infectado y el resultado del test le da positivo (Error Tipo 2),
lo peor que puede suceder es que lo internen un tiempo y lo sometan a un tratamiento, hecho
incomparablemente menos grave que el anterior. Es por ello que acostumbramos a minimizar
la probabilidad de cometer un error Tipo 1, es decir que elegimos un margen de error muy
pequeño (e.g. =0,05 ó = 0,03, = 0,01, = 0,001, o menor a 1).
Luego, con este vamos a una tabla de la distribución estadística de E y luego definimos él o
los valores críticos EC.
n Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estu
n Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estu
n Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estu
n Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estu
n Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estu
n Estudiantil Versión Estudiantil 1-α
Versión Estudiantil Versión Estudiantil Versión Estudiantil
Zona de no Rechazo
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estu
n Estudiantil (de H0) Versión Estudiantil Versión
Versión Estudiantil ZonaEstudiantil
de Rechazo (de H0) Estudiantil
Versión
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estu
n Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil α
Versión Estudiantil Versión Estudiantil Versión Estu
n Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estu
n Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Ec (valor critico ó teórico)
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estu
Ahora ubicamos en el eje real por el valor del estadístico E:
La región crítica será aquella región del campo de variación del estadístico tal que si contiene
al valor evaluado del mismo con los datos muestrales nos llevará a rechazar la hipótesis. La
designaremos por R1. Otro concepto importante es el de región de aceptación que es la región
complementaria de la anterior. Si el valor evaluado del estadístico pertenece a ella No
rechazamos la hipótesis (las hipótesis nunca se aceptan de forma definitiva, sólo se aceptan
provisionalmente, es decir ,no se rechazan, a la espera de una nueva información que
eventualmente pueda llevarnos a rechazarla en el futuro). La designaremos por R0.
Evidentemente los conjuntos de puntos que forman ambas regiones son disjuntos.
Regla de decisión:
Se debe distinguir entre dos tipos de contraste o test, que determinan la región de aceptación
y la región de rechazo.
Estadísticos de contraste para tests de hipótesis
paramétricos
vs.
̅
Estadístico de contraste
√
vs.
̅
Estadístico de contraste
√
vs.
̅ ̅
Estadístico de contraste
√
vs.
Estadístico de contraste
̅ ̅
√
donde
vs.
Estadístico de contraste
̅ ̅
donde
( )
( ) ( )
Sean las diferencias entre los datos apareados de ambas muestras, es decir de
dos mediciones X e Y realizadas sobre la misma unidad de recolección. Suponemos que estas
diferencias son independientes y normales
vs.
Estadístico de contraste
̅ ̅
√
donde
∑ ̅
Test de hipótesis para una varianza
Para la varianza
vs.
Estadístico de contraste
vs.
Estadístico de contraste
vs.
Donde mna es la mediana teórica de la población X de la cual fue extraída una muestra de
tamaño n, y es la mediana empírica de la muestra
Estadístico de contraste
U = cantidad de positivos ~ B ( )
Donde
y B es la distribución Binomial.
vs.
Estadístico de contraste
√
∑ ̅
√
√
∑
̅ ̅
̂
∑ ∑
√ ̅ √ ̅
Ho : = 0
vs.
Ha : ≠ 0 (bilateral a 2 colas)
vs.
El estadístico de contraste es
̅
| |
Estamos interesados en evaluar la temperatura media diaria en Rio Gallegos durante el mes de
Julio de 2011.
X : T (temperatura media diaria de julio 2011 en Río Gallegos, en ºC, datos oficiales del Servicio
Meteorológico Nacional, SMN)
Los datos observados son los siguientes:
̅ √
Al indicar de esta manera la hipótesis alterna queremos decir que sospechamos que la
temperatura media puede ser mayor que 1,3°C. En consecuencia estamos planteando en este
caso un test unilátero o a “una cola”. También podríamos haber testeado la hipótesis nula
contra una hipótesis alterna que estableciera que ≠ 0 = 1,3 (°C). De ese modo estaríamos
planteando un test bilátero o “a dos colas”
Calculamos el estadístico E:
̅ √
̅ √
Buscamos ahora por tabla Z el valor crítico , que coincide con el valor critico y elegimos el
nivel de significación, =0,05 o simplemente trabajamos con el p-valor si es que disponemos
de un software estadístico.
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil
No Rechazo
Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil 0,95
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
α = 0,05 Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
E = 0,47
Versión Estudiantil Versión Estudiantil Ec = 1,645
Versión Estudiantil Versión Estudiantil Versión Estudiantil
estadístico
Se lleva a cabo un estudio estadístico de recursos humanos para analizar si los salarios por
hora de los obreros de la construcción, categoría “oficial especializado”, son los mismos,
mayores o menores en la provincia de Buenos Aires que en Santa Cruz. Los datos obtenidos en
las dos muestras independientes tomadas en Junio de 2017 son, en pesos:
vs.
Notamos:
̅ : Media de la muestra de los salarios de la provincia de Buenos Aires,
̅ : Media de la muestra de los salarios de la provincia de Santa Cruz,
̅ ̅
En nuestro caso:
√
√
( )
( ) ( )
( )
( ) ( )
vs.
Estadístico de contraste
= 0,04105769
= 0,04408846
El estadístico de contraste
El valor crítico teórico tabular para el contraste lo obtenemos de una tabla F de Fisher -
Snedecor con 13 grados de libertad en el numerador y 13 en el denominador, y nos da:
Fc (tabla) = 2,577
Regla de decision: como no
rechazamos la hipotesis nula y en consecuencia podemos suponer que las varianzas de ambas
poblaciones son homogeneas en el sentido de que su diferencia no es estadisticamente
significativa.
Una nueva empresa de colectivos de línea se instala en la ciudad de Rio Gallegos, y desea
ganar una buena imagen con los habitantes haciendo que sus conductores sean puntuales en
los horarios de llegada a las paradas. La empresa desea que haya poca variabilidad en dichos
tiempos y que la varianza sea de 4 minutos o menos. Esta hipótesis se va a testear con un nivel
de significación
Se tomó una muestra aleatoria de 24 llegadas a la parada que se encuentra ubicada en la calle
Zapiola esquina Fagnano, de la cuales la varianza muestral encontrada es de
vs.
∑
̅ ̅
̂
∑ ∑
√ ̅ √ ̅
No Rechazo
Rechazo Rechazo
0,025 0,025
-1,96 1,68 1,96
t0 estadístico
Regla de decisión
Como t0 = 1,68 < t29; 0,975 = 1,96 No rechazamos Ho y consideramos
válido = 0, con una P (error tipo I) = 0,05 = P (rechazar H0 siendo
verdadera) = α
En consecuencia podemos asumir que no existe una asociación lineal (proporcional) entre la
temperatura media y la humedad en Julio de 2011 para la ciudad de Rio Gallegos.
Recordemos una vez mas que en lugar de establecer un nivel de significación α y utilizar las
tablas estadísticas Z y t de Student, podemos trabajar con el p-valor si disponemos de un
software estadístico.
p – valor
A partir del uso de las computadoras ya no se utilizan más las tablas de las distribuciones
estadísticas en la vida práctica porque los software estadísticos específicos (como por ejemplo
Infostat, SPSS, SAS, Statistics, Stata, etc) las tienen incorporadas. Por este motivo tampoco se
usa más el nivel de significación ya que no es necesario. En lugar de la tabla y el nivel de
significación , el software nos informa cual es el p -valor (p – value) correspondiente al test.
Este número llamado p – valor es el área o probabilidad que queda entre el estadístico de
contraste y el final de la cola de rechazo, es decir que el p – valor es la probabilidad que queda
a la derecha (o a la izquierda, o en ambas colas, según se haya planteado la hipótesis alterna)
del estadístico.
Si el p – valor es muy pequeño, por ejemplo menor que un milésimo, podemos considerar que
el estadístico ha caído en lo profundo de la cola de rechazo, y en consecuencia podemos
interpretar la regla de decisión como que rechazamos H 0. Si por el contrario el p – valor no es
pequeño, por ejemplo mayor que un centésimo, podemos considerar que el estadístico de
contraste no se encuentra en lo profundo de la cola de rechazo, y en consecuencia podemos
aceptar la hipótesis nula. No hay valores fijos determinados del tamaño del p – valor tanto
para rechazar como para aceptar H0, el valor y la interpretación de los mismos quedan a
consideración de quien realiza el test y del contexto del mismo así como del grado de exigencia
del resultado.