Está en la página 1de 5

RESUMEN PEP III

DOCIMAS DE HIPOTESIS

Es un proceso para determinar la validez de una aseveración hecha sobre la población basándose
en evidencia muestral, es decir, probar cierta hipótesis dada una muestra poblacional.

Hipótesis Nula (Ho): Es la hipótesis de no efecto, la que “se busca rechazar”, es lo opuesto a la
hipótesis alternativa.

Hipótesis Alternativa (Ha o H1): En esta hipótesis generalmente se plantea lo que se está buscando
averiguar (lo que se pregunta).

Tipos de dócimas:

𝐷ó𝑐𝑖𝑚𝑎 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝐷ó𝑐𝑖𝑚𝑎 𝑏𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙 𝐷ó𝑐𝑖𝑚𝑎 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟

𝐻0 : ≥ 𝑜 = 𝐻0 : = 𝐻0 : ≤ 𝑜 =

𝐻1 : < 𝐻1 : ≠ 𝐻1 : >

NOTA: En la hipótesis alternativa NUNCA va una igualdad (≤,= o ≥)

Nivel de significancia (α): Es el límite que existe para rechazar Ho, es decir, las posibilidades de
equivocarse cuando se rechaza H0.
Región de rechazo o región critica

Es la región donde se evalúa el valor del estadístico, si dicho valor cumple con las condiciones
presentes en la región critica, se asume que se RECHAZA Ho, en caso contrario, no existe evidencia
suficiente para rechazar la hipótesis nula.

Si la prueba es unilateral inferior: 𝑅. 𝑅: {𝐸𝑠𝑡𝑎𝑑𝑖𝑠𝑡𝑖𝑐𝑜 ≤ 𝐷𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛(𝑛−1;𝛼) }

Si la prueba es bilateral:

𝑅. 𝑅: {𝐸𝑠𝑡𝑎𝑑𝑖𝑠𝑡𝑖𝑐𝑜 ≤ 𝐷𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛(𝑛−1;𝛼) ; 𝐸𝑠𝑡𝑎𝑑𝑖𝑠𝑡𝑖𝑐𝑜 ≥ 𝐷𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛(𝑛−1;1−𝛼) }


2 2

Si la prueba es unilateral superior: 𝑅. 𝑅: {𝐸𝑠𝑡𝑎𝑑𝑖𝑠𝑡𝑖𝑐𝑜 ≥ 𝐷𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛(𝑛−1;1−𝛼) }


2

EJEMPLO

Suponiendo que el estadístico es Zo

Las regiones e rechazo serán:

Si la prueba es unilateral inferior: 𝑅. 𝑅: {𝑍𝑜𝑏𝑠 ≤ 𝑍𝑐𝑟𝑖𝑡𝑖𝑐𝑜= 𝑍(𝑛−1;𝛼) }

Si la prueba es bilateral: 𝑅. 𝑅: {𝑍𝑜𝑏𝑠 ≤ 𝑍𝑐𝑟𝑖𝑡𝑖𝑐𝑜= 𝑍(𝑛−1;𝛼) ; 𝑍𝑜𝑏𝑠 ≥ 𝑍𝑐𝑟𝑖𝑡𝑖𝑐𝑜= 𝑍(𝑛−1;1−𝛼) }


2 2

Si la prueba es unilateral superior: 𝑅. 𝑅: {𝑍𝑜𝑏𝑠 ≥ 𝑍𝑐𝑟𝑖𝑡𝑖𝑐𝑜= 𝑍(𝑛−1;1−𝛼) }

PASOS PARA FORMULAR UNA PRUEBA DE HIPOTESIS

1.- Describir las características de la población acerca de la cual se va a probar la


hipótesis (establecer si se cumplen los supuestos del contraste).
2.- Formular las hipótesis nula y alternativa (H0 y H1).
3.- Seleccionar el estadístico de prueba que coincida con lo que estoy queriendo
probar.
4.- Determinar la región crítica o de rechazo.
5.- Calcular el estadístico de contraste.
6.- Tomar una decisión de rechazar H0 o no rechazarla.
7.- Dar una conclusión al problema.

MUESTRAS INDEPENDIENTES Y PAREADAS

Muestras independientes: son mediciones realizadas en dos conjuntos de elementos distintos.


Puede que el tamaño de dichas muestras sean iguales o distintos.

Muestras pareadas: se comparan las mediciones ejecutadas en el mismo grupo de sujetos.


Es decir, existe una sola muestra, la cual se somete a experimentación.
NOTA: Estar atento al momento de calcular muestras independientes, hay que recordar que
se deben conocer las VARIANZAS POBLACIONALES si se desea resolver inmediatamente lo
que se está preguntando, en caso contrario, si en el enunciado no se entregan las varianzas
poblacionales, se debe realizar una dócima de hipótesis que permita determinar si las
varianzas de ambas poblaciones son iguales o distintas, para esto se deben conocer las
varianzas muestrales de cada variable.
DOCIMA DE BONDAD DE AJUSTE
En este tipo de dócima se evalúa si una muestra proviene o no de una población con cierta
distribución de probabilidad.
Hipotesis Nula: La muestra se distribuye según la función o distribución de probabilidad
𝑥~𝑓(x)
Hipótesis Alternativa: La muestra no se distribuye según la función o distribución de
probabilidad. 𝑥~𝑓(𝑥)
(𝑂𝑖 −𝑒𝑖 )2
2
Estadístico: 𝑋𝑜𝑏𝑠 = ∑𝑘𝑖=1 2
~𝑋𝑘−𝑟−1 2
𝑅𝑅: {𝑋𝑜𝑏𝑠 2
: 𝑋𝑜𝑏𝑠 2
> 𝑋(𝑘−𝑟−1;1−𝛼) }
𝑒𝑖

Donde : k=Número de valores de los intervalos de clase

r= Número de parámetros desconocidos en la distribución, pero que posteriormente se


pueden estimar.

Oi=frecuencia observada

𝑒𝑖 = valor esperado, dicho valor debe ser mayor a 5 para que la prueba tenga validez, en caso
de que sea menor, se debe sumar a una fila adyacente hasta que se cumpla lo solicitado.

𝑒𝑖 = 𝑛 × 𝑝𝑖
Donde 𝑝𝑖 =probabilidad de tomar el valor i

Se debe considerar que ∑𝑘𝑖=1 𝑒𝑖 = 𝑛 y ∑𝑘𝑖=1 𝑝𝑖 = 1

Para ordenar estos datos de mejor manera, resulta conveniente hacer una tabla:

Variable de frecuencia pi ei
estudio Si se unen filas
Intervalos adyacentes, el
de clase valor de k
disminuye

=1 − ∑𝑘−1
𝑖=1 𝑝𝑖
1 n

NOTA: En caso de que en una muestra entregada, salga el dato de “mayor a x”, siendo x
cualquier valor, dicho dato se agrega a la tabla con el valor siguiente y se calcula de manera
normal, obteniendo el pi restándole a 1 todos los pi obtenidos anteriormente
PRUEBA DE HOMOGENEIDAD E INDEPENDENCIA

Homogeneidad: El objetivo de esta prueba es determinar si existe o no variabilidad de datos en la


muestra.

Hipótesis nula: no existe variabilidad en los datos/todos los elementos son iguales

Hipótesis alternativa: al menos un elemento es distinto.

Independencia: busca verificar que dos poblaciones distintas son independientes entre sí, es decir,
se busca comprobar si están o no están relacionadas.

Hipótesis nula: las variables son independientes

Hipótesis alternativa: las variables no son independientes

Para calcular el estadístico de esta dócima se hace uso de las tablas de contingencia.

1 2 3 ... j … c Total 𝑂𝑖∙


1 𝑎11 𝑎1∙ Suma
2 de las
⋮ filas
i 𝑎𝑖2

r
Total 𝑂∙𝑗 𝑎∙2 n

Suma de las
columnas
𝑟 𝑐
2
(𝑂𝑖𝑗 − 𝑒𝑖𝑗 )2 2
𝐸𝑠𝑡𝑎𝑑í𝑠𝑡𝑖𝑐𝑜: 𝑋𝑜𝑏𝑠 = ∑∑ ~𝑋((𝑟−1)(𝑐−1);1−𝛼)
𝑒𝑖𝑗
1 1
2 2 2
𝑅. 𝑅: {𝑋𝑜𝑏𝑠 : 𝑋𝑜𝑏𝑠 > 𝑋𝑐𝑟𝑖𝑡𝑖𝑐𝑜 }

Donde :

𝑂𝑖𝑗 = frecuencia observada de la celda i-esima j-esima


𝑂𝑖∙ ×𝑂∙𝑗
𝑒𝑖𝑗 = frecuencia esperada
𝑛
REGRESIÓN Y CORRELACION

Este estudio se basa en la relación existente entre 2 o más variables, las variables conocidas reciben
el nombre de variable independiente, la variable que se está intentando predecir es la variable
dependiente.

Una relación lineal se estima mediante: 𝑦𝑖 = 𝑎 + 𝑏𝑥𝑖 ; 𝑎, 𝑏 ∈ 𝑅, 𝑏 ≠ 0

𝑎=𝑏0 y 𝑏=𝑏1
𝑐𝑜𝑣(𝑥,𝑦)
𝑎̂ = 𝑦̅ − 𝑏̂𝑥̅ 𝑏̂ = 2
𝑠 (𝑥)

Dichos valores también pueden obtenerse por calculadora

Mode Reg Lin

Los datos se ingresan: x,y M+

a: valor de y cuando x = 0, es decir, cuando el valor de estimación intersecta el eje perpendicular del
sistema cartesiano.

b: pendiente de la recta que define la ecuación, también indica que por cada unidad que aumente
x, “y” aumentará en b unidades.

Coeficiente de correlación (𝜌): Mide el grado de relación lineal entre las variables e indica si la
relación entre ellas es directa o indirecta. El estimador del parámetro 𝜌 es “r”:
𝑐𝑜𝑣(𝑥, 𝑦)
𝑟= ; −1 ≤ 𝑟 ≤ 1
𝑠(𝑥)𝑠(𝑦)

Para docimar el tipo de relación de las variables, las hipótesis se formulan de la siguiente manera:

𝐸𝑥𝑖𝑠𝑡𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑙𝑖𝑛𝑒𝑎𝑙 𝑅𝑒𝑙𝑎𝑐𝑖𝑜𝑛 𝑙𝑖𝑛𝑒𝑎𝑙 𝑖𝑛𝑑𝑖𝑟𝑒𝑐𝑡𝑎 𝑅𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑙𝑖𝑛𝑒𝑎𝑙 𝑑𝑖𝑟𝑒𝑐𝑡𝑎


𝐻0 : 𝜌 = 0 𝐻0 : 𝜌 ≥ 0 𝐻0 : 𝜌 ≤ 0
𝐻1 : 𝜌 ≠ 0 𝐻1 : 𝜌 < 0 𝐻1 : 𝜌 > 0

𝑇𝑜𝑏𝑠 : 𝑇𝑜𝑏𝑠 ≤ 𝑡(𝑛−2;𝛼) ;


2
𝑅. 𝑅: { } 𝑅. 𝑅: {𝑇𝑜𝑏𝑠 : 𝑇𝑜𝑏𝑠 ≤ 𝑡(𝑛−2;𝛼) } 𝑅. 𝑅: {𝑇𝑜𝑏𝑠 : 𝑇𝑜𝑏𝑠 ≥ 𝑡(𝑛−2;1−𝛼) }
𝑇𝑜𝑏𝑠 ≥ 𝑡(𝑛−2;1−𝛼)
2

Coeficiente de determinación (r²): proporción de variabilidad de la variable Y que queda explicada


por el modelo. En otras palabras el coeficiente de determinación explica en qué porcentaje la
variable dependiente es definida por la ecuación de regresión. A mayor r², mejor es el ajuste de las
variables.

También podría gustarte