Está en la página 1de 5

Inferencia estadística.

Pardo (127 y 128)


El objetivo último del análisis de datos es el de extraer conclusiones de tipo general a partir de
unos pocos datos, es decir, extraer conclusiones sobre las propiedades de una población a partir
de la información de una muestra. Este salto de lo concreto (la muestra) a lo general (la
población) se conoce como inferencia estadística.
La estimación de parámetros es el proceso que consiste en asignar a las propiedades
desconocidas de una población, las propiedades conocidas de una muestra. El contraste de
hipótesis es el proceso mediante el cual se trata de comprobar si una afirmación sobre una
propiedad poblacional puede sostenerse a la luz de la información muestral disponible. El
contraste de hipótesis puede entenderse como un método de toma de decisiones, también
llamado prueba de significación o prueba estadística. Es un procedimiento que permite decidir si
una proposición sobre una población puede ser mantenida o debe ser rechazada.
En la investigación psicológica es frecuente encontrarse con problemas de conocimiento surgidos
a partir de conocimientos existentes o de observaciones de nuevas situaciones, por ejemplo
¿produce el estímulo a menor tiempo de reacción que el estímulo b?.
Surgido un problema de conocimiento, se requiere buscar algún tipo de solución. Esa solución
provisional suele tomar forma de afirmación directamente verificable, o empíricamente
contrastable, en la que se establece de forma operativa el comportamiento de la o las variables
involucradas en el problema. Esa afirmación recibe el nombre de hipótesis científica, donde es
preciso definir operativamente qué se entiende por la variable en cuestión (por ejemplo,
inteligencia) y cómo medirla (test a utilizar).

Contraste de hipótesis. Pardo 3.1 (128,129 y 130)


Pasos en la lógica del contraste de hipótesis:
a) formular estadísticamente la hipótesis científica que se desea contrastar, es decir,
transformarla en una hipótesis estadística.

b) buscar evidencia empírica relevante capaz de informar sobre si la hipótesis estadística es


sostenible o no. Si una hipótesis concreta referida a una distribución poblacional es
correcta, al extraer una muestra debemos encontrar un resultado muestral similar. Una
hipótesis será compatible con los datos empíricos cuando a partir de ella sea posible
deducir o predecir un resultado muestral (un estadístico) con cierta precisión. Una
discrepancia importante entre la afirmación propuesta en la hipótesis estadística y el
resultado muestras encontrado puede significar dos cosas: o bien la hipótesis es correcta y
la discrepancia se debe al azar, o bien la hipótesis es incorrecta. Se plantea entonces la
necesidad de determinar cuando la discrepancia encontrada es lo bastante grande como
para considerar que el resultado muestral observado es incompatible con la hipótesis
formulada y por ende, no explicable por fluctuaciones azarosas.

c) Establecer una regla de decisión, que debe postularse en términos de probabilidad. El


número de reglas de decisión que pueden establecerse es casi ilimitado. La teoría de la
decisión se encarga de proporcionar algunos principios elementales al respecto. En
general se utilizará una regla del tipo: si el resultado muestral es, suponiendo la hipótesis
correcta, muy poco probable, la hipótesis se considera incompatible con los datos; por el
contrario, si el resultado muestral, suponiendo la hipótesis correcta, es probable, se
considera la hipótesis compatible con los datos.
 Un CONTRASTE DE HIPÓTESIS es un proceso de decisión en el que una hipótesis
formulada en términos estadísticos es puesta en relación con los datos empíricos para
determinar si es o no es compatible con ellos.

Hipótesis estadística. Pardo 3.1 (131)


La hipótesis estadística es una afirmación sobre la forma de una o más distribuciones de
probabilidad o sobre uno o más parámetros de esas distribuciones. Se representan por la letra H
seguida de una afirmación que le da contenido: Por ejemplo H: la variable X se distribuye
normalmente con  = 100 y ϑ = 15.
En general surgen de una hipótesis científica, pero no son lo mismo. La hipótesis científica
proporciona la base para la formulación de la hipótesis estadística y se refiere a algún aspecto de
la realidad, mientras que la hipótesis estadística se refiere a algún aspecto de una distribución de
probabilidad. Existen varias formas distintas de expresar estadísticamente una hipótesis científica.
El primer paso en el proceso de verificación de una hipótesis es formular en términos estadísticos
la afirmación de la hipótesis científica.
Todo contraste de hipótesis se basa en la formulación de dos hipótesis:
1. La hipótesis nula 𝐻0: Es la que se somete a contraste y generalmente es una afirmación
sobre la forma de una distribución de probabilidad o sobre el valor de alguno de los
parámetros. Suele ser una hipótesis exacta (tal cosa es igual a tal otra, es mayor o igual,
es menor o igual).

2. La hipótesis alternativa 𝐻1: Es la negación de la hipótesis nula. Suele ser inexacta (tal
cosa es distinta, mayor o menor que tal otra). Cuando en ella aparece un signo ≠ es
bilateral/bidireccional, cuando aparece un signo < o > es unilateral/unidireccional.
La hipótesis nula y alternativa suelen plantearse como hipótesis rivales, son exhaustivas y
mutuamente excluyentes, si una es verdadera la otra es necesariamente falsa.
 El signo desigual representa contraste bilateral o difireccional. Los signos mayor y menor
representan contraste unilateral o unidireccional.
Los supuestos: Son un conjunto de afirmaciones que necesitamos establecer para conseguir
determinar la distribución en la que se basará nuestra decisión sobre H 0.
 Las hipótesis simples: define una distribución normal con parámetros conocidos.
Permitiría especificar por completo una distribución binomial una vez establecido el tamaño
de la muestra.
- Supuesto de muestra aleatoria: Los individuos seleccionados para la muestra son al
azar.
- Supuesto de distribución normal: es el supuesto usual. Es estratégico ya que permite
desarrollar contraste de hipótesis para muchos problemas diferentes. Con X siendo
normal aparecen una serie de propiedades que permiten desarrollar métodos muy
efectivos.

 Hipótesis compuestas: No quedan completamente especificadas. Define una distribución


normal con media conocida, pero varianza desconocida. No define una única distribución,
sino muchas diferentes.
Con frecuencia la H0 será compuesta, lo cual nos obliga a establecer un conjunto de supuestos
que permitan especificar por completo la distribución.
Algunos de estos supuestos son más restrictivos o exigentes que otros. El incumplimiento de
éstos podría invalidar el contraste y llevarnos a una decisión errónea. Conviene que los supuestos
sean pocos y poco exigentes.
Lo ideal sería plantear siempre hipótesis nulas simples, ya que definiríamos con precisión la
distribución poblacional a partir de la cual se efectuarán las predicciones muestrales. Auque esto
no es siempre posible, por lo que con frecuencia, la hipótesis nula planteada no será simple, sino
compuesta. Lo cual nos obligará a establecer un conjunto supuesto que, junto con la hipótesis,
permitan especificar por completo la distribución poblacional de referencia. Solo entonces será
posible predecir con cierta precisión qué es lo que podemos encontrarnos al extraer una muestra
aleatoria de esa población. Cuando se tiene una hipótesis compuesta, se recurre a la evidencia
muestral.

Estadístico de contraste y regla de decisión. Pardo 3.1.3 y 3.1.4 (135 - 138).


El estadístico de contraste es un resultado muestral que cumple la doble condición de 1)
proporcionar información empírica relevante sobre la afirmación propuesta en la hipótesis nula y
2) poseer una distribución muestral conocida.
Una vez planteadas las hipótesis, es necesario seleccionar un estadístico de contraste capaz de
proporcionar información relevante sobre ellas y establecer los supuestos necesarios para
conseguir determinar la distribución muestral del estadístico.
La regla de decisión es el criterio que se utilizará para decidir si la hipótesis nula debe ser
rechazada o no. Se basa en la partición de la distribución muestral del estadístico de contraste en
dos zonas mutuamente exclusivas:
- La zona de rechazo o zona crítica, es el área de la distribución muestral que corresponde
a los valores del estadístico de contraste que se encuentran tan alejados de la afirmación
establecida en la hipótesis nula, que es muy poco probable que ocurran si la hipótesis nula
es verdadera. Su probabilidad α es y a ese valor alfa se lo llama nivel de significación o
nivel de riesgo.

- La zona de aceptación es el área de la distribución muestral que corresponde a los


valores del estadístico de contraste próximos a la afirmación establecida en la hipótesis
nula. Corresponde a los valores del estadístico de contraste que es probable que ocurran
si la hipótesis nula es verdadera. Su probabilidad es 1 − α y se denomina nivel de
confianza.

*La regla de decisión consiste en rechazar la hipótesis nula si el estadístico de contraste toma un
valor perteneciente a la zona de rechazo o crítica; y mantener la hipótesis nula si el estadístico de
contraste toma un valor perteneciente a la zona de aceptación.
El tamaño de las zonas de rechazo y de aceptación se determina fijando el valor de α, es decir,
fijando el nivel de significación. Esa elección la realiza el investigador de manera arbitraria.
Habitualmente se usan niveles de significación entre 0,01 y 0,05 (1% y 5%).
En los contrastes bilaterales, la zona crítica se encuentra repartida a partes iguales entre las dos
colas de la distribución muestral. En los contrastes unilaterales, la zona crítica se ubica en una de
las colas de la distribución.

Mantener y rechazar hipótesis nula, Pardo 3.1.5 (140).


Planteada la hipótesis, formulados los supuestos, definido el estadístico de contraste y su
distribución muestral y establecida la regla de decisión, el paso siguiente es obtener una muestra
aleatoria de tamaño n, calcular el estadístico de contraste y tomar una decisión. Tal decisión se
toma respecto de la hipótesis nula y consiste en rechazarla o mantenerla de acuerdo con el valor
tomado por el estadístico de contraste y viendo si ese valor cae en la zona de rechazo o en la
zona de aceptación.
Cuando se decide mantener la hipótesis nula, se considera que esa hipótesis es compatible con
los datos. Cuando se decide rechazar la hipótesis nula, se considera probado que esa hipótesis
es falsa.
La hipótesis nula nunca se acepta como verdadera. Si estamos interesados en determinar si una
afirmación sobre una distribución poblacional es falsa, debemos plantear esa afirmación como
hipótesis nula; si la rechazamos podremos concluir que hemos probado la falsedad de esa
hipótesis. Si, por el contrario, estamos interesados es determinar si esa afirmación es verdadera,
debemos plantearla como la hipótesis alternativa; así, si rechazamos la hipótesis nula, lo haremos
en favor de la hipótesis alternativa.

Consecuencias de una prueba de hipótesis, errores tipo I y II. Nivel de


significación y potencia. Pardo 3.2 (143 y 144). Relación entre α y β. Nivel
crítico. Pardo 3.4 (155 - 157)
Todo contraste de hipótesis desemboca en una decisión que consiste en mantener o rechazar la
hipótesis nula planteada.
Se llama error de tipo I al que se comente cuando se decide rechazar una hipótesis nula que en
realidad es verdadera. La probabilidad de cometer este error es α.
Se llama error de tipo II al que se comete cuando se decide mantener una hipótesis nula que en
realidad es falsa. La probabilidad de cometer este error es β.
La probabilidad de cometer un error de tipo I es una probabilidad conocida, ya que el nivel de
significación α lo determina el investigador. Sin embargo, la probabilidad de cometer un error de
tipo II es un valor desconocido que depende de tres factores:
1) la verdadera hipótesis alternativa
2) el valor de α
3) el tamaño del error típico de la distribución muestral utilizada para efectuar el contraste.
El nivel de significación α es la probabilidad de cometer un error de tipo I (rechazar una
hipótesis nula verdadera). Esa probabilidad se establece antes de efectuar el contraste y se
entiende como el riesgo máximo que se asume al tomar la decisión de rechazar una hipótesis.
Esta forma de proceder tiene algunos inconvenientes:
 La decisión sobre la hipótesis nula puede depender decisivamente del nivel de
significación establecido. Que tan pequeño es el nivel de significación es totalmente
arbitrario. Para hacer esa definición se debe considerar si cometer un error de tipo I es
muy grave, entonces se adoptará un valor más pequeño para α. En ese caso de
reducción de alfa se estará aumentando la probabilidad de cometer un error de tipo II.

 Decidir si la hipótesis nula es o no falsa no proporciona información sobre el grado en el


que la evidencia muestral es incompatible con esa hipótesis.
Se llama nivel crítico (p) al nivel de significación más pequeño al que una hipótesis nula
puede ser rechazada con el estadístico de contraste obtenido. Es la probabilidad asociada al
estadístico de contraste.
En un contraste unilateral, el nivel crítico es la probabilidad asociada a los valores mayores o
menores; en un contraste bilateral el nivel crítico es la probabilidad asociada a los valores que
se encuentran tan alejados de la hipótesis nivela como, al menos, el estadístico de contraste.
Este nivel crítico se obtiene después de realizar el contraste. Su utilización en lugar del nivel
de significación tiene la ventaja de superar, en parte, el problema de la arbitrariedad del nivel
de significación. Ayuda a tomar una decisión sobre la hipótesis nula e informa sobre el grado
de compatibilidad o discrepancia entre la evidencia muestral y la hipótesis nula.
El tamaño del error típico de la distribución muestral de un estadístico se ve fuertemente
afectado por el tamaño de la muestra utilizada. Permaneciendo todo lo demás constante, el
valor del estadístico de contraste será tanto más extremo cuanto mayor sea el tamaño de la
muestra. Entonces, la utilización del nivel crítico como una medida del grado de discrepancia
entre la hipótesis nula y la evidencia muestra tiene el inconveniente de que el valor del nivel
crítico está condicionado por el tamaño de la muestra.
Es conveniente acompañar la decisión de un contraste de hipótesis con alguna medida del
grado de discrepancia entre la hipótesis nula y la evidencia muestral, como puede ser la
proporción de la varianza explicada.

Hoja de cátedra “esquema de prueba de hipótesis”. VER APUNTE.

También podría gustarte