Está en la página 1de 10

Tema 5.

Estadística
inferencial y contraste de
hipótesis
Análisis de Datos

Análisis de Datos

Marina Iniesta Sepúlveda


Facultad de Ciencias de la Salud

Departamento de Psicología
Análisis de Datos

ÍNDICE

1. El proceso de inferencia estadística _______________________________________________ 3


2. Contraste de hipótesis __________________________________________________________ 6
3. El valor p de un estadístico ______________________________________________________ 8
4. Referencias bibliográficas _____________________________________________________ 10

2
Marina Iniesta Sepúlveda - Tlf: (+34) 968 278 788 - miniesta@ucam.edu
Análisis de Datos

Tema 5. Estadística inferencial y contraste de hipótesis

1. El proceso de inferencia estadística

Como se ha comentado la estadística inferencial intenta extraer conclusiones acerca de la


población a través de los datos obtenidos en las muestras. En otras palabras, partiendo de los
estadísticos calculados en las muestras se pretende obtener información acerca de los valores de los
parámetros en la población. Esto es posible a través de procedimientos estadísticos basados en la
teoría de la probabilidad. Recordemos que los estadísticos se representan con letras latinas y los
parámetros con letras griegas, en la Tabla 1 podemos ver la equivalencia entre estadísticos y
parámetros.

Tabla 1. Equivalencia entre parámetros y estadísticos

Denominación Estadístico Parámetro

Media ̅

Proporción

Varianza

Desviación típica

Correlación

Los estadísticos calculados en las muestras se comportan como una variable. Es necesario
asumir que los estadísticos encontrados en la muestra siguen una determinada distribución de
probabilidad en la población. Una distribución de probabilidad es un modelo teórico simplificado
acerca del comportamiento real de una variable (ej., la distribución normal). Este hecho posibilita
conocer las características de los datos sin realizar laboriosas comprobaciones, ya que estas
distribuciones teóricas tienen propiedades conocidas.

3
Marina Iniesta Sepúlveda - Tlf: (+34) 968 278 788 - miniesta@ucam.edu
Análisis de Datos

Para entender mejor esta explicación veamos el ejemplo de Píldoras Matemáticas (16 abril
2017) video disponible en YouTube. Imaginemos que queremos conocer cuál es la media de la
estatura en la población adulta española (µ). Lo más adecuado sería medir la estatura de todos y
cada uno de los adultos españoles y calcular la media. Sin embargo, como sabemos, este
procedimiento es logísticamente imposible. En este sentido, la estadística nos aporta la solución de
estimar lo que vale la media en la población mediante la media obtenida en una muestra aleatoria
representativa ( ̅ ) ¿Cómo es esto posible?

Como sabemos, la altura en la población sigue una distribución normal, es decir hay un gran
número de personas que tienen estaturas en torno a la media y son cada vez menos aquellos que
presentan estaturas inferiores o superiores a la media. Imaginemos que se conociera y que la
estatura media de la población española fuera de 170 cm, con una desviación típica de 12, por lo
tanto la distribución poblacional de la variable altura se representaría como N(170, 12).

Figura 1. Distribución de la estatura en la población (tomado de Píldoras Matemáticas, 16 abril 2017)

Si escogemos mediante muestreo aleatorio varias muestras de tamaño N de la población


española y calculamos la media de la estatura en ellas, la distribución muestral de las medias tendería
a la forma de una distribución normal conforme el número de muestras escogidas fuera mayor, la
media de esta distribución de las medias muestrales (llamada esperanza matemática en este caso)
sería igual a la media de la población (µ). En otras palabras, una gran parte de las muestras que
escogiéramos tendrían como media 170 o valores cercanos y serían cada vez menos las muestras
con valores medios más alejados. La dispersión en la distribución de las medias muestrales de la
estatura sería bastante menor que la dispersión en la distribución poblacional de la estatura. Es

4
Marina Iniesta Sepúlveda - Tlf: (+34) 968 278 788 - miniesta@ucam.edu
Análisis de Datos

decir, aunque es poco probable escoger una persona al azar de la población que presente un valor
de estatura extremo (195 cm) no es imposible pues existen personas muy altas, sin embargo escoger
una muestra que tuviera como media 195 cm es prácticamente imposible. Es por ello que la
desviación típica de la distribución de las medias (denominada error típico en este caso) sería igual a
la desviación típica de la población dividida por la raíz del tamaño de las muestras ( ).

Figura 2. Distribución de las medias muestrales de la estatura (tomado de Píldoras Matemáticas, 16


abril 2017)

Esto que acabamos de describir ocurriría con la distribución muestral de la media de


cualquier variable, incluso aunque esta no siguiera una distribución normal en la población (si se
escogiera un número suficiente de muestras). Es lo que se conoce como teorema central del límite.
Dado que se conoce que la media sigue una distribución normal, es posible transformar los
diferentes valores que toma la media a puntuaciones típicas y de esta forma poder determinar áreas
de probabilidad bajo la curva mediante la consulta de las tablas de la distribución normal. Existen
procedimientos matemáticos que permiten conocer las propiedades de las distribuciones muestrales
de diferentes estadísticos. La utilidad de la distribución muestral del estadístico es lo que hace
posible conocer la probabilidad de que en una población dicho estadístico tome un valor concreto, a
partir de su cálculo en las muestras. En esto consiste exactamente el proceso de inferencia
estadística.

5
Marina Iniesta Sepúlveda - Tlf: (+34) 968 278 788 - miniesta@ucam.edu
Análisis de Datos

2. Contraste de hipótesis

Como sabemos, una de las etapas de la investigación es el planteamiento de hipótesis, en la


que el investigador el investigador plantea predicciones acerca de los resultados de la investigación
que deberá confirmar o refutar dependiendo de las evidencia empírica (pruebas) recogidas. Un
ejemplo de hipótesis podría ser: “los alumnos motivados rendirán más que los no motivados”. Estas
hipótesis son denominadas hipótesis conceptuales. Para poder ser verificada, la hipótesis conceptual
debe ser reformulada como hipótesis estadística.

Las hipótesis estadísticas son afirmaciones acerca de los valores que tomarán los parámetros
en la población. Siguiendo con el ejemplo, la hipótesis estadística sería: “la media de rendimiento de
los alumnos motivados será superior a la media de los alumnos desmotivados”. La hipótesis se
representa con la letra H seguida de la afirmación en términos matemáticos, en el ejemplo:

El contraste de hipótesis es entendido como un método de toma de decisiones mediante el


cual se comprueba si una afirmación acerca de las propiedades de una población puede ser
mantenida según la información aportada por una muestra representativa. Es decir, comprueba si la
hipótesis estadística del investigador puede ser mantenida en función de la evidencia disponible. A
pesar de que en nuestro ejemplo se ha formulado una sola hipótesis, todo contraste de hipótesis se
basa en la formulación de dos hipótesis:

 La hipótesis nula H0: siempre se expresa en términos de igualdad. Por ejemplo, cuando se
trata de estimar el valor de un parámetro será la hipótesis que mantenga que el parámetro es
igual a ese valor, o cuando se trata de comparar los valores de dos parámetros, será la
hipótesis que afirme que no hay diferencias entre los mismos (que ambos son iguales).

 La hipótesis alternativa H1: consiste en la negación de la hipótesis nula, incluyendo todo lo


que esta excluye. Por ejemplo, si la hipótesis nula afirma que el parámetro es igual a un valor,
la hipótesis alternativa afirmará que el parámetro es diferente a dicho valor. Si la hipótesis

6
Marina Iniesta Sepúlveda - Tlf: (+34) 968 278 788 - miniesta@ucam.edu
Análisis de Datos

afirma que un parámetro es igual a otro, la hipótesis alternativa afirmará que uno de los
parámetros es diferente, mayor o menor que otro.

Siguiendo con el ejemplo este sería el planteamiento del contraste de hipótesis en una
investigación que pretende comprobar si el rendimiento de los alumnos motivados es superior al de
los desmotivados:

Vemos que la hipótesis nula afirma que el rendimiento de los motivados es menor o igual que
el de los no motivados, mientras que la alternativa afirma que el rendimiento de los motivados es
mayor que el de los no motivados. Como se puede deducir, estas dos hipótesis son complementarias
y mutuamente excluyentes, aceptar una implica necesariamente rechazar la otra. En este sentido,
los contrastes de hipótesis pueden ser bilaterales o unilaterales:

 Contraste bilateral: Este tipo de contraste plantea si existen o no diferencias entre los
parámetros o entre el parámetro y un valor, sin especificar el sentido de tales diferencias. La
hipótesis nula afirma que los parámetros son iguales o que el parámetro es igual a un valor,
conteniendo el símbolo (=), mientras que hipótesis alternativa afirma que los parámetros son
diferentes o que el parámetro es diferente a un valor, conteniendo el símbolo (≠). Un ejemplo
sería:

 Contraste unilateral izquierdo: Este tipo de contraste si plantea el sentido de las diferencias.
La hipótesis nula afirma que un parámetro es igual o mayor que otro, o que un parámetro es
igual o mayor que un valor, conteniendo el símbolo (≥), mientras que la hipótesis alternativa
afirma que los parámetros son diferentes o que el parámetro es diferente a un valor,
conteniendo el símbolo (<).

7
Marina Iniesta Sepúlveda - Tlf: (+34) 968 278 788 - miniesta@ucam.edu
Análisis de Datos

 Contraste unilateral derecho: Este tipo de contraste también plantea el sentido de las
diferencias. La hipótesis nula afirma que un parámetro es igual o inferior que otro, o que un
parámetro es igual o inferior que un valor, conteniendo el símbolo (≤), mientras que la
hipótesis alternativa afirma que los parámetros son diferentes o que el parámetro es
diferente a un valor, conteniendo el símbolo (>).

Es importante señalar que la hipótesis acerca de la cual se toma una decisión (aceptar o
rechazar) es la hipótesis nula. Si los datos muestrales aportan suficientes pruebas a favor de la
hipótesis nula esta tendrá que ser mantenida, por el contrario, si se obtiene suficiente evidencia en
contra de la hipótesis nula, esta será rechazada. Aceptar o rechazar la hipótesis nula no implica
necesariamente que esta sea verdadera o falsa.

3. El valor p de un estadístico

Llegado este momento, ¿de qué forma vamos a contrastar la veracidad de la hipótesis nula?
Lo primero que necesitamos será el estadístico de contraste (como sabemos el cálculo de
estadísticos en las muestras nos permite hacer inferencias probabilísticas acerca de los valores de los
parámetros en la población). El estadístico tiene que cumplir con dos propiedades:

1. Proporcionar la información necesaria para contrastar la hipótesis nula, es decir el


estadístico debe ser un buen estimador del parámetro.

2. Poseer una distribución muestral conocida. La media, la varianza y la proporción tienen


distribuciones muestrales conocidas (distribución normal, distribución Chi-cuadrado, distribución F
de Snedecor, respectivamente).

8
Marina Iniesta Sepúlveda - Tlf: (+34) 968 278 788 - miniesta@ucam.edu
Análisis de Datos

Ya podemos intuir que para realizar el contraste tipificaremos los estadísticos y les
asignaremos su probabilidad de ocurrencia valiéndonos de su correspondiente distribución muestral.

El p-valor es la probabilidad asociada al estadístico de contraste si la hipótesis nula fuese


cierta. Es decir, cómo de probable sería observar un estadístico con ese valor si la hipótesis nula
fuese cierta, si la probabilidad de observar ese valor fuese muy pequeña, lo lógico sería rechazar la
hipótesis nula (si aun siendo tan pequeña la probabilidad de observar un estadístico con este valor,
lo hemos observado en nuestra muestra, tenemos fuerte evidencia en contra de la hipótesis nula).

Pero ¿cómo de pequeña debe ser esa probabilidad para considerar el rechazo de la hipótesis
nula? Evidentemente será necesario un criterio. Esta probabilidad, es denominada nivel de
significación (α) y es prefijada por el investigador, utilizándose en psicología generalmente un valor
de 0,05. Por lo tanto, cuando los estadísticos de contraste tienen asociados p-valores (probabilidades
de ocurrencia) inferiores o iguales a 0,05 se rechaza la hipótesis nula y se acepta la alternativa. Por el
contrario se aceptará la hipótesis nula si la probabilidad de ocurrencia el estadístico toma un valor
superior a 0,05.

4. Error tipo I y error tipo II

Como se ha visto, el contraste de hipótesis implica tomar la decisión de aceptar o rechazar la


hipótesis nula. Asimismo H0 puede ser falsa o puede ser verdadera. Si es verdadera y la mantenemos
estaremos tomando una decisión correcta. Si es falsa y la rechazamos también estaremos tomando
una decisión correcta. Sin embargo tanto si H0 es verdadera y la rechazamos como si es falsa y la
mantenemos, estaremos cometiendo dos tipos de error:

 El error Tipo I se comete cuando se decide rechazar una H0 que en realidad es verdadera. La
probabilidad de cometer este error es igual a α. Por lo tanto es conocida ya que viene fijada
RV
de antemano por el investigador.

9
Marina Iniesta Sepúlveda - Tlf: (+34) 968 278 788 - miniesta@ucam.edu
Análisis de Datos

 El error Tipo II es el que ocurre cuando se decide aceptar una H0 que en realidad es falsa. La
VR
probabilidad de cometer este error es desconocida y se representa como β.

De esto se desprende que 1- α es la probabilidad de tomar una decisión correcta cuando H0


es verdadera y que 1- β es la probabilidad de tomar una decisión correcta cuando H0 es falsa, este
última decisión correcta es conocida como potencia del contraste. La Tabla 2 sintetiza las ideas
presentadas:

Tabla 2. Error tipo I, error tipo II y potencia del contraste

Hipótesis Nula

Decisión Verdadera Falsa

Mantener H0 Decisión correcta Error Tipo II


1- α β

Rechazar H0 Error Tipo I Decisión correcta (Potencia contraste)


α 1- β

5. Referencias bibliográficas

Píldoras Matemáticas. (16 abril 2017). 08 Inferencia estadística [Video]. YouTube.


https://www.youtube.com/watch?v=nbJU4iS-LEg

10
Marina Iniesta Sepúlveda - Tlf: (+34) 968 278 788 - miniesta@ucam.edu

También podría gustarte