Está en la página 1de 5

Programa de Estudios de Matemática

Estadística aplicada a la educación

Inferencia Estadística (Parte I)


Autor
Jorge M. Minaya Martínez
Inferencia estadística

Como subrayamos en el capitulo anterior, al iniciar una investigación de una determinada


población requerimos conocer algunas características tales como la variables a estudiar, la escala
y la unidad de investigación. Se debe tener claridad en cuanto a los objetivos y las hipótesis
planteadas a fin de definir a la población. Por ejemplo si queremos conocer cómo se comportan
los valores del Índice de Masa Corporal (IMC) de los niños menores de 5 años de la provincia de
Caraz (Ancash), entonces la población estará constituida por todos los niños menores de 5 años
(de la provincia de Caraz) y el interés es conocer es el IMC de éstos niños (variable).
Ahora bien, estudiar a toda la población es difícil (por el costo, la dificultad geográfica), por lo
que se recurre a una muestra aleatoria cuyos resultados describen a la misma muestra (no a la
población), pero el objetivo es conocer y concluir a partir de las características de la población.
Por lo tanto, se requiere inferir los resultados de la muestra a la población con cierto
grado de incertidumbre. Este proceso constituye la inferencia estadística que se
estudiará en esta sección. En síntesis, la inferencia estadística consiste en obtener conclusiones
probabilísticas relativas a una población valiéndose de la información de una muestra de ésa
población.
Para una mejor comprensión de la inferencia estadística podemos dividirla en dos partes:
Estimación de parámetros
Prueba de hipótesis

3.8. Estimación de parámetros


En principio, un estimador es una medida estadística centrada en responder a la siguiente
pregunta, ¿cómo utilizamos los datos de una muestra para estimar un parámetro desconocido de la
población? Recordar que para estimar un parámetro de una población se utilizan los estimadores
de una muestra (son medidas estadísticas de una muestra), Por lo tanto, si queremos realizar
una estimación debemos usar las medidas calculadas en la muestra (estimadores) para predecir
los valores de los parámetros de la población.
La estimación de un parámetro se puede realizar mediante la estimación por punto o mediante la
estimación por intervalo. En esta sección se analizara esos dos tópicos. Veamos en que consisten.

3.8.1. Estimación por punto


En esta estimación se usan los valores de la muestra para determinar un único valor numérico
que es la estimación del parámetro de la población.
En la siguiente relación se presenta las notaciones para la población (primera columna), las
notaciones de una muestra (segunda columna) y sus respectivos parámetros y estimadores res-
pectivamente.

41
Estadística aplicada a la educación Programa de Matemática - EESPP

Pn
µ x= xi
i=1 n Media aritmética
Pn (xi −x)2
σ2 s2 = i=1 n−1 Varianza

µ1 − µ2 x1 − x2 Diferencia de medias

P p= a
n Proporción

P1 − P2 p1 − p2 Diferencias de proporciones

3.8.2. Estimación por intervalo


Consiste en determinar dos valores numéricos que definan un intervalo y que se tenga cierto
grado de seguridad que en dicho intervalo se encuentre al parámetro poblacional. Para determinar
el intervalo de confianza para la media aritmética µ se tendrá:
s
L1 = x − tn−1 ( √ ) (3.10)
n
s
L1 = x + tn−1 ( √ ) (3.11)
n
ESx = √s , es el error estándar que nos permite cuantificar la variabilidad entre las medias
(n)
de las muestras (que se obtienen de las distintas muestras que se selecciona a la población) con
respecto a la media aritmética de la población.
tn−1 : es el coeficiente de confianza. Su valor depende del grado de confianza que se establece.
El coeficiente tn−1 es una variable continua que tiene una distribución t de Student con n − 1
grados de libertad (el número de grados de libertad indica el número de variables independientes
que constituyen la nueva variable y se le identifica con t(n) . Para determinar el coeficiente de

Figura 3.8: Se observa la forma de la curva de una distribución t y la distribución normal. Ambas
son simétricas con respecto al origen con una media igua a cero (µ = 0)
.

confianza (tn−1 , se debe establecer el grado de confianza que generalmente es: 90 %, 95 % y 99 %.


Vamos a esclarecer esto con un ejemplo:

42
Estadística aplicada a la educación Programa de Matemática - EESPP

Ejemplo 1
Se tiene interés en conocer el gasto promedio mensual de movilidad de los estudiantes del
programa de Matemática. Para tal efecto se recurre a una muestra de 25 estudiantes y se obtie-
nen los siguientes resultados para la media y la desviación estándar:

x = 180 y s = 40
Solución:
Para esta situación la distribución t tiene 25 − 1 = 24 grados de libertad. Utilizaremos una calcu-
ladora online o un aplicativo para determinar t24 para un grado de confianza de 95 % o un nivel
de significación de 0, 05 y para una prueba de dos colas se tiene que t24 = 2, 064. Reemplazando
los valores en las ecuaciones 3.10 y 3.11, tendremos:

40
L1 = 180 − 2, 064( √ ) = 163, 49
24
40
L1 = 180 + 2, 064( √ ) = 196, 51
24
Observación: Explore el cálculo de tn−1 utilizando el siguiente recurso online: https://goodcalculators.
com/student-t-value-calculator
Conclusión: el gasto promedio de movilidad de los estudiantes del Programa de Matemática
está comprendido entre 163, 49 y 196, 51 nuevos soles con un grado de confianza del 95 %.

Estimación por intervalo de una proporción poblacional (P).


A veces estamos interesados en determinar en determinar la estimación por intervalos para
una proporción poblacional P. Los límites de confianza L1 y L2 estarán expresados como:
r
pq
L1 = p − zα/2 (3.12)
n
r
pq
L2 = p + zα/2 (3.13)
n
Dónde: q = 1 − p
Además, el estimador del error estándar (ESp ) de la proporción muestral p, estará dado por:
r
pq
ESp = (3.14)
n

Zα/2 : es el coeficiente de confianza cuyo valor depende del grado de confianza que se establece.
Por ejemplo para 90 %, 95 % y 99 % los valores de coeficiente de confianza correspondientes son
de 1, 64, 1, 96 y 2, 57 respectivamente.

Nivel 90 % 95 % 99 %
α 0,10 0,05 0,01
Zα 1,28 1,64 2,33
Zα/2 1,64 1,96 2,57

Cuadro 3.1: Resumen de niveles de confianza de los más utilizados.

43
Estadística aplicada a la educación Programa de Matemática - EESPP

Ejemplo 2
Vamos a estimar la proporción de niños desnutridos menores a 5 años de una determinada
comunidad del Perú. Para tal efecto se seleccionan aleatoriamente 100 niños menores de 5 años
y de contabiliza que 45 están desnutridos
Solución:
El estimador esta dado por P = a/n, donde a es el numero de niños desnutridos dela muestra y
n el tamaño de la muestra. De conformidad con los datos, tendremos que: P = 45/100 = 0, 45.
Ahora bien, vamos a construir un intervalo de confianza del 95 % para P , por lo tanto para un
grado de confianza del 95 % se tendrá que Zα−1 = 1, 96
Vamos a reemplazar los datos en 3.12 y 3.13,
r
0, 45(0, 55)
L1 = 0, 45 − 1, 96 ∗ = 0, 352
100
r
0, 45(0, 55)
L2 = 0, 45 + 1, 96 ∗ = 0, 352
100
Para fijar los conceptos anteriores resuelva los siguientes ejercicios:

Ejemplo 3

Si X1 , X1 ...X4 9 es una muestra aleatoria de una población con distribución N (µ, σ 2 ) y si el


verdadero valor de la desviación estándar es de σ = 35 y la media es 160, construye un intervalo
de confianza para la media con un nivel de confianza de 95 %.

Ejemplo 4
Considerando el ejercicio anterior, suponga que la varianza es desconocida,pero que el valor
observado s = 35 (s: desviacion estandar). Determine el intervalo de confianza para la media con
un nivel de confianza del 95 %.

44

También podría gustarte