Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADSTICA INFERENCIAL
2.1. INTRODUCCIN
Tambin se le llama Inferencia Estadstica, pero previamente recordemos que la Estadstica
(EI) comprende el conjunto de mtodos estadsticos que permiten deducir (inferir) cmo se
distribuye la poblacin bajo estudio a partir de la informacin que proporciona una muestra
representativa, obtenida de dicha poblacin. Ver seccin 1.6.2 del presente libro.
Para que la Estadstica Inferencial proporcione buenos resultados debe:
1. Basarse en una tcnica estadstico-matemtica adecuada al problema y suficientemente
validada.
2. Utilizar una muestra que realmente sea representativa de la poblacin y de un tamao
suficiente.
Veamos el siguiente ejemplo:
Ejemplo 2.1
Se realiza un estudio para comparar tres mtodos para ensear tcnicas de comprensin
lectora en ingls a escolares de segundo grado de Educacin Bsica Secundaria, como son:
El mtodo de la enseanza recproca.
El mtodo de instruccin directa.
La combinacin de mtodos de instruccin directa y enseanza recproca.
Estadstica industria II
2.2. POBLACIN
Este concepto vamos a definir bajo diferentes enfoques. En investigacin cientfica se le
define como la totalidad de elementos sobre los cuales recae la investigacin. A cada
elemento se le llama unidad estadstica, sta se le observa o se le somete a una
experimentacin, estas unidades son medidas pertinentemente.
Si representamos mediante, X , una variable aleatoria bajo investigacin, al estudiar a esta
variable en la poblacin, como resultado tendremos los valores:
X 1 , X 2 , X 3 ,..., X
N
poblacin, pero resulta que las poblaciones son grandes o por razones de tica, recursos
financieros, metodolgicos u otros no ser posible entonces se debe trabajar con una muestra
extrada de la poblacin bajo estudio.
2.3. MUESTRA
Sierra Bravo (1991) anota que: Una muestra en general, es toda parte representativa de la
poblacin, cuyas caractersticas debe reproducir en pequeo lo ms exactamente posible.
Para que sea representativa se debe seleccionar empleando el muestreo, tpico importante de
la Estadstica, con la finalidad de que los resultados de esta muestra sean validos para la
poblacin de la que sea obtenido la muestra. Esta generalizacin se realiza empleando la
estadstica inferencial.
2.4. MUESTRA ALEATORIA
Una muestra aleatoria de tamao n de la funcin de distribucin de la variable aleatoria X es
una coleccin de n variables aleatorias independientes X 1 , X 2 , X 3 ,..., cada una con la
Xn
misma funcin de distribucin de la variable aleatoria X.
Ejemplo 2.3
Consideremos nuevamente la poblacin definida en el ejemplo 2.2, la variable de inters es X,
calificacin obtenida en la prueba de conocimientos sobre educacin ambiental (escala
vigesimal), de los alumnos de la Facultad de Educacin. Asumiremos que tiene distribucin
de probabilidad con media
el valor numrico de
y Varianza
o de
2
x
2
x
determinarse con precisin si se revisa cada una de las calificaciones de los 300 alumnos. Para
tener una idea del valor de
poblacin. Entonces:
respectivamente, para
independient
es e
idnticament
e
distribuidas.
Ejemplo 2.4
Para el caso del ejemplo 2.3, una vez identificados los seis alumnos, podemos determinar los
valores numricos de las seis variables aleatorias X 1 , X 2 , X 3 , X 4 , X 5 , X 6 . Supongamos que
el
primer alumno seleccionado ha obtenido 13 en la prueba de educacin ambiental en este caso,
la variable aleatoria X 1 toma el valor x1 = 13.
Si el segundo alumno seleccionado ha obtenido 10 en la prueba de educacin ambiental en
este caso, la variable aleatoria X 2 toma el valor x2 = 10. De igual forma las variables
aleatorias X 3 , X 4 , X 5 ,
X6
que obtienen los alumnos seleccionados en tercera, cuarta, quinta y sexta seleccin.
Ahora estamos utilizando el termino muestra aleatoria no para referirnos a los alumnos
seleccionados o a las variables aleatorias asociados con ellos sino a los seis valores numricos
x1 , x 2 , x3 , x 4 , x5 , que toman respectivamente cada una de las seis variables aleatorias.
x6
Por tanto hay tres formas de considerar a una muestra aleatoria:
1. Como un conjunto de unidades seleccionadas y que son sometidos al estudio.
2. Como un conjunto de variables aleatorias tericas asociadas con esas unidades
3. Como un conjunto de valores numricos tomadas por las variables.
Las definiciones no son equivalentes pero estn estrechamente relacionadas.
2.6. PARMETRO
Sierra Bravo (1991) indica que parmetro deriva del vocablo griego parmetreo que significa
medir una cosa con otra:
En estadstica se refiere a los valores o medidas que caracterizan una poblacin como
por ejemplo la media y la desviacin tpica de una poblacin () Son cantidades
indeterminadas constantes o fijas respecto a una condicin o situacin que caracteriza
a un fenmeno en un momento dado que ocurre en una poblacin.
Se suele representar a un parmetro mediante letras griegas, por ejemplo la media poblacional
se representa mediante
2
x
variable aleatoria X.
En trminos prcticos un parmetro es un valor que resulta al emplear los valores que se
obtiene de una poblacin.
Ejemplo 2.5
Si al obtener las calificaciones de los 300 alumnos que conforman la poblacin, estos se
promedia, entonces
X
x
i 1
(2.1)
X
x
i 1
(2.2)
Xi
1 si alumna
0 si alumno
x
x
i 1
(2.3)
El numerador de la expresin (2.3) es la suma de los seis valores, que da 71, que dividido por
6, resulta x = 11,83, es decir en promedio los alumnos han obtenido 11,83 de calificacin en
la prueba de educacin ambiental.
S2
i 1
(2.4)
Para su clculo, disponemos de la tabla, 2.1, en la que mostramos paso a paso el uso de la
expresin (2.4) sabiendo que x = 11,83:
Tabla 2.1
Clculos para obtener el valor de la varianza (ejemplo 2.6)
2
Unidad
xi
xi
13
1,17
1,3689
10
-1,83
3,3489
13
1,17
1,3689
14
2,17
4,7089
11
-0,83
0,6889
10
-1,83
3,3489
Total
71
0,02*
14,8334
xi x
Tericamente:
n
i 1
El numerador de la expresin (2.4) es la suma del cuadrado de las seis desviaciones de cada
valor que toma la variable, respecto a su media aritmtica, que es igual a 14,8334, que
dividido por 6 es justamente 2,4722.
(2.5)
Tabla 2.2
Resultados de posibles muestras de tamao 2
Muestras
Medias muestrales
Posibles
13,11
12
13,7
10
11,13
12
11,7
7,13
10
7,11
Frecuencia
Frecuencia relativa
muestrale
9
2/6 = 0.33
10
2/6 = 0.33
12
2/6 = 0.33
y varianza poblacional
1. E x
2. V x
/n
4. Sea X 1 , X 2 , X 3 ,...,
Xn
poblacional
/ n
y varianza poblacional
x
/ n
(2.6)
la varianza muestral,
definida como:
x1 , x2 ,...,
xn
s2
n 1
(2.7)
i 1
respectivamente, entonces
n 1 s2
2
nA
n
(2.8)
2. V p
/n
(1
)/n
p
(1
)/n
(2.8.)
Ejemplo 2.8
En una muestra aleatoria de 15 docentes de educacin secundaria, de la Institucin Educativa
Martn Adn, se les aplico un cuestionario para recoger su opinin sobre el investigador
educativo, se presenta la respuesta de 3 preguntas, de un total de 27:
Tabla 2.4
Muestra aleatoria de 15 docentes de la Institucin Educativa Martn
Adn (Lima)
Docentes
Edad (1)
34
Investigador
(2)
1
Remuneracin
(3)
1
1
2
38
49
42
35
44
30
36
43
10
47
11
39
12
46
13
48
14
36
15
44
(1)
(2)
(3)
2. Docentes maduros.
2. No.
Con esta informacin vamos a mostrar la diferencia entre desviacin estndar y error
estndar.
MEDIA MUESTRAL
La edad en aos cumplidos tiene distribucin con media poblacional,
varianza poblacional,
= 38,5 aos y
= 30 aos .
Usando la expresin 2.3 se obtiene x = 40,73 aos, y al usar la expresin 2.7 se obtiene s 2 =
2
33,21 aos .
33,21 = 5,76.
En cambio el error estndar del estadstico media muestral, empleando la propiedad 3, es:
5,48
15
5,48
= 1,42 aos
3,87
PROPORCIN MUESTRAL
Para la segunda variable, interesa que el docente encuestado indique que la profesin de
investigador es una profesin atractiva para docentes jvenes ( A ). La muestra aleatoria es
igual a 15 docentes n 15 .
En esta poblacin se asume que la proporcin poblacional de docentes que consideran que la
profesin de investigador es una profesin atractiva para docentes jvenes es igual a 0,71
0,71 .
9
= 0,6 (60%)
15
Esto es, el 60% de docentes encuestados afirman que la profesin de investigador es una
profesin atractiva para docentes jvenes.
El error estndar del estadstico p es:
(1
n
0,71(1 0,71)
15
0,71(0,29)
15
0,2059
15
0,0137 = 0,1170
2.9. ESTIMACIN
La Inferencia Estadstica se clasifica como: Estimacin y Prueba de Hiptesis de parmetros
estadsticos. En ambos casos hay una poblacin bajo investigacin y generalmente al menos
un parmetro de esta poblacin, al que vamos a representar mediante la letra griega .
Cuando no se tiene una nocin preconcebida sobre el valor de
, se desea responder a la
y se
, se le denotara
por . Una vez que la muestra ha sido tomada y se han hecho algunas observaciones, se
puede obtener el valor numrico del estadstico . A tal nmero se le denomina una
estimacin puntual de
estimacin.
Ejemplo 2.9
Consideremos las variables edad en aos cumplidos
investigador educativo debe ser bien remunerado Y , para distinguir entre estimador y
estimacin:
Variable
Parmetro
Estimador
Estimacin
x
x
i 1
x = 40,73 aos
s = 33,21 aos
X
2
n 1
xi
i 1
2
2
nA
n
0,7333 (73,33%)
PRUEBA DE HIPTESIS
Proceso mediante el cual, a partir de los valores de una muestra aleatoria se decide si se
rechaza o no el supuesto que plantea el investigador para el parmetro o parmetros de la
poblacin o poblaciones bajo estudio, pero con cierta probabilidad de error (riesgo) por tomar
una decisin.
Ejemplo 2.10
En cierta investigacin, se requiere estudiar el nivel de comprensin lectora en nios de 8
aos de edad, que asisten a Instituciones Educativas estatales y privados, para tal fin se elige
al azar una muestra de alumnos de cada tipo de Institucin Educativa (IE). Se pretende lograr
los siguientes objetivos:
1. Determinar el nivel promedio poblacional del puntaje de la prueba de comprensin lectora
para tipo de IE.
2. Verificar si el nivel promedio poblacional del puntaje de la prueba de comprensin lectora
en nios de IE estatal es diferente de los nios de IE privados.
Explicar cul rama de la Inferencia Estadstica emplear, para lograr cada objetivo.
Solucin
Previamente se requiere identificar:
2:
= Nivel promedio poblacional del puntaje de la prueba de comprensin lectora para nios
) o equivalentemente
son
diferente de
= 0.
En este caso se parte del supuesto que no existe diferencias entre el nivel promedio
poblacional del puntaje de la prueba de comprensin lectora para nios que asisten a IE
Estatales y Privados. Por tanto se empleara la prueba de hiptesis estadstica, mediante el cual
se somete a prueba
= 0.
ESTADSTICA PARAMTRICA
Segn Sierra Bravo (1991) es parte de la estadstica que exige determinados requisitos para
emplear en la inferencia estadstica generalmente requiere para su uso el supuesto de
normalidad es decir que las muestras aleatorias se extraen de poblaciones que estn
normalmente distribuidas o aproximadamente.
Ejemplo 2.11
Se desea verificar si el tiempo promedio requerido para resolver un problema sencillo en
nios de 10 aos de edad con secuelas neurolgicas derivadas de hiperbilirubenia al nacer, se
incrementa despus de haber recibido una capacitacin especial para resolver problemas de
ese tipo.
En este caso se debe elegir una muestra aleatoria de la poblacin conformada por nios de
esta poblacin, es decir, nios de 10 aos de edad con secuelas neurolgicas derivadas de
hiperbilirubenia al nacer.
La variable aleatoria bajo estudio X, es el tiempo, en minutos, para resolver un problema
sencillo, cuyo parmetro se define como:
= Tiempo promedio poblacional, en minutos, requerido para resolver un problema
sencillo.
Para estudiar a este parmetro se requiere evaluar a la muestra aleatoria de esta poblacin
antes de la capacitacin especial y despus de la capacitacin especial, es decir los parmetros
para este esquema, sujetos a estudio estadstico son:
antes de la capacitacin.
antes de la capacitacin.
En este caso la muestra aleatoria es relacionada, porque a cada unidad de la muestra se le
evala bajo dos condiciones antes, y despus de la capacitacin especial.
Para verificar el supuesto propuesto: la capacitacin especial incrementa el tiempo promedio
requerido para resolver problemas sencillos en nios de esta poblacin a partir de muestras
relacionadas, se aplica una prueba de hiptesis para someter a prueba:
: tiempo, en
1
<
< 0.