Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadistica Inferencial Aplicada PDF
Estadistica Inferencial Aplicada PDF
Serie:
Textos de la Maestra en Educacin.
Edicin:
Elena Soto Loayza.
2
Dedicatoria
Dedicatoria
Para Sandra Natalia (Mara Estela)
Para Ernesto Alonso (Violeta Alicia)
3
NDICE
Prefacio 008
Agradecimientos 009
4
Captulo 3. Estimacin de parmetros
3.1. Introduccin
3.2. Propiedades de los estimadores
3.3. Estimacin de parmetros mediante intervalos de confianza
3.4. Intervalo de confianza para estimar la media de una poblacin normal
3.5. Intervalo de confianza para estimar la varianza poblacional
2 de una poblacin normal
3.6. Intervalo de confianza para estimar la proporcin poblacional
de una poblacin binomial
3.7. Intervalo de confianza para estimar diferencia de medias poblacionales,
1 2 , de poblaciones normales
3.7.1. Usando muestras independientes
3.7.2. Usando muestras relacionadas
3.8. Intervalo de confianza para estimar la razn de varianzas poblacionales,
12
, de poblaciones normales independientes
22
3.9. Intervalo de confianza para estimar la diferencia de proporciones
poblacionales, 1 2 , de poblaciones binomiales independientes
Ejercicios propuestos
5
4.8. Para 1 2 usando muestras relacionadas
4.9. Para la igualdad de varianzas poblacionales
Anexo
Uso de Excel en el clculo de los valores de algunas variables aleatorias
7
PREFACIO
Los clculos que se presentan para aplicar las herramientas de la inferencia estadstica son
para que los lectores entiendan sus cmo y porqu y, asimismo, la interpretacin de los
resultados obtenidos. Dejamos bien en claro que en ningn momento se pretende
adiestrar a lo lectores en clculos, sino en que aprendan los conocimientos tericos
estadsticos de la inferencia (saber), apliquen las herramientas estadsticas (saber hacer) y
desarrollen una actitud positiva hacia la estadstica. Esto es, que la estadstica no
solamente es clculo, o el simple uso de las frmulas o expresiones que aparecen en ste y
en diversos libros de estadstica, sino razonamiento crtico basado en evidencias objetivas
que se obtienen de la poblacin bajo estudio (ser).
Una vez que el lector haya asimilado los conocimientos estadsticos, y sus aplicaciones,
que brindamos en el presente libro, estar en la capacidad de usar software estadstico,
que es un instrumento comparable a una calculadora. El aprendizaje de estadstica usando
software estadstico no debe reducirse, sin embargo, a manipulaciones mecnicas, pues
ste sirve como apoyo del profesor para mostrar, en forma precisa y rpida, los grficos y
clculos estadsticos.
Violeta Alicia Nolberto Sifuentes y Mara Estela Ponce Aruneri
Departamento Acadmico de Estadstica de la UNMSM
8
AGRADECIMIENTOS
A todos los lectores docentes, alumnos, empresarios y, en general, aquellos que toman
decisiones basadas en evidencias objetivas, en concordancia con el mundo en que
vivimos, caracterizado por el constante aprendizaje y el manejo adecuado de la
informacin, en particular de la informacin estadstica.
Asimismo, a los que nos hagan llegar sus comentarios, observaciones y dudas respecto a
lo tratado en el presente libro, los mismos que contribuirn con la enseanza y la difusin
de la estadstica.
9
CAPTULO 1
1.1. INTRODUCCIN
Para Castillo Arredondo (2003), evaluar es el acto de valorar una realidad que forma
parte de un proceso cuyos momentos previos son la fijacin de las caractersticas de la
realidad a valorar y la recogida de informacin sobre las misma, y cuyas etapas posteriores
son la informacin y/o toma de decisiones en funcin del juicio de de valor emitido.
10
Por tanto, si el educador desea evaluar el rendimiento escolar, es necesario conocer las
caractersticas de esta realidad escolar llamada, estadsticamente, poblacin. Si est en
condiciones de recolectar los datos de toda la poblacin se denomina censo, es decir
datos de todos y cada uno de los escolares para lograr los objetivos propuestos, o por el
contrario, si toma o selecciona un grupo de escolares, se denomina una muestra
representativa (muestra probabilstica o aleatoria) de escolares, y a travs de la muestra
intentar conocer la realidad de la poblacin escolar.
Este libro es a nivel bsico, tratando de ser lo ms amigable posible, tomando en cuenta
que nos dirigimos a profesionales no estadsticos, en particular de la educacin.
Para Sierra Bravo (1991), la estadstica es la ciencia formada por un conjunto de teoras y
tcnicas cuantitativas, que tiene por objeto la organizacin, presentacin, descripcin,
resumen y comparacin de conjuntos de datos numricos, obtenidos de poblaciones en
su conjunto de individuos o fenmenos o bien de muestras que representan las
poblaciones estudiadas, as como el estudio de su variacin, propiedades, relaciones,
11
comportamiento probabilstico de dichos datos y la estimacin, inferencia o
generalizacin de los resultados obtenidos de muestras, respecto a las poblaciones que
aqullas representan. La estadstica en la investigacin cientfica, dada la necesidad de
manejar y tratar en ellas grandes cantidades, progresivamente crecientes, de datos.
12
entre otros mbitos; en particular respecto a los alumnos sobre rendimiento acadmico,
aptitud cientfica, desarrollo social y la desercin entre otros. Tambin respecto al docente
sobre su desempeo en aula, su formacin acadmico-profesional, los recursos didcticos
que emplea y la produccin cientfica, entre otros. Respecto al sistema educativo,
financiamiento de la educacin, gestin acadmica, informtica educativa y modelos
educativos, entre otros.
Todos estos problemas no pueden ser resueltos por iniciativas subjetivas, por pareceres o
lluvia de ideas; sino en base a informacin vlida y confiable, esto es, tener informacin lo
ms prxima a la realidad bajo estudio. Indudablemente esto se logra empleando la
ciencia llamada estadstica.
13
comprobacin y verificacin de un problema, el replantear lo ya conocido no se puede
llamar investigacin.
4. Es lgica y objetiva.
En relacin a las funciones que realiza la ciencia, los objetivos fundamentales de una
investigacin cientfica son:
14
3. Predecir la realidad. La explicacin de la realidad y las generalizaciones tericas,
permiten que cumpla con el objetivo de predecir los comportamientos futuros de los
fenmenos, esto es, establecer pronsticos dentro de un determinado lmite de la
probabilidad.
15
Para sintetizar estos dos paradigmas se presenta la siguiente tabla, disponible en:
http://www.fisterra.com/mbe/investiga/cuanti_cuali/cuanti_cuali.asp (de fecha
22 de marzo de 2008).
Tabla N 1.1
Ventajas y desventajas entre mtodos cualitativos y cuantitativos
Podemos afirmar que, como todo mtodo cientfico, se debe reconocer sus ventajas y
desventajas, lo importante es determinar el momento adecuado para aplicarlo en el
desarrollo de la investigacin cientfica.
16
Pero destacamos que el paradigma cuantitativo se vale de la estadstica para garantizar el
estudio de muestras representativas y para el anlisis de los datos, como tambin para
efectuar generalizaciones a partir de los resultados de estas muestras representativas.
En otros casos ser necesario emplear ambos paradigmas, como por ejemplo cuando se
trata de evaluar la calidad de la educacin, en particular la educacin superior, no es
suficiente uno de ellos se deben emplear ambas. La realidad es muy compleja,
multifactorial, dinmica, por lo tanto, ambos paradigmas se complementan, no son
excluyentes.
Una vez establecido el objeto de estudio en base a los conocimientos tericos, se inicia la
etapa de diseo metodolgico (diseo), donde se define el proceso de recoleccin de
datos, delimitando las unidades bajo estudio y las variables a medirse, que permitan
contestar las preguntas formuladas, en el proyecto de investigacin cientfica. Es
indudable que la estadstica es una poderosa herramienta para planificar y desarrollar el
diseo metodolgico.
17
Cmo se llevara a cabo el estudio para investigar sobre diferentes problemas y
aristas del trabajo educativo, para el logro de sus objetivos y/o verificacin de
sus hiptesis?
Cmo se realizar la investigacin, a fin de maximizar la validez y confiabilidad
de la informacin y reducir errores en los resultados?
Las respuestas que ustedes proporcionen dejan notar la relacin que existe entre
estadstica e investigacin cientfica.
Tiene como objetivo caracterizar los datos, de manera grfica o analtica, para resaltar las
propiedades de los elementos bajo estudio.
18
1.6.2. Estadistica inferencial
Tiene como objetivo generalizar las propiedades de la poblacin bajo estudio, basado en
los resultados de una muestra representativa de la poblacin.
19
RECUERDE
Ningn mtodo estadstico puede corregir los defectos por una inadecuada
seleccin del problema que se investiga, o por una mala recoleccin de
datos. Una investigacin que empieza mal, con seguridad termina mal.
CON DATOS DE MALA CALIDAD NO SERA POSIBLE DAR
RESPUESTA ADECUADA A UN PROBLEMA CIENTIFICO
Nosotros recordamos al estudiante que los mtodos estadsticos son las herramientas ms
peligrosas en manos de gente inexperta. Pocas materias tienen una aplicacin tan amplia,
ninguna requiere tal cuidado en su aplicacin.
20
CAPTULO 2
ESTADSTICA INFERENCIAL
2.1. INTRODUCCIN
Ejemplo 2.1.
Se realiza un estudio para comparar tres mtodos para ensear tcnicas de comprensin
lectora en ingls a escolares de segundo grado de Educacin Bsica Secundaria, como
son:
21
Las preguntas por resolver son:
2.2. POBLACIN
22
En investigacin cientfica se le define como la totalidad de elementos sobre los cuales
recae la investigacin. A cada elemento se le llama unidad estadstica, a sta se le observa
o se le somete a una experimentacin, estas unidades son medidas pertinentemente.
Si representamos mediante X una variable aleatoria bajo investigacin, al estudiar a sta
variable en la poblacin, como resultado tendremos los valores:
X 1 , X 2 , X 3 , ..., X N
Ejemplo 2.2.
X 1 , X 2 , X 3 , ..., X 300
Sierrra Bravo (1991), anota que una muestra en general es toda parte representativa de la
poblacin, cuyas caractersticas debe reproducir en pequeo lo ms exactamente posible.
Para que sea representativa se debe seleccionar empleando el muestreo, tpico importante
de la estadstica, con la finalidad de que los resultados de esta muestra sean vlidos para la
poblacin de la que se ha obtenido la muestra. Esta generalizacin se realiza empleando
la estadstica inferencial.
Ejemplo 2.3.
24
X 2 : La calificacin que ha obtenido, en la prueba de conocimientos sobre educacin
ambiental, el segundo alumno seleccionado en la muestra.
. . .
X 6 : La calificacin que ha obtenido, en la prueba de conocimientos sobre educacin
Puesto que la seleccin de los alumnos (en este caso, seis) es aleatoria o al azar:
X1, X 2 , X 3 , X 4 , X 5 , X 6
Constituye variables aleatorias. Se admite que son independientes y cada una con la misma
distribucin que la variable aleatoria X. En un sentido matemtico, el trmino muestra
aleatoria se refiere no a seis alumnos seleccionados para este estudio, sino a las seis
variables aleatorias X 1 , X 2 , X 3 , X 4 , X 5 , X 6 asociadas con los alumnos.
25
Ejemplo 2.4.
Para el caso del ejemplo 2.3. Una vez identificados los seis alumnos, podemos determinar
los valores numricos de las seis variables aleatorias X 1 , X 2 , X 3 , X 4 , X 5 , X 6 . Supongamos
que el primer alumno seleccionado ha obtenido 13 en la prueba de educacin ambiental.
En este caso, la variable aleatoria X 1 toma el valor x1 = 13.
Ahora estamos utilizando el trmino muestra aleatoria, no para referirnos a los alumnos
seleccionados o a las variables aleatorias asociados con ellos, sino a los seis valores
numricos x1 , x2 , x3 , x4 , x5 , x6 que toman respectivamente cada una de las seis variables
aleatorias.
26
2.6. PARMETRO
Sierra Bravo (1991), indica que parmetro deriva del vocablo griego parmetreo que
significa medir una cosa con otra: En estadstica se refiere a los valores o medidas que
caracterizan a una poblacin como, por ejemplo, la media y la desviacin tpica de una
poblacin () Son cantidades indeterminadas, constantes o fijas respecto a una condicin
o situacin, que caracterizan a un fenmeno en un momento dado que ocurre en una
poblacin.
En trminos prcticos, un parmetro es un valor que resulta al emplear los valores que se
obtienen de una poblacin.
Ejemplo 2.5.
Si al obtener las calificaciones de los 300 alumnos que conforman la poblacin, stas se
promedian, entonces x = 14.78 es el parmetro correspondiente. Para su clculo se ha
empleado la siguiente expresin, llamada media poblacional:
X i
x = i =1
(2.1)
N
27
Si de estos 300 alumnos, 198 son mujeres, entonces la proporcin poblacional de mujeres
representada por x = 0.66 (66%). Para su clculo se ha empleado la siguiente expresin,
llamada proporcin poblacional:
X i
x = i =1
(2.2)
N
1 si alumna
Xi =
0 si alumno
2.7. ESTADSTICO
Los estadsticos son variables aleatorias por que estn sujetos a la fluctuacin de la
muestra en relacin al valor poblacional, que se asume es constante.
Ejemplo 2.6.
Continuando con el ejemplo 2.4, al seleccionar una muestra aleatoria de tamao seis, una
vez identificados los seis alumnos, se obtienen las siguientes calificaciones x1 = 13, x2 =
10, x3 = 13, x4 = 14 x5 = 11, x6 = 10. La media obtenida de los seis alumnos es de
28
n
x i
x= i =1
(2.3)
n
El numerador de la expresin (2.3) es la suma de los seis valores, que da 71, que dividido
por 6, resulta x = 11,83, es decir en promedio los alumnos han obtenido 11,83 de
calificacin en la prueba de educacin ambiental.
(x x )
n
2
i
S = 2 i =1
(2.4)
n
Para su clculo, disponemos de la tabla 2.1, en la que mostramos paso a paso el uso de la
expresin (2.4), sabiendo que x = 11,83:
Tabla 2.1
Clculos para obtener el valor de la varianza (Ejemplo 2.6)
Unidad xi (x x )
i (x x )
i
2
1 13 1,17 1,3689
2 10 -1,83 3,3489
3 13 1,17 1,3689
4 14 2,17 4,7089
5 11 -0,83 0,6889
6 10 -1,83 3,3489
Total 71 0,02* 14,8334
29
(x )
n
Tericamente i x =0
i =1
S = + S2 (2.5)
Sierrra Bravo (1991), anota que la distribucin muestral est formada por estadsticos o
valores determinados obtenidos de muestras: medias, varianzas, etc. acompaados de sus
respectivas frecuencias relativas o probabilidades, o de la proporcin de veces que se
repiten en el conjunto de todas las muestras posibles del mismo tamao obtenidas de la
poblacin.
Ejemplo 2.7.
30
de tamao 2. En la tabla 2.2 se muestran los posibles resultados de la muestra de tamao
2, as como su respectiva media muestral:
Tabla 2.2
Resultados de posibles muestras de tamao 2
Tabla 2.3
Distribucin muestral de la media muestral
31
Por cultura estadstica estudiaremos algunos estadsticos y su distribucin de probabilidad
(distribucin muestral).
La expresin (2.3), nos indica cmo se obtiene una media muestral. Veamos sus
propiedades:
1. E (x ) =
()
2. V x = 2 / n
x
(2.6)
/ n
32
incluso, an cuando la variable aleatoria X no est normalmente distribuida, podemos
aplicarla en la inferencia estadstica.
(x x )
n
1 2
s =
2
n 1 (2.7)
i
i =1
1. E (s 2 ) = 2
Consideremos una poblacin en la que existe una proporcin de elementos que tienen
el atributo A (o pertenecen a la categora A ).
33
Si se toma una muestra aleatoria de n elementos de esa poblacin y se calcula el nmero
nA de elementos con el atributo A , entonces:
nA
p= (2.8)
n
1. E ( p ) =
2. V ( p ) = (1 ) / n
La desviacin estndar, o error estndar de la proporcin muestral, se denota como
p y es igual a (1 ) / n
p
Z= (2.8)
(1 ) / n
Tabla 2.4
Muestra aleatoria de 15 docentes de la Institucin Educativa Martn Adn (Lima)
Media muestral
La edad en aos cumplidos tiene distribucin con media poblacional, = 38,5 aos y
varianza poblacional, 2 = 30 aos2.
Usando la expresin 2.3 se obtiene x = 40,73 aos, y al usar la expresin 2.7 se obtiene
s 2 = 33,21 aos2.
En cambio el error estndar del estadstico media muestral, empleando la propiedad 3, es:
5,48 5,48
x = = = = 1,42 aos.
n 15 3,87
Proporcin muestral
Para la segunda variable, interesa que el docente encuestado indique que la profesin de
investigador es una profesin atractiva para docentes jvenes ( A ). La muestra aleatoria
es igual a 15 docentes (n = 15) .
36
De la tabla contamos que, nA =9, es decir 9 docentes afirman que la profesin de
investigador es una profesin atractiva para docentes jvenes, entonces empleando la
expresin 2.8, se obtiene:
9
p= = 0,6 (60%)
15
Esto es, el 60% de docentes encuestados afirman que la profesin de investigador es una
profesin atractiva para docentes jvenes.
2.9. ESTIMACIN
Sierra Bravo (1991), anota que estimacin proviene del latn estimatio y significa
estimacin, precio y valor que se da a una cosa. En estadstica es la operacin que
mediante la inferencia un parmetro, utilizando datos incompletos procedentes de una
37
muestra, se trata de determinar el valor del parmetro. Pero los valores de la muestra estn
sujetos al error muestral esto es a las fluctuaciones de la muestra.
1. Estimacin puntual.
Ejemplo 2.9.
38
Variable Parmetro Estimador Estimacin
x i
= x = 40,73 aos
x= i =1
n
X n
(x x)
1
s =
2 2
2 n 1 2 = s 2 =33,21 aos2
i
i =1
nA
p=
Y n = p = 0,7333 (73,33%)
Proceso mediante el cual, a partir de los valores de una muestra aleatoria, se decide si se
rechaza o no el supuesto que plantea el investigador para el parmetro o parmetros de la
poblacin o poblaciones bajo estudio, pero con cierta probabilidad de error (riesgo) por
tomar una decisin.
Ejemplo 2.10.
39
2. Verificar si el nivel promedio poblacional del puntaje de la prueba de comprensin
lectora en nios de IE estatal es diferente de los nios de IE privados.
Explicar cul rama de la inferencia estadstica emplear para lograr cada objetivo.
Solucin
40
1 = Desviacin estndar poblacional del puntaje de la prueba de comprensin lectora
para nios que asisten a IE estatales.
Para lograr el objetivo 1. Se debe emplear la estimacin debido a que se requiere tener
un valor aproximado de 1 y 2 empleando muestras aleatorias que se han obtenido de
manera independiente de cada tipo de institucin educativa.
Para el logro del objetivo 2. Se debe verificar que los promedios poblacionales 1 y 2
son diferentes a partir de muestras aleatorias, aritmticamente significa: 1 diferente de
2 ( 1 2 ) o equivalentemente 1 - 2 = 0.
En este caso se parte del supuesto que no existe diferencias entre el nivel promedio
poblacional del puntaje de la prueba de comprensin lectora para nios que asisten a IE
estatales y privados. Por tanto se empleara la prueba de hiptesis estadstica, mediante el
cual se somete a prueba 1 - 2 = 0.
Segn Sierra Bravo (1991), es parte de la estadstica que exige determinados requisitos
para emplear en la inferencia estadstica generalmente requiere para su uso el supuesto de
normalidad es decir que las muestras aleatorias se extraen de poblaciones que estn
normalmente distribuidas, o aproximadamente normal.
Ejemplo 2.11.
41
se incrementa despus de haber recibido una capacitacin especial para resolver
problemas de ese tipo.
En este caso se debe elegir una muestra aleatoria de la poblacin conformada por nios
de esta poblacin, es decir, nios de 10 aos de edad con secuelas neurolgicas derivadas
de hiperbilirubenia al nacer.
sencillo.
Para estudiar a este parmetro se requiere evaluar a la muestra aleatoria de esta poblacin
antes de la capacitacin especial y despus de la capacitacin especial, es decir los
parmetros para este esquema, sujetos a estudio estadstico son:
42
tiempo, en minutos, promedio poblacional requerido para resolver un problema sencillo
1 < 2 o equivalentemente 1 - 2 < 0.
Y que son excelentes cuando los tamaos muestrales son pequeos ( n 10 ), asimismo
estos mtodos se basan en el anlisis de los rangos de los datos que en las propias
observaciones.
Ejemplo 2.12.
43
EJERCICIOS PROPUESTOS
Resumen
44
A partir de este resumen:
1. Defina la poblacin.
2. Defina la muestra.
Resumen
El objetivo de esta investigacin fue identificar la percepcin que tienen los estudiantes
universitarios respecto a sus habilidades de investigacin, para lo cual se utiliz un
instrumento llamado Autoevaluacin de habilidades de investigacin (Rivera, Torres,
Garca Gil de Muoz, Salgado, Arango, Caa y Valentn, 2005). Participaron 119
estudiantes de los cuales 73.7% fueron mujeres y 26.3% hombres, entre ellos, el 88.2% se
encontraba realizando estudios de licenciatura y el 11.8% de postgrado. Se cont con
representantes de cuatro reas de conocimiento: Ciencia y Tecnologa, Ciencias Humanas,
Ciencias Econmico-Administrativas, y Educacin. La confiabilidad del instrumento
aplicado fue alta (Alfa de Cronbach =.9557). Se encontr que la mayora de los
estudiantes asignan calificaciones altas a sus habilidades de investigacin y que por lo
general los hombres y las mujeres evalan sus habilidades de investigacin de manera
3Mtra. RIVERA HEREDIA, Mara Elena y Mtra. TORRES VILLASEOR, Claudia Karina.
Universidad Simn Bolvar. merivera@bolivar.usb.mx. ambiental@bolivar.usb.mx.
www.usb.edu.mx/investigacion/cif/proyectos/proyecto3/habilidades.doc
45
semejante; cuando aparecen diferencias significativas, son los hombres quienes se asignan
puntajes ms altos. Se discuten las diferencias entre los resultados arrojados por este
cuestionario con los de otras estrategias de evaluacin.
En base a este resumen plantear como sera la aplicacin de la inferencia estadstica bajo
el enfoque de:
1. Estimacin de parmetros.
46
47