Está en la página 1de 81

Estadstica Educativa

UNS XX
















J. L. Siani
M. Zeballos Q.






J. L. Siani
Mster en Proyectos
Profesor de Matemtica
Catedrtico de Estadstica
en la U. P. E. A. y U.N.S.XX

M. Zeballos Q.
Licenciada en Cs de la Educacin
Ayudante de Ctedra en la U. P. E. A.
Profesora de Matemtica



MDULO
Estadstica Educativa
Estadstica Educativa
UNS XX










Por:
Jos L. Siani Ticona
Mster en Proyectos
Catedrtico de Estadstica y Economa
Profesor de Matemtica
Mery Zeballos Quispe
Licenciada en Ciencias de la Educacin
Ayudante de Ctedra en la U. P. E. A.
Profesora de Matemticas
La Paz Bolivia
2010
MDULO
Estadstica Educativa
Estadstica Educativa
UNS XX

Presentacin
Instrucciones Necesarias
UNIDAD DIDCTICA No 1
ANALISIS UNIVARIABLE
Tema No 1
Conceptos Bsicos
1- Concepto de estadstica.
1.1- Estadstica Descriptiva o Deductiva.
1.2- Estadstica Inferencial o Inductiva.
2- Concepto de Probabilidad.
3- Concepto de Variable.
4- Concepto de Poblacin.
5- Concepto de Muestra.
Para Recordar.
Reflexiona Sobre el Tema.
Actividades.
Tema No 2
Distribucin de Frecuencias y Estadsticos de Posicin
1- Estadsticos de una Variable.
1.1- La Media o Media Aritmtica.
1.2- La Mediana.
1.3- La Moda.
2- Utilizacin de Grficos.
3- Anlisis de Datos Agrupados en Categoras o Intervalos de Clase.
3.1- El rango.
3.2- Nmero de Clases.
3.3- Amplitud de Clases.
3.4- Intervalo de Clase.
3.5- Marca de Clase.
3.6- Frecuencia Absoluta, Relativa, Absoluta Acumulada y Absoluta Relativa.
4- Histograma de Frecuencias.
5- Polgono de Frecuencias.
6- Ojiva de Frecuencias Acumuladas.
6.1- Ojiva Suavizada de Frecuencias Acumuladas.
7- Media Aritmtica en Datos Agrupados.
8- Mediana en Datos Agrupados.
9- Moda en Datos Agrupados.
Para Recordar.
Reflexiona Sobre el Tema
Actividades.
Tema No 3
ndices de Localizacin y Estadsticos de Dispersin.
1- Cuartiles.
1.1- Amplitud Intercuartlica.
Estadstica Educativa
UNS XX

2- Deciles y Percentiles.
3- Estadsticos de Dispersin.
3.1- El Rango o Recorrido.
3.2- La Desviacin Media o Absoluta.
3.3- La Varianza y la Desviacin Estndar.
Para Recordar.
Reflexiona Sobre el Tema.
Actividades.
Tema No 4
Estadsticos de Forma y Estadsticos de Concentracin.
1- Coeficiente de Asimetra.
2- Coeficiente de Kurtosis o Apuntamiento.
3- Coeficiente de Variacin.
4- Estadsticos de Concentracin.
4.1- Curva de Lorenz.
Para Recordar.
Reflexiona Sobre el Tema.
Actividades.
Autoevaluacin.
UNIDAD DIDCTICA No 2
ANALISIS BIVARIANTE
Tema No 1
Intervalos de Confianza
1- Intervalo de Confianza para la Media Poblacional con Varianza Desconocida y Muestra
Pequea.
1.1- Proporciones y Tasas.
2- Intervalo de Confianza para Proporciones.
Para Recordar.
Reflexiona Sobre el Tema.
Actividades
Tema No 2
Pruebas de Hiptesis
1- La Prueba de T para la Diferencia de Muestras Pequeas.
2- Significacin de una Diferencia Entre las Medias de Dos Muestras Correlacionadas
(Diferencia Pareada).
3- Una Prueba de Significacin para la Diferencia de Medias y Proporciones con Muestras
Grandes.
Para Recordar.
Reflexiona Sobre el Tema.
Actividades
Autoevaluacin



Estadstica Educativa
UNS XX



UNIDAD DIDCTICA No 3
ANALISIS DE REGRESIN
1- Criterios de Bsqueda de la Funcin de regresin.
2- Medida de Bondad de Ajuste.
3- Presentacin de Resultados.
Para Recordar.
Reflexiona Sobre el Tema.
Actividades
Autoevaluacin
Glosario.
Anexos.
Bibliografa.















Estadstica Educativa
UNS XX




El Presente mdulo de Estadstica Educativa Computarizada est dividido en tres unidades
didcticas secuencialmente estructuradas las cuales detallo a continuacin:

La primera Unidad Didctica est constituida por cuatro temas los cuales son: El tema No 1
donde damos los lineamientos sobre conceptos bsicos inherentes a aspectos tratados en todo
el mdulo, el tema No 2 en el que armamos distribuciones de frecuencias de los tipos discreto y
continuo, para as en el tema No 3 en base al conocimiento adquirido del armado de
distribuciones construir indicadores de tendencia central y de dispersin, concluyendo con el
tema No 4 con los indicadores de posicin y medidas de forma.

La segunda unidad didctica, est constituida por dos temas clsicos de la inferencia como ser
la estimacin y el contraste, por ejemplo: en el tema No 1 realizamos estimaciones intervlicas
de parmetros cuyo valor es desconocido no obstante se presume que es fijo, ste tratamiento
se fundamenta en base al conocimiento sobre medidas de tendencia central y dispersin
adquiridos en el tema No 3 de la Unidad Didctica No 1. En el tema No 2, suponemos que si
conociramos el valor del parmetro deberamos probarlo o contrastarlo empricamente, ste
proceso se denomina prueba o contraste de hiptesis paramtrica.

En la Tercera y ltima unidad por razones didcticas no la estructuramos en temas especficos,
no obstante; en el mismo estudiamos aspectos como el anlisis de regresin, cuyo uso es muy
importante en el tratamiento estadstico de investigaciones de orden social, dicho anlisis es
complementado con la construccin de coeficientes como el de correlacin lineal y el
coeficiente de determinacin, los cuales nos darn mayores luces acerca de su comportamiento
y especificacin tcnica bsica.

Todo lo antedicho sobre unidades didcticas y temas correspondientes, estn complementados
mediante un tratamiento estadstico con Microsoft Excel, el cual es utilizado en ste mdulo
por su difusin social en cualquier ordenador, cabe aclarar que existen tambin paquetes
especializados como el SPSS (Statistical Product and Service Solutions) una potente
herramienta de construccin de datos y anlisis estadstico, empero, su difusin social es
escasa por lo que no lo considero en el presente mdulo.

Tambin reforzamos tu aprendizaje en base a cuadros sntesis con el denominativo PARA
RECORDAR, ejercicios de AUTOEVALUACIN, sugerencia de ACTIVIDADES, un GLOSARIO
para aclarar ciertos trminos tcnicos dispuestos en el mdulo y las correspondientes hojas de
EVALUACIN. As entonces; te animo a que puedas explorar el presente modulo el cual
espero pueda darte algunos criterios para un conocimiento razonable y elemental de la materia,
empecemos pues con la hoja de instrucciones.
PRESENTACIN
Estadstica Educativa
UNS XX





Para que te familiarices con el mdulo te sugiero stos siete pasos para no olvidar:

Paso uno: Escudries la parte conceptual denominada Conceptos bsicos e introducciones
de cada Tema y Unidad para que luego de confrontarlos con la razn puedas interpretarlos, no
olvides que: Estudiar es Interpretar.

Paso dos: Luego de interpretar los conceptos esenciales, medita cada indicador elaborado en
base a sus definiciones expuestas lo que te posibilitar armarlos y construirlos, no olvides que:
Aprender es Pensar.

Paso tres: Una vez que hayas aprendido a mediato al armar distribuciones y construir
indicadores estadsticos esenciales, tradcelos o interprtalos para que posteriormente sean
aplicados, no olvides que: or aprender es traducir en el interior lo que se est captando en el
exterior.

Paso cuatro: Traducidos y construidos los indicadores, aplcalos para avanzar en tu
aprendizaje elaborando, en base a los mismos: estimadores intervlicos, pruebas de hiptesis y
anlisis de regresin, no olvides que: La esencial textura de un aprendizaje es la de
movimiento, evolucin, camino, ya que al transmitir, por ms literal que se procure ser, se
producen cambios del que da, del que recibe, porque el cambio es parte del movimiento.

Paso cinco: Ya que avanzaste o evolucionaste en tu aprendizaje realiza las actividades que te
proponemos al finalizar cada unidad didctica, no olvides que la pedagoga moderna sugiere:
La enseanza es lo que el maestro entrega, pero la comunicacin se cumple cuando surge el
aprendizaje, que es la internalizacin que cada uno practica con las palabras del maestro.

Paso seis: La internalizacin que te posibilita la realizacin de actividades, solo se har cuando
apliques tus conocimientos objetivamente, para ello al realizar tus actividades debers proceder
en la realidad de la Unidad Educativa o en donde desempees tu labor, no olvides que: El
aprendizaje se consolida con la apropiacin del objeto o sujeto de estudio por parte del sujeto
estudiante.

Paso siete: Si prosigues sistemticamente con todo lo antedicho ya vers que estars
motivado a realizar investigaciones con suficiente evidencia emprica en base a un sustento
estadstico razonable, no olvides que: toda autntica enseanza aprendizaje ha de concluir
en una ley del comportamiento, una tica

Estudiemos pues ahora la unidad didctica uno.
INSTRUCCIONES NECESARIAS
Estadstica Educativa
UNS XX

UNIDAD DIDCTICA 1.







Despus de estudiar sta unidad didctica el estudiante:
1. Construye una distribucin de frecuencias utilizando variables cuantitativas (discretas y
continuas) y cualitativas (nominales y ordinales) dividindolos en clases o categoras e
ilustra con grficos sus resultados.
2. Construye estadsticos de tendencia central cuantitativos con ayuda de sus respectivas
definiciones disponiendo para el efecto de Microsoft Excel y aplica dichos ndices de
posicin para caracterizar una distribucin de frecuencias respecto a su centro.
3. Construye medidas de dispersin, localizacin y distribucin disponiendo de sus
respectivas definiciones y usa Microsoft Excel para replicar los mismos caracterizando
una distribucin de frecuencias respecto a su variabilidad.












ANLISIS UNIVARIABLE
Estadstica Educativa
UNS XX

Tema No 1.
CONCEPTOS BSICOS

1. CONCEPTO DE ESTADSTICA

En el presente mdulo, la conceptualizacin ms adecuada de Estadstica que dispondremos
es la realizada por Lundberg
1
que hace referencia a:

Aquellos conceptos y tcnicas que se emplean en la recopilacin, presentacin, anlisis e
interpretacin de informacin numrica o datos que pueden ser cuantitativos, con valores
expresados numricamente, o cualitativos, en cuyo caso se diferencian por tipo de variable.

- En la recopilacin, se recogen los datos de acuerdo al punto de vista sobre las variables.
- En la presentacin, se podra idear inicialmente una tabla o cuadro en que se puedan
colocar los datos. En esta tabla se podrn escribir o vaciar ordenadamente los datos
obtenidos. Al conjunto de estas operaciones se les da el nombre de tabulacin.
- En el anlisis, permitir la reduccin y sistematizacin de los datos; se considera
entonces la distribucin de los mismos, se analiza una vez ms la dependencia e
interdependencia de las variables consideradas inicialmente.
- En la interpretacin, es ya la expresin de la relacin existente entre los fenmenos.
Esto es simplemente la expresin de la relacin existente entre las variables
consideradas en un estudio.

As, la Estadstica nos posibilita por medio del anlisis y examen de nuestra masa de datos o
muestra estadstica, generar informacin til oportuna y pertinente para asumir decisiones que
conlleven a una accin, posibilitando as la obtencin de resultados cientficamente probados en
una investigacin. No obstante la Estadstica se divide en dos grandes ramas a saber:

1.1. Estadstica Descriptiva o Deductiva

Es aquella que utiliza tcnicas y medidas que indican las caractersticas de los datos
disponibles. Comprende el tratamiento y anlisis de datos que tienen por objeto resumir y
describir los hechos que proporcionaron la informacin, y que por lo general asumen la forma
de tablas, grficos, cuadros e ndices. Se denomina descriptiva, por ser su fin primordial la
descripcin de las caractersticas principales de los datos obtenidos, sin sacar conclusiones e
inferencias sobre un grupo mayor.






1
Lundberg. Op. cit., pg. 213
Estadstica Educativa
UNS XX

1.2. Estadstica Inferencial o Inductiva

Es el conjunto de mtodos estadsticos que permiten deducir o inferir como se distribuye la
poblacin en estudio o las relaciones estocsticas entre varias variables de inters a partir de la
informacin que proporciona una muestra.

2. CONCEPTO DE PROBABILIDAD

Una probabilidad es una medida de ocurrencia de un evento, se indica con el smbolo P. As,
P(A) denota la probabilidad de que ocurra el evento A en una sola observacin o experimento.

El menor valor que puede poseer un enunciado de probabilidad es 0 (lo que implica que el
evento es imposible), y el mayor 1 (lo que implica, que la ocurrencia del evento es segura).
Puesto que el nmero de elementos de cualquier conjunto A es no negativo, queda claro que
P(A) > 0; la nica restriccin matemtica para la definicin de P es que los nmeros P({A
i
}),
elegidos arbitrariamente deban satisfacer:

1 ) ( 0 s s A P
para i = 1, 2, .., n
Y que

=
=
n
i
i
A P
1
1 }) ({


As, en un experimento dado, un evento debe ocurrir o no ocurrir. En consecuencia, la suma de
la probabilidad de la ocurrencia ms la probabilidad de la no ocurrencia siempre es igual a 1.
Entonces, concediendo que A
c
indica la no ocurrencia del evento A, tenemos que

) ( ) ( 1
c
A P A P + =


3. CONCEPTO DE VARIABLE

Una variable Es un especto o dimensin de un fenmeno que tiene como caracterstica la
capacidad de asumir distintos valores, ya sea cuantitativa o cualitativamente; adems Es la
relacin causal (causa efecto) que se da entre uno o ms fenmenos estudiados,
simblicamente se representa por las letras maysculas X, Y y Z, etc.

Ejemplo de simbolizacin de variable:

LITERAL SIMBOLO
Grado de Escolaridad X
Coeficiente Intelectual Y

Estadstica Educativa
UNS XX

En Estadstica, al referirnos a valores no estamos centralizando el anlisis nicamente en
valores numricos, sino que las variables pueden ser cuantitativas (es decir, un valor numrico)
o cualitativas (es decir, analizar una caracterstica poblacional que no es numrica).

As, las variables cuantitativas se caracterizan por algn valor numrico y arrojan resultados
numricos. Existen dos tipos de variables cuantitativas:

- Variables discretas, son aquellas variables cuantitativas en las que el resultado slo
puede tomar valores enteros; por lo que los datos que arroja surgen de un proceso de
conteo. Ejemplo: nmero de estudiantes en un colegio, nmero de hijos por familia, etc.
- Variables contnuas, son aquellas variables cuantitativas que pueden adoptar infinitos
valores entre dos enteros; los resultados surgen de un proceso de medicin. Ejemplo: la
estatura, el nivel de colesterol, etc.

Las variables cualitativas son aquellas que tienen un atributo que no puede ser sometido a
cuantificacin, arrojan respuestas categricas. Tambin se subdivide en dos categoras a
saber:

- Variables nominales, son aquellas variables cualitativas que se agrupan, sin poseer
ningn tipo de jerarqua entre si. Ejemplo: sexo de las personas, raza, etc.
- Variables ordinales, son aquellas variables cualitativas que pueden ordenarse de
acuerdo algn criterio. Ejemplo: nivel socioeconmico, grados de desnutricin, etc.

4. CONCEPTO DE POBLACIN

La poblacin es la totalidad del fenmeno a estudiar, en donde las unidades poblacionales
poseen una caracterstica comn, la cual se estudia y da origen a los datos de la investigacin.

Entonces, al conjunto fuente de las muestras posibles asociadas a un experimento
determinado, se denomina poblacin o universo. (En trminos probabilsticos, es el espacio
muestral).

5. CONCEPTO DE MUESTRA

Lo que constituye a una muestra, es el conjunto de observaciones o medidas actuales sobre
alguna variable especfica, por lo que la conceptualizamos como:

El conjunto de operaciones que se realizan para estudiar la distribucin de determinados
caracteres en la totalidad de una poblacin, universo o colectivo, partiendo de la observacin de
una fraccin de la poblacin considerada.

As, la materia prima es la muestra, la que nos informa todo lo que se pretende saber acerca de
la poblacin.


Estadstica Educativa
UNS XX

Caso Prctico

Para determinar el tamao muestral (n) que nos viabilice el realizar encuestas, uno debe
preguntarse. Cul es el nmero de unidades de anlisis (personas, organizaciones, objetos,
etc.), que se necesita para conformar una muestra (n) que asegure una varianza poblacional
(
2
) menor o dicho de otra forma una mayor precisin de los estimadores, dado que la
poblacin N es aproximadamente de tantos elementos adems de reducir el error (e) de
diferencia de medias
x
y probar la hiptesis formulada, considerando un nivel de
significacin () determinado?.

En el siguiente ejercicio, plantearemos la necesidad de analizar si es conveniente o no, iniciar
una empresa que provea Internet por banda ancha, en una ciudad del interior del pas, la cual
con cuenta con dicho servicio, y posee una poblacin distribuida en 3000 viviendas.

Para ello necesitamos cuantificar, cuntos pobladores de esta ciudad estn dispuestos a utilizar
este nuevo servicio. En primer lugar, redactamos un cuestionario que necesitamos que
completen las familias a ser encuestadas. En segundo lugar, deben seleccionarse las viviendas
en las que se llevar a cabo la encuesta. A su vez, cada vivienda posee una numeracin,
diferente para cada una de las ubicadas en una misma calle (numeracin que nos ser de
identificacin). Seguidamente, volcamos esta informacin en una planilla de clculos de Excel:

1. Primero, abrimos una hoja en blanco de la planilla, y escribimos los nmeros 1 y 2 en las
primeras dos filas de la planilla; y arrastramos los nmeros hasta la celda 3000.
2. Luego pasamos a incorporar la lista con la identificacin de cada vivienda en la segunda
columna.
3. El paso siguiente consiste en seleccionar la muestra. Para ello, debemos utilizar un
instrumento que posee el men Herramientas del programa Microsoft Excel. El mismo
se encuentra dentro de Anlisis de Datos: Se abrir una ventana, en la que debemos
seleccionar la funcin Muestra.
4. Oprimimos la tecla aceptar, y se abrir un cuadro. En el recuadro entrada debemos
indicar cules son las celdas que contienen la numeracin que le otorgamos a cada
vivienda.
5. Luego, decidimos el mtodo de muestreo que deseamos utilizar. Para este ejercicio,
seleccionamos una muestra aleatoria. Tambin debemos informar el tamao de muestra
que queremos obtener. Para decidirlo utilizaremos la siguiente frmula:

Para datos cuantitativos Para datos cualitativos

2
2 2
2
e
Z
n
o
o
=
;
2
2
2
) 1 (
e
P P Z
n

=
o



Estadstica Educativa
UNS XX

Siendo:
n = Tamao muestral

2
= Varianza poblacional para muestras cuantitativas.
= Nivel de significacin del cual deducimos (1 ) que es el nivel de confianza
deseado en la estimacin a realizar.
e = Mximo error permitido a la estimacin.
P = Proporcin poblacional para muestras cualitativas

Ejemplo: Supongamos que la muestra a seleccionar ser utilizada para estimar el nmero
promedio de clientes que dispongan del servicio de Internet, con varianza de 45. Se desea que
el valor de la media muestral no se aleje en ms de tres unidades de la Media poblacional, con
una probabilidad del 0.95. Entonces, el valor de e es 3 y el valor de es 0.05 (siendo
= 1 nivel de confianza). El tamao mnimo de muestra que deber utilizarse es:

19 2 . 19
9
8 . 172
9
) 45 ( ) 84 . 3 (
) 3 (
) 45 ( ) 96 . 1 (
2
2
2
2 2
2
~ = =
e
Z
n
o
o
viviendas

Donde:
96 . 1
95 . 0 025 . 0 1
2
05 . 0
1
2
1
=

Z Z Z Z o
ste valor fue obtenido de tablas del anexo.
Ejemplo: Si la varianza Poblacional no es conocida, y se sabe que las mediciones se
encuentran aproximadamente entre los valores 70 y 30, se puede utilizar una estimacin de la
varianza calculada de la siguiente manera:

44 . 44
36
1600
6
40
6
30 70
2 2
2
=
(


= o


6. Con todo lo antedicho el nmero de muestras que debemos incorporar en el recuadro
mtodo de muestreo es 19.
7. Como deseamos obtener los valores en una nueva hoja de clculo, en Opciones de
Salida seleccionamos la celda En una hoja nueva.
8. Una vez incorporados todos los datos, hacemos clic sobre la palabra Aceptar, y
conseguimos lo que estbamos buscando. En este caso, obtenemos el nmero de
ubicacin en la planilla de clculos de cada elemento que debemos incorporar en la
muestra.

Ejemplo: La oficina de planificacin familiar de cierto distrito desea determinar la proporcin de
familias con un ingreso mensual inferior a Bs. 2000. Estudios previos indicaron que esta
proporcin era de 20%

a. Qu tamao muestral se requiere para asegurar con confianza de 0.95 que el error en
la estimacin de esta proporcin no sobrepasar a 0.05?
b. En que forma variar el tamao muestral requerido si el mximo error permisible es
reducido a 0.01?
Estadstica Educativa
UNS XX


Donde:
96 . 1
95 . 0 025 . 0 1
2
05 . 0
1
2
1
=

Z Z Z Z o
ste valor fue obtenido de tablas del
anexo.



a. Si e = 0.05
244
0025 . 0
61 . 0
0025 . 0
) 8 . 0 ( ) 2 . 0 ( ) 84 . 3 (
) 05 . 0 (
) 2 . 0 1 ( ) 2 . 0 ( ) 96 . 1 (
) 1 (
2
2
2
2
2
=

=
e
P P Z
n
o


b. Si e = 0.01
6100
0001 . 0
61 . 0
0001 . 0
) 8 . 0 ( ) 2 . 0 ( ) 84 . 3 (
) 01 . 0 (
) 2 . 0 1 ( ) 2 . 0 ( ) 96 . 1 (
) 1 (
2
2
2
2
2
=

=
e
P P Z
n
o


PARA RECORDAR

En este tema cubrimos los conceptos necesarios sobre La Estadstica. El punto principal, es
que sta conceptualizacin es muy importante para desarrollar todo el mdulo ya que nos
provee una concepcin general y somera de la Estadstica.

Resumimos el contenido del tema de la manera siguiente:

1. La Estadstica son aquellos conceptos y tcnicas que se emplean en la recopilacin,
presentacin, anlisis e interpretacin de informacin numrica o datos que pueden ser
cuantitativos, con valores expresados numricamente, o cualitativos, en cuyo caso se
diferencian por tipo de variable.
2. Las actividades estadsticas encaminadas a lograr deduccin se denominan Estadstica
Descriptiva, y las que tienen por objeto realizar inducciones se llaman Estadstica
Inferencial.
3. Una variable es un especto o dimensin de un fenmeno que tiene como caracterstica
la capacidad de asumir distintos valores, ya sea cuantitativa o cualitativamente.
4. La poblacin es la totalidad del fenmeno a estudiar, en donde las unidades
poblacionales poseen una caracterstica comn, la cual se estudia y da origen a los
datos de la investigacin, y
5. La muestra es el conjunto de operaciones que se realizan para estudiar la distribucin
de determinados caracteres en la totalidad de una poblacin, universo o colectivo,
partiendo de la observacin de una fraccin de la poblacin considerada


Estadstica Educativa
UNS XX

Reflexiona Sobre el Tema:

1. D el concepto de Estadstica segn Lundberg y mencione en cuantas ramas se
divide sta ciencia

..

2. Cul es el concepto de variable, mencione los tipos de variable que se
describen en el mdulo?

..

3. Segn usted, cuales seran los motivos para trabajar con las unidades bsicas
de una muestra en lugar de trabajar con todos los elementos de la poblacin?

..






Estadstica Educativa
UNS XX










1) A propsito de la reflexin anterior, te propongo cuantificar manualmente as como
disponiendo de Microsoft Excel un tamao muestral del nivel secundario de la Unidad
Educativa donde desempeas tu labor docente para investigar sobre el rendimiento
acadmico (nota final) de la gestin anterior en la materia de Matemtica. Para ello:

a. Realiza una prueba piloto seleccionando aleatoriamente unas 20 calificaciones
de estudiantes que llevan la materia de Matemtica.
b. Con dichas calificaciones cuantifica la coasivarianza como te lo enseamos en el
Tema No. 3 de sta unidad didctica.
c. Utiliza la varianza calculada con datos de la prueba piloto para sustituirla en lugar
de la varianza poblacional en la formula del tamao de la muestra.
d. Trabaja con el 95% de confiabilidad.
e. Asgnate un error mximo de 5 puntos.
f. Cuantifica el tamao de la muestra.
g. Recoge la informacin sobre los puntajes de acuerdo al tamao muestral
requerido y.
h. Transforma los puntajes en calificaciones considerando el mayor puntaje como
se ejemplifica en el Tema No 4 de sta Unidad Didctica.

2) Manualmente as como con el uso de Microsoft Excel, cuantifique y seleccione un
tamao muestral del lugar donde vive para investigar la tasa de escolaridad, para lo cual
le pido seguir los siguientes pasos:
a. Realice una prueba piloto seleccionando aleatoriamente unas 30 personas de 5 a
19 aos de edad y conslteles si son alcanzados o no por algn servicio
educativo.
b. Con dichas respuestas compute la tasa de escolaridad piloto cuya frmula se
detalla en el Tema No 1 de la Unidad Didctica dos.
c. Utilice dicha tasa calculada con datos de la prueba piloto para sustituirla en lugar
de la proporcin poblacional en la formula del tamao de la muestra.
d. Trabaje con el 99% de confiabilidad y.
e. Asgnese un error mximo de 5%.
f. Cuantifique el tamao muestral y.
g. Recopile los datos de la poblacin de 5 a 19 aos hasta completar el tamao
muestral requerido.
h. Calcule con los datos de la muestra la tasa de escolaridad.
A C T I V I D A D E S

Como se dijo, una muestra estadstica es aquella que nos provee informacin
acerca de la poblacin objeto de estudio, as, la muestra viene a constituirse en la
evidencia emprica o parte representativa de la Poblacin.

Estadstica Educativa
UNS XX

Tema No 2

DISTRIBUCIN DE FRECUENCIAS Y
ESTADSTICOS DE POSICIN

Una distribucin de frecuencias, Es un esquema conceptual e instrumento til en la
sumarizacin de la informacin muestral, por que posibilita el organizar los datos o categoras
observadas de acuerdo al nmero relativo de veces (frecuencia), que ocurre la medida
individual o agrupada.

Caso prctico

Luego de realizadas encuestas a 14 docentes de una universidad acerca de su vida
universitaria sobre los cargos jerrquicos que desempearon, se pudo constatar que 2 fueron
Rectores, 3 Vicerrectores, 4 fueron Directores, 2 Coordinadores, 1 Administrativo y solo
docentes 2.

Ordenando las categoras en una tabla, en la columna 1, se registra las categoras de la
variable, en la columna 2 se registra la frecuencia absoluta.


Tabla No. 1
Frecuencias Acumuladas y Absolutas
de Cargo Ejercido por Docente
(En Escala Ordinal)

X = Cargo Jerrquico fi
1. Docente (E)
2. Administrativo (A)
3. Coordinador (C)
4. Director (D)
5. Vicerrector (V)
6. Rector (R)
2
1
2
4
3
2
14
Fuente: Elaboracin Propia

La categora que ms se repiti fue la cuatro, con 4 docentes que ejercieron el cargo de
director, seguido de 3 que alguna vez fueron vicerrectores, sin embargo tan solo un docente
manifest que fue administrativo.
Estadstica Educativa
UNS XX

Ejercitacin:

A fin de conocer las distribuciones de frecuencias para la variable cargo jerrquico mediante
Excel, ser necesario abrir en primer lugar el fichero de Excel. Seguidamente realizamos las
operaciones indicadas para obtener la distribucin de frecuencias absoluta relativa y
acumulada.

As, lo que observamos en la tabla No.1, son la variable y la frecuencia absoluta. Si queremos
observar la frecuencia relativa, lo que debemos hacer es dividir cada celda de resultados por
14, obtendremos:


Tabla No. 2
Frecuencias Acumuladas y Absolutas de
Cargo Ejercido por Docente
(En Escala Ordinal)

X = Cargo Jerrquico fi hi
1. Docente (E)
2. Administrativo (A)
3. Coordinador (C)
4. Director (D)
5. Vicerrector (V)
6. Rector (R)
2
1
2
4
3
2
2/14= 0.1428
1/14= 0.0714
2/14= 0.1428
4/14= 0.2857
3/14= 0.2143
2/14= 0.1428
14 14/14=1
Fuente: Elaboracin Propia

Como podemos ver, la suma de la Frecuencia Relativa de todos los intervalos debe dar 1.

Lo que tambin podemos cuantificar, es la Frecuencia Acumulada y los porcentajes
acumulados a partir de los clculos anteriores.












Estadstica Educativa
UNS XX


Tabla No 3
Frecuencias Acumuladas y Absolutas de
Cargo Ejercido por Docente
(En Escala Ordinal)

X = Cargo Jerrquico fi hi Hi % % acum.
1. Docente (E)
2. Administrativo (A)
3. Coordinador (C)
4. Director (D)
5. Vicerrector (V)
6. Rector (R)
2
1
2
4
3
2
2/14= 0.1428
1/14= 0.0714
2/14= 0.1428
4/14= 0.2857
3/14= 0.2143
2/14= 0.1428
0.1428
0.1428+0.0714=0.2142
0.2142+0.1428=0.3570
0.3570+0.2857=0.6427
0.6427+0.2143=0.8570
0.8570+0.1428=1
14.28
7.14
14.28
28.57
21.43
14.28
14.28
21.42
35.70
64.27
85.70
100
14 14/14=1 100
Fuente: Elaboracin Propia

Interpretando decimos que 28.57% de los entrevistados fueron alguna vez directores, mientras
que un 7.14% se desempe como administrativo y un 21.43% como vicerrector. Las
frecuencias acumuladas, nos manifiestan que un 64.27% de los docentes ocuparon cargos
menores o iguales a director (es decir de docentes a directores de carrera).

1. ESTADSTICOS DE UNA VARIABLE

Un Estadstico tambin denominado Estadgrafo, es una funcin de una muestra aleatoria;
vale decir, tiene un comportamiento inducido por la muestra estocstica o aleatoria. Por tanto,
distintas muestras nos proveern generalmente distintos estadsticos. Entonces, los estadsticos
son medidas sumarizantes que permiten resumir la informacin contenida en la muestra para
obtener un mejor conocimiento de la poblacin.

Disponiendo de Microsoft Excel, al pulsar la opcin Herramientas, se despliega el recuadro
Anlisis de datos, del cual tomamos la opcin Estadstica Descriptiva, de sta opcin
seleccionamos resumen de Estadsticas y nos provee la tabla:
Media 15
Error tpico 0,86
Mediana 15
Moda 15
Desviacin estndar 4,14
Varianza de la muestra 17,18
Curtosis 6,52
Coeficiente de asimetra -1,13
Rango 24
Mnimo 1
Mximo 25
Suma 345
Cuenta 23
Fuente: Elaboracin Propia
Estadstica Educativa
UNS XX

As podemos decir, que existen ciertas medidas sumarizantes o estadsticos agrupados en
cuatro grupos:

1. Estadsticos de Posicin: son aquellos que describen la posicin que ocupa la
distribucin de frecuencias respecto a un valor de la variable. Se distinguen dos tipos:
Los estadgrafos de tendencia central y Los de Localizacin:
a. os estadgrafos de tendencia central nos proveen una idea acerca del centro del
histograma los ms representativos en investigacin social son: La media o
media aritmtica, y la mediana.
b. Los estadgrafos de localizacin son sealizadotes de valores afectados por la
mayor frecuencia o afectados por valores atpicos, los ms dispuestos son: La
moda, los cuartiles, deciles y percentiles.

2. Estadgrafos de Dispersin: Indican cuan dispersos estn los datos con respecto a un
valor que bien podra ser un estadstico de posicin, los ms usados son: La desviacin
tpica, la varianza, la desviacin media, el rango.
3. Estadgrafos de Forma: indican la simetra o asimetra vertical u horizontal del polgono
de frecuencias, los ms utilizados son: Los coeficientes de Asimetra y de Curtosis.
4. Estadgrafos de Concentracin: Indican el grado de concentracin o de desigualdad de
una distribucin, el estadstico ms conocido es el Indice de Gini.

1.1. LA MEDIA O MEDIA ARITMTICA
La Media o Media Aritmtica. Es un valor representativo de un conjunto de datos. Se denomina
media aritmtica porque proviene precisamente de una progresin aritmtica y se denota por
x
.
La media o valor representativo conjuntamente los estadgrafos de dispersin o
variabilidad, sirven (como veremos ms adelante) para realizar comparaciones entre
los datos de dos o ms muestras.
As entonces, si disponemos de una muestra de tamao n, podemos emplear la media
aritmtica simple que constituye el punto de equilibrio de un conjunto de datos.

Esta media simple, puede ser definida como la suma de todos los valores dividida entre el
nmero de casos.
n
x
x
n
i
i
=
=
1

Caso prctico

La Sra. Dolores Fuertes de Barriga, registr las temperaturas en su Ciudad a cierta hora en
grados Fahrenheit (F), las cuales fueron: 51, 60, 58, 62, 57, 49, 52, 62, 61 y 63. Determine la
media en grados centgrados (C), sabiendo que
) 5 / 9 (
) 32 (


=
F
C



Estadstica Educativa
UNS XX

Disponiendo de la regla de clculo de la media simple se tiene:
5 . 57
10
575
10
63 61 62 52 49 57 62 58 60 51
F
n
x
x
n
i
i

+ + + + + + + + +
=



Lo que implica que el promedio de temperatura en F durante los ltimos 10 das es de 57.5.

Calculando ahora la media en C . De acuerdo con la relacin dada ser:


17 . 14
9
5 . 127
9
5 ) 32 5 . 57 (
) 5 / 9 (
) 32 (
C
F
C =

=


Implicando una temperatura promedio en C de 14.17.

Ejercitacin:

Ac, se presentan los pasos a seguir para resolver el ejemplo planteado en el punto anterior
con Microsoft Excel. Primeramente introduzcamos los datos a una planilla Excel en forma de
columna. Puede notarse que la cantidad de mediciones es 10. El paso siguiente consiste en
seleccionar la opcin Anlisis de Datos dentro del men Herramientas: Se abre una ventana en
la que seleccionamos la Opcin Estadstica Descriptiva: Se abrir una nueva ventana, en la que
deben ser incorporados los datos que se dispone marcando el recuadro rango de entrada. La
opcin Rtulo de Datos, debe ser seleccionada, ya que se incorpor la columna de datos con el
ttulo respectivo, en este caso de TEMPERATURA.

En este caso, deseamos que nos arroje los resultados En una hoja nueva. Al hacer clic sobre la
palabra Aceptar, se abre una nueva hoja de Microfosoft Excel dentro del libro en el que
estamos trabajando, con la siguiente estructura:
















Temperatura
Media 57,5
Error tpico 1,61417334
Mediana 59
Moda 62
Desviacin estndar 5,10446428
Varianza de la muestra 26,0555556
Curtosis -1,17438091
Coeficiente de asimetra -0,6766935
Rango 14
Mnimo 49
Mximo 63
Suma 575
Cuenta 10
Estadstica Educativa
UNS XX

Los resultados que nos interesan en el caso de ste ejemplo, son slo tres de todos los
obtenidos. Ellos son:

- La Media Aritmtica en grados Fahrenheit (F):

Media 57,5

- El mayor y el menor nmero con los que estamos trabajando:

Mnimo 49
Mximo 63

Es exactamente igual al obtenido mediante frmulas!

1.2. LA MEDIANA

Es la categora o valor central dentro de la distribucin de frecuencias. As, la mediana, X
Me
,
divide nuestra distribucin en dos partes iguales de tal forma que la mitad de los casos se
sitan por encima de ella y la otra mitad por debajo.

Existen dos variantes en el cmputo de la mediana en datos no agrupados; cuando la
cantidad de datos es impar y cuando la cantidad de datos es par: Para el efecto;
primeramente, debemos ordenar los datos bsicos de la muestra en sentido creciente
o decreciente.

Cuando la cantidad de datos es par

Cuando tenemos una cantidad par de datos. Por ejemplo: n = 10, 18, 28, etc., la regla de
cuantificacin es definida como la semisuma de los dos valores centrales. En este caso:

2
1 ) 2 / ( 2 / +
+
=
n n
Me
X X
X


Caso prctico

Supongamos que queremos cuantificar la mediana de las temperaturas observadas en el caso
anterior mediante frmula, entonces ordenamos los datos crecientemente: 49, 51, 52, 57, 58,
60, 61, 62, 62 y 63. Luego, procedemos a identificar los dos valores centrales que en este caso
son 58 y 60 y reemplazamos en la frmula.


F
X X
X X X X
X
n n
Me
=
+

= + =

+
=
+ +
59
2
60 58
2
60 58
2 2
6 5
1 ) 2 / 10 ( 2 / 10 1 ) 2 / ( 2 /


Estadstica Educativa
UNS XX

Implicando que durante los ltimos 10 das el 50% de las temperaturas fue menor o igual a 59
F y el restante 50 % fue mayor a sta temperatura.

Ejercitacin:

Si continuamos analizando las respuestas que nos otorg Microsoft Excel en la Ejercitacin
planteada al explicar el concepto de Media, podemos ver que la Mediana para dicho ejemplo,
aparece en la tercera fila del mismo cuadro. Luego, el resultado que nos interesa en este caso
es:
Mediana 59

Que coincidencia con la formula verdad!

Cuando la cantidad de datos es impar

Cuando poseemos un tamao muestral cuya cantidad es impar, se puede aplicar la siguiente
definicin o en todo caso considerar simplemente el valor central.

)
2
1
(
+
=
n Me
X X

Caso prctico

Zoila Vaca de Toro (profesora de Matemtica Nivel Secundario), observa en un curso una
muestra de 11 estudiantes a los cuales les otorga 5 ejercicios de Matemtica y cuantifica el
tiempo requerido para su resolucin. Estos tiempos fueron enlistados en orden ascendente de
acuerdo con el minuto ms cercano: 5, 5, 5, 7, 9, 14, 15, 15, 16, 18, 18.

Determinando la mediana:

{ }
| | 6
2
12
2
1 11
2
1
11
1
X X X X X X
n i i Me
= =
|
.
|

\
|
|
.
|

\
| +
|
.
|

\
| + =


Por tanto, en una serie estadstica simple, la mediana ser el valor central si la muestra
contiene un nmero impar de elementos.

Minutos X X
Me
14
) 6 (
=


Interpretamos que el tiempo en la resolucin de los problemas de Matemtica es de 14 minutos
o menos, donde el 50% de los estudiantes con tiempos inferiores estn por debajo de ste
valor, as como por sobre 14 minutos est el restante 50%.




Estadstica Educativa
UNS XX

1.3. LA MODA

La moda o el valor modal, es la categora o valor ms frecuente dentro de la muestra. Por tanto;
es aqul valor que es afectado por la mxima frecuencia.

Puede presentarse algn caso en el que no exista algn valor modal, debido a la no recurrencia
de valores reiterados en la muestra, o puede existir ms de una moda siempre y cuando los
datos muestrales presenten algunos valores muy recurrentes.

Caso prctico

Siguiendo el ejemplo dado sobre temperaturas, observemos el valor ms recurrente en los
datos: 51, 60, 58, 62, 57, 49, 52, 62, 61 y 63.

As, claramente palpamos que la temperatura ms frecuente es 62 F siendo ste el valor
modal. Por tanto:
F X
Mo
= 62


Decimos entonces que la temperatura que ms veces se registr durante los ltimos 10 das fue
de 62F.

Ejercitacin

Continuando con el ejercicio donde se explic la definicin de Media, el valor del Modo para
ste caso, tambin puede encontrarse en la tabla anterior. Por tanto, la respuesta a nuestro
problema la encontraramos en el cuarto rengln del cuadro.

Moda 62
Que opina el lector!

2. UTILIZACIN DE GRFICOS

Comenzaremos con una interrogante: Cul es el cargo ms desempeando por los
profesionales del acpite anterior y cul el cargo que muy pocos profesionales accedieron?.

Para obtener las respuestas a esta pregunta se selecciona la opcin Asistente para Grficos de
Microsoft Excel, luego se siguen los pasos:

Paso 1

Seleccionamos tipo de grfico demarcando para ste ejemplo el grfico de columnas y se elige
el grfico ms pertinente para luego hacer clic en siguiente.


Estadstica Educativa
UNS XX

Paso 2

En la ventana rango de datos demarcamos las columnas concernientes a la variable y la
frecuencia absoluta de nuestra tabla con series en columna y presionamos el indicador
siguiente.

Paso 3

En ttulo de grfico registramos el rtulo CARGO JERRQUICO en eje de categoras (x)
registramos cargos ocupados y en eje de valores (y) registramos la palabra frecuencia y
presionamos nuevamente la pestaa siguiente para hacer clic finalmente en finalizar. Con lo
que nos provee el grfico:

CARGO JERARQUICO
0
0,5
1
1,5
2
2,5
3
3,5
4
4,5
6
.


R
e
c
t
o
r

(
R
)
5
.

V
i
c
e
r
r
e
c
t
o
r

(
V
)
4
.

D
i
r
e
c
t
o
r

(
D
)
3
.

C
o
o
r
d
i
n
a
d
o
r

(
C
)
2
.

A
d
m
i
n
i
s
t
r
a
t
i
v
o

(
A
)
1
.

D
o
c
e
n
t
e

(
E
)
Cargos ocupados
F
r
e
c
u
e
n
c
i
a


ste grafico es un diagrama de barras que Es aqul en el cual el fenmeno que se estudia
queda representado por una serie de rectngulos, barras o paraleleppedos, sobre un sistema
de ejes (ordenadas y abscisas). Los cuales pueden dibujarse horizontal o verticalmente. La
altura de los rectngulos es proporcional a la frecuencia absoluta, el ancho deber ser el
mnimo posible, stos rectngulos debern estar separados entre si.

Caso prctico

Supongamos que aplicamos una escala de tipo Likert para medir la actitud de un grupo de
estudiantes hacia el Profesor Sr. Malgesto Malacara con lo que se obtuvo los siguientes
resultados:

Estadstica Educativa
UNS XX


Tabla No 4
Actitud Hacia el Profesor
Malgesto Malacara
(En Escala Likert)
X = Calificacin fi hi hi 360 %
21
24
35
44
51
58
59
62
4
6
10
15
17
12
9
6
0.051
0.076
0.126
0.190
0.215
0.152
0.114
0.076
18.36
27.36
45.36
68.40
77.40
54.72
41.04
27.36
5.10
7.60
12.60
19.00
21.50
15.20
11.40
7.60
79 1 360 100
Fuente: Elaboracin Propia

De stos resultados obtengamos el diagrama de sectores. Un diagrama de sectores tambin
denominado grafico circular, se dispone para representar variables de tipo cualitativo o
cuantitativo.
Para construir ste grfico de manera manual es menester obtener los ngulos de la
circunferencia mediante el producto de la frecuencia relativa por 360 como expone la tabla
actual
2
. La figura siguiente es un diagrama circular obtenido mediante informacin de la tabla
No 4 en el que se describen las calificaciones y su respectivo porcentaje, durante una encuesta
para saber la actitud hacia el Prof. Malgesto Malacara.
DIAGRAMA DE SECTORES
54.72



77,4
41.04



27.36
68.4

18.36

27.36 45.36
Puntuaciones de una escala Likert

2
El procedimiento que se expone, tambin es aplicable para distribuciones continuas o clasificacin de datos, por lo que no se har grafico alguno
para el ejemplo correspondiente.
15.2 %
21.5%
11.04%


7.6%
19%
5.1 %
7.6% 12.6%
Estadstica Educativa
UNS XX

Con el uso de Microsoft Excel, para determinar el diagrama de sectores podemos realizar las
operaciones antes mencionadas como en el diagrama de barras.

3. ANLISIS DE DATOS AGRUPADOS EN CATEGORAS O INTERVALOS DE CLASE

Antes de tocar ste punto, debemos aclarar que al estructurar en una distribucin de
frecuencias de tipo continuo cualquier variable cuantitativa, la estamos transformando en una
medicin ordinal, sin embargo, se justifica su utilizacin ya que es ms censillo su anlisis
estadstico descriptivo.

Entonces, se denomina clase a los intervalos en que se agrupan los valores posibles de una
variable. Por ende, los valores extremos superior e inferior de cada clase son los valores
numricos que limitan, superior e inferiormente al intervalo denominados lmites de
clase (L
i
-
1
____ L
i
).

Caso prctico

Los siguientes, son datos respecto a los puntajes de Coeficiente de inteligencia (CI) de 150
estudiantes de tercer grado de la Escuela Mata Burros. Con base en stos puntajes los
profesores pretenden preparar una distribucin de frecuencias. La prueba revela que los
puntajes ms bajos y altos son 85 y 129 de (CI) respectivamente.


Tabla No 5
Puntajes de Coeficiente Intelectual de
150 Estudiantes de Tercer Grado
(En Escala de Intervalo)

88
119
93
99
106
102
108
109
114
108
91
91
89
120
106
127
98
104
106
114
104
106
124
101
97
121
108
113
105
125
113
120
96
108
104
116
114
118
115
121
125
129
105
118
105
100
102
110
98
122
101
120
95
118
122
95
96
129
112
117
114
109
91
113
112
89
99
124
103
105
104
106
114
124
103
108
105
92
101
112
93
109
108
115
114
93
125
88
101
88
91
121
113
121
115
107
126
113
89
104
96
129
107
120
115
118
100
100
109
97
91
122
97
118
100
106
115
110
99
85
100
112
128
111
105
98
113
101
108
116
94
92
125
121
108
119
116
103
111
113
85
109
128
88
119
118
116
113
122
126
Fuente: Elaboracin Propia sobre la base de puntajes sobre coeficiente
Intelectual de 150 estudiantes.

Para agrupar una clasificacin de datos se debe mirar las puntuaciones como distancias a lo
largo de una escala entre dos puntos limitantes, as el procedimiento es el siguiente:

1. Determinar el mayor y el menor entre los datos registrados y as encontrar el rango.
Estadstica Educativa
UNS XX

2. Dividir el rango entre un nmero conveniente de intervalos de clase del mismo tamao
(generalmente ste nmero conveniente proviene de la raz cuadrada del tamao de la
muestra).
3. Determinar el nmero de observaciones que caen dentro de cada intervalo de clase, es
decir encontrar las frecuencias de clase.

Con referencia a la tabla No 5, el menor de los valores obtenidos es 85 y el mayor de los
valores obtenidos es 129, del cual proceder el rango.

3.1. EL RANGO (R)

Tambin denominado recorrido, Es la diferencia entre el mayor y menor de los valores
obtenidos, e indica el nmero de unidades en la escala de medicin necesario para incluir los
valores mximo y mnimo (Hernndez, 2003: 508).

puntos X X R 44 85 129
min max
= = =


As cuantificado ste rango muestra que los valores de coeficiente intelectual de los estudiantes
se inclinan hacia valores elevados donde existe una diferencia de 44 puntos del mayor con el
menor de los puntajes.

3.2. NMERO DE CLASES (K)

El nmero de clases es la cantidad de intervalos que poseer una clasificacin o distribucin
continua de datos. Para calcular (k) existen distintas modalidades, una de ellas es la
denominada regla de Sturges cuya frmula es funcin del inmediato entero superior de:

n K log 3 . 3 1 + =

O en todo caso
1
2 log
log
+ =
n
K


Tambin es deseable dividir el rango en un nmero de intervalos k que no sea menor que 10 ni
mayor que 20 por ejemplo el rango 10 k 20 debido a que trabajamos comnmente con
mltiplos de diez como lo asevera la regla de Sturges.

Pero el mtodo ms usual, consiste en sacar la raz cuadrada del tamao muestral n as:

n k =

No obstante, si deseamos una distribucin de frecuencias de 10 clases tendremos:

K = 10
Implica que nuestra clasificacin de datos tendr 10 intervalos o clases.
Estadstica Educativa
UNS XX


3.3. AMPLITUD DE CLASES (c)

Tambin denominado tamao o anchura de un intervalo de clase Es la diferencia entre las
fronteras de clase superior e inferior. Ciertos valores para la magnitud del intervalo son ms
convenientes que otros, por ejemplo, 3, 5 y 7 porque como nmeros nones darn un punto
medio del intervalo que es un nmero entero. Sin embargo, comnmente su clculo se basa en
dividir el rango (R) entre el nmero de clases (k) y se asume el entero inmediato superior que
ser un mejor valor de (c).

5 4 . 4
10
44
) ( = = =
k
R
c Amplitud


La magnitud de cada intervalo ser de cinco unidades.

Esta operacin de incrementar artificialmente la amplitud de clases de 4.4 a 5 eleva el rango,
por lo que es necesario computar el nuevo rango (R) que sera el producto de c x k


R = c x k = 5 x 10 = 50


Como el nuevo rango (R) excede al anterior (R) en 6 unidades, esta diferencia se la divide
entre 2 ejemplo:

Si R > R ya que 50 > 44 entonces: 50 44 = 6


3
2
6
= =



Luego la diferencia se la resta al menor valor y se le suma al mayor valor de las
observaciones Ejemplo: L
i -1
= 85 3 = 82 y L
i
= 129 + 3 = 132 y se procede a construir
el intervalo de clases.


3.4. INTERVALO DE CLASE


Se denomina intervalo de clases a los valores comprendidos entre: (82 86); (87 91), etc.
Hay dos mtodos comunes para anotar los lmites del intervalo las dos definiciones difieren solo
en 0.5 de punto.


Estadstica Educativa
UNS XX


Tabla No 6
Intervalos de Clase
para Puntajes de Coeficiente Intelectual
(Escala de Intervalo)

Lmites de Clase
Li -1 ____ Li
Fronteras de clase
X i -1 ____ X i
82________86
87________91
92________96
97_______101
102______106
107______111
112______116
117______121
122______126
127______131
81.5________86.5
86.5________91.5
91.5________96.5
96.5_______101.5
101.5______106.5
106.5______111.5
111.5______116.5
116.5______121.5
121.5______126.5
126.5______131.5
Fuente: Elaboracin Propia en base a puntajes de coeficiente
Intelectual de 150 estudiantes de tercer grado.

Cada par de valores extremos son los lmites de clase o fronteras de clase. i) Los lmites de
clase tienen la ventaja de ser compactos y pueden facilitar la exactitud de la tabulacin, es de
preferirse cuando se trata con puntuaciones de pruebas que no incluyen valores fraccionarios,
siempre que los lmites actuales de los intervalos se tengan en cuenta. ii) Las fronteras de clase
dan una indicacin ms clara de los lmites actuales de los intervalos, al mismo tiempo precisan
la magnitud del intervalo de clase que en este caso es de 5 unidades o puntos, y no de 4 como
podra parecer.

3.5. MARCAS DE CLASE (X
i
)

La marca de clase Es el punto central de cada intervalo, es decir, el promedio de sus
extremos superior e inferior, por lo que se considera un representante de cada intervalo o
frontera de clase. Su formula de cmputo es:



2 2
1 1 i i i i
i
X X L L
X
+
=
+
=










Estadstica Educativa
UNS XX


Tabla No 7
Marcas o Puntos Medios para
Intervalos de Clase
(Escala de Intervalo)

L-1 ____ L+1 Xi
82________86
87________91
92________96
97_______101
102______106
107______111
112______116
117______121
122______126
127______131
84
89
94
99
104
109
114
119
124
129
Fuente: Elaboracin Propia

109 es el valor representativo o promedio de la clase [107 __ 111] por lo que 109 remplaza a
todos los valores contenidos en el intervalo. O tambin podramos mencionar que en cada
agrupacin existe un promedio de puntajes desde 84, 89, 94 a 129.

3.6. FRECUENCIA ABSOLUTA, RELATIVA, ABSOLUTA ACUMULADA Y ABSOLUTA
RELATIVA

Las Definiciones anteriormente citadas, son tambin vlidas para una clasificacin de datos
como la actual, por lo que nos limitaremos a interpretar algunas frecuencias.


Tabla No 8
Tabla de Frecuencias Absoluta, Relativa, Absoluta
Acumulada y Relativa Acumulada
(En Escala Ordinal)

L i -1 __ L i Xi fi hi Fi Hi
82___86
87___91
92___96
97__101
102__106
107__111
112__116
117__121
122__126
127__131
84
89
94
99
104
109
114
119
124
129
2
12
11
19
22
19
27
19
13
6
0.013
0.080
0.073
0.127
0.147
0.127
0.180
0.127
0.087
0.040
2
14
25
44
66
85
112
131
144
150
0.013
0.093
0.166
0.293
0.440
0.567
0.747
0.874
0.961
1
150 1
Fuente: Elaboracin Propia en base a tabla anterior

Estadstica Educativa
UNS XX

f
4
= Implica que hay 19 estudiantes con puntajes entre 97 y 101 de coeficiente intelectual
o promedio de 99 puntos.
h
4
= La proporcin de los estudiantes que tienen puntajes entre 97 y 101 de coeficiente
intelectual o promedio de 99 puntos es de 0.127.
F
6
= Implica que existen 85 o menos de los estudiantes que tienen un coeficiente
intelectual menor o igual a 111 puntos o menor igual a 109 puntos en promedio.
H
7
= Implica que 0.747 x 100 = 74.7% de los estudiantes tienen puntajes menores o
iguales a 116 menor o igual a 114 puntos en promedio.

Para construir una distribucin de frecuencias acumuladas y menor o igual que como tambin
y mayor que, tanto absolutas y relativas, se procede partiendo del lmite inferior, en este caso
82, hasta llegar al lmite superior 131. As solo se acumularn las frecuencias absolutas
disponiendo de las fronteras de clase
3
Ejemplo:


Tabla No 9
Tabla de Frecuencias Absolutas
Y Menor o Igual que Y Mayor que
(En Escala Ordinal)

Puntajes Fi Puntajes Fi*
Y Menor o igual que 81.5
Y Menor o igual que 86.5
Y Menor o igual que 91.5
Y Menor o igual que 96.5
Y Menor o igual que 101.5
Y Menor o igual que 106.5
Y Menor o igual que 111.5
Y Menor o igual que 116.5
Y Menor o igual que 121.5
Y Menor o igual que 126.5
Y Menor o igual que 131.5
0
2
14
25
44
66
85
112
131
144
150
Y Mayor que 81.5
Y Mayor que 86.5
Y Mayor que 91.5
Y Mayor que 96.5
Y Mayor que 101.5
Y Mayor que 106.5
Y Mayor que 111.5
Y Mayor que 116.5
Y Mayor que 121.5
Y Mayor que 126.5
Y Mayor que 131.5
150
148
136
125
106
84
65
38
19
6
0
Fuente: Elaboracin Propia en base tabla anterior
* Frecuencia absoluta acumulada Y mayor que

F
8
= 112 menos de los estudiantes tienen un coeficiente intelectual menor a 116.5
puntos.
F*
5
= Ms de 106 de los estudiantes tienen un coeficiente intelectual mayor que 101.5
puntos.






3
Normalmente se dispone de los lmites actuales de cada clase pero como en el desarrollo del presente ejercicio, no se los consider, entonces se
dispondr de las fronteras de clase.
Estadstica Educativa
UNS XX

4. HISTOGRAMA DE FRECUENCIAS

Un histograma Es un grfico dividido en paralelogramos sucesivos, sobre cada uno de los
intervalos en que se agrupa los posibles valores de una variable continua. (Tamams, 1993:
284). Con Referencia al ejemplo sobre puntajes de coeficiente intelectual, consideremos la tabla
No 8 que contiene a las fronteras y lmites de clase con la que se construye el siguiente grfico:
Histograma de Frecuencias
%

18%
14.7%
12.7%

8.7%

8 %
7.3%

4%

1.3%

0 81.5 86.5 91.5 96.5 101.5 106.5 111.5 116.5 121.5 126.5 131.5 X
Puntuaciones de Coeficiente Intelectual

Implica que el 18% de los estudiantes de tercer grado tienen puntajes entre 111.5 y 116.5
puntos, y el 13% entre 81.5 y 86.5 puntos inclusive.

5. POLGONO DE FRECUENCIAS
El polgono de frecuencias para variables medidas a escala de intervalo y agrupadas segn una
clasificacin de datos, relaciona las marcas de clase con sus respectivas frecuencias. Con
Referencia al ejemplo sobre puntajes de coeficiente intelectual, consideremos las marcas de
clase con la que se construye el siguiente grfico:
Polgono de Frecuencias
f
i
27
22
19

13
12
11

6
2

0 79 84 89 94 99 104 109 114 119 124 129 134X
i
Puntuaciones de Coeficiente Intelectual
Estadstica Educativa
UNS XX

En la grfica se observa que la puntuacin mas frecuente en cuanto a coeficiente intelectual de
150 estudiantes es ciento catorce.

6. OJIVA DE FRECUENCIAS ACUMULADAS

Una ojiva es un grfico que recoge las frecuencias acumuladas por debajo de cualquiera de las
fronteras de clase superiores (Kazmier, 1988: 12 13).

Con Referencia al ejemplo sobre puntajes de coeficiente intelectual, consideremos la tabla
frecuencias absolutas Y Menor o igual que, con la que se construye el siguiente grfico:

Ojiva de Frecuencias Acumuladas Y Menor o Igual Que

F
i
150
144
131

112

85
66
44
25
14
2

0 81.5 86.5 91.5 96.5 101.5 106.5 111.5 116.5 121.5 126.5 131.5 X
Ojiva de Puntuaciones de Coeficiente Intelectual

La grafica manifiesta que 131 o menos de los estudiantes poseen un coeficiente intelectual
menor o igual a 121.5 puntos (obviamente, con esa cifra se dice tambin que el complemento
de 19 estudiantes tienen puntajes mayores). Como se ve, tambin con el uso de frecuencias
relativas o porcentajes acumulados, se puede lograr dar una caracterizacin global del grupo en
lo referente al coeficiente intelectual.

6.1. OJIVA SUAVIZADA DE FRECUENCIAS ACUMULADAS

Este tipo de grafica Indica las frecuencias acumuladas bajo cada frontera de clase o lmite real
de la distribucin de frecuencias, se la obtiene suavizando la ojiva Y Menor o igual Que,
aplicando la siguiente formula:

3
1 1 +
+ +
=
j j
j
F F F
F

Donde:
F
j - 1
= Frecuencia absoluta acumulada anterior.
Estadstica Educativa
UNS XX

F
j + 1
= Frecuencia absoluta acumulada posterior.
F
s
= Frecuencia acumulada suavizada.

Para suavizar la ojiva del ejemplo sobre coeficiente intelectual de 150 estudiantes se proceder
de la siguiente manera por cada frecuencia acumulada: Al suavizar la frecuencia 7 se tiene:
67 . 87
3
112 85 66
7
=
+ +
= F
Con las frecuencias suavizadas se tiene el siguiente cuadro de
distribucin continua de la variable medida en escala de intervalo.


Tabla No 10
Clculo de Frecuencias Acumuladas Suavizadas


Puntajes

Fi
Fi Suavizada
Y Menor o igual que 81.5
Y Menor o igual que 86.5
Y Menor o igual que 91.5
Y Menor o igual que 96.5
Y Menor o igual que 101.5
Y Menor o igual que 106.5
Y Menor o igual que 111.5
Y Menor o igual que 116.5
Y Menor o igual que 121.5
Y Menor o igual que 126.5
Y Menor o igual que 131.5
0
2
14
25
44
66
85
112
131
144
150
0.67
5.33
13.67
27.67
45
65
87.67
109.33
129
141.67
150
Fuente: Elaboracin Propia

La figura siguiente, es una ojiva suavizada de frecuencias absolutas acumuladas Y Menor
Que de la distribucin sobre coeficiente intelectual de 150 estudiantes de la tabla No 10.
Ojiva Suavizada de Frecuencias Acumuladas
Y Menor o Igual Que
F
i

150
141,67
129
109.33
87,67

65
45
27.67
13.67
5,33
0,67

0 81.5 86.5 91.5 96.5 101.5 106.5 111.5 116.5 121.5 126.5 131.5 X
Puntuaciones de Coeficiente Intelectual
Estadstica Educativa
UNS XX

Con la distribucin de los puntajes de coeficiente intelectual en once categoras de la variable,
los clculos correspondientes muestran que 65 de los estudiantes o menos, tienen puntajes
menores o iguales a 106.5 puntos. O los restantes 85 estudiantes tienen puntajes mayores que
106.5 puntos.

7. MEDIA ARITMTICA EN DATOS AGRUPADOS

Cuando se dispone de una distribucin de frecuencias como el caso anterior, el cmputo de
ste estadgrafo requiere de la respectiva ponderacin de la frecuencia observada f
j
. Por lo que
tambin la denominamos media aritmtica ponderada, definida como el producto de las marcas
de clase con su respectiva frecuencia absoluta, sobre el total de los casos.
n
f x
x
k
j
j j
=
=
1

Caso prctico

Con respecto a datos anteriores sobre el coeficiente intelectual de 150 estudiantes se obtuvo la
siguiente tabla:

Tabla No 11
Tabla del Producto de Marcas de Clase con
sus Respectivas Frecuencias Absolutas

L
i 1
__ L
i
Xj fj X
j
f
j
Fj
82___86
87___91
92___96
97___101
102__106
107__111
112__116
117__121
122__126
127__131
84
89
94
99
104
109
114
119
124
129
2
12
11
19
22
19
27
19
13
6
168
1068
1034
1881
2288
2071
3078
2261
1612
774
2
14
25
44
66
85
112
131
144
150
150 16235
Fuente: Elaboracin Propia en base a tablas anteriores
determinar coeficiente Intelectual promedio de 150 estudiantes.

Una de las caractersticas de las medidas de posicin, es que stas se encuentran en
el o los intervalos de clase con mayor frecuencia, As tenemos:

puntos x 23 . 108
150
16235
= =

Estadstica Educativa
UNS XX


Esto implica que el promedio de coeficiente intelectual de stos 150 estudiantes es de 108.23
puntos, lo que no manifiesta un promedio que raya en lo regular.

Verificando si
x
ocupa una posicin central aplicamos la regla del percentil:

( )
n
F
c
f
L P
j
j
i
100
1(

+ =

e e

Entonces:

( ) ( ) | |
( ) % 35 . 47 67 . 0 67 . 70
67 . 0 66 8 . 3 23 . 1
150
100
66
5
19
107 23 . 108
=
+
(

+ = e


La media aritmtica en este ejemplo ocupa la posicin 47.35% es decir, no se ubica
exactamente al centro de la distribucin; est afectada por las frecuencias mayores que estn
por debajo de ella como 22, 19 y 11 respectivamente.

8. MEDIANA EN DATOS AGRUPADOS

Si se dispone de una distribucin en lmites de clase, el cmputo de la mediana, requiere de
aditamentos algebraicos del tipo:
c
f
F
n
L X
j
j
i Me
(
(
(
(


+ =

1
1
2

Que se logra computando las frecuencias acumuladas. El intervalo mediano o que contiene la
mediana ser el asociado a la primera frecuencia acumulada que supere a n/2; es decir,
j j
F
n
F < <

2
1


En nuestra frmula, L
i 1
es la cota inferior del intervalo mediano; f
j
su frecuencia; c la amplitud
intervlica y F
j 1
la respectiva frecuencia acumulada anterior al intervalo mediano.

Caso prctico

Considerando los datos sobre coeficiente intelectual de 150 estudiantes del ejemplo anterior:

Primeramente se obtiene la Mediana que ser:
75
2
150
2
= =
n

Luego reemplazamos en la formula:
Estadstica Educativa
UNS XX


puntos X
X
Me
Me
37 . 109
19
45
107 5
19
9
107 5
19
66
2
150
107
=
+
(

+
(
(
(
(


+ =


Decimos que el 50% o menos de los estudiantes tienen coeficiente intelectual de 109.37
puntos, lo que implica que el restante 50% tiene un coeficiente intelectual por encima de ste
valor.

Verificando si X
ME
ocupa una posicin central aplicamos la regla del percentil:

( )
n
F
c
f
L P
j
j
i
100
1(

+ =

e e

Entonces:
( ) ( ) | |
( ) % 50 25 . 50 67 . 0 ) 006 . 75 (
67 . 0 66 8 . 3 37 . 2
150
100
66
5
19
107 37 . 109
~ =
+
(

+ = e


Implica que la mediana en este ejemplo ocupa la posicin 50 % es decir divide exactamente por
la mitad a nuestra distribucin de frecuencias.

9. MODA EN DATOS AGRUPADOS

La moda en distribuciones de frecuencias continuas dispone de la siguiente formula

c L X tambin c
n n
n
L X
i Mo
i i
i
i Mo (

A + A
A
+ =
(

+
+ =

+

2 1
1
1
1 1
1
1


Caso prctico

Computando la Moda para los datos de nuestro ejemplo sobre coeficiente intelectual de 150
estudiantes se obtuvo el siguiente valor:
La Moda ser:
8 ) 19 27 (
8 ) 19 27 (
2
1
= = A
= = A

puntos X
Mo
5 , 114 5 . 2 112
16
40
112 5
8 8
8
112 + +
+
+ =

El valor de la variable CI de 150 estudiantes que viene afectado por la mxima frecuencia es
114,5 puntos.

Estadstica Educativa
UNS XX

Verificando si X
Mo
., ocupa una posicin central aplicamos la regla del percentil:
( )
n
F
c
f
L P
j
j
i
100
1(

+ =

e e

Entonces:
( ) ( ) | |
% 67 , 65
150
9850
150
100
) 5 . 98 ( 85 4 . 5 5 . 2
150
100
85
5
27
112 5 , 114
=
|
.
|

\
|
+
(

+ = e


La moda en este ejemplo ocupa la posicin 65,67% esto implica que sobreestima el promedio
de la distribucin de frecuencias.


PARA RECORDAR

En este tema cubrimos los conceptos necesarios sobre Distribuciones de frecuencias y
Estadsticos de Posicin que caracterizan parcialmente una variable. Por lo que resumimos su
contenido de la manera siguiente:

1. Una distribucin de frecuencias es un esquema conceptual e instrumento til en la
sumarizacin de la informacin muestral, por que posibilita el organizar los datos o
categoras observadas de acuerdo al nmero relativo de veces (frecuencia), que ocurre
la medida individual o agrupada.
2. La media o media aritmtica es un valor representativo de una distribucin de
frecuencias o datos no agrupados.
3. La mediana es el valor central de una distribucin de frecuencias o datos no agrupados.
4. La moda es el valor ms frecuente de una distribucin de frecuencias o datos no
agrupados.
5. Un diagrama de sectores tambin denominado grafico circular, sirve para representar
variables de tipo cualitativo o cuantitativo.
6. Un histograma es un grfico dividido en paralelogramos sucesivos sobre cada uno de
los intervalos en que se agrupa los posibles valores de una variable continua
7. Un polgono de frecuencias relaciona las marcas de clase con sus respectivas
frecuencias.
8. Una ojiva es un grfico que recoge las frecuencias acumuladas por debajo de
cualquiera de las fronteras de clase superiores u observaciones individuales de la
variable.







Estadstica Educativa
UNS XX

Reflexiona Sobre el Tema:

1. Segn el concepto de distribucin de frecuencias. Cul ser el motivo principal
para armar estas distribuciones?

..

2. En base a la definicin conceptual especifique las diferencias que se generan en
la interpretacin de la media aritmtica, la mediana y la moda.

..

3. Seale: Qu grficos pueden representar a una distribucin en datos
agrupados en categoras o intervalos de clase? y Qu grficos a una distribucin
que no posee clases o intervalos?

..





Estadstica Educativa
UNS XX












1) Arma una distribucin de frecuencias con intervalos de clase utilizando los puntajes
transformados en calificaciones sobre Matemtica obtenidos mediante determinacin del
tamao de muestra de la actividad anterior y luego:

a. Cuantifica e interpreta el valor representativo media aritmtica.
b. Cuantifica e interpreta el valor central mediana.
c. Cuantifica e interpreta el valor ms frecuente o valor modal.
d. Verifica con Microsoft Excel los resultados obtenidos manualmente a propsito
de los indicadores de tendencia central.
e. Mediante la regla del percentil, verifica cual de los tres indicadores de tendencia
central calculados caracteriza correctamente el centro del histograma.

2) Arma otra distribucin de frecuencias de tipo discreto para saber la opinin que tienen
los estudiantes de secundaria sobre el nivel acadmico que posee la Unidad Educativa
donde desempeas tu labor. Para ello usa:

a. Las categoras de la escala Lickert (Muy Bueno, Bueno, Regular, Malo y Muy
Malo).
b. Cuantifica las frecuencias absolutas, relativas, absolutas acumuladas y relativas
acumuladas.
c. Interpreta contraponiendo la ms alta de las frecuencias con la ms baja de las
frecuencias Por qu consideras que se produjeron tales eventos?.
d. Ilustra grficamente sta distribucin construyendo un diagrama de barras y un
diagrama de sectores.
e. Con qu tipos de medidas de posicin central caracterizaras a esta distribucin
de orden cualitativo?.







A C T I V I D A D E S

Una distribucin de frecuencias nos revela la forma funcional o histograma de
nuestra masa de datos, a lo que los estadsticos de tendencia central nos proveen
una nocin acerca de su centro.

Estadstica Educativa
UNS XX

Tema No 3

INDICES DE LOCALIZACIN Y
ESTADSTICOS DE DISPERSIN

Como se mencion, los ndices de posicin y ms concretamente de localizacin son los
cuartiles, deciles y percentiles. Estos ndices, posibilitan dividir o fraccionar una muestra en:
cuatro, diez y cien partes equitativamente.

1. CUARTILES

Los cuartiles fraccionan a una distribucin de frecuencias en 4 partes iguales, por debajo de la
primera parte se encuentra el 25% de los datos lo que significa que el 75% de los datos estn
por sobre ste cuartil, por debajo de la segunda parte que tambin es igual a la mediana se
encuentra el 50% de los datos, y por debajo de la tercera parte se encuentra el 75% de las
observaciones. Asociada a sta medida descriptiva, se encuentra una medida de dispersin
denominada amplitud intercuartlica (AI).

1.1. AMPLITUD INTERCUARTLICA (AI)

Como anteriormente se dijo, es una medida de dispersin que concentra al 50% de los datos,
su frmula es:
1 3
Q Q AI =


Esta frmula es aplicable tanto a datos no agrupados como agrupados, para los primeros
ilustremos el siguiente caso prctico.

Caso prctico

Anteriormente se dio un ejemplo sobre la cantidad de tiempo requerido en la resolucin de 5
ejercicios de Matemtica de un curso de la Prof. Zolia Vaca de Toro, calculemos el primer y
tercer cuartiles con los resultados enlistados en orden ascendente de acuerdo con el minuto
mas cercano: 5, 5, 5, 7, 9, 14, 15, 15, 16, 18, 18.

Cuantificando el primer cuartil:

( ) ( ) | | ( ) ( ) | | ( ) ( ) | | | | 25 . 3 5 . 0 75 . 2 2 / 1 4 / 11 2 / 1 4 / 1
X X X X Q
n
=
+ + +


Por tanto el primer cuartil ser aquel dato que ocupe la posicin 3.25, de las observaciones
anteriormente ordenadas de manera creciente:
Estadstica Educativa
UNS XX

Luego
utos Q min 5 , 5 ) 5 7 )( 3 25 . 3 ( 5
1
= + =


5.5 minutos o menos es el tiempo requerido en la resolucin de los problemas de matemtica
del 25% de los estudiantes, as como el restante 75% requiere de ms tiempo.

Cuantificando el tercer cuartil:

( ) ( ) | | ( ) ( ) | | ( ) ( ) | | | | 75 . 8 5 . 0 25 . 8 2 / 1 4 / 11 3 2 / 1 4 / 3 3
X X X X Q
x n
=
+ + +


Por tanto el tercer cuartil ser aquel dato que ocupe la posicin 8.75, de las observaciones
anteriormente ordenadas de manera creciente:

Luego
utos Q min 75 . 15 ) 15 16 )( 8 75 . 8 ( 15
3
= + =


15.75 minutos o menos es el tiempo requerido en la resolucin de los problemas de
matemticas del 75% de los estudiantes, as como el restante 25% requiere de ms tiempo.

Se calcula la amplitud intercuartil en funcin a los datos anteriores:

utos Q Q AI min 25 . 10 5 . 5 75 . 15
1 3
= =


Ello implica que el 50% central aproximadamente 5 de los estudiantes con tiempos entre 5.5 y
15.75 minutos requieren 10.25 minutos en la resolucin de cinco ejercicios de Matemtica.

Para el caso de datos agrupados el clculo de cuartiles requiere de la siguiente frmula:

c
f
F
n
L P
j
j
i
(
(
(


+ =
1
4
e
e

Donde:

w = Cuartil que se desea determinar. w = 1, 2, 3

Caso prctico

Con referencia a los datos sobre coeficiente intelectual CI de 150 estudiantes del ejemplo
anterior, el clculo del cuartil uno es:
5 . 37
4
150
4
= =
n


Estadstica Educativa
UNS XX

puntos
Q
29 . 100 29 . 3 97
19
5 . 62
97
5
19
5 . 12
97 5
19
25 5 . 37
97 5
19
25
4
150
97
1
+ + =
= |
.
|

\
|
+
(


+
(
(
(


+ =

Y el clculo del tercer cuartil es:
5 . 112
4
) 150 ( 3
4
3
= =
n

puntos
Q
13 . 117 13 . 0 117
19
5 . 2
117 5
19
5 . 0
117
5
19
112 5 . 112
117 5
19
112
4
) 150 ( 3
117
3
+ + |
.
|

\
|
+ =
=
(


+
(
(
(


+ =


Con stos datos, podemos cuantificar el indicador de dispersin denominado Amplitud
Intercuartlica, el cual contiene al 50% de los datos muestrales entre sus lmites. Entonces,
aplicando la regla de clculo de la Amplitud Intercuartlica AI :

Puntos Q Q AI 84 . 16 29 . 100 13 . 117
1 3
= =


Entre el tercer y primer cuartiles se reparte el 50% de los puntajes centrales de la distribucin,
significando 16.84 puntos aproximadamente.

Para verificar que el 50% de las observaciones se encuentra en esta Amplitud procedemos de
la siguiente manera:

Tabla No 12
Puntos de Corte en Tabla para
Intervalos de Clase
(Escala de Intervalo)

Li 1 ____ Li fi
82____________86
87____________91
92____________96
97__[100.29__101]
102__________106
107__________111
112__________116
[117__117.13]_121
122__________126
127__________131
2
12
11
19
22
19
27
19
13
6
150
Fuente: Elaboracin Propia
Estadstica Educativa
UNS XX


En la tabla precedente, se estableci puntos de corte dentro de los lmites de clase, para
proceder luego con las diferencias:

101 100.29 = 0.71 y 117.13 117 = 0.13
Si c = 4 entonces:
4 19
0.71 X

3 37 , 3
4
49 , 13
4
19 71 . 0
~ = =

= X

Si c = 4 entonces:
4 19
0.13 X

1 62 . 0
4
47 , 2
4
19 13 . 0
~ = =

= X


Con los datos obtenidos se obtiene la siguiente tabla resumen:


Tabla No 13
Tabla Recortada para Establecer
Nuevas Frecuencias de Clase
(Escala de Intervalo)

Li 1 ____ Li fi
100.29_______101
102__________106
107__________111
112__________116
117_______ 117.13
3
22
19
27
1
72
Fuente: Elaboracin Propia

Implica que en el intervalo entre 100.29 y 101 solo existen 3 datos y no 19 como parecera que
fuera; entre 117 y 117.13 existe tan solo 1 dato y no as 19 datos.

Verificando el porcentaje del intervalo
| | 13 . 117 29 , 100 s s x
se tendr; si 150 es el 100%
entonces:

150 100%
72 X

% 50 48
150
% 200 . 7
150
% 100 72
~ = =

= X


Estadstica Educativa
UNS XX

Donde 48% es un valor muy aproximado al 50%.

Tambin podemos cuantificar otra medida de dispersin denominada Recorrido Semi
intercuartlico que consiste en el promedio de la diferencia entre el tercero y primer cuartiles:

2
1 3
Q Q
Q

=

Caso prctico

Calculando el Recorrido Semi intercuartilico ser:

puntos
Q Q
Q 42 . 8
2
84 . 16
2
29 . 100 13 . 117
2
1 3
= =

=


Los cuartiles tercero y primero se desvan en promedio 8,42 puntos respecto de la mediana.

Disponiendo del Recorrido Semiintercuartlico o Desviacin Cuartlica (Q) establecemos los
lmites dentro de los cuales cae en realidad el 50% de los casos centrales, simplemente cuando
(Q) se mide debajo y arriba de la mediana para determinar los lmites inferior y superior
respectivamente, y tenemos el intervalo representativo:

] [ Q Me

Por tanto ser:

95 . 101 42 . 8 37 . 109
79 . 117 42 . 8 37 . 109
=
+ = +
Q Me
Q Me


Que viene a ser:
| | 79 . 117 ; 95 . 101


Podemos interpretar nuestros resultados en trminos de probabilidad y decir: Existe una
probabilidad de 50% de que cualquier puntuacin tomada al azar caer dentro de los lmites
| | 79 . 117 ; 95 . 101
.

Para verificar que el 50% de las observaciones se encuentra en este Intervalo Semi
intercuartlico procedemos de la siguiente manera:







Estadstica Educativa
UNS XX


Tabla No 14
Puntos de Corte en Tabla para
Intervalos de Clase
(Escala de Intervalo)

Li 1 ____ Li fi
82____________87
87____________92
92____________97
97__[101.95__102]
102__________107
107__________112
112__________117
[117__117.79]_122
122__________127
127__________132
2
12
11
19
22
19
27
19
13
6
150
Fuente: Elaboracin Propia

102 101.95 = 0.05 y 117.79 117 = 0.79
Si c = 5 entonces:
5 19
0.05 X

1 19 . 0
5
95 . 0
5
19 05 . 0
~ = =

= X

Si c = 5 entonces:
5 19
0.79 X

3 002 . 3
5
01 . 15
5
19 79 . 0
~ = =

= X

Reestructurando la tabla obtenemos:


Tabla No 15
Tabla Recortada para Establecer
Nuevas Frecuencias de Clase
(Escala de Intervalo)

Li 1 ____ Li fi
101.95_______102
102__________107
107__________112
112__________117
117_______ 117.79
1
22
19
27
3
72
Fuente: Elaboracin Propia
Estadstica Educativa
UNS XX

Implica que en el intervalo entre 101.95 y 102 solo existe 1 dato y no 19 como parecera que
fuera y entre 117 y 117.79 existe tan solo 3 datos y no 19 datos.

Verificando el porcentaje del intervalo
| | 79 . 117 95 . 101 s s x
se tendr; si 150 es el 100%
entonces:

150 100%
72 X

% 50 % 48
150
% 200 . 7
150
% 100 72
~ = =

= X


Donde 48% es un valor muy aproximado al 50%.

2. DECILES Y PERCENTILES

Son aquellos que dividen a una cierta distribucin en diez o cien partes iguales. Tales
conceptos reciben, respectivamente, los nombres de deciles y percentiles.

Conviene tener claro que cuando alguno de los valores anteriormente mencionados dejan por
debajo o por encima de ellos los nmeros o porcentajes de casos a los cuales se refiere su
nombre (la cuarta parte del total de los casos o el 25% cuando se trata de los cuartiles, la
decima parte o 10% si se trata de los deciles, as como la primera parte o 1% cuando se trata
con percentiles) no quiere decir que los casos que queden en esas posiciones tengan valores
mayores o menores que la medida de participacin.

As, cuando los casos se ordenan de acuerdo con valores decrecientes, los casos que quedan
por debajo del cuartil, decil, etc., tienen valores menores, pero si la ordenacin es creciente, los
casos debajo de cualquiera de esas medidas tienen valores mayores.

Con relacin a los percentiles, existen numerosos tests de tipo psicolgico o sociolgico cuyos
resultados se expresan en este tipo de medida con la cual se tiene la ventaja de saber la
situacin que tiene cualquier persona respecto de otra que tambin fue sometida a la misma
prueba. Su frmula de cmputo es:
c
f
F
n
L P
j
j
i
(
(
(
(


+ =
1
100
e
e

Caso prctico

Con referencia a los datos sobre coeficiente intelectual CI de 150 estudiantes del ejemplo
planteado, supongamos que Pepe Cortisona se ubica en el percentil 25 y Rumualdo Arpifilo en
el percentil 60. El clculo del percentil 25 es:

Estadstica Educativa
UNS XX

5 . 37
100
3750
100
25
= =
n


puntos
P
29 . 100 29 . 3 97
19
5 . 62
97
5
19
5 . 12
97 5
19
25 5 . 37
97 5
19
25
100
3750
97
25
+ + =
= |
.
|

\
|
+
(


+
(
(
(
(


+ =

Y el clculo del percentil 60 es:
90
100
9000
100
60
= =
n


puntos
P
92 , 112 92 . 0 112
27
25
112 5
27
5
112
5
27
85 90
112 5
27
85
100
) 150 ( 60
112
60
+ + |
.
|

\
|
+ =
=
(


+
(
(
(
(


+ =


Decimos entonces que si Pepe Cortisona estuviese ubicado en el percentil 25 y Rumualdo
Arpifilo en el percentil 60, esas cifras indican que Rumualdo tiene una posicin mejor en la
prueba de CI, pues esta persona sobrepasa por 12.63 es decir (112.92 100.29 = 12.63) de
puntaje en coeficiente intelectual a Pepe Cortisona.

Otra ventaja de los percentiles consiste en permitir la comparacin de resultados obtenidos por
las personas en diversos tests (por ejemplo, comparar los resultados obtenidos de una prueba
de rendimiento escolar en alguna asignatura con aquellos obtenidos en la prueba de CI).

Para cuantificar un decil consideremos tambin los datos sobre coeficiente intelectual CI de 150
estudiantes. As, para una mejor comprensin, computemos el decil sptimo, aplicando la regla:

c
f
F
n
L D
j
j
i
(
(
(
(


+ =
1
10
e
e


Por lo que debemos previamente cuantificar:

105
10
1050
10
) 150 ( 7
10
7
=
n


Estadstica Educativa
UNS XX

Una vez ubicado el valor 105 en la columna de frecuencias absolutas y acumuladas aplicamos
la definicin:

. 70 . 115 70 . 3 112
27
100
112 5
27
20
112
5
27
85 105
112 5
27
85
10
) 150 ( 7
112
7
CI de
D
+ + |
.
|

\
|
+ =
=
(


+
(
(
(
(


+ =


Implica que 7 / 10 partes de una proporcin de 0.7, lo que seala que 7 de 10 personas tienen
un coeficiente intelectual menor o igual a 115.70, y el restante 3 de10 de las personas poseen
un coeficiente intelectual superior a 115.70.

3. ESTADGRAFOS DE DISPERSIN

Tambin denominadas medidas de variabilidad, son un adecuado complemento de una medida
de posicin central en conjuncin con las cuales debe utilizarse, ya que stas ltimas dan una
informacin tan solo acerca de la posicin de la distribucin, pero no proporcionan informacin
acerca de si los datos estn muy agrupados o, por el contrario, muy dispersos en relacin con
dicha medida de posicin central. Las medidas descriptivas de dispersin son: el rango, la
amplitud intercuartlica, la desviacin media, la varianza, la desviacin tpica.

3.1. EL RANGO O RECORRIDO (R)

El rango o recorrido es la diferencia entre el mayor valor y menor valor de la muestra aleatoria,
un rango muy amplio, implica mucha variabilidad en los datos.

Caso prctico

Cuantificando el rango del ejemplo sobre temperaturas registradas en los ltimos 10 das por la
Prof. Dolores Fuertes de Barriga cuyos datos eran: 51, 60, 58, 62, 57, 49, 52, 62, 61 y 63. Se
tiene:
puntos X X R 14 49 63
min max
= = =

Ejercitacin

Con la disposicin de Microsoft Excel la cuantificacin del rango se obtuvo en la tabla
anterior:
Rango 14





Estadstica Educativa
UNS XX

3.2. LA DESVIACIN MEDIA ABSOLUTA (DMA)

Es una forma de medir la dispersin que promedializa los desvos de las observaciones
individuales con referencia a su respectiva media, cuando se mide arriba y debajo de la media,
fija los lmites para aproximadamente el 57% central de la distribucin.

Se define como la suma del valor absoluto de la diferencia entre cada valor del conjunto de
datos respecto de la media del grupo sobre el tamao de la muestra. Desviacin Media
Absoluta en Datos No Agrupados:
n
X X
DMA
n
i
i
=

=
1

Caso prctico

Sigamos con la profesora Dolores Fuertes de Barriga quien desea estimar el promedio en que
se desva las temperaturas respecto de la temperatura media, con sus datos: 51, 60, 58, 62,
57, 49, 52, 62, 61 y 63. Determine la desviacin media en grados Fahrenheit (F).

Como se vio anteriormente se determin que la temperatura promedio era de 57.5 F 58F
por lo que calculando la desviacin media se tiene:
=
+ + + + + + + + +

=

=
10
58 63 58 61 58 62 58 52 58 49 58 57 58 62 58 58 58 60 58 51
1
n
X X
DMA
k
i
i


F 4 1 . 4
10
41
10
5 3 4 6 9 1 4 0 2 7
10
5 3 4 6 9 1 4 0 2 7
~ = =
+ + + + + + + + +
=
+ + + + + + + + +
=


En promedio las temperaturas se desvan 4F por debajo y 4F por encima de la media que es
de 58 F

Disponiendo de la DMA tenemos el intervalo representativo:

] [ DMA x

Por tanto ser:

62 4 58
54 4 58
+ = +
=
DMA x
DMA x


Estadstica Educativa
UNS XX

Que viene a ser:
| | 62 ; 54


Decimos que: Existe una probabilidad del 57% de que un dato de temperatura seleccionado al
azar del conjunto registrado, obtenga una temperatura media entre los lmites
| | 62 ; 54
.
La desviacin media en Datos Agrupados es:
n
f X X
DMA
k
i
i i
=

=
1


La diferencia respecto a la regla anterior para datos no agrupados radica en que la DMA en
datos agrupados es la suma del producto de la frecuencia absoluta por los desvos en valor
absoluto sobre el tamao muestral (cuando se dispone de una muestra).

Caso prctico

Con referencia a los datos sobre coeficiente intelectual CI de 150 estudiantes del ejemplo
anterior, el clculo de la desviacin media viene a ser:

23 . 108
150
16235
= = x


El promedio de CI de los 150 estudiantes de tercer grado es de 108.23 puntos 108 puntos.

Para la desviacin media se requiere de la tabla:


Tabla No 16
Tabla del Producto de Marcas de Clase con los Desvos en
Valor Absoluto

L i 1 __ L i Xi fi Ix i -
x
I fi


82___86
87___91
92___96
97___101
102__106
107__111
112__116
117__121
122__126
127__131
84
89
94
99
104
109
114
119
124
129
2
12
11
19
22
19
27
19
13
6
48
228
154
171
88
19
162
209
208
126
150 1413
Fuente: Elaboracin Propia

Estadstica Educativa
UNS XX

9 42 . 9
150
1413
1
~ =

=

=
n
f X X
DMA
k
i
i i


Podemos decir que, en promedio los puntajes de CI difieren en 9 puntos respecto de la media o
promedio normal de 108 de CI en cualquier direccin.

Disponiendo de la DMA tenemos el intervalo representativo:

] [ DMA x

Por tanto ser:

23 . 117 9 23 , 108
23 , 99 9 23 , 108
+ = +
=
DMA x
DMA x

Que viene a ser:
| | 23 , 117 ; 23 , 99


Existe una probabilidad del 57% de que los puntajes de coeficiente CI, estn entre los lmites
| | 23 , 117 ; 23 , 99
siendo el promedio regular de CI de 108.23.

Para verificar que el 57% de las observaciones se encuentra en el intervalo anterior,
se proceder con operaciones similares al caso del intervalo semi intercuartil.

3.3. LA VARIANZA (S
2
) Y DESVIACIN ESTNDAR (S)

La varianza, es la media aritmtica de las desviaciones cuadrticas por lo que es una medida
de dispersin, variabilidad o concentracin de la informacin alrededor de la media
x
. La
varianza es pequea si la informacin se encuentra concentrada alrededor de
x
y si la varianza
crece, la informacin se aleja de la media
x
. As, la varianza sirve para examinar la precisin de
un estadstico, el cual cambia de muestra en muestra.

Existen dos reglas para su respectiva obtencin (por definicin y por clculo) las cuales son las
siguientes:

Varianza por definicin; simple o para datos no agrupados:

( )
n
x x
S
n
i
i
x

=

=
1
2
2


Estadstica Educativa
UNS XX

La cual indica, que deben lograrse las diferencias entre cada uno de los valores individuales de
la variable del caso, y la respectiva media aritmtica, elevar cada una de stas diferencias al
cuadrado, sumarlas y dividir la suma total as obtenida por el nmero de casos.

Varianza por clculo; simple o para datos no agrupados:

(
(
(
(
(

|
|
.
|

\
|
=


=
=
2
1
1
2 2
1
n
i
n
i
i
i x
n
x
x
n
S


Existe otro concepto muy emparentado al de la varianza denominado cuasivarianza del cual
hablaremos algo ms adelante, ste concepto es aplicado con muestras pequeas n < 30, y es
un buen estimador de la varianza poblacional ya que dispone de los denominados grados de
libertad (n 1), en cambio regularmente se aplica la varianza anterior con muestras grandes
n > 30. Las frmulas de cmputo para datos no agrupados por definicin y clculo son:

Formula por definicin para datos no agrupados
( )
1
1
2
2

=

=
n
x x
S
n
i
i
x


Observe el denominador el cual esta dividido entre (n 1) en lugar de n tan solamente, ello
implica que la coasivarianza es mayor a la varianza regular.

Formula por clculo para datos no agrupados
(
(
(
(
(

|
|
.
|

\
|

=


=
=
2
1
1
2 2
1
1
n
i
n
i
i
i x
n
x
x
n
S


La desviacin estndar, es el promedio de desviacin de las puntuaciones o informacin con
respecto a la media. Sirve para medir la volatilidad de la variable. Su regla de cmputo es:
2
x x
S S =


Esto es la raz cuadrada positiva de la varianza.

Las unidades de medida de la varianza no son comparables a las de la variable en
consideracin, ya que se utilizan en su clculo los cuadrados de sus valores
Estadstica Educativa
UNS XX

numricos. Por ende, si la desviacin tpica es la raz cuadrada de la varianza, sta
mide en las mismas unidades que la variable que se analiza.

La varianza y la desviacin estndar a menudo se emplean en la estadstica inferencial,
contrario a la desviacin media, que se usa principalmente en estadstica descriptiva, donde el
inters principal est en describir las caractersticas de un conjunto dado de datos.

Caso prctico

Respecto a la profesora Dolores Fuertes de Barriga quien desea estimar la dispersin de la
informacin de las temperaturas respecto de la temperatura promedio, con sus datos: 51, 60,
58, 62, 57, 49, 52, 62, 61 y 63. Determine la varianza y desviacin estndar en grados
Fahrenheit (F).

Anteriormente se determin que la temperatura promedio era de 57.5 F, y como es una
muestra pequea (n <30) es menester computar la coasivarianza y no as la varianza, por lo
que se tiene:
( )
1
1
2
2

=

=
n
x x
S
n
i
i
x

=
+ + + +
+ + + + +
=
9
) 5 . 57 63 ( ) 5 . 57 61 ( ) 5 . 57 62 ( ) 5 . 57 52 ( ) 5 . 57 49 (
) 5 . 57 57 ( ) 5 . 57 62 ( ) 5 . 57 58 ( ) 5 . 57 60 ( ) 5 . 57 51 (
2 2 2 2 2
2 2 2 2 2
2
x
S

=
+ + + + + + + + +

+ +
+ + + + + + + +
=
9
25 . 30 25 . 12 25 . 20 25 . 30 25 . 72 25 . 0 25 . 20 25 . 0 25 . 6 25 . 42
9
) 5 . 5 ( ) 5 . 3 (
) 5 . 4 ( ) 5 . 5 ( ) 5 . 8 ( ) 5 . 0 ( ) 5 . 4 ( ) 5 . 0 ( ) 5 . 2 ( ) 5 . 6 (
2 2
2 2 2 2 2 2 2 2
2
x
S
2 2
05 . 26
9
5 . 234
F S
x
=

Computamos la desviacin estndar:

F S S
x x
10 . 5 05 . 26
2
= =


El clculo anterior manifiesta que las temperaturas oscilaron en 5F de diferencia alrededor del
promedio 58 F

El intervalo representativo en el que se encuentra la media
| |
x x
S x S x + ;
est entre 5 F
por debajo y 5 F por encima:

Estadstica Educativa
UNS XX

Por tanto ser:

63 5 58
53 5 58
+ = +
=
x
x
S x
S x


Que viene a ser:
| | 63 ; 53


Suponiendo que las temperaturas estn normalmente distribuidas podemos mencionar que:
Entre los lmites
| | 63 ; 53
estarn aproximadamente el 68,2% de los datos de temperaturas.

Computando el intervalo representativo para dos desviaciones tpicas
| |
x x
S x S x 2 ; 2 +
se
tiene:
68 10 58 ) 5 ( 2 58 2
48 10 58 ) 5 ( 2 58 2
= + + = +
= =
x
x
S x
S x


Que viene a constituir:
| | 68 ; 48

Suponiendo que las temperaturas estn normalmente distribuidas podemos mencionar que:
Entre los lmites
| | 68 ; 48
estarn aproximadamente el 95% de los datos de temperaturas.

Ejercitacin

Si queremos cuantificar la varianza del ejemplo presentado, primeramente debemos calcular la
temperatura media de los 10 das muestreados, de la forma explicada al definir la Media
Aritmtica. Esta es de 57.5 F.

Para realizar el clculo de la varianza de sta muestra, en primer lugar, debemos tener
acomodados los datos en una fila del Microsoft Excel (Ya los deberamos tener as para
poder calcular la Media). Luego, debemos posicionarnos en una celda vaca de la misma hoja
en la que tenemos los datos y escribir:
= var (..)

Donde figuran los puntos suspensivos, debemos escribir cules son las celdas que contienen
los datos. Si, por ejemplo, comenzamos la columna de la siguiente manera:

A
1 Temperatura
2 51
3 60
4 58
5 62
Estadstica Educativa
UNS XX

Lo que debemos escribir en la celda en la que queremos obtener el resultado, es:

= var (A2:A11)

Luego de apretar Enter, sabremos cul es la varianza de esta muestra. Ella es de 26.055556.

Continuando con la ejercitacin que venimos realizando, presentaremos los pasos a seguir para
calcular la varianza de un conjunto de datos.

Si reiteramos los pasos desarrollados para encontrar la media de las temperaturas, solo
debemos observar otra de las filas de resultados.

El cuadro que aparece con los resultados de la Estadstica Descriptiva, es el siguiente:

Temperatura
Media 57,5
Error tpico 1,61417334
Mediana 59
Moda 62
Desviacin estndar 5,10446428
Varianza de la
muestra
26,0555556
Curtosis -1,17438091
Coeficiente de
asimetra
-0,6766935
Rango 14
Mnimo 49
Mximo 63
Suma 575
Cuenta 10


La lnea con resultados que nos interesa en este caso es la sexta, en la que se presenta la
varianza de la muestra:
Varianza de la
muestra 26,0555556


Si cuantificamos el Desvo (Desviacin estndar) para el ejemplo presentado junto con el
concepto de varianza, lo que debemos escribir en la celda a obtener el resultado es:

= DESVEST (A2:A11)

El resultado que obtendremos, en este caso, es de 5.10446428. Esto manifiesta como se dijo
que los datos se desvan del valor de la media en 5.10446428 F (en ms y menos). Si el lector
observa lo obtenido mediante frmula Es exactamente lo mismo!.

Estadstica Educativa
UNS XX

Si deseamos conocer la Desviacin Tpica de la muestra de las temperaturas en F, podemos
observarlo en el cuadro que nos otorga la funcin Estadstica Descriptiva del men Anlisis de
Datos:

En este caso, debemos observar la quinta fila que contiene resultados:

Desviacin estndar 5,10446428

Como se sabe, este resultado es la raz cuadrada positiva de la Varianza de la muestra que
obtuvimos en el punto anterior. Ahora veamos la varianza por definicin para datos agrupados:

( )
n
x x f
S
k
j
j j
x

=

=
1
2
2

Varianza por clculo para datos agrupados:

(
(
(
(
(

|
|
.
|

\
|
=


=
=
2
1
1
2 2
1
k
j
k
i
i i
j j x
n
x f
x f
n
S

Caso prctico

Con referencia a los datos sobre CI (coeficiente de Inteligencia) computaremos la varianza por
definicin para datos agrupados como sigue:


Tabla No 17
Tabla del Producto de Marcas de Clase con la Sumatoria de los
Desvos al Cuadrado
(En escala de Intervalo)

L i -1 __ L i x i f i x i f i (x i -
x
) (x i -
x
)
2
f
82___86
87___91
92___96
97__101
102__106
107__111
112__116
117__121
122__126
127__131
84
89
94
99
104
109
114
119
124
129
2
12
11
19
22
19
27
19
13
6
168
1068
1034
1881
2288
2071
3078
2261
1612
774
587.09
369.79
202.49
85.19
17.89
0.59
33.29
115.99
248.69
431.39
1174.18
4437.48
2227.39
1618.61
393.58
11.21
898.83
2203.81
3232.97
2588.34
150 16235 18786.4
Fuente: Elaboracin Propia

Estadstica Educativa
UNS XX

Computando el promedio de coeficiente intelectual.

23 . 108
150
16235
= = x


El promedio de CI de los 150 estudiantes de tercer grado es de 108.23 puntos.

Entonces la varianza por definicin es:

( )
2
1
2
2
24 . 125
150
4 . 18786
CI
n
x x f
S
k
j
j j
x
=

=

=


Como se dijo anteriormente un concepto muy importante de varianza utilizado sobre
todo en inferencia estadstica, es la denominada Coasivarianza, donde en lugar de
disponer en el denominador del tamao de la muestra, disponemos de los
grados de libertad (n 1). Su regla de obtencin para datos agrupados es la
siguiente:
( )
) 1 (
2
1 * 2

=

=
n
x x f
S
k
j
j j
x


Con relacin al ejemplo anterior la coasivarianza es:

2 2
08 . 126
1 150
4 . 18786
CI S
x
=

=


Al mismo tiempo la coasivarianza (casi varianza); es mucho ms amplia que la
varianza, y por ende es un mejor estimador de la varianza poblacional. Empero se
puede estimar la varianza de la poblacin (
2
) disponiendo de la varianza de la
muestra:
s
x
S
n
n
1
2

= o

Donde:

2
x
S
= Varianza de la muestra (por definicin o clculo).

Con relacin al ejemplo anterior la varianza poblacional es:

( ) ( ) ( ) 08 . 126 24 . 125 0067 . 1 24 . 125
1 150
150
2
= =

=
x
o

Estadstica Educativa
UNS XX

Como se puede apreciar este indicador es similar a la coasivarianza por lo que mejor sera
disponer de la misma.

Ahora computemos tambin la desviacin tpica para datos agrupados en funcin a la varianza
o coasivarianza respectivamente.

CI S S
x x
11 19 . 11 24 . 125
2
~ = =


El cmputo anterior manifiesta que los puntajes de CI oscilaron en 11 puntos de diferencia
alrededor del promedio 108.23 de CI.

Con referencia a la coasivarianza ser:

CI S S
x x
11 23 . 11 08 . 126
2
~ = =


Tambin el cmputo anterior con referencia a la coasivarianza manifiesta que los puntajes de
CI oscilaron en 11 puntos de diferencia alrededor del promedio 108.23 de CI.

Ahora, disponiendo de la desviacin tpica construiremos el intervalo representativo que
contendr al 68,2% de la informacin sobre el coeficiente intelectual.
] [
x
S x

Por tanto ser:

CI de S x
CI de S x
x
x
23 . 119 11 23 , 108
23 . 97 11 23 , 108
+ = +
=

Que viene a ser:
| | 23 , 119 ; 23 , 97


Existe una probabilidad del 68.2% de que los puntajes de coeficiente CI, estn entre los lmites
| | 23 , 119 ; 23 , 97
siendo el promedio regular de CI de 108.23. Esto desde luego implica que 102
(0.682 x 150) puntajes de CI estn en dicho intervalo. Qu opina el lector?.

Para verificar sta aseveracin de que el 68.2% 102 de CI de las observaciones se encuentra
en el intervalo construido, se proceder con la regla de tres simple como en el caso semi
intercuartil. Entonces:







Estadstica Educativa
UNS XX


Tabla No 18
Puntos de Corte en Tabla para
Desviacin Tpica
(Escala de Intervalo)

Li 1 ____ Li Fi
82____________87
87____________92
92____________97
97__[97.23___102]
102__________107
107__________112
112__________117
[117__119.23]_122
122__________127
127__________132
2
12
11
19
22
19
27
19
13
6
150
Fuente: Elaboracin Propia

102 97.23 = 4.77 y 119.23 117 = 2.23

Si c = 5 entonces:
5 19
4.77 X

19 13 . 18
5
63 . 90
5
19 77 . 4
~ = =

= X

Si c = 5 entonces:
5 19
2.23 X

9 47 . 8
5
37 . 42
5
19 23 . 2
~ = =

= X



Tabla No 19
Tabla Recortada para Establecer
Nuevas Frecuencias de Clase
(Escala de Intervalo)

Li 1 ____ Li Fi
97.23_________102
102__________107
107__________112
112__________117
117_______ 119.23
19
22
19
27
9
96
Fuente: Elaboracin Propia
Estadstica Educativa
UNS XX

Implica que en el recorrido entre 97.23 y 119.23 existen tan solo 96 datos y no 106
observaciones como parece que fuera.

Entonces
% 64 100 64 . 0 100
150
96
=
que se aproxima aunque con cierta diferencia al 68.2%.



PARA RECORDAR

Los principales puntos de ste tema son los ndices de localizacin y estadsticos de
variabilidad o dispersin. Por tanto; es menester sintetizarlos en los siguientes aspectos
puntuales:

1. Los cuartiles son los percentiles 25, 50 y 75; es decir, dividen los datos en cuatro
partes iguales.
2. La Amplitud Intercuartlica es una medida de dispersin que concentra al 50% de los
datos cuando se la utiliza conjuntamente la mediana.
3. Los deciles y percentiles son aquellos que dividen a los datos en diez y cien partes
iguales respectivamente.
4. La Desviacin Media Absoluta es el promedio de los desvos en valor absoluto, cuando
se mide arriba y debajo de la media fija los lmites para aproximadamente el 57%
central de la distribucin.
5. La varianza, es la media aritmtica de las desviaciones cuadrticas y sirve para
examinar la precisin de un estadstico.
6. La cuasivarianza es un concepto que se aplica con muestras pequeas y sirve para
estimar el parmetro varianza poblacional.
7. La desviacin estndar o desviacin tpica, es el promedio de desviacin de las
puntuaciones o informacin con respecto a la media, sirve para medir la volatilidad de la
variable ya que concentra aproximadamente el 68,2% de los datos.
















Estadstica Educativa
UNS XX

Reflexiona Sobre el Tema:

1. De lo recientemente tratado. Qu podemos hacer con nuestros datos usando los
cuartiles, deciles y percentiles?

..

2. Para qu sirven la varianza y coasivarianza respectivamente?

..

3. Mencione la diferencia que existe entre la desviacin tpica o estndar y la
desviacin media absoluta.

..








Estadstica Educativa
UNS XX











1) Con la media aritmtica de las calificaciones en Matemtica calculada anteriormente
mediante la distribucin en intervalos de clase, cuantifica:

a. La varianza muestral para medir la precisin de los datos.
b. La desviacin tpica o desviacin estndar para medir la volatilidad de la variable.
c. Construye el intervalo representativo para las calificaciones e interpreta el
resultado.
d. Qu porcentaje se encuentra en el intervalo representativo armado mediante la
desviacin tpica (comprubalo usando la distribucin de intervalos de clase)
e. Verifica con Microfost Excel tus resultados sobre la varianza y la desviacin
tpica.
f. Calcula la desviacin media de los mismos datos y luego construye su intervalo
representativo.
g. Verifica con Microfost Excel tu resultado sobre la desviacin media.
h. Qu porcentaje se encuentra en el intervalo representativo armado mediante la
desviacin media (comprubalo usando la distribucin de intervalos de clase)

2) Recolecte aleatoriamente informacin real acerca de los salarios mensuales de 50
maestros y tablelos en una distribucin discreta. Luego:

a. Cuantifica los tres cuartiles.
b. Cuantifica la amplitud intercuartil y la amplitud semi intercuartil.
c. Cuantifica el quinto decil.
d. Cuantifica el 25 percentil, 50 percentil y 75 percentil.
e. Construye el intervalo representativo utilizando la desviacin tpica para el 68%
de los salarios de los maestros.





A C T I V I D A D E S

Si bien los estadsticos de tendencia central dan una nocin sobre el centro del
histograma, no nos dicen nada en absoluto sobre la variabilidad de los datos, para
ello debemos recurrir forzosamente a los estadsticos de localizacin y dispersin.

Estadstica Educativa
UNS XX

Tema No 4

ESTADSTICOS DE FORMA Y
ESTADSTICOS DE CONCENTRACIN

Conocer el comportamiento o forma de la distribucin es importante, por este hecho, que se
analiza y estudia la asimetra y curtosis o apuntamiento.

1. COEFICIENTE DE ASIMETRA (as)

El coeficiente de asimetra, posibilita determinar la deformacin horizontal de una forma
funcional (curva de frecuencias), la cual representa a una distribucin. As en datos no
agrupados o simples tenemos la definicin:
3
1
3
) (
S
n
x x
as
n
i
i
=

=


En datos agrupados en intervalos de clase o distribucin discreta tendremos la definicin:
3
1
3
) (
S
n
f x x
as
n
i
i i
=

=


En ambas frmulas el denominador es la tercera potencia de la desviacin tpica, adems,
como el exponente es impar, conserva el signo de las diferencias que en l intervienen, por
ende los coeficientes de asimetra son:

as > 0 La distribucin tiene asimetra positiva o asimtrica hacia la derecha.
as = 0 La distribucin es simtrica.
as < 0 La distribucin tiene asimetra negativa o asimtrica hacia la izquierda.

2. COEFICIENTE DE CURTOSIS O APUNTAMIENTO (k)

Es una medida de la deformacin vertical de una distribucin de frecuencias, por lo que es un
indicador del peso que en la distribucin tienen los valores ms alejados del centro, en datos no
agrupados se define:
Estadstica Educativa
UNS XX

4
1
4
) (
S
n
x x
k
n
i
i
=

=


As como en datos agrupados se la define como:
4
1
4
) (
S
n
f x x
k
n
i
i i
=

=


En ambas frmulas el denominador es la cuarta potencia de la desviacin tpica. Los
coeficientes de curtosis son:

k > 3 La distribucin es ms apuntada y recibe el nombre de leptocrtica.
k = 3 La distribucin es moderadamente apuntada y se denomina mesocrtica.
k < 3 La distribucin es menos apuntada y se denomina platicrtica.

As, un coeficiente de curtosis positivo indica que la curva es ms apuntada que la de una
Normal teniendo en consecuencia menos dispersin que dicha distribucin; tal distribucin se
denomina leptocrtica o apuntada. Lo contrario ocurre cuando el coeficiente de curtosis es
negativo, siendo ms dispersa y denominndose entonces platicrtica o aplastada.

Caso prctico

A propsito de nuestro ya conocido ejemplo sobre temperaturas cuantificadas por la prof.
Dolores Fuertes de Barriga, computemos pues los coeficientes de asimetra y apuntamiento
manualmente:
3
1
3
) (
S
n
x x
as
n
i
i
=

=

Apliquemos la frmula:

=
+ + + +
+ + + + +
=
10
) 5 . 57 63 ( ) 5 . 57 61 ( ) 5 . 57 62 ( ) 5 . 57 52 ( ) 5 . 57 49 (
) 5 . 57 57 ( ) 5 . 57 62 ( ) 5 . 57 58 ( ) 5 . 57 60 ( ) 5 . 57 51 (
3 3 3 3 3
3 3 3 3 3
3
x
S

Estadstica Educativa
UNS XX

=
+ + + + + +

+ +
+ + + + + + + +
=
10
38 . 166 88 . 42 12 . 91 38 . 166 12 . 614 12 . 0 12 . 91 12 . 0 62 . 15 62 . 274
10
) 5 . 5 ( ) 5 . 3 (
) 5 . 4 ( ) 5 . 5 ( ) 5 . 8 ( ) 5 . 0 ( ) 5 . 4 ( ) 5 . 0 ( ) 5 . 2 ( ) 5 . 6 (
3 3
3 3 3 3 3 3 3 3
2
x
S
3 3
75 . 9
10
75 . 98
F S
x

=


Dividiendo ste momento de orden tres respecto a la tercera de la desviacin tpica obtenemos:

07 . 0
65 . 132
75 . 9
) 10 . 5 (
75 . 9
) (
3 3
1
3
=

=
S
n
x x
as
n
i
i


Implica que la distribucin es asimtrica negativa, es decir tiene una deformacin horizontal
hacia la izquierda.

El coeficiente de curtosis (k) es obtenido de la siguiente manera:

=
+ + + +
+ + + + +
=
10
) 5 . 57 63 ( ) 5 . 57 61 ( ) 5 . 57 62 ( ) 5 . 57 52 ( ) 5 . 57 49 (
) 5 . 57 57 ( ) 5 . 57 62 ( ) 5 . 57 58 ( ) 5 . 57 60 ( ) 5 . 57 51 (
4 4 4 4 4
4 4 4 4 4
4
x
S

=
+ + + + + + + + +

+ +
+ + + + + + + +
=
10
06 . 915 06 . 150 06 . 410 06 . 915 06 . 5220 06 . 0 06 . 410 06 . 0 06 . 39 06 . 1785
10
) 5 . 5 ( ) 5 . 3 (
) 5 . 4 ( ) 5 . 5 ( ) 5 . 8 ( ) 5 . 0 ( ) 5 . 4 ( ) 5 . 0 ( ) 5 . 2 ( ) 5 . 6 (
4 4
4 4 4 4 4 4 4 4
4
x
S
4 4
46 . 984
10
6 . 9844
F S
x
=


Apliquemos ahora la formula del coeficiente de curtosis no sin antes elevar a la cuarta potencia
la desviacin tpica:
45 . 1
52 . 676
46 . 984
) 1 . 5 (
46 . 984
) (
4 4
1
4
=

=
S
n
x x
k
n
i
i


Como k < 3 la distribucin se denomina platicrtica.
Estadstica Educativa
UNS XX

Ejercitacin

Podemos cuantificar el Coeficiente de Asimetra del ejemplo presentado, junto con la definicin
de curtosis. En el mismo se presentaban las temperaturas de los ltimos 10 das observados
por la prof. Dolores Fuertes de Barriga. Para ello, podemos hacer uso de la siguiente funcin,
disponible en Microsoft Excel:

= COEFICIENTE . ASIMETRIA (..)

Donde figuran los puntos suspensivos, debemos incorporar los datos que indican en qu celdas
de la hoja de Microsoft Excel est incorporada la matriz de datos.

En este caso concreto, el Coeficiente de Asimetra es 0.6766935, lo que significa que la
distribucin de datos es Asimtrica Negativa. Si usted ve los datos del mismo coeficiente
cuantificados manualmente, se dar cuenta que nuestro coeficiente es 0.07 ya que
disponemos de otra formula distinta a Microsoft Excel; no obstante, nos muestra que es
asimtrica negativa.

Podemos tambin analizar el caso de la Curtosis de un grupo de datos muestrales, que indican
la temperatura de los ltimos 10 das, para lo cual deben incorporarse los valores muestrales
observados de la temperatura, como en el siguiente cuadro:

A
1 Temperatura
2 51
3 60
4 58
5 62

Para conocer la Curtosis de stos valores, podemos disponer de la siguiente funcin:

= CURTOSIS(..)

Donde figuran los puntos suspensivos, debemos informar cul es la matriz que contiene los
datos muestrales. Al oprimir la tecla Enter; conocemos que la Curtosis de este ejemplo es de
1. 17438091. Esto implica que la distribucin de este ejercicio es Platicrtica. Si usted ve los
datos del mismo coeficiente cuantificados manualmente, se dar cuenta que nuestro coeficiente
es k = 1.45 ya que disponemos de otra formula distinta a Microsoft Excel; no obstante, nos
asevera el mismo resultado.

Al igual que antes, la Curtosis y el Coeficiente de Asimetra se pueden conocer observando el
cuadro que arroja la herramienta Estadstica Descriptiva:




Estadstica Educativa
UNS XX

Temperatura
Media 57,5
Error tpico 1,61417334
Mediana 59
Moda 62
Desviacin estndar 5,10446428
Varianza de la
muestra
26,0555556
Curtosis -1,17438091
Coeficiente de
asimetra
-0,6766935
Rango 14
Mnimo 49
Mximo 63
Suma 575
Cuenta 10

En este caso, debemos prestar atencin sobre la septima y octava lnea de resultados:

Curtosis -1,17438091
Coeficiente de asimetra -0,6766935

La curva que podemos construir con los datos de ste ejercicio, es Asimtrica Negativa y
Platicrtica.

En caso de contar con datos agrupados de acuerdo a una distribucin discreta podemos
considerar el siguiente ejemplo:

En la Materia Didctica General, 18 estudiantes obtuvieron los siguientes puntajes en su primer
parcial: 13, 14, 13, 14, 15, 14, 17, 14, 12, 13, 14, 14, 11, 13, 14, 9, 14 y 9. Empero, el docente
Prof. Lindo Len consider que estos puntajes eran nfimos tomando en cuenta que el primer
parcial tena una ponderacin de 20 puntos, por lo que decidi transformarlos en calificaciones
realizando una curva en base al mayor puntaje que es de 17 puntos.

Para ello dispuso de la siguiente regla de transformacin:

1 +

=
N
V P
C

Donde:

C = Calificacin.
P = Puntaje obtenido por el estudiante.
V = Valor de la escala de calificaciones.
N = Nmero de caso o puntaje mayor obtenido.


Estadstica Educativa
UNS XX

Nuestros datos en el ejemplo son:

N = El mayor puntaje obtenido por un estudiante fue 17
V = 19 ya que V + 1 = 19 + 1 = 20 que es la ponderacin del primer parcial.

Por tanto procedemos de la manera siguiente:

11 06 . 11 1
17
19 9
13 29 . 13 1
17
19 11
14 41 . 14 1
17
19 12
20 1
17
19 17
18 76 . 17 1
17
19 15
17 65 . 16 1
17
19 14
15 53 . 15 1
17
19 13
1
6
5
4
3
2
1
= +

=
= +

=
= +

=
= +

=
= +

=
= +

=
= +

=
C
C
C
C
C
C
C


Se puede apreciar que el mayor puntaje obtenido utilizando el proceso adquiere una calificacin
de 20, y los dems se incrementan en promedio 2 puntos. Ahora procedamos a su tabulacin:


Tabla No 20
Distribucin de Frecuencias para Coeficiente de Asimetra y Curtosis
De Calificaciones en Didctica General

Puntaje
Obtenido
Calif. Por
Redondeo
Calif.
final
Xi

fi

Xi f i

x x
i



2
) ( x x f
i i



3
) ( x x f
i i



4
) ( x x f
i i


9
11
12
13
14
15
17
11.06
13.29
14.41
15.53
16.65
17.76
20.00
11
13
14
16
17
18
20
2
1
1
4
8
1
1
22
13
14
64
136
18
20
- 5
- 3
- 2
0
1
2
4
50
9
4
0
8
4
16
- 250
- 27
- 8
0
8
8
64
1250
81
16
0
8
16
256
18 287 91 - 205 1627
Fuente: Elaboracin Propia en base a calificaciones de 18 estudiantes en Didctica General



Estadstica Educativa
UNS XX

Su media y varianza sern:

puntos
n
f x
x
i i
16 94 . 15
18
287
~ = =



2
2
2
05 . 5
18
91
) (
pts
n
f x x
S
i i
x
=



Su desviacin tpica por tanto es:
puntos S S
x z
25 . 2 05 . 5
2
= =


Por lo que su coeficiente de asimetra es:

1
39 . 11
39 . 11
) 25 . 2 (
18
205
) (
3 3
1
3
=

=
S
n
x x f
as
n
i
i i


Ya que 1 < 0 decimos que la distribucin de frecuencias representada por la curva de
frecuencias es asimtrica negativa, es decir, posee una leve deformacin horizontal hacia la
izquierda.

Ahora palpemos su coeficiente de curtosis o apuntamiento:

53 . 3
63 . 25
39 . 90
) 25 . 2 (
18
1627
) (
4 4
1
4

=
S
n
f x x
k
n
i
i i


Ya que 3.53 > 3 decimos que la distribucin de frecuencias representada por la curva de
frecuencias es apuntada o leptocrtica, vale decir, es de mnima varianza (5.05), la cual nos
proveera en el caso de realizar una inferencia de estimadores eficientes.

3. COEFICIENTE DE VARIACIN

En algunas oportunidades la comparacin se hace con referencia a caractersticas o variables
diferentes que se dan en las personas de un mismo grupo, medidas en unidades diferentes.
As, si se quisiera saber qu vara ms en los estudiantes de una clase, si sus edades (medidas
en aos cumplidos) o sus rendimientos en una prueba de lectura, entonces la respuesta debe
buscarse con el uso del denominado coeficiente de variacin que posee sta definicin:
Estadstica Educativa
UNS XX

100 =
x
S
CV
x

La cifra 100 posibilita expresar el resultado en porcentaje (%).


Si CV < 50% Entonces la variable es homognea.
Si CV > 50% Entonces la variable es heterognea.

Caso prctico

Un anlisis histrico elaborado por Rosa Flores permiti desarrollar un modelo correlacionando
las variables Tasa de Mortalidad (TM), Ingresos Familiares (IF) y tasa de analfabetismo
(TA), estableciendo la siguiente expresin funcional:

TA IF TM 2 . 0 032 . 0 24 + =


Determinar la tasa de mortalidad para los aos 2007, 2008, 2009, 2010 y 2011 dada la
proyeccin de la variable ingresos familiares y tasa de analfabetismo:

Ao 2007: IF = 570 TA = 42%
Ao 2008: IF = 630 TA = 30%
Ao 2009: IF = 701 TA = 28%
Ao 2010: IF = 856 TA = 17%
Ao 2011: IF = 900 TA = 12%

Y luego determine el coeficiente de variacin para la tasa de mortalidad verificando si es
homognea o no.

78 . 4 024 . 0 8 . 28 24 ) 12 . 0 ( 2 . 0 ) 900 ( 032 . 0 24
35 . 3 034 . 0 39 . 27 24 ) 17 . 0 ( 2 . 0 ) 856 ( 032 . 0 24
63 . 1 056 . 0 43 . 22 24 ) 28 . 0 ( 2 . 0 ) 701 ( 032 . 0 24
90 . 3 06 . 0 16 . 20 24 ) 30 . 0 ( 2 . 0 ) 630 ( 032 . 0 24
84 . 5 084 . 0 24 . 18 24 ) 42 . 0 ( 2 . 0 ) 570 ( 032 . 0 24
2011
2010
2009
2008
2007
= + + =
= + + =
= + + =
= + + =
= + + =
TM
TM
TM
TM
TM


La media de la tasa de mortalidad viene a ser:

0065 . 0
5
0324 . 0
5
0478 . 0 0335 . 0 0163 . 0 039 . 0 0584 . 0
=

+ +
=

n
x
x
i



Estadstica Educativa
UNS XX

Su varianza y desviacin tpica ser:
(
(
(
(
(

=


=
=
n
i
n
i
i
i x
n
x
x
n
S
1
2
1 2 2
1
1

0021 . 0 ) 0084 . 0 ( 25 . 0 ) 00021 . 0 00856 . 0 ( 25 . 0
5
00105 . 0
0023 . 0 0011 . 0 00026 . 0 0015 . 0 0034 . 0
4
1
5
) 0324 . 0 (
) 0478 . 0 ( ) 0335 . 0 ( ) 0163 . 0 ( ) 039 . 0 ( ) 0584 . 0 (
1 5
1
2
2 2 2 2 2 2
= =

+ + + + =
(

+ + + +

=
x
S


Si la varianza es 0.0021 la desviacin tpica es:

046 . 0 0021 . 0 =
x
S


Por tanto el coeficiente de variacin:

% 708 100 08 . 7 100
0065 . 0
046 . 0
100 = =
x
S
CV
x

Entonces podramos decir que existe una gran variacin en la tasa de mortalidad, porque CV es
absolutamente mayor al 50%, lo que implica heterogeneidad absoluta.

4. ESTADSTICOS DE CONCENTRACIN

El concepto de concentracin sirve para medir el grado de desigualdad (concentracin) de
cualquier distribucin. Su definicin matemtica es:

=

=
1
1
1
1
) (
n
i
i
n
i
i i
p
q p
G


Este ndice est comprendido entre 0 y 1; pues mide la concentracin a travs de diferencias
entre p
i
y la q
i
solo hasta n 1 porque siempre p
n
q
n
= 100% - 100% = 0.

Cuando la concentracin es mxima, entonces a p
1
corresponde un q
1
= 0 a p
2
un q
2
= 0,
., de tal forma que el ndice de Gini es igual a uno.

Si la concentracin es mnima, entonces a p
1
corresponde un q
1
igual, a p
2
= q
2
, ., de tal
forma que el ndice de Gini es igual a cero, debido a que el numerador es nulo.

Estadstica Educativa
UNS XX

4.1. CURVA DE LORENZ

Es una curva muy valiosa para expresar fenmenos de concentracin de cualquier variable, se
la construye de la forma siguiente:
a) Se traza un cuadrado con sus ejes de coordenadas divididas en escalas iguales del 0 al
100%.
b) En los ejes de coordenadas cartesianas se ubican los porcentajes acumulados o
agregados de ambas variables.
c) En el cuadrado se traza una diagonal que lo divide exactamente por la mitad.
d) La curva de concentracin representa a q
i
en funcin de p
i
, donde q
i
es siempre inferior
a p
i
. (en una distribucin con perfecta equidad la curva coincide con la diagonal).

Caso prctico.
La administrativa sra. Zoila Vaca de Toro, sumariz los datos sobre salarios de 26 trabajadores
del rea rural esquematizndolos de la siguiente manera:
Salarios Casos
100___139 3
140___179 5
180___219 4
220___259 6
260___299 5
300___340 3
Se le exige a Zoila Vaca de Toro:
a) Obtener la masa salarial.
b) El porcentaje de masa salarial.
c) El porcentaje acumulado de trabajadores (casos) (p
i
,).
d) El porcentaje acumulado de masa salarial (q
i
,).
e) Representar mediante una curva de Lorenz la concentracin de los salarios.
f) Encontrar la proporcin que provee el ndice de Gini


Tabla No. 21
Distribucin De La Masa Salarial Y
Porcentaje Por Trabajador
(En Bolivianos)

Salarios Xi Trab. % de
Trab.
Masa
Salarial
% de
Sal.
pi qi
100_139
140_179
180_219
220_259
260_299
300_340
119.5
159.5
199.5
239.5
279.5
320.0
3
5
4
6
5
3
12
19
15
23
19
12
358.5
797.5
798.0
1437.0
1397.5
960.0
6.24
13.87
13.88
25.00
24.31
16.70
12
31
46
69
88
100
6.24
20.10
33.98
58.98
83.29
100
Total 26 100 5748.5 100
Fuente: Elaboracin propia.
Estadstica Educativa
UNS XX

La masa salarial, implica que la mayor cantidad de dinero (Bs. 1437) se concentran en seis
personas que ganan entre 220 y 259 bolivianos.

e) La representacin grfica mediante la curva de Lorenz es,

CURVA DE LORENZ
100

83.29


58.98



A
33.98

20.10

6.23

12 31 46 69 88 100
Equidad o desequitatividad en la distribucin del ingreso

f) El ndice de Gini puede ser cuantificado a travs de la tabla reestructurada.


Tabla No. 22
Porcentajes Acumulados
(En Porcentaje)

pi qi pi qi pi
12
31
46
69
88
6.23
20.10
33.98
58.98
83.29
5.77
10.9
12.02
10.02
4.71
12
31
46
69
88
43.42 246
Fuente: Elaboracin propia.

La tabla No. 22, expresa que la diferencia entre el porcentaje agregado de trabajadores y
salarios es convergente conforme se acumulan los datos. Entonces, existe una relativa equidad
en la distribucin de la masa salarial en el sector rural.

Estadstica Educativa
UNS XX

176 . 0
246
42 . 43
) (
1
1
1
1
=

=
n
i
i
n
i
i i
p
q p
G


Como 0 < G < 1 aseveramos empricamente que existe una concentracin mnima por lo que no
hay desigualdad en la distribucin de la renta.


PARA RECORDAR

En este tema cubrimos los conceptos sobre Estadsticos de Forma o Estadsticos de
Concentracin por lo que podemos resumir el tema:

1. El coeficiente de asimetra, es una medida de la deformacin horizontal de un polgono
de frecuencias que representa a una distribucin.
2. El coeficiente de curtosis es una medida de la deformacin vertical de una distribucin
de frecuencias.
3. El coeficiente de variacin es adimensional y generalmente se expresa en forma de
porcentaje midiendo la dispersin de una muestra o variable aleatoria.
4. El coeficiente de concentracin sirve para medir el grado de desigualdad de cualquier
distribucin.
5. La Curva de Lorenz es una erramienta muy valiosa para expresar fenmenos de
concentracin o desigualdad de cualquier variable.























Estadstica Educativa
UNS XX

Reflexiona Sobre el Tema:

1. Si trabajando con un mismo conjunto de datos obtenemos un coeficiente de
asimetra igual a cero conjuntamente un coficiente de curtosis igual a tres Cmo
sera nuestra distribucin? (Realice un breve comentario)

..

2. Cundo realizamos una investigacin, en qu momento del anlisis estadstico
de debe utilizar el coeficiente de variacin y qu significa un valor de CV > 50%?.

..

3. De un ejemplo de carcter educativo en el cual se pueda aplicar el ndice de
concentracin Gini y la curva de Lorenz.

..





Estadstica Educativa
UNS XX













1) Disponga de la distribucin en intervalos de clase de las calificaciones de Matemtica
para:

a. Disear el polgono de frecuencias relativas.
b. Computar el coeficiente de variacin CV Es homogneo o heterogneo el
rendimiento acadmico en Matemtica del nivel secundario de tu Unidad
Educativa?.
c. Computar el coeficiente de asimetra, interpretar su resultado y compararlo con
el polgono de frecuencias.
d. Computar el coeficiente de kurtosis, interpretar su resultado y compararlo con el
polgono de frecuencias.
e. Verificar con Microsoft Excel los resultados de la asimetra y kurtosis
respectivamente.

2) Con los salarios mensuales de 50 maestros aleatoriamente recolectados en la actividad
anterior:

a. Compute el coeficiente de variacin CV y certifique su homogeneidad o
heterogeneidad.
b. Compare los coeficientes de variacin de las calificaciones de Matemtica, con
los de los salarios. Cul de las distribuciones posee mayor dispersin?
(comente los resultados).
c. Construya en Indice de concentracin Gini para analizar la equidad en la
distribucin del ingreso en el sector magisterio (interprete su resultado)Existe
concentracin salarial en pocas manos?.
d. Elabore la curva de Lorenz para observar visualmente el comportamiento en la
concentracin de los salarios






A C T I V I D A D E S

Los estadsticos de forma nos proveen un criterio general acerca del tipo de
distribucin que posee cada variable, ste anlisis tambin es complementado por
los estadsticos de concentracin que implican distribuciones equitativas o
desequitativas en los datos.

Estadstica Educativa
UNS XX




Lee con mucha atencin cada pregunta, resuelve los ejercicios en hojas independientes,
aplica tus conocimientos de Microsoft Excel y responde de la manera ms concreta
posible

1. Para usted Qu es la Estadstica y qu es variable?

..

2. Al conjunto total de datos que se puedan obtener, al efectuar una secuencia exhaustiva de
experimentos, se le denomina

3. La Estadstica se divide en dos ramas: una que da las reglas para describir los datos, llamada
y otra que da las reglas para inferir ciertas
caractersticas de la poblacin, denominada

4. Se pretende efectuar una investigacin entre la comunidad docente, estudiantil y
administrativa de la carrera respecto al rol que debe cumplir la Carrera Ciencias de la
Educacin. Si esta investigacin es realizada por muestreo, defina concretamente como
seleccionara la muestra (tamao y forma). Seale dos opciones.

..

5. Dolores fuertes de Barriga propietaria de una empresa fabricante de aceite comestible
tradicional, evala un proyecto para colocar un nuevo producto en el mercado, (como el aceite
combinado de oliva y maz), puede estimar el tamao de la muestra basndose en el promedio
A U T O E V A L U A C I N
Estadstica Educativa
UNS XX

histrico de consumo medio anual. Si la media histrica fue de 12 litros, y la desviacin tpica de
la muestra obtenida mediante prueba piloto, es 3 y si el error mximo permitido es 0.3 (lo que
supone que ningn consumidor comprara ms de 12.3 litros ni menos 11.7 litros), Cul ser el
tamao de la muestra para un nivel de confianza de 95%?.

6. El departamento de Infraestructura educativa a cargo de Armando Paredes el cual desea
determinar la proporcin de estudiantes que no son aceptados a causa de una falta en
establecimientos sostiene que es de un 22%.

a. Qu tamao muestral se requiere para asegurar con confianza de 98% que el error de
estimacin de esta proporcin no sobrepasar a 2%?.
b. Cmo cambiar el tamao de su muestra, si la diferencia entre proporciones es de
9%?.

7. La siguiente informacin corresponde a la planilla mensual de sueldos, en el magisterio.

CATEGORA CASOS SUELDO
BSICO
CATEGORAS
Mrito
Primera
Segunda
Tercera
Cuarta
215
627
842
1.384
1.250
501
490
452
415
370
115%
85%
60%
42%
25%
TOTAL 4.318

a. Determine el costo total del pago de sueldos bsicos
b. Determine el costo del pago de sueldos totales.
c. Determine los nuevos costos si se incrementa el salario bsico en 6% para las dos
primeras categoras y 8% al resto y se contratan a 22 docentes al mrito, 85 de
segunda categora y se reduce 30 de tercera categora.
d. Represente grficamente sus resultados, por medio de diagrama de sectores y barras.

8. Supongamos que un grupo de estudiantes presenta las siguientes estaturas.

160 161 161 163 172 190 191 192 198

a. Halla la moda y la mediana
b. Usted piensa que la moda o la mediana de este caso describen acertadamente al grupo
de alumnos porque?

9. Por su color de cabello, 40 estudiantes de una clase se distribuyen como sigue:
Rubios 9 Castaos 20 Morenos 11

Estadstica Educativa
UNS XX

a. Calcular la moda
b. Puede Calcular la mediana?.

10. Con los siguientes datos hipotticos que corresponden a la distribucin de recursos para
educacin.


Nivel
Monto Asignado (Mil. $us) Nmero de Estudiantes
2006 2007 2008 2006 2007 2008
Inicial
Primario
Secundario
Superior
48.8
77.5
65.7
69.6
47.1
77.9
67.3
72.4
45.5
77.4
68.8
74.5
1.320
2.215
1.460
870
1.346
2.293
1.495
883
1.379
2.345
1.529
897
TOTAL 261.7 264.8 266.2 5.865 6.017 6.151

a. Representar en un grfico el nmero de estudiantes por ao como porcentaje del total.
b. Cul de los niveles de educacin est mejor atendido?
c. Justifique su respuesta (disponga de variables de escala, grficos y otros).

11. Se presentan las puntuaciones en la prueba de aptitud de 42 estudiantes de preuniversitario:

61 60 50 52 58 38 60 51 55 68 55 62 47 39
58 42 47 42 48 49 48 46 55 51 58 65 45 35
43 54 52 56 46 65 53 34 48 50 39 59 53 52

Se exige responder en una hoja independiente los siguientes incisos:
a. Construir una tabla de frecuencias con intervalos de clase.
b. Encuentre tambin las marcas de clase e interprtelas en sus propias palabras la marca
de clase con una distribucin acumulada absoluta y relativa respectivamente.
c. Encuentre e interprete la media aritmtica, mediana y moda de las observaciones
agrupadas y con la regla del percentil pruebe su posicin.
d. Encuentre la varianza, desviacin estndar y desviacin mediana construya los
intervalos significativos e interprete sus resultados.
e. Determine el segundo cuartil,quinto decil y el 50 percentil e interprete sus resultados.
f. Es la distribucin de las puntuaciones aproximadamente normal o hay tendencia hacia la
bimodalidad o hacia la asimetra, comente.