Está en la página 1de 132

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

UNIVERSIDAD NACIONAL DE
SANTIAGO DEL ESTERO

ESCUELA PARA LA INNOVACIÓN EDUCATIVA

LICENCIATURA EN GESTIÓN EDUCATIVA

ESPACIO CURRICULAR

METODOLOGÍA Y ESTADÍSTICA
APLICADA A LA EDUCACIÓN

Autores:
Dra. Marta Graciela del Valle Pece
Mg. Ing. Margarita Juárez de Galíndez
Mg. Lic. María Mercedes Simonetti

1
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

PROGRAMA DE ESPACIO CURRICULAR


UNIDAD I: Estadística
Concepto. Etapas en el trabajo estadístico. Estadística Descriptiva e
Inferencial. Variable: concepto. Clasificación de variables. Series
simples. Agrupamiento de datos en series de frecuencias. Frecuencias
absolutas. Frecuencias relativas. Porcentajes. Frecuencias acumuladas,
frecuencias relativas acumuladas y porcentajes acumulados. Tasas de
uso común: de escolarización, de analfabetismo, de desgranamiento, de
retención.

UNIDAD II: Presentación de datos estadísticos.


Partes funcionales y construcción de tablas estadísticas. Elementos
estructurales de las tablas. Tablas simples, cruzadas. Análisis de tablas
estadísticas. Técnicas de representaciones gráficas. Reglas de
construcción. Gráficos según los distintos tipos de variables.

UNIDAD III: Medidas de resumen.


Medidas de tendencia central. Media aritmética, mediana y moda.
Comparación de media, mediana y moda. Distribuciones simétricas y
asimétricas. Medidas de dispersión. Rango, variancia y desviación
estándar y desviación mediana. Coeficiente de variación. Medidas de
localización. Percentiles y rango percentil. Aplicaciones.

UNIDAD IV: Nociones elementales de probabilidad. Inferencia


estadística.
Experimentos aleatorios: conceptos básicos. Probabilidad clásica,
frecuencial y axiomática. Teorema de la suma y del producto de
probabilidades.
Tabla de contingencia. Cálculo de probabilidades.
Distribución de probabilidades de variables aleatorias discretas:
Uniforme y Binomial.
Cálculo de probabilidad en variables aleatorias continuas: distribución
normal y distribución normal estándar.
Población. Definición de muestra aleatoria. Diseños de muestreo.
Muestreo al azar simple. Muestreo sistemático. Muestreo por estratos.
Muestreo por conglomerados. Concepto.
Estimación puntual y por Intervalos de confianza para muestras
grandes en el Muestreo al Azar Simple.

2
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

UNIDADES I y II

INTRODUCCIÓN

La palabra Estadística proviene del latín status (estado).


Precisamente la primera aplicación de la estadística consistió en la
recopilación de datos y la construcción de gráficos para describir el estado
de un país. Con el correr del tiempo esta herramienta fue evolucionando
hasta que en la actualidad podríamos decir que no hay aspectos de la vida
cotidiana donde no se aplique la Estadística. Hogares, gobiernos y
negocios se apoyan en datos estadísticos para dirigir sus acciones.

El objetivo que se persigue con este módulo es proporcionar al


docente herramientas y técnicas para obtener datos, procesarlos para
obtener información que sirva para la interpretación correcta de
fenómenos que se producen en su ámbito de trabajo.

ESTADÍSTICA. CONCEPTOS.

La Estadística es una colección de métodos para planear


experimentos, obtener datos, y después organizar, resumir, presentar,
analizar, interpretar y llegar a conclusiones basadas en ellos (Triola, 2004).

Otra definición considera a la Estadística como una disciplina


perteneciente a la Matemática Aplicada que se dedica al estudio
cuantitativo de fenómenos colectivos. Proporciona los métodos para:

 La recolección de datos
 Su ordenamiento, resumen y presentación,
 Su análisis e interpretación y
 Posterior enunciado de conclusiones.

Los cuatro pasos que se han enumerado constituyen las etapas del
trabajo estadístico.

La primera etapa tiene como objetivo recolectar datos proveniente de


medición, conteo u observación efectuado sobre el material objeto de
estudio en base a un plan formulado según los principios del diseño
experimental y las técnicas de muestreo.

3
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

La segunda etapa consiste en ordenar los datos en tablas estadísticas,


presentarlos mediante gráficos y diagramas y resumirlos a través del
cálculo de promedios, porcentajes e índices.

En la tercera etapa se analizan los resultados obtenidos en la etapa


anterior, y comienzan a distinguirse las características del fenómeno, lo
que permite utilizar diferentes métodos para analizarlos e interpretarlos.

En la última etapa se debe concluir acerca del estudio realizado.

Si las conclusiones, se refieren exclusivamente a los datos de los que


se dispone (una parte de la población que se desea estudiar), se dice que
la Estadística es Descriptiva.

Si por el contrario, las conclusiones van más allá de los datos que se
dispone y se refieren a un conjunto mayor (población), del cual se
extrajeron, se dice que la Estadística es Inferencial; las conclusiones
van de lo particular (muestra) a lo general (la población).Esta se basa en el
estudio de la teoría de probabilidades que nos permite medir el error de
nuestras afirmaciones.

Las estadísticas (en plural) se obtienen como resultado del trabajo


estadístico y están constituidas por porcentajes, promedios, tablas,
gráficos y otros elementos que describen un fenómeno y ayudan a su
comprensión (Ej.: estadísticas demográficas, estadísticas del fútbol,
estadísticas de accidentes de tránsito, estadísticas universitarias, etc.).

Es necesario definir algunos conceptos importantes: por ejemplo

Población. Se define población como el conjunto de individuos u


objetos que comparten una característica común, en la
que el investigador está interesado.

Muestra. Es un subconjunto de la población. Debe ser


representativa, es decir se deben mantener las mismas
características de la población en estudio.

Una población puede ser finita o infinita.

Población finita Una población finita es aquella que puede ser


físicamente listada

Población infinita. Una población es infinita, cuando en la práctica


no puede ser físicamente listada

4
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Ejemplo. Una población puede ser definida como los alumnos de la


escuela San Francisco. Los alumnos pueden ser listados e
individualizados a través de los registros áulicos. Es un ejemplo de
población finita.

Personas portadoras de SIDA en Santiago del Estero,


constituyen un ejemplo de población infinita.

Unidad de observación: es aquélla sobre la cual se efectúan las


mediciones u observaciones. La unidad de
observación puede ser una persona, una familia, una
planta, una parcela, etc.

Dato: es el valor que se obtiene de la medición, observación o conteo


efectuada en la unidad de observación o unidad de
muestreo.

Por ejemplo si el objetivo de una investigación es el rendimiento


de los alumnos, la unidad de observación es el alumno.

El número de materias rendidas contadas en un alumno es el


dato.

El conjunto de datos obtenidos de cada unidad de observación


constituirá la base para el análisis estadístico del rendimiento de los
alumnos de la escuela San Francisco.

Variables. Concepto y tipos.

Variable. Una variable es cualquier característica que varía de una


unidad de muestreo a otra en la población o en la
muestra

Ejemplo 1: Supóngase que interesa conocer la salud de los alumnos,


entonces la variable a observar en cada alumno será el estado de salud,
el que podrá asumir dos valores: sano o enfermo.

Ejemplo 2: Si interesa saber el número de hermanos que posee


cada alumno, se tendrá valores que van desde 0(ningún hermano), 1, 2...,n
y se deberá contar cuantos hermanos posee cada alumno.

5
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Ejemplo 3: Si el objetivo de un estudio fuera la talla alcanzada por


alumnos, se debe medir la variable altura la que, expresada en metros
podrá tener valores mayores a 1 metro.

En los tres ejemplos anteriores, el nombre de la variable y la forma


de obtener sus valores está resaltado en negrita. En el primer ejemplo, los
valores que puede asumir la variable son calidades, por lo que se dice que
la variable es cualitativa. Las calidades o categorías pueden ser naturales
como al definir la variable sexo, o arbitrarias como la clasificación de
alturas en bajas, medianas y altas.

Por el contrario, en los otros dos ejemplos los valores que asumen
las variables pueden expresarse mediante números, por lo que las dos
últimas variables son cuantitativas. En el caso de número de hermanos,
la variable toma sólo determinados valores en el intervalo que va de cero a
n por lo que se la denomina variable cuantitativa discreta o
discontinua; cuando la variable toma los infinitos valores dentro del
intervalo se dice que la variable es cuantitativa continua

Otra forma de clasificación de las variables es mediante el empleo de


cuatro niveles de medición: nominal, ordinal, de intervalo y de razón.
Cuando se manejan datos reales el nivel de medición es importante ya que
orienta sobre el procedimiento estadístico a utilizar.

Un nivel de medición es nominal cuando los valores de variables


son nombres, etiquetas o categorías y no se puede establecer un orden
entre ellos.

Ejemplo: colores de ojos, estado de salud, lugar de nacimiento de un


alumno. Aunque las ciudades pueden ser ordenadas según su tamaño,
densidad poblacional, grado de contaminación del aire, etc., en general, la
variable “lugar de nacimiento” no tiene un orden establecido

Con estos datos no es posible realizar cálculos. A veces se asignan


números a las diferentes categorías; a la variable salud que posee dos
valores sano y enfermo, podemos codificarlas numéricamente de la
siguiente manera 1= sano, 2= enfermo pero esto no es nada más que una
codificación y tales números no tienen significado computacional.

Un nivel de medición es ordinal cuando se puede establecer un


orden entre las categorías de la variable. Ejemplo: máximo nivel de
instrucción alcanzado por los padres de los alumnos: analfabeto, primario,
secundario, terciario, universitario.

6
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Lo único que podemos decir es que el nivel de instrucción


secundario es mayor que el primario y que el universitario es mayor que el
primario, secundario o terciario, pero no podemos decir cuanto mayor es
una categoría de la variable respecto a la otra.

Supongamos que se codifican dichos niveles con 1, 2, 3, 4 y 5.

Si bien se podría hacer la diferencia entre 2-1=1 y 4-3=1, este


resultado 1 no significa que entre el primario y el analfabeto hay la misma
cantidad de conocimiento que entre el universitario y el nivel terciario.

Otro nivel de medición es el de intervalo. En este nivel la


diferencia entre dos valores de datos tiene un significado. En este nivel no
hay un cero natural, donde nada de la cantidad esté presente. El valor del
cero es convencional

Ejemplo: La variable Temperatura está medida en escala de intervalo. Un


termómetro por ejemplo, mide la temperatura en grados que son del mismo
tamaño en cualquier punto de la escala. Aquí no existe un punto de partida
natural, el valor 0° es arbitrario y no representa la ausencia total de calor.
La diferencia entre 20ºC y 21ºC es la misma que entre 12ºC y 13ºC Se
pueden realizar operaciones de suma y resta pero no cociente entre valores.

Por último el nivel de medición de razón o cociente aunque se


parece al nivel de medición de intervalo tiene un punto de partida o cero
inherente (donde cero indica que nada de la cantidad está presente). Para
los valores en este nivel tanto las diferencias como los cocientes tienen
significado. En este nivel se pueden realizar todas las operaciones.
Ejemplo: Los precios de los libros de texto (0$ representa ningún costo y
un precio de $60 es dos veces más costoso que uno de $30).

7
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Datos

Variable Variable
Categórica o numérica o
cualitativa cuantitativa

Escala Escala Escala de Escala de


nominal ordinal intervalo razón
minal

Series de datos. Series simples

El conjunto de valores de una variable constituye una serie de datos.


Se presentan a continuación series de datos referidas a los tres ejemplos
que se dieron para ilustrar tipos de variables:

Ejemplo 1: En el año 2004, se examinan 30 alumnos de un Curso


de EGB1 de la escuela San Francisco y se anota su estado de salud
(S=Sano, E=Enfermo).

Generalmente las variables se designan con las últimas letras del


abecedario en mayúscula por ej. X y los valores que toma la variable con x
minúscula; incluso se coloca xi donde el subíndice i indica el número de
individuo observado; de éste modo las 30 observaciones son:

xi : S, S, E, E, E, S, S, E, S, S, S, S, S, E, S, S, S, S, E, S, S, S, S, S, S, S,
S, S, S, S.

El subíndice “ i “ varía de 1 a 30. Así, x1 = S; x7 = S; X14 = E; . . . x30 =S.

Ejemplo 2: Un maestro de la Escuela San Martín interroga a sus 30


alumnos de primer grado de EGB1 sobre el número de hermanos que
poseen.
Xi: 4,1,6,0,0,1,2,3,1,0,2,5,6,4,2,0,1,2,4,3,5,6,1,3,2,4,5,2,6,0.

8
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

El subíndice “i“ va desde 1 a 30 y entonces x1 = 4; x5 = 0; x12 = 5; . .;


x30 =0.

Ejemplo 3: Un maestro mide la talla de sus 25 alumnos de Sección


Maternal de la Escuela San Francisco la que expresada en cm es la
siguiente:

xi(cm):
70,75,74,87,92,89,72,83,84,79,98,99,95,87,84,85,79,78,95,99,97,84,86,78,
74.

Ahora “i” va desde 1 a 25, entonces x1 = 70; x2 = 75; . . .;


x25 =74.

Los datos en bruto, tal cual fueron obtenidos, sin agrupar


constituyen una serie simple.

Tablas y gráficos

Organización de datos categóricos o cualitativos.

Cuando la masa de datos obtenidos es muy grande y éstos están


desordenados, no dan información alguna; conviene por lo tanto
ordenarlos y tabularlos, haciendo uso de tablas estadísticas, que deben
confeccionarse de tal modo que los datos resulten fáciles de ser leídos e
interpretados. Con los datos del ejemplo 1 se puede construir una tabla de
frecuencias.

Tabla de frecuencias. Una tabla de frecuencias para variable cualitativa,


es una tabla que asocia cada categoría de la variable con el
número de veces que se repite la categoría.

Tabla 1. Alumnos de un curso EGB1, de la Escuela San Francisco, según


estado de salud. Año 2004.

i Categorías:xi Frecuencias: fi
(Estado de salud) (nº de alumnos)
1 Sano 24
2 Enfermo 6
Total 30
Fuente: Datos ficticios

9
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Frecuencia absoluta: Es el nº de veces que se repite cada categoría de la


variable. Se la simboliza con fi.

La suma de las frecuencias absolutas, es igual al nº total de observaciones,

 fi
en éste caso 30 ( i 1 =30). Nótese que “ i “ ahora se refiere a las
categorías, x1 = Sano, f1 = 24; x2 = Enfermo, f2= 6.

La tabla de frecuencias, es la más sencilla de las tablas y es una


tabla de simple entrada pues los individuos se clasifican según una única
variable, estado de salud en el ejemplo
.
Los datos organizados en tabla de simple entrada para variable
cualitativa, pueden presentarse mediante gráficos, que tiene la finalidad
de que la información entre por los ojos. El gráfico que puede usarse en
éste caso es el gráfico de barras.

Gráfico 1a. Alumnos de un curso EGB1, de la Escuela San Francisco,


según estado de salud. Año 2004.

30
25
Nº de alumnos

20
15
10
5
0
Sanos Enfermos
Estado de salud

Fuente: Datos ficticios


.
Para su construcción se utiliza el sistema de coordenadas
ortogonales. Sobre el eje horizontal se colocan las distintas categorías de la
variable en estudio (estado de salud) y sobre el eje vertical con una escala
adecuada, se representan las frecuencias. Se dibujan barras de ancho

10
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

constante, una para cada valor de la variable, con una altura que
representa el valor de la frecuencia que corresponde a cada categoría. Es
conveniente que la separación entre las barras sea menor que el ancho de
las mismas.

El ancho de las barras debe elegirse teniendo en cuenta el espacio


disponible, el número de categorías de la variable a representar y la altura
que les corresponde, con el objeto de obtener un gráfico proporcionado.
Las barras pueden dibujarse en sentido vertical u horizontal.

Gráfico 1b. Alumnos de un curso EGB1, de la Escuela. San Francisco,


según estado de salud. Año 2004

Enfermos
Estado de salud

Sanos

0 5 10 15 20 25 30
Nº de alumnos

Fuente: Datos ficticios

En algunos trabajos es necesario calcular frecuencias relativas.

Frecuencia relativa de una categoría es la proporción de veces que ocurre


dicha categoría.

Se obtiene dividiendo la frecuencia absoluta de cada categoría entre la


suma de las frecuencias de todas las categorías. La suma en éste caso es
f1 + f2 = 24 + 6 = 30, y se expresa literalmente mediante el signo  que
se denomina sumatoria, así
i 2

i 1
fi  f1  f 2  24  6  30

11
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

a la frecuencia relativa de la clase i-ésima se la simboliza con fri y se la


calcula de la siguiente manera:

fi
fri 
f i

La suma de las frecuencias relativas es siempre igual a 1.

 fr
i 1
i 1

Si se multiplica las frecuencias relativas por 100 se obtienen porcentajes.


En éste ejemplo sería:

Tabla 2. Alumnos de un curso EGB1, de la Escuela. San Francisco, según


estado de salud. Año 2004.

i xi fi fri Porcentajes:
(Estado de salud) %
1 Sano 24 24/30=0,80 80

2 Enfermo 6 6/30=0,20 20

Total 30 1.00 100


Fuente: Datos ficticios

Se pueden representar los datos de la tabla 2 mediante un gráfico de


barras, sólo que en el eje vertical van los porcentajes.

Gráfico 2. Alumnos de un curso EGB1, de la Escuela San Francisco,


según estado de salud. Año 2004.

% 100
80
60
40
20
0
sanos enfermos
Estado de salud

Fuente: Datos ficticios

12
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Otro gráfico adecuado para representar series de frecuencias de


variable cualitativa es el gráfico de sectores circulares, llamado gráfico
de tortas o pie charts.

Tabla 3. Alumnos de un curso EGB1, de la Escuela San Francisco, según


sexo. Año 2004

Sexo fi fri 360ºxfri


(nº de
alumnos)
Varones 15 0,38 137º
Mujeres 25 0,62 223º
Total 40 1,00 360º
Fuente: Datos ficticios

Se elige un radio por ej 3cm (el valor del radio se elige según el espacio que
se disponga para el gráfico) y se grafica un círculo. La superficie de dicho
círculo representa el total de alumnos (40), en consecuencia, le
corresponde un ángulo de 360°. Se puede discriminar mediante sectores
circulares la porción que corresponde a las mujeres y a los varones. Los
grados correspondientes a los sectores se obtienen multiplicando la
frecuencia relativa por 360º.

Gráfico 3. Alumnos de un curso EGB1, de la Escuela. San Francisco,


según sexo. Año 2004

Varones
Mujeres

38%

62%

Fuente: Datos ficticios

13
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Variables cuantitativas.
Ejemplo: Nº de hermanos que tienen los alumnos de primer grado de
EGB1 de la escuela San Martín
Xi: 4,1,6,0,0,1,2,3,1,0,2,5,6,4,2,0,1,2,4,3,5,6,1,3,2,4,5,2,6,0

Para el caso de variables cuantitativas discretas, la tabla de


frecuencias se construye de la siguiente manera: se ubica el valor mayor y
el menor valor de la variable (en el ejemplo 2 del n° de hermanos por
alumno, el menor valor es cero y el valor mayor 6), se colocan todos los
valores correspondientes en la primera columna de la tabla, y luego se
cuentan las veces que se presentan dichos valores. La tabla resultante es:

Tabla 5. Alumnos de primer grado de EGB1 de la escuela San Martín


según Nº de hermanos

Xi fi Fi fr %
0 5 5 0,17 17
1 5 10 0,17 17
2 6 16 0,20 20
3 3 19 0,10 10
4 4 23 0,13 13
5 3 26 0,10 10
6 4 30 0,13 13
Total 30 1,0 100
Fuente: Datos ficticios

La diferencia que existe entre cada clase es constante e igual a 1.

Además de las frecuencias relativas (cuyo cálculo se explicó en


párrafos anteriores) aquí se puede calcular también las frecuencias
acumuladas Fi. La frecuencia acumulada de una clase se obtiene
sumándole a la frecuencia de la clase, la frecuencia de las clases
anteriores.

F (0)=5
F (1)=5+5=10
F (2)=5+5+6=16 = Fi (1)+6

La tabla de frecuencias para variables cuantitativas discretas se


representa mediante un gráfico de bastones. En la abscisa se colocan los
valores de la variable y se levanta para cada uno de ellos una línea de
altura igual a su frecuencia.

14
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Gráfico 4. Alumnos de primer grado de EGB1 de la escuela San


Martín según Nº de hermanos
6

4
frecuencia

0
0 1 2 3 4 5 6
Número de hermanos

Fuente: Datos ficticios

Interpretación:
El número 6 en la columna de fi significa que 6 alumnos tienen 2
hermanos
El número 19 en la columna Fi significa que 19 alumnos tienen 3
hermanos o menos
El número 20 en la columna de porcentajes significa que el 20% de los
alumnos tienen 2 hermanos

Para el caso de variables cuantitativas continuas como los datos


del ejemplo 3 (altura en cm. de 25 alumnos de una sección maternal de la
Escuela San Francisco) que fueron obtenidos por medición, se recomienda
construir intervalos de clase, cuya amplitud depende de la cantidad de
intervalos que se deseen construir y la cantidad de datos que posee la serie
simple. Es recomendable que los intervalos de clases sean iguales, es decir
que la amplitud de los mismos (a) sea constante. La técnica a emplear para
el agrupamiento de una serie simple de variable cuantitativa continua es
sencilla.

15
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

xi (cm): 70, 75, 74, 87, 88, 89, 72, 83, 84, 79, 98, 99, 95, 87, 84, 85, 79,
78, 95, 99, 97, 84, 86, 78, 74

1. -Se ubica el valor mayor que toma la variable (99 cm) y el valor menor
(70 cm).

2. - Se obtiene la diferencia, la que se denomina Rango o amplitud de


variación y se designa con la letra R.

R  xmax  xmin  99  70  29
3.– El número de intervalos aproximado se puede calcular con la siguiente
fórmula:
log(n  1)
n de intervalos 
log(2)
dónde n: n° de valores de la serie o tamaño de la muestra
log: logaritmo decimal

log( 25  1)
nde int erv.   4.7004  5 int ervalos
log( 2)

Cuando en la variable que se estudia existen intervalos predeterminados,


el número de clases o intervalos dependerá de la amplitud que se usa
habitualmente.

4. - El rango se divide entre el nº de clases o intervalos de clases, 5 para


éste ejemplo, (se recomienda que el número de intervalos no sea menor
que 5, ni mayor de 15, pues en el primer casos se reduce demasiado la
información y en el segundo no se cumple con el objetivo del
agrupamiento) obteniéndose una idea aproximada de la longitud o
amplitud del intervalo de clase.

Rango 29
a   5.8  6
nº de int ervalos 5

Éste valor de amplitud es orientativo, por lo que se decide tomar una


amplitud de intervalo 5 cm para facilitar el agrupamiento.

5.- Se delimitan las clases buscando preferentemente valores enteros para


sus límites. Se debe elegir el límite inferior del 1er intervalo de tal manera
que contenga al menor valor de la serie (70 cm). La elección recae en el 70.
El límite superior del 1er intervalo, se obtiene sumando al Li la amplitud.

16
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Li del 1er intervalo = 70


Ls del 1er intervalo = Li + a= 70 + 5 = 75

El límite inferior del 2do intervalo debe coincidir con el límite superior
del primer intervalo.

Li del 2do intervalo = 75


Ls del 2do intervalo Li + a= 75+ 5 = 80

El límite inferior del 3er intervalo debe coincidir con el límite


superior del 2do intervalo, y así sucesivamente, hasta que el límite superior
del último intervalo, contenga el valor observado más alto de la variable.

6.- Una vez formadas las clases se procede al conteo, que consiste en
determinar el nº de observaciones (frecuencias) de cada clase. Una manera
sencilla de hacerlo es leyendo la serie simple y ubicando mediante marcas
cada valor de la variable en su clase correspondiente. De ésta manera
cuando se termine de pasar lista a la serie simple, el agrupamiento ha
sido efectuado.

Tabla 6. Alumnos de Sección maternal de la escuela San Francisco según


su altura.
Intervalo de clase xi fi fri
(altura en cm) (marca de clase)
70 a 75 72.5 4 0.16
75 a 80 77.5 5 0.20
80 a 85 82.5 4 0.16
85 a 90 87.5 5 0.20
90 a 95 92.5 1 0.04
95 a 100 97.5 6 0.24
Total 25 1.00
Fuente: Datos ficticios

Un problema que se puede presentar es el siguiente: si un valor de la


variable coincide con uno de los límites del intervalo, por ejemplo la altura
95 cm ¿dónde se lo ubica? ¿en el quinto o en el sexto intervalo de clase?
La respuesta es: puede ubicarlo en cualquiera de los intervalos, pero si se
elige un criterio se lo debe respetar hasta el final del agrupamiento. En
éste ejemplo al nº 95 se lo ubica en el 6° intervalo, de la misma manera,
cuando aparezca por ejemplo un valor 85, debe ser anotado como
perteneciente al intervalo en el que el nº 85 se encuentra como límite
inferior. El intervalo de clase es cerrado en el límite inferior y abierto en el
superior. Esto se indica de la siguiente forma 75;80 los valores del
intervalo van desde 75 a 79,9999.

17
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

7.- Se agrega una tercera columna, titulada “marca de clase” o “punto


medio de clase” que se designa con xi que contiene los valores
correspondientes a los puntos medios de cada uno de los intervalos y se
calcula así:

Li1  Ls1 70  75
x1    72,5
2 2
Li  Ls2 75  80
x2  2   77,5
2 2

También se puede calcular de la siguiente manera

x2  x1  a  72,5  5  77,5

Al efectuar el agrupamiento, se pierde detalle de la información ya


que, por ejemplo, de los valores que resultaron ubicados en la primera
clase, sólo se sabe ahora que se encuentran entre 70 y 75. Por eso, en caso
de ser necesario asignar un valor a cada uno de ellos, como es en el
cálculo de la media aritmética a partir de la tabla de frecuencias, se opta
por pensar que todos tienen igual valor, que es el correspondiente al punto
medio de clase.

Un gráfico adecuado para representar una serie de frecuencias de


variable cuantitativa continua es el histograma (gráfico nº 5). Su
construcción es fácil. Se utiliza el sistema de coordenadas cartesianas
ortogonales. En el eje de las ordenadas (vertical) se marcan las frecuencias
(fi) y en el de las abscisas (horizontal), la variable según la cual se efectuó
la clasificación (altura). Consiste en rectángulos adyacentes (uno por cada
clase) con bases materializadas por la amplitud de clases (5 cm). La altura
está dada por la frecuencia correspondiente a la clase. Cuando las clases
son iguales, el área del histograma es proporcional a la frecuencia total.

18
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Gráfico 5.Alumnos de Sección maternal de la escuela San Francisco según


su altura

7
6
5
4
Nº alum.

3
2
1
0
70 75 80 85 90 95 100

Altura (cm)

Fuente: Datos ficticios

Otro gráfico adecuado para representar la serie de frecuencias de


variable cuantitativa continua es el polígono de frecuencias (gráfico 6).
Se emplea para su realización el sistema de coordenadas cartesianas
ortogonales. Se coloca la variable clasificadora en el eje horizontal y las
frecuencias en el vertical.

La construcción es sencilla, se marcan tantos puntos como pares de


valores (xi,fi) o sea marcas de clase, frecuencias haya en la tabla. En la
tabla Nº 6 vemos que hay 6 pares de valores; el primer par tiene abscisa
72,5 y ordenada 4 y así sucesivamente hasta marcar el sexto par. Luego se
unen los puntos mediante trazos rectos. Algunos autores, en su afán de
mantener la proporcionalidad entre la superficie y la frecuencia aconsejan
cerrar el polígono de frecuencias uniendo el primer punto con la marca de
clase inmediata anterior y el último punto con la inmediata superior; en
éstos dos casos la unión de los puntos se realiza con trazos cortados.

La principal ventaja de los polígonos de frecuencias consiste en que


ellos permiten dibujar en el mismo sistema de eje dos o más polígonos
correspondientes a series diferentes que tengan similar posición sobre el
eje de las x, así se puede compararlos, lo cual resulta engorroso efectuar
con los histogramas a causa de la superposición de las superficies de los
rectángulos.

19
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Gráfico 6.Alumnos de Sección maternal de la escuela San Francisco según


su altura

5
Nº de alumnos

0
65 70 75 80 85 90 95 100 105
Altura(cm)

Fuente: Datos ficticios

Como cada miembro de una población presenta diversas


características, se puede necesitar clasificarlos de acuerdo a dos de ellas.
Cuando el número de individuos medidos es pequeño, se enumeran todos
los pares de observaciones, si alguno de ellos aparece dos veces, se lo
repite y la presentación suele hacerse de modo que una de las dos
variables esté ordenada.

Tabla 9. Alumnos de una escuela según su peso y altura.


Peso 39 40 41 42 43 43 44 45 50 52
(kg)
Alt (m) 1,27 1,30 1,30 1,31 1,34 1,35 1,37 1,39 1,45 1,49
Fuente: Datos ficticios

Para representar estos datos que corresponden a dos variables


cuantitativas continuas se utilizan los gráficos de dispersión o scatter
plot, que se construye de la siguiente manera: se coloca una de las
variables en las abscisas o eje horizontal, por ejemplo la altura y la otra
variable, el peso, en el eje vertical, con sus escalas correspondientes, luego
se marcan tantos puntos como pares de valores (xi, yi) se tengan.

20
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Gráfico 7. Alumnos de una escuela según su peso y altura


1,55

1,5

1,45
Altura (m)

1,4

1,35

1,3

1,25
35 40 45 50 55
Peso (kg)
Fuente: Datos ficticios

Éste gráfico sirve para mostrar la relación entre las dos variables y
se usa cuando para el mismo valor de xi se tiene diferentes valores de yi. Si
esto no ocurre puede utilizarse el gráfico lineal, que se construye de igual
manera que el anterior, con la única diferencia que se unen los puntos.
Éste gráfico, se suele emplear, especialmente, en los casos donde la
variable que se representa en el eje horizontal es el tiempo. De éste modo
se puede ver la evolución de la otra variable en el período considerado.
Pueden representar simultáneamente en el mismo gráfico dos o más
variables, como se observará al representar gráficamente los datos de la
tabla Nº 10

Tabla 10. Inasistencias mensuales de alumnos de Segundo grado A de


EGB1 de la Escuela San Martín según sexo

Meses N° de inasist.
Mujeres Varones
Marzo 3 4
Abril 5 7
Mayo 2 4
Junio 6 5
Julio 8 8
Agosto 4 5
Sept. 3 4
Octubre 4 3
Noviem. 5 2
Diciem. 1 6
Fuente: Datos ficticios

21
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Gráfico 8. Inasistencias mensuales de alumnos de Segundo grado A de


EGB1 de la Escuela San Martín según sexo

9
Mujeres
8 Varones

7
Nº de inasistencias

0
M A M J J A S O N D
Meses

Fuente: Datos ficticios

Cuando los pares de valores son muy numerosos, las tablas se


presentan según lo muestra la tabla 11; en éste caso se dice que las tablas
son de doble entrada pues son dos las variables de clasificación.

Tabla 11. Alumnos de la escuela Nº 42 según ocupación de la madre y


lugar de residencia.

Ocupación Barrios Total


de la
Madre A B C
A. de casa 400 500 200 1100
Profesional 200 200 50 450
Empleada 300 400 100 800
Total 900 1100 350 2350
Fuente: Datos ficticios

En este ejemplo cada alumno se caracteriza según la variable


Ocupación de la madre (variable cualitativa nominal) y Barrio de
residencia (variable cualitativa nominal).

22
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Los valores que se encuentran en la celda son frecuencias, es decir


representan la cantidad de alumnos que comparten las dos características.

Las partes de una tabla son:

La matriz, formada por la primera fila, lleva los encabezamientos de las


columnas y / o la primera columna que titula a las filas.

El cuerpo constituido por celdas.

La información proporcionada por los valores de las celdas se completa


con la suministrada por los encabezamientos de las filas y columnas; en
las celdas se encuentra la frecuencia, es decir la cantidad de elementos o
individuos que poseen las dos características.

Por ejemplo el 100 de la última celda significa que en esa escuela hay
100 alumnos que viven en el Barrio C y cuyas madres son empleadas.

El gráfico que se utiliza para representar éste tipo de tablas es el


gráfico de barras compuestas (gráfico 9) y el gráfico de barras
agrupadas (gráfico 10).

Gráfico de barras compuestas

La construcción del gráfico de barras compuestas es sencilla. Se


comienza dibujando las barras como si fueran simples es decir con las
alturas correspondientes a los totales y luego se yuxtaponen los valores
parciales hasta alcanzar el de su suma. En el ejemplo, Barrio A, se procede
de la siguiente manera: se marca una barra de altura 900, en ella se indica
la subdivisión que corresponde a alumnos cuyas madres son amas de casa
con el valor 400; para marcar el nº de alumnos que es 200, se marca
400+200=600 en el eje vertical lo que queda corresponde nº de alumnos
cuyas madres son empleadas. De igual manera se procede con los barrios
B y C.

23
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Gráfico 9. Alumnos de la escuela Nº 42 según ocupación de la madre y


lugar de residencia
1200
Empleada
Profesional
1000
A. de casa

Nº de alumnos
800

600

400

200

0
A B C

Lugar de residencia

Fuente: Datos ficticios


Gráfico de barras agrupadas

Sirven para representar fenómenos similares a los que originan


barras compuestas. La diferencia con éstas estriba en que, para cada valor
de la variable independiente “x” en éste ejemplo lugar de residencia, se
dibujan grupo de barras . El número de barras en cada grupo es el del
número de categorías de la segunda variable, en este ejemplo ocupación de
las madres.

Gráfico 10. Alumnos de la escuela Nº 42 según ocupación de la madre y


lugar de residencia
600
A. de casa
Profesional
500
Empleada
Nº de alumnos

400

300

200

100

0
A B C

Lugar de residencia

Fuente: Datos ficticios

24
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Otro tipo de gráficos son los gráficos de figuras o pictogramas. Son


los más indicados para publicaciones de divulgación popular, por su fácil e
inmediata interpretación. Consisten en dibujos esquemáticos y
relacionados con el fenómeno a representar. Cada figura es equivalente a
una cantidad determinada, preferentemente entera, de unidades de la
variable dependiente y el número de unidades no su tamaño, es
proporcional a la magnitud a representar.

Cartogramas: Se emplean cuando es importante señalar la


distribución geográfica de un determinado acontecimiento, razón por la
cual se construyen sobre planos o mapas.

Cartogramas de señalización (Gráfico 11): Sirven para indicar la


distribución de una variable cualitativa sobre una base geográfica.
Mediante figuras, colores o diferentes rayados se señala que hay en
lugares determinados.

Gráfico 11. Qué es lo que caracteriza a cada provincia argentina.

Fuente: Pensando en Plural. División de educación tributaria. AFIP. Mayo 2005.


ISBN Nº987-9101-26-X

25
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

En este mapa, se observa lo que caracteriza a cada provincia


argentina. Por ejemplo en Santiago del Estero las aguas termales; en La
Pampa la producción de trigo, etc...

Cartogramas de densidad: además de indicar que hay y dónde, de


ellos se puede obtener la información de cuánto hay. Mediante diferente
rayado o colores y también utilizando barras sobre la base geográfica, se
puede expresar la cuantía del fenómeno como así también su ubicación.
Suelen utilizarse pictogramas, gráficos de líneas, en general cualquiera de
los descriptos, sobre el mapa o plano.

Resumiendo: los datos se ordenan, clasifican y presentan en formas


de tablas. Las tablas pueden de ser de simple entrada(cuando los
individuos se clasifican según una variable), de doble entrada(cuando los
individuos se clasifican según dos características) y de triple o más
entradas (cuando se clasifican los datos según tres o más variables).Las
tablas se complican a medida que se agregan más variables, por lo tanto
es preferible varias tablas sencillas a una complicada.

Toda tabla debe llevar título, el cuál debe responder a las preguntas
¿Según?, ¿Qué?, ¿Cuándo? y ¿Dónde?.

No se debe olvidar la fuente de datos que indica de donde proviene la


información.

Se debe incluir los totales.

En caso de expresar los datos en porcentajes, deben indicarse los


totales de los cuales provienen.

Con respecto a los gráficos, éstos constituyen una de las formas más
útiles de presentación de datos estadísticos. Su importancia reside en las
múltiples formas que pueden adoptar, lo que permite su aplicación a una
amplia gama de finalidades: didácticas, de investigación, etc. Sirven para
mostrar la relación entre una o más variables. La variedad de tipo de
representaciones gráficas exige una cautelosa elección de acuerdo a su
finalidad. La selección de la presentación gráfica debe, por lo tanto tener
los siguientes aspectos:

Tipo de análisis estadístico, características y número de los


fenómenos o variables a representar y público al que va dirigido.

26
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Recomendaciones para la construcción correcta de un gráfico.

Una vez elegido el tipo de gráfico adecuado, es conveniente no


descuidar las siguientes consideraciones:

 Decidir cuál de las variables es la independiente “x” y cuál la


dependiente “y”.
 La representación gráfica debe ser sencilla, simple y explicarse
por sí misma.
 Título se coloca encabezando el gráfico y debe responder a las
preguntas; qué, según, cuándo, dónde?.
 Fuente de datos. Se coloca al pie del gráfico.
 Escalas se elige de tal modo que no alteren la objetividad de la
representación, hecho éste muy utilizado para fines publicitarios
donde es común ver escalas construidas con el propósito de
alterar el fenómeno exagerando ventajas y enmascarando la
realidad, o lo que es peor aún eliminando la graduación de los
ejes, evitando de ésta forma todo patrón de comparación. Las
escalas deben construirse buscando obtener como resultado un
dibujo armónico y proporcionado.
 Debe nominarse los ejes de modo tal que no quede duda alguna
acerca de las variables que en ellos se representan.
 No olvidar el corte de ejes en caso de ser necesario. Éste debe
efectuarse entre el 0 y el valor mínimo a representar.
 Aclaración de las unidades de representación.
 Las referencias serán colocadas al pie o al costado del gráfico.
 En caso de usarse abreviaturas, éstas serán aclaradas con la
debida extensión, en el renglón siguiente al correspondiente a
las fuentes.
 En lo posible acompañar los gráficos con las tablas estadísticas
que lo originen.
 Si el trabajo lo requiere y es necesario expresar algunos
valores en %, deben consignarse las cifras de las cuales
provienen éstos porcentajes.

27
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

ÍNDICES

El Índice es un indicador útil tanto para fijar situaciones como para


hacer un diagnóstico. Cuando interesa comparar los valores de una
característica de la educación (matrícula, asistencia de alumnos, número
de profesores, etc...) en el tiempo o en el espacio, ya sea comparando dos
valores entre sí o todos con uno de ellos se puede realizar un cociente cuyo
resultado se denomina Índice simple.

Ejemplo: Se desea comparar la matrícula escolar de una escuela en el año


2004 con la matrícula en el año 1994. Si la primera es de 4000 alumnos y
la de 1994 es de 2000, el Indice será:

4000
I2004/1994= 2
2000

Lo que indica que la matrícula en el año 2004 es el doble que la


matrícula de 10 años atrás, en esa escuela.

El valor que va en el denominador se llama base.

El Indice del año base es 1:


2000
I1994/1994= 2000  1

Con frecuencia se multiplica por 100 los índices con lo que entonces
los índices son los porcentajes correspondientes siendo 100 el porcentaje
del índice base.

Los Índices más comunes utilizados en educación son:

 Razón de alumnos matriculados en las escuelas con respecto a la


población en edad escolar.

Nalumnos matriculad os
I=
Población en edad escolar

28
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Ejemplo: En el año 2001, en la localidad de La Banda según el INDEC, la


población en edad escolar fue de 88735 y los alumnos matriculados fue de
32613. La razón de alumnos matriculados es entonces en ese año de:

32613
I=  0.37
88735

Es decir que solo el 37% del total de la población en edad escolar asiste a
la escuela.

 Alumnos por maestro en las escuelas primarias.

N alumnos
I=
N maestros

Ejemplo: Si el total de alumnos de una escuela es de 1000 y el plantel


docente informa que hay 40 maestros( Datos ficticios), la razón alumnos
por maestro es:

1000
I=  25
40

Es decir que en esa escuela hay 25 alumnos por cada maestro.

 Porcentaje de población analfabeta de 15 años y más.

Nanalfabeto s.de 15años y más


I= *100
Población de 15años y más

Ejemplo: En la provincia de Santiago del Estero según el INDEC, en el año


2001 el total de población de 15 años y más fue de 571546 personas. De
ellas, 31625 no tenían ninguna instrucción.

El Porcentaje de población analfabeta para la provincia es entonces,

31625
I= *100  5.53%
571546

29
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

 Tasa de ausentismo de docentes


Es el porcentaje de ausentismo de docentes en un período de tiempo
determinado.

N º de días de ausenciade todos los docentesen un período


Ta= N º de días de clase de todoslos docentesen ese período
* 100

Ejemplo: Si en una escuela hay una planta docente de 115 personas y el


total de inasistencias de los docentes(por diversas causas) en el año es de
3101días, la Tasa de ausentismo se calcula como sigue(considere que los
días de clase en el año son 180):
3101
Ta= * 100  14.98%
115* 180

 Tasa de desgranamiento
Es la proporción de alumnos ingresados al primer grado (o curso) que no
lograron culminar todos los grados (o cursos) correspondientes al nivel, en
el período establecido.

N º de alumnosque no culminaron sus estudios en el período establecido


Td  * 100
N º de alumnosmatriculados al inicio del período

Ejemplo: Si en el estudio de la cohorte 1974-1980 el número de alumnos


matriculados en la Argentina en la escuela primaria al inicio del período es
de 729048 y los que no culminaron sus estudios es de 337292 (Fuente:
Estado, sociedad y educación en la Argentina de fin de siglo. D. Filmus. Troquil-Bs.As.-
1996-Pág.87.Citado por Lic,. Julio Zurita: Guía de actividades de la asignatura:
Introducción a la Estadística Educativa. Escuela para la Innovación Educativa. UNSE.
Año 1999)

la Tasa de desgranamiento es: 337292


Td= 729048  0.46

Es decir que en ese período hay un desgranamiento del 46%.


El 46% de los alumnos matriculados al inicio del período no culminaron
sus estudios al final del mismo.

30
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

 Tasa de retención de la cohorte


Es la proporción de alumnos ingresados al primer grado (o curso) que
lograron culminar todos los grados (o cursos) correspondientes al nivel, en
el período establecido.

N º de alumnos que culminaron sus estudios en el período establecid o


Tr  *100
N º de alumnos matriculad os al inicio del período

Ejemplo: Si en el mismo período considerado en el ejercicio anterior


terminan el 7ª grado 391756 alumnos de los 729048 matriculados, la Tasa
de retención será:

391756
 0.5374
Tr= 729048

Es decir que la Tasa de retención es aproximadamente del 54%.


El 54% de los alumnos matriculados al inicio del período culminaron
sus estudios al final del mismo.

 Tasa de escolarización
Proporción de la población en edad escolar que está efectivamente
escolarizada

N º de alumnos matriculad os
Ez  *100
Población en edad escolar

Ejemplo: La población de 5 años y más para Sgo. del Estero en el 2001


según el INDEC es de 706794 habitantes. De ellos asisten a la escuela
237708.

La Tasa de escolarización es:


237708
I= *100  33.63%
706794
Es decir que el 33.63% de la población en edad escolar asiste a la escuela.

31
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

GUÍA DE EJERCITACIÓN
Actividad 1
Clasifique en base al siguiente listado las variables socio educativas, en
cualitativas nominales u ordinales y cuantitativas discretas o continuas

Variable Tipo
1- Religión

2- Nº de alumnos promocionados por


curso

3- Barrios

4- Nivel de educación alcanzado por el


tutor

5- Edad de los alumnos

6- Sexo

7- Nº de inasistencias mensuales

8- Altura de los alumnos

9- Lugar de nacimiento

10- Peso de los alumnos

11- Horas de estudio diario

12- Nº de materias que cursan

13- Nº de hermanos que tiene cada


alumno

14- Grado de satisfacción por la


asignatura

15 Superficie construída por escuela

16 Nº de escuelas por Departamento

17 Categorías de escuela

32
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Actividad 2

Los siguientes datos corresponden a Nº de inasistencias de los


alumnos de un curso correspondientes al primer cuatrimestre

xi: 8 5 3 4 2 5 4 4 10 6
6 7 5 5 3 9 7 2 6 4
9 4 5 0 8 6 5 1 1 4
5 7 2 7 6 4 9 4 5 3

a) ¿Que indica el subíndice i?


b) ¿Cuál es la variable que se estudia?. Clasifíquela.
c) Ud. debe presentar un cuadro de inasistencias de los alumnos.
¿Cómo construye el mismo?
d) Incluya en la tabla: frecuencias acumuladas, frecuencias relativas,
porcentaje y porcentaje acumulado correspondiente a cada valor de
la variable.
e) Presente los resultados con el gráfico apropiado.

Actividad 3
En un curso de 50 alumnos de un establecimiento de la Capital del a
Pcia. De Sgo. Del Estero, se empleó la técnica de profundización de temas
por grupo en el desarrollo de contenidos teóricos. Se distribuyó un
cuestionario con la finalidad de determinar la actitud de los mismos ante
esta modalidad de estudio. Una de las preguntas estaba referida al grado
de conformidad sobre el desarrollo de los contenidos teóricos.

Los resultados obtenidos fueron los siguientes:


xi:
MC MD C I C MC D D MC MC
I MC I MC D MC MD C D C
MC D MC D MC D MD I C C
C MD MC I C MC MC D C MC
C MC D MD MC I D MC I MC

Donde:
MC: muy conforme
C: conforme
I: indiferente
D: disconforme
MD: Muy disconforme

33
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

a) Indique el tamaño de la muestra


b) Ud. debe representar al establecimiento en una reunión de
profesores en la que participan distintos Colegios de la Capital.
¿Como presentaría la opinión del alumnado?
c) Que título colocaría a la presentación?
d) Incluya en la misma frecuencias relativas y porcentajes
correspondiente a cada valor de la variable.
e) Presente esos mismos resultados con un gráfico de barras simples.
f) Indique si corresponde calcular frecuencia acumulada. En el caso de
respuesta afirmativa obtenga dicha frecuencia.
g) Analice los resultados obtenidos

Actividad 4
En un estudio realizado en el Instituto Santo Tomás de Aquino para
determinar la zona de influencia del mismo según el lugar de residencia de
los alumnos, los resultados obtenidos fueron los siguientes:

Alumnos del Instituto Santo Tomás de Aquino según el barrio en el que


residen.

Barrios Número de alumnos


Barrio Belgrano 300
Barrio Cabildo 150
Barrio Contreras 30
Barrio Ejército Argentino 20
Total 500
Fuente: Datos ficticios

a) ¿Que representa el número 500?


b) ¿Cuál es la variable de clasificación? Indique de que tipo de variable
se trata.
c) Obtenga frecuencias relativas y los porcentajes correspondientes.
d) Determine si corresponde calcular frecuencias acumulada.
e) Realice gráfico de tortas.
f) ¿Qué otro gráfico puede emplear para representar estos datos?

34
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Actividad 5
Los siguientes datos corresponden a la edad de los tutores de alumnos que
concurren al EGB de un establecimiento escolar
xi:
44 30 45 48 31 45 33 35 54 44
45 47 38 56 29 43 43 62 60 30
52 36 45 31 31 32 34 32 54 55
55 46 61 39 43 38 47 45 38 37
63 49 34 48 34 64 44 47 36 60
50 52 37 41 29 37 49 37 39 56
39 46 46 31 60 29 53 40 41 58

Presentar los datos :


a) En una tabla con un número aproximado de intervalos de clase.
b) En una tabla con 5 intervalos
c) ¿Que gráficos utilizaría para representar los datos contenidos en
estas tablas?
d) Con la tabla presentada en el item b, realice un histograma.
e) Con la tabla presentada en el item a, realice un polígono de
frecuencias.

Actividad 6
Los siguientes datos corresponden a alumnos analfabetos por
Departamento en la Pcia. de Santiago del Estero, discriminados por sexo.
Año 2001
Departamento Total Sexo
Varones Mujeres
Capital 4587 2299 2288
Banda 4752 2461 2291
Río Hondo 3473 1960 1513
Robles 2116 1166 950

FUENTE: INDEC. Censo Nacional de Población, Hogares y Viviendas. 2001.

En base a los datos proporcionados en la tabla anterior realice:


a) Gráfico de barras simples que muestre el número total de alumnos
analfabetos por Departamento. ¿Que otro tipo de gráfico podría
utilizar en la representación?
b) Gráfico de tortas que muestre el número de alumnos analfabetos
discriminados por sexo para el Departamento Robles.
c) Realice un gráfico de barras agrupadas por Departamento

35
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

d) Realice un gráfico de barras porcentuales por Departamento


discriminando dentro de cada una de ellas los porcentajes de
varones y mujeres analfabetos.

Actividad 7

Utilice un gráfico lineal para mostrar la evolución de egresados del


Polimodal
Año Nº de
egresados
1980 233
1985 278
1990 321
1995 375
2000 391
FUENTE: Datos ficticios

Actividad 8
En base a los datos de la siguiente tabla:

Población en edad escolar, Nº de alumnos matriculados y Nº de maestros


correspondiente a cuatro lugares de la República Argentina.

Lugar Población en Nº de Nº de Nº de
edad escolar alumnos alumnos no maestros
matriculados matriculados
A 300000 248.000 7.000
B 150000 106.000 4.000
C 25000 24.000 1.200
D 160000 142.000 4.750
Fuente: Datos Ficticios

Calcular para cada lugar:


a) Proporción de alumnos matriculados
b) Nº de alumnos por maestro
c) Tasa de escolarización
d) Número de alumnos No matriculados
e) Porcentaje de alumnos No matriculados

36
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Actividad 9
Dada la siguiente tabla, calcule la retención y el desgranamiento de cada
cohorte y en base a los resultados realice el análisis correspondiente

Retención y Desgranamiento de la Escuela Primaria. Su evolución en 3


ciclos escolares del período 1964-1980

Ciclo Escolar Alumnos matriculados


1er Grado 7º Grado
1964 - 1970 723.264 321.940
1969 - 1975 751.049 375.723
1974 - 1980 729.048 391.756

Fuente: Estado, sociedad y educación en la Argentina de fin de siglo. D. Filmus. Troquil-


Bs.As.-1996-Pág.87.Citado por Lic,. Julio Zurita: Guía de actividades de la asignatura:
Introducción a la Estadística Educativa. Escuela para la Innovación Educativa. UNSE.
Año

a) Calcule la tasa de desgranamiento


b) Calcule la tasa de retención
c) Interprete los resultados obtenidos

Actividad 10
La siguiente tabla fue extraída del Censo Nacional de Población, Hogares y
Vivienda . 2001.

Población de 10 años y más de departamentos de Santiago del Estero, por


condición de alfabetismo y sexo. Año 2001.

Provincia Población Condición de alfabetismo


de 10 años Alfabetos Analfabetos
y más Total Varones Mujeres Total Varones Mujeres
Total 607.782 571.067 284.309 286.758 36.715 19.030 17.685
Capital 191.311 186.724 87.894 98.830 4.587 2.299 2.288
Banda 97.689 92.937 45.066 47.871 4.752 2.461 2.291
Río 38.435 34.962 17.361 17.601 3.473 1.960 1.513
Hondo
Copo 19.241 17.264 9.156 8.108 1.977 948 1.029

a) Calcular la tasa de analfabetismo de los distintos Departamentos que se


muestran en la Tabla.
b) ¿Cuál es el porcentaje de población de más de 10 años sabiendo que la
población total de Santiago del Estero, según el Censo del año 2001 es de
804.457 ?

37
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

c) ¿Cuál es la tasa de analfabetismo de las mujeres en los distintos


departamentos?
d) Calcule la tasa de analfabetismo correspondiente a los varones de los
distintos departamentos.

38
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

UNIDAD III

MEDIDAS DE POSICIÓN Y DISPERSIÓN

INTRODUCCIÓN

En todo trabajo estadístico luego de recolectar los datos, ordenarlos,


agruparlos en tablas y presentarlos gráficamente, es preciso extraer alguna
información que caracterice a la población de la cual se los extrajo.

Por ello, el objetivo de éste capítulo es interiorizarlos acerca de las


medidas de posición y variación más utilizadas para caracterizar a la
población en estudio, y en que caso se emplea cada una de ellas,
interpretando los resultados a través del pensamiento crítico.

Los métodos de éste capítulo suelen denominarse métodos de


estadística descriptiva, porque su objetivo es resumir o describir las
características importantes de un conjunto de datos. Éstas características
se refieren al centro, variación, distribución, datos distantes y cambios a
través del tiempo.

1. Medidas de posición

Supongamos que una directora está preocupada por las notas


obtenidas en las pruebas de Matemáticas. Lo primero que se le ocurrirá es
tener una idea de si las notas de una muestra de alumnos se ubican cerca
de la calificación cinco o cerca de la calificación nueve. Necesita resumir
los datos y calcular alguna medida que sirva para que, con un único valor
sencillo y representativo pueda establecer si los alumnos se posicionan
cerca de una calificación de 5 puntos o si por el contrario se posicionan
cerca de la calificación de nueve puntos; a estas medidas se las denominan
Medidas de Posición, y si además indican el centro de ése conjunto de
valores, se denominan Medidas de posición y tendencia central.

Se conocen varias formas de determinar el centro de un conjunto de


datos. A continuación, se indicarán tres que son las más comúnmente
utilizadas: media, mediana y modo.

39
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

1.1. Media aritmética

La media (aritmética) es la medida de posición y tendencia central más


empleada para describir los datos; constituye lo que la mayoría de la gente
denomina promedio. Es quizás la más conocida y usada.

La media aritmética en una serie simple de datos, se la obtiene al dividir la


suma de todos los valores de la variable entre la cantidad de valores
sumados. A la media aritmética se la representa con x :

a)Cálculo de las media aritmética en series simples

 Ejemplo 1
Se registró los días de inasistencias en un año, de una muestra de cinco
alumnos del primer ciclo del EGB y se desea averiguar cuál es el promedio
de inasistencias de esa muestra. La variable en estudios es:

X = nº de inasistencias de los alumnos


Los valores de la variable son:
xi : 0; 16; 12; 5; 7
5

0  16  12  5  7 x1  x 2  x3  x 4  x5
x i
x   i 1

5 5 5 ,
y su fórmula de cálculo es la siguiente
n

x i
x i 1
n 2.1

En la fórmula se utiliza la letra griega  (sigma mayúscula) que indica


que los valores de la variable deben sumarse.
El símbolo n denota el tamaño de la muestra, que es el número de
alumnos observados.

Cuando los datos provienen de una muestra el símbolo de la media


aritmética es x (se denomina “x barra”); si se calcula la media aritmética
con los datos de toda la población se simboliza con
N

x i
 i 1

N 2.2

40
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

 denota la sumatoria del conjunto de valores.


xi expresan los diferentes valores que toma la variable.
n tamaño de la muestra, cantidad de valores observados
N tamaño de la población

Como nuestros datos constituyen una muestra para calcular la


media utilizamos la fórmula 2.1

x i
0  16  12  5  7 40
x i 1
  8
5 5 5

Interpretación: Los alumnos tienen en promedio 8 inasistencias por año.

Algunas propiedades de la media aritmética

1-La media aritmética es reproductora del total.

2- Si llamamos desvío a la diferencia entre un valor y la media aritmética

 d    x
i i 
x 0
xi d i  xi  x
0 0 – 8 =-8
5 5 - 8 =-3
7 7 - 8 =-1
12 12 – 8 = 4
16 16 – 8 = 8
Total 0

Una desventaja de la media es su sensibilidad a valores extremos, de modo


que un valor excepcional puede afectarla de una manera drástica, en este
caso no representa en forma adecuada al centro de dicho conjunto y tiende
a dirigirse a ese valor extremo.

Si por equivocación al pasar los datos en el ejemplo de las inasistencias de


los 5 alumnos colocamos 66 en vez de 16:

 Ejemplo 2
X = inasistencias de alumnos
xi : 0; 66; 12; 5; 7

41
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

La inasistencia promedio toma el valor 18, alejándose el promedio


hacia al valor extremo 66.

x i
0  66  12  5  7 90
x  i 1
   18
5 5 5

La media aritmética no representa el centro del conjunto de datos.


Este problema o desventaja se resuelve utilizando otra medida de resumen
de datos que se denomina: mediana.

La media aritmética se puede calcular cuando los valores de


las variables son cuantitativos tanto continuos como discretos.

1. 2 Mediana.

La mediana (de un conjunto de datos):es una medida de tendencia


central que divide a la serie ordenada de datos en dos partes iguales, de tal
forma que el 50% de los datos son menores o iguales a la mediana y el otro
50% mayores o iguales a ella. La mediana se designa con Me.

a) Cálculo de la mediana en series simples

 Ejemplo 3
 Se van a considerar dos casos: cuando el tamaño de la
muestra es impar y cuando n es par

Se desea determinar el valor mediano de las inasistencias de los alumnos
del ejemplo 2,
El tamaño de la muestra, “n” es impar.

X: inasistencias de alumnos
xi : 0; 66; 12; 5; 7

Para su cálculo debemos ordenar primero los datos en forma


ascendente o descendente.

Si el número de observaciones es impar, la mediana es el valor de la


variable que se localiza exactamente en la mitad de la lista.

En caso de que el número de observaciones fuera par, el valor de la

42
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

mediana se obtiene promediando los dos valores centrales.

Esos valores centrales se posicionan en el lugar


n 1
2

Solución. Primero se ordenan los datos

0; 5; 7; 12; 66.

La muestra posee tamaño impar n = 5 y el valor mediano está posicionado


en el lugar
5 1 6
 3
2 2

, o sea que el valor de la mediana es el valor de la variable ubicado en el 3º


lugar.

0; 5; 7; 12; 66.

Me = 7 inasistencias

Interpretación: el 50% de los alumnos tiene inasistencia menores o


iguales a 7.

 Ejemplo 4
En el caso de que n sea par
Supongamos que contamos las inasistencias de 6 alumnos.
X = inasistencias de alumnos
xi : 0; 66; 12; 5; 7;10

Solución. Primero se ordenan los datos


0; 5; 7; 10; 12; 66.

Las muestra posee tamaño par n = 6,


6 1 7
  3,5
Posición de los valores centrales 2 2

Los valores centrales ocupan el tercer y cuarto lugar, la mediana se


obtiene como el promedio de los dos valores centrales:

43
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

0; 5; 7; 10; 12; 66

7  10
Me   8,5  8
2
Interpretación: el 50% de los alumnos tienen inasistencias menores o
iguales a 8.

Deben quedar claro dos conceptos:

Primero: La mediana no se ve influenciada por los valores extremos, ya


que en su cálculo interviene el orden y no la magnitud de los valores.

Segundo: la media aritmética es sensible a valores extremos.

La mediana se puede determinar para variables cuantitativas


continuas discretas y para variables cualitativas que se miden en
escala ordinal.

1. 3. Modo.

El Modo es el valor de la variable que ocurre con mayor frecuencia.


Se designa frecuentemente como Mo.

Se debe hacer notar aquí que el Mo es un valor de variable y la


frecuencia de este valor sugiere su importancia estadística.

Cuando dos valores ocurren con la misma frecuencia y ésta es la


más alta, ambos valores son modas, por lo que el conjunto de datos es
bimodal.

Cuando más de dos valores ocurren con la misma frecuencia y ésta


es la más alta, todos los valores son modas, por lo que el conjunto de
datos es multimodal.

Cuando ningún valor se repite, se dice que no hay moda.

 Ejemplo 5.
Calcule las modas para los siguientes conjuntos de datos:

Serie A: 4,5; 7,6; 2,8; 4,5; 3,6; 2,6


Serie B: 4; 5; 3; 4; 6; 8; 5
Serie C: 27; 27; 27; 55; 55; 55; 88; 88; 99
Serie D: 1; 2; 3; 6; 7; 8; 9; 10

44
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Solución:
En la serie A. El número 4,5 es la moda pues es el valor que ocurre con
mayor frecuencia(2 veces).
En la serie B. Los números 4 y 5 son modas, ya que ambos ocurren con
la frecuencia más alta (2 veces).
En la serie C. Los números 27 y 55 son modas, ya que ambos ocurren
con la frecuencia más alta (3 veces).
En la serie D. No hay moda, ya que ningún valor se repite.

En realidad, la moda no se utiliza mucho con datos numéricos.


Sin embargo, entre las distintas medidas de tendencia central que
consideramos, la moda es la única que puede usarse cuando se trata
de variables cualitativas nominales.

 Ejemplo 6.
Una encuesta efectuada a estudiantes mostró que el 84 tiene
aparato de televisión; 76 videocasetera; 39 videojuegos y el 35 reproductor
de DVD. En tanto que el televisor es el aparato más frecuente, es posible
afirmar que la moda es el televisor.

No podemos calcular una media o mediana para datos como éstos,


cualitativos a nivel nominal.

3.- Cálculo de las medidas de posición en series de frecuencias

Veremos como se calculan la medidas de posición y tendencia central


cuando los datos están agrupados en una serie de frecuencias.

3.1. Variables agrupadas en serie de frecuencias simple

3.1.a. Media aritmética.


Como en una serie de frecuencias, fi nos indica las veces que se repite el
valor de la variable, debemos considerarlas en el cálculo de la media
aritmética.

45
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

 Ejemplo 7
Una maestra esta interesada en conocer el número promedio de hermanos
de su alumnos. Para ello tomó de una muestra de 25 alumnos.

Tabla 1. Alumnos de tercer año de polimodal de la Escuela Sarmiento


clasificados según el número de hermanos

Nº de hermanos Nº de alumnos
(xi) (fi)
0 1
1 9
2 7
3 5
4 3
Total 25
Fuente: Datos ficticios

Si aplicamos la fórmula 2.1, deberíamos sumar 1 vez cero, nueve


veces 1 y así sucesivamente hasta sumar 3 veces 4 y dividir esa suma
entre 25 que es el tamaño de la muestra.

xi: nº de hermanos
fi : número de alumnos que poseen xi hermanos

25

x i
0  1...  1  2...  3...  4...  4 50
x  i 1
  2
25 25 25

Pero, este cálculo se podría realizar en forma más simple y es


obtener esa misma suma reemplazándola por la multiplicación. Utilizando
la frecuencia fi que indica las veces que se repite el valor de la variable xi.

xi f1  x2 f 2  ...  x5 f 5
x
f1  f 2  ...  f 5

ahora expresando literalmente la fórmula de la media aritmética tenemos

1 n
x  xi f i
n i 1

Este promedio se conoce como media aritmética ponderada. Para


poder calcular la media aritmética ponderada correspondiente al ejemplo
planteado, agregamos a la tabla de frecuencias anterior una columna

46
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

auxiliar que facilitará el cálculo de la media.

Tabla 2. Alumnos de tercer año de polimodal de la Escuela Sarmiento


clasificados según el número de hermanos

Nº de hermanos Nº de alumnos xi*fi


(xi) (fi)
0 1 0
1 9 9
2 7 14
3 5 15
4 3 12
Total 25 50
Fuente: Datos ficticios

x
1 n
 .
xi f i =
1 50 = 2
25
n i 1

Podemos concluir diciendo que los alumnos de tercer año de


polimodal de la Escuela Sarmiento en promedio poseen 2 hermanos.

3.1.b. Mediana

Una maestra esta interesada en conocer la mediana del número de


hermanos de una muestra de 44 alumnos que concurren a una escuela
rural.

Tabla 3. Alumnos de una Escuela rural clasificados según el número de


hermanos

Nº de hermanos Nº de alumnos
(xi) (frecuencia, fi)

2 5
3 5
4 30
5 4
Total 44
Fuente: Datos ficticios

En esta serie de frecuencias de variable cuantitativa discreta, los


datos ya están ordenados, por lo que solo resta encontrar el valor central,
cuya posición se encuentra en el lugar

n  1 44  1 45
   22,5
2 2 2

47
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

O sea el valor mediano será el promedio de los valores de la variable


ubicados en el lugar 22 y 23. Para ello se deben seguir los siguientes
pasos:

1.-Calcular las frecuencias acumuladas correspondientes a cada valor de


la variable.

2.-Calcular el orden de localización de la mediana efectuando el cociente

n  1 44  1 45
   22,5
2 2 2

donde n = tamaño de la muestra

Tabla 4. Alumnos de una Escuela rural clasificados según el número de


hermanos
Nº de hermanos Nº de alumnos Frecuencias
(xi) (frecuencia, fi) acumulada (Fi)

2 5 5
3 5 10
4 30 40
5 4 44
Total 44
Fuente: Datos ficticios

Como el valor de la mediana se encuentra entre la posición 22 y la


posición 23, se busca en la columna de frecuencias acumuladas, el menor
valor que contiene a 22 (es 40), al que corresponde el valor de variable 4 y
el menor valor que contiene a 23 (es 40), al que corresponde el valor de
variable 4.

Por lo que el valor mediano es el promedio de los dos valores


centrales.
44
Me  4
2
Interpretación: el 50 % de los alumnos de escuelas rurales, tienen 4
hermanos o menos.

48
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

3.1.c. Moda

Ejemplo: Calcular el valor más frecuente del número de hermanos de los


alumnos de tercer año de polimodal de la Escuela Sarmiento (Tabla 2).

Solución: La variable que se estudia es una variable cuantitativa discreta.


Se busca en la columna fi el valor más alto, en este ejemplo es 9.
El valor de la moda es el valor de la variable que tiene frecuencia 9, es
decir

Mo = 1

Interpretación: La mayoría de los alumnos de tercer año de polimodal de


la Escuela Sarmiento. poseen un hermano .

3.2. Variable agrupada en serie de frecuencias con intervalos de clase,


para variable aleatoria continua

3.2.a. Media aritmética.

 Ejemplo

Para realizar un estudio sobre la nutrición de la población infantil


que concurre a la escuela en una localidad rural, se consultaron los pesos,
en kilogramos, de los 50 alumnos de la escuela, los que se muestran en la
Tabla 4. Los datos se agruparon en intervalos de amplitud 2 kg. y con
límite superior abierto. Determine el valor promedio del peso de los
alumnos.

Solución

1.- Se calcula las marcas de clase

Al organizar de esta forma los datos, se pierde información, pues la


tabla indica, por ejemplo que hay 12 alumnos que pesan entre 38 kg y 40
kg, pero no cuanto pesan cada uno. Ahora debemos encontrar un único
valor que represente o resuma a todos los valores del intervalo: ese valor es
el promedio o media aritmética de los límites del intervalo y se denomina
punto medio de la clase o marca de clase. Este valor representará el
valor xi de la fórmula de la media.

49
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

38  40
x1   39
2
40  42
x2   41  xi  a  39  2  41
2

Se introduce una nueva columna en la tabla que la denominaremos xi

Tabla 4. Peso de los alumnos de una escuela rural

Intervalo Nº de alumnos Marca de clase xi * fi


(kg) fi xi

38 a 40 12 39 468
40 a 42 19 41 779
42 a 44 7 43 301
44 a 46 6 45 270
46 a 48 6 47 282
Total 50 2100
Fuente: Datos ficticios

La fórmula para encontrar la media en serie de frecuencias es

1 n
x  xi f i
n i 1

Pero en este caso xi representa a la marca de clase


n=tamaño de la muestra= 
fi

Ahora ya estamos en condiciones de aplicar la fórmula para el


cálculo de la media aritmética, por ello agregamos una columna que es el
producto de cada marca de clase por su frecuencia (xi*fi).

1 n 1
x 
n i 1
xi f i 
50
* 2100  42kg

Interpretación: Los alumnos pesan en promedio 42 kg.

50
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

3.2.b. Mediana

 Ejemplo
Se desea conocer el peso mediano de los 50 alumnos de una escuela
rural (Tabla 4). El cálculo de la mediana en serie de frecuencias para
variable cuantitativa continua se efectúa utilizando la siguiente fórmula

f i
 Fant Me
Me  L inf  2 *a
f Me

L inf : límite inferior de la clase mediana


 fi
2 : Suma de la frecuencia entre 2
F ant Me
: frecuencia acumulada anterior a la clase mediana
f Me : frecuencia absoluta de la clase mediana
a: amplitud del intervalo a = Lsup- Linf

Peso de los alumnos de una escuela rural


Intervalo Nº de alumnos
(kg) fi

38 a 40 12
40 a 42 19
42 a 44 7
44 a 46 6
46 a 48 6
Total 50
Fuente: Datos ficticios
Solución
1-En la tabla se agrega una columna para valores de frecuencias
acumuladas.

Peso de los alumnos de una escuela rural


Intervalo (kg) Nº de alumnos fi Fi
38 a 40 12 12
40 a 42 19 31
42 a 44 7 38
44 a 46 6 44
46 a 48 6 50
Total 50

51
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Fuente: Datos ficticios


2- Se calcula
f i

El tamaño de la muestra se divide entre 2 porque la Mediana es el valor


de la variable que divide la serie ordenada de datos en 2 partes iguales.

f i

50
 25
2 2

3- Se busca en la columna Fi el menor valor que contiene a 25. En este


ejemplo el valor que corresponde es 31. Se señala la clase mediana y se
aplica la fórmula.
 fi  F
ant Me
Me  L inf  2 *a
f Me

50
 12
25  12 13 * 2
Me  40  2 * 2  40  * 2  40   40  1,37  41,37
19 19 19

Interpretación:
El 50% de los alumnos pesan 41,37 kg o menos.

3.2.c. Moda
 Ejemplo
Se desea conocer el peso más frecuente de los 50 alumnos. El cálculo del
modo en serie de frecuencias para variable cuantitativa continua se realiza
utilizando la siguiente fórmula

D1
Mo  Linf Mo  *a
D1  D2

Donde:
D1  f Mo  f anterior a la clase Modal
D2  f Mo  f posteriora la clase Modal
a: amplitud del intervalo

52
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Solución
En la columna fi se busca el valor más alto, en nuestro ejemplo 19,
se señala la fila, ella constituye la clase modal.
Se calcula:

D1  19  12  7

D2  19  7  12

a = 42- 40 = 2

Se aplica la fórmula

7 7 14
Mo  40  * 2  40  * 2  40   40,74kg
12  7 19 19

Interpretación: el peso más frecuente del grupo de alumnos es de 40,74


kg

Relación entre media, mediana y modo

Cuando la media, la mediana y el modo coinciden, la serie de datos


presenta una distribución simétrica unimodal.

= Me=Mo

Cuando esa coincidencia no existe, se dice que la distribución


unimodal es asimétrica.

La asimetría es positiva cuando la media es mayor que la mediana y


la mediana mayor que el modo, en éste caso vemos que la media aritmética
se dirige hacia el o los valores extremadamente grandes

53
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Mo < Me <
La distribución presenta asimetría negativa cuando la media es
menor que la mediana y la mediana menor que el modo; en éste caso
vemos que la media aritmética se dirige hacia el o los valores
extremadamente pequeños.

< Me< Mo

La distancia entre la media aritmética y el modo podría usarse como una


medida de asimetría (Ya-Lun Chou, 1990).

Asimetría = media – modo

Cuánto mayor es esta distancia, negativa o positiva, tanto más asimétrica


es la distribución

4- Medidas de localización

Son Medidas de Posición que dividen los valores ordenados de una serie en
cuatro, diez o cien partes iguales y se denominan cuartiles, deciles y
percentiles.

4.1 Cuartiles

Los cuartiles son tres valores Q1, Q2, Q3, que dividen a la serie ordenada
en cuatro partes iguales.
Por debajo del primero quedan el 25% de los datos; por debajo del segundo
el 50% de los mismos y por debajo del tercero el 75%. El segundo cuartil
coincide con la Mediana.

54
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

4.2 Deciles
Los Deciles son nueve valores de la variable y dividen a la serie ordenada
de datos en 10 partes iguales, el decil 5 coincide con la Mediana, es decir
el 50% de los valores son menores o iguales al D5.

4.3 Percentiles
Los percentiles son 99 valores de la variable, que dividen al conjunto de
datos (ordenados de menor a mayor) en cien partes iguales el percentil 50
coincide con la mediana. Los percentiles se designan con la letra Pi, el
subíndice i, varía de 1 a 99, indicando el valor del percentil, que se desea
calcular.

 Cálculo de percentiles:

Forma analítica

Para calcular los percentiles de una distribución de frecuencias se procede


del mismo modo que en el caso de la mediana, salvo que ahora dividiremos

n fi
al tamaño de la muestra en cien partes iguales, en vez de dos.

 Ejemplo
Se desea conocer P20 de licencia en las escuelas del centro de la ciudad de
Santiago del Estero en el año 2004.

Tabla 5. Días de inasistencia de los docentes de escuelas de la capital de


Santiago del Estero en el período escolar 2004.

Intervalo de clase Nº de docentes Fi


(días de licencia) (fi)
0 a 10 30 30
10 a 20 60 90
20 a 30 60 150
30 a 40 70 220
40 a 50 90 310
50 a 60 100 410
60 a 70 60 470
70 a 80 40 510
80 a 90 10 520
90 a 100 10 530
Total 530
Fuente: Datos ficticios

55
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

El cálculo de percentiles para variables agrupadas en serie de


frecuencias con intervalos de clase, se efectúa utilizando la siguiente
fórmula:

i fi
 Fant Pi
Pi  L inf  100 *a
f Pi

L inf : Límite inferior de la clase donde se encuentra el percentil

i = valor del percentil que se busca

Fant Pi: frecuencia acumulada anterior a la clase donde se encuentra el


Percentil i

fPi :frecuencia absoluta de la clase donde se encuentra el Pi

a: amplitud del intervalo a =Lsup- Linf

Solución
Cálculo del percentil 20

Pasos
1.- Se agrega una columna de frecuencias acumuladas (Fi)

2.- Se calcula
i  f i 20 * 530
  106
100 100

3.- Se ubica en la columna Fi el menor valor que contiene a 106, en


nuestro ejemplo 150. La clase que tiene una Fi= 150 es la clase que
contiene al Percentil buscado

4.- Se calcula a: Lsup –Linf = 30-20=10


5.- Se aplica la fórmula

106  90 16 *10
P20  20  *10  20   22,67  23 días
60 60

56
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Interpretación
P20 = 23 días

El 20 % de los docentes toman 23 días de licencia o menos

 Rango percentil

Forma analítica

Se puede presentar, el problema inverso, es decir, conocer cuántos


docentes toman 52 días de licencia o menos, es decir nos dan como dato
un valor de la variable y nos preguntan que percentil le corresponde; a este
procedimiento se lo denomina calcular el Rango percentil.

Es decir el rango percentil de un valor dado es el porcentaje de valores


comprendidos debajo del valor solicitado.

 Ejemplo:
Calcular el rango percentil que le corresponde a 52 días de licencia de los
docentes de las escuelas de la ciudad de Santiago del Estero

Repetimos la tabla 5 para visualizar mejor el cálculo

Días de inasistencia de los docentes de escuelas de la capital de Santiago


del Estero en el período escolar 2004.

Intervalo de clase Nº de docentes Fi


(días de licencia) (fi)
0 a 10 30 30
10 a 20 60 90
20 a 30 60 150
30 a 40 70 220
40 a 50 90 310
50 a 60 100 410
60 a 70 60 470
70 a 80 40 510
80 a 90 10 520
90 a 100 10 530
Total 530
Fuente: Datos ficticios

Solución
1.- Ubicamos en la tabla el intervalo de clase donde se encuentra el valor
52 es el intervalo que va de 50 a 60.

2.- Se calcula la Frecuencia acumulada que le correspondería al valor 52

57
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

con la siguiente fórmula


( xi  Linf )
F ( xi )  * f int erv  FClase anterior
a

Donde:
F(xi)= frecuencia acumulada correspondiente al valor que se busca
Linf Límite inferior del intervalo de clase donde se encuentra xi
finterv Frecuencia absoluta del intervalo donde se encuentra xi
a amplitud del intervalo

F clase ant. Frecuencia acumulada de la clase anterior al intervalo donde


se encuentra xi

(52  50) 2 *100


F (52)  *100  310   310  330
10 10

3.- Se calcula ahora el rango percentil con la siguiente fórmula

F ( xi )
Rp  *100
 fi
330
Rp  * 100  62.26%  62%
530

Interpretación:
Xi= 52 días
Pi= 52

El 62% de los docentes toman 52 días de licencia o menos.

(Cálculo gráfico de percentiles y rango percentil

Ejemplo
Calcular gráficamente el percentil 20

Solución
Se debe construir un gráfico de líneas; los pares de valores a graficar
corresponden al límite superior del intervalo con el porcentaje acumulado
correspondiente a dicha clase.
1.- Calcular porcentaje acumulados. Para ello se necesita calcular:
a) frecuencia relativa para cada intervalo

58
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

b) porcentaje
c) porcentaje acumulado
2.- Se grafica un polígono (Lsup; %acum.). El gráfico que se obtiene se
denomina ojiva.

Días de inasistencia de los docentes de escuelas de la capital de Santiago


del Estero en el período escolar 2004.

Intervalo de clase Nº de docentes fri Porcentaje Porcentaje


(días de licencia) (fi) fri*100 acumulado
0 a 10 30 0,0566 5,67= 6 6
10 a 20 60 0,1132 11,32 = 11 17
20 a 30 60 0,1132 11,32 = 11 28
30 a 40 70 0,1321 13,21 = 13 41
40 a 50 90 0,1698 16,98 = 17 58
50 a 60 100 0,1887 18,87 = 19 77
60 a 70 60 0,1132 11,32 = 11 88
70 a 80 40 0,0755 7,55 = 8 96
80 a 90 10 0,0189 1,89 = 2 98
90 a 100 10 0,0189 1,89 = 2 100
Total 530 100

100

90
80

70
60
%

50

40
30

20
10
0
0 10 20 30 40 50 60 70 80 90 100

Días

5.-Si deseamos calcular el valor que corresponde al percentil 20. Se ubica


el valor 20 en el eje vertical y se traza una paralela al eje horizontal hasta
la curva y luego se traza una vertical hasta encontrar el valor de días
correspondiente, el que aproximadamente es 23.

Interpretación:
El 20 % los docentes incurren en 23 días de licencia o menos

59
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

6.-Si deseamos conocer cual es el rango percentil que corresponde a 52


días, ubicamos ese valor en el eje horizontal y trazamos una paralela al eje
vertical hasta la curva y desde allí una paralela al eje horizontal, leemos en
el eje vertical el valor correspondiente al rango percentil (aproximadamente
60).

100

90
80

70
60
%

50
40
30

20
10
0
0 10 20 30 40 50 60 70 80 90 100

Días

Los valores correctos se obtienen utilizando las fórmulas presentadas


anteriormente.

MEDIDAS DE VARIABILIDAD O DISPERSIÓN

Las Medidas de Posición no son suficientes por si solas para


describir el conjunto de datos es necesario tener además una idea de como
se distribuyen los datos alrededor del centro de la distribución. Para eso
surgen las Medidas de Dispersión o variabilidad.

60
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

1.-Medidas de variabilidad en series simple. Su cálculo

1.1. RANGO
Es llamado también amplitud total de variación de la variable. Se lo
obtiene como la diferencia entre el valor máximo y mínimo de la variable.

Distribución A: 1 5 5 5 5 5 5 5 5 9

Distribución B: 1 1 2 4 5 6 7 7 8 9

RA=9-1=8
RB=9-1=8

En este caso el valor del rango es el mismo, a pesar de que notamos


que la variabilidad de las dos distribuciones es diferente.

La desventaja de esta medida es que solo considera los valores


extremos sin tener en cuenta el comportamiento del resto de las
observaciones. Por lo que observamos que a pesar de tener variabilidades
diferentes las dos distribuciones, el rango no la capta.

Para solucionar este problema surgen otras medidas de variabilidad


como el desvío medio.

¿Cómo se puede medir la variabilidad de un conjunto de datos? Si por


variabilidad se entiende el grado en que los valores de la distribución
difieren de la media y entre si, entonces la desviación promedio de los
valores a partir de la media puede resultar una medida razonable de
variabilidad:

 x i x 
n

Se denomina desvío a la diferencia entre cada valor de la variabley


su medio.

Cuando el valor de la variable es mayor que el valor medio el desvio


es positivo; cuando el valor de la variable es menor que el valor promedio
los desvíos son negativos.

Pero por propiedades de la media sabemos que la suma de los


desvíos de los valores respecto a la media es siempre es cero, pues las
desviaciones positivas respecto a la media, anulan siempre a las

61
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

desviaciones negativas, con lo que resulta siempre una suma igual a cero y
por ende el valor promedio.

Como esta medida de variabilidad parece razonable, debemos


redefinir nuestra medida para evitar los valores negativos. Una manera de
hacerlo es considerar el valor absoluto de los desvíos; la medida que se
obtiene se denomina:

1.2.DESVIO MEDIO: Se define como el promedio del valor absoluto de los


desvíos; se designa con DM.

DM 
d i

x i x
n n

Tabla 6: Distribución de puntajes de un grupo de alumnos


xi x x di
d= i i
1 -4 4
5 0 0
5 0 0
5 0 0
5 0 0
5 0 0
5 0 0
5 0 0
5 0 0
9 4 4
x i  50  d   0
i d i 8
x5 DM 
8
 0,8
10
Fuente: Datos ficticios

Pero generalmente no se puede operar fácilmente cuando se trabaja


con valor absoluto, por eso se considera una segunda forma de modificar
esos signos negativos y consiste en elevar los desvíos al cuadrado, lo que
dará desvíos al cuadrado positivos. Esta nueva medida de variabilidad se
denomina varianza.

1.3. Varianza es el promedio de los desvíos al cuadrado y se designa con


S2 cuando se trata de una muestra y es un mejor estimador de
la varianza poblacional(  ) cuando la suma de los desvíos al
2

cuadrado se divide entre el tamaño de la muestra menos 1;


por ello para una muestra la fórmula es:

62
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

 x  x 
n
2
i
S2  i 1 Variancia de una muestra, para series simples
n 1

 x   
i
2

Variancia poblacional
2  i 1
N

Cuántos más tiendan los valores a diferir de la media, mayor será la


varianza. El valor numérico de la varianza de una distribución depende de
la unidad de medida que se utilice. Por consiguiente, cuando se compara
la varianza de dos o más distribuciones, hay que estar seguro que la
unidad de medida empleada es igual en todas las distribuciones. En el
ejemplo de la Tabla 7:

Distribución de puntajes de un grupo de alumnos

xi
di=
xi  x 
d12  xi  x 
2

1 -4 16
5 0 0
5 0 0
5 0 0
5 0 0
5 0 0
5 0 0
5 0 0
5 0 0
9 4 16
x  50  d   0  x 
2
i i i  x  32
x5 S2 
32
 3,56
9
Fuente: Datos ficticios

 x  x 
n
2
i
32
S2  i 1
  3,56
n 1 9

63
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Otra desventaja es que la varianza se expresa, en unidades al


cuadrado y no en término de las unidades originales de medición, lo que
hace difícil la tarea de relacionar en forma significativa el valor de la
varianza con el conjunto original de datos.

Por eso es conveniente, considerar una medida de variabilidad que


se exprese en unidades originales. Esta nueva medida denominada
desviación estándar se obtiene al extraer a la varianza la raíz cuadrada.

1.4.Desviación estándar muestral

 x  x 
n
2
i
S i 1
n 1

 x  x 
n
2
i
32
S i 1
  3,56  1,89
n 1 9

Desviación estándar poblacional

 x   
2
i
  i 1
N

Nos debe quedar claro que la desviación estándar mide la variación


entre los valores. Los valores cercanos producirán una desviación estándar
pequeña, mientras que los valores dispersos producirán una desviación
estándar más grande.

2.-Medidas de variabilidad en series de frecuencia simple. Su cálculo

Ejemplo: Calcular la variabilidad de las inasistencias de 32 alumnos

64
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Tabla N° 7. Inasistencias de 32 alumnos

Nº de inasistencias Nº de alumnos
(xi) (fi)
11 12
12 9
14 5
15 4
23 2
Total 32

FUENTE: Datos ficticios

Cuando se trata de variables cuantitativas discretas el Rango se calcula:

2.1 Rango= Valor máximo -Valor mínimo + 1

Rango=R = 23 - 11+1=13 inasistencia

2.2 Desvío medio en serie de frecuencia simple

DM 
 d * f  x  x *f
i i i i

f i f i

Cálculo:
1) Se calcula la media aritmética
2) Se calcula los desvíos
3) Se obtiene el valor absoluto y se lo multiplica por su frecuencia
4) Se aplica la fórmula

Inasistencias de 32 alumnos
Nº de inasistencias Nº de alumnos xi*fi d i  xi  x d1 di * fi
(xi) (fi)
11 12 132 -2 2 24
12 9 108 -1 1 9
14 5 70 1 1 5
15 4 60 2 2 8
23 2 46 10 10 20
32 416 66

x
x * f i i

416
 13
f i 32

65
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

DM 
d *f i i

66
 2,06
f i 32

2.3. Varianza en serie de frecuencia simple

 x  x   x  x  f
n n
2 2
i fi i i
S2  i 1
 i 1
n 1  f 1 i

1) Se calcula la media aritmética


2) Se calcula los desvíos
3) Se elevan los desvíos al cuadrado
4) Se multiplica cada desvío al cuadrado por su frecuencia
5) Se aplica la fórmula

Inasistencias de 32 alumnos
Nº de inasistencias Nº de alumnos xi*fi d i  xi  x d i2 d i2 * f i
(xi) (fi)
11 12 132 -2 4 48
12 9 108 -1 1 9
14 5 70 1 1 5
15 4 60 2 4 16
23 2 46 10 100 200
32 416 278
FUENTE: Datos ficticios

 x  x 
n
2
i fi
278 278
S 
2 i 1
   8,97 días 2
n 1 32  1 31

2.4 Desviación estándar en serie de frecuencia simple

 x  x  * f  x  x  * f
n n
2 2
i i i i
S i 1
 i 1
n 1  f 1 i

 x  x 
n
2
i * fi
278 278
S i 1
   8,97  2,99
n 1 32  1 31

66
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

3.- Medida de variabilidad en serie de frecuencias con intervalos de


clase

Los siguientes datos corresponden a edades de los alumnos de los 2 ciclos


de EGB.

Tabla N°9. Edades de los alumnos de segundo ciclo del EGB

Clases de Marca de fi xi*fi di  ( xi  x) d1 d1


edad en año clase (xi) *fi
6 a 8 7 4 28 -4 4 16
8 a 10 9 8 72 -2 2 16
10 a 12 11 11 121 0 0 0
12 a 14 13 12 156 2 2 24
14 a 16 15 2 30 4 4 8
Total 37 407 64
Fuente: Datos ficticios

3.1.Rango
L.superior de la última clase – L.inferior de la primera clase. Como los
límites superiores de las clases son abiertos, es decir no toma el valor 16,
debemos colocar el valor 15,99

R = 15,99 – 6 = 9,99 años

1) Se calculan las marcas de clase y luego la media aritmética


2) Se calcula los desvíos
3) Se elevan los desvíos al cuadrado
4) Se multiplica cada desvío al cuadrado por su frecuencia
5) Se aplica la fórmula

3.2. Desvío medio en serie de frecuencia de intervalos

DM 
d *fi i

64
 1.73
f i 37

1) Se calculan las marcas de clase y luego la media aritmética

67
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

x
x * f i i

407
 11
f i 37

2) Se calcula los desvíos


3) Se obtiene el valor absoluto de los desvíos
4) Se multiplica cada desvío absoluto por su frecuencia, se suma
5) Se aplica la fórmula

3.3. Variancia serie de frecuencia con intervalos de clase

1) Se calculan las marcas de clase y luego la media aritmética


2) Se calculan los desvíos
3) Se elevan los desvíos al cuadrado
4) Se multiplica cada desvío al cuadrado por su frecuencia
5) Se aplica la fórmula

Edades de los alumnos de segundo ciclo del EGB

Clases de Marca de fi xi*fi di  ( xi  x) d i2 d i2 *fi


edad en año clase (xi)
6 a 8 7 4 28 -4 16 64
8 a 10 9 8 72 -2 4 32
10 a 12 11 11 121 0 0 0
12 a 14 13 12 156 2 4 48
14 a 16 15 2 30 4 16 32
Total 37 407 176
Fuente: Datos ficticios

Varianza en serie de frecuencias con intervalos de clase, la única


diferencia con las fórmulas para serie de frecuencias simples es que xi,
representa el punto medio de la clase o marca de clase

 x  x 
n
2
i fi
176 176
S 
2 i 1
   4,89 años 2
n 1 37  1 36

68
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

3.4 Desviación estándar en serie de frecuencias con intervalos de clase.

 x  x 
n
2
i * fi
176 176
S i 1
   4,89  2,21 años
n 1 37  1 36

COEFICIENTE DE VARIACIÓN

Las cuatro medidas de variabilidad enunciadas precedentemente son


medidas de variabilidad absoluta. El coeficiente de variación es una
medida de variabilidad relativa.

Expresa la desviación estándar como un porcentaje de la media. Es


una medida adimensional, se expresa en % y sirve para comparar la
variabilidad entre dos o más distribuciones que provengan de diferentes
unidades de medidas o teniendo igual unidad de medida los valores de
diferente magnitud.

Coeficiente de variación muestral C.V .  S 100


x

Ejemplo
Decir cual de las siguientes distribuciones es más variable:

xi: peso de los alumnos de nivel inicial (kg)


34; 29; 28; 31; 40

yi: altura de los alumnos de nivel inicial (m)


1,24 1,54 1,38 1,37 1,56

x =32,4 kg Sx=4,83kg
y =1,42 m Sy=0,13m

No podemos decir que la variabilidad en peso es mayor que la


variabilidad en altura, ya que las variables están medidas en distintas
unidades, para poder compararlas la debemos expresar como porcentaje
de sus medias

69
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

CVx=(4,83/32,4)*100=14,91%

CVy=(0,13/1,42)*100=9,15%

Conclusión: los alumnos tienen menor variabilidad en altura que en peso.

--------------------------------------------------------------------------------------------
Uso de la calculadora científica para el cálculo de Medidas de
Posición y Dispersión Calculadoras Casio modelo fx-82W.
Seguir las siguientes instrucciones:

Debe procurar que la calculadora se encuentre en disposición para


efectuar cálculos estadísticos. Para ello apriete mode 2. En la parte
superior de la pantalla aparece la notación SD.

Debe cerciorarse de que no hay nada acumulado en la memoria.


Para ello pulse SHIFT AC = y en su pantalla aparece el número cero. Se
está ahora en condiciones de introducir los datos.

Por ejemplo para serie simple: xi: 1 2 3 4 5

Marque el nº 1 y luego la tecla M+

Marque el nº 2 y luego la tecla M+

Marque el nº 3 y luego la tecla M+

Así sucesivamente hasta haber cargado todos los datos.

Para cerciorarse de la cantidad de datos introducidos

Pulse ALPHA y la tecla 3 en el cursor aparece la letra n, apriete


ahora = y aparecerá el 5, pues Ud. introdujo los 5 valores.
Para obtener la media aritmética pulse SHIFT y la tecla 1, en la pantalla

aparece x apriete = y en su pantalla aparece el valor 3 que es el valor de


la media.

Para obtener la desviación estándar marque SHIFT y la tecla 3, aparece en

su pantalla
 n1 presione = y en su pantalla aparecerá el valor 1,58

Si aprieta ahora la tecla x2 obtendrá 2,50 que es el valor de la

70
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

varianza muestral S2

Si desea obtener la suma de los valores de x presione Alpha y la tecla 2.

Para el caso de que la serie sea de frecuencia simple

Se coloca la máquina en modo estadística Mode 2

Presione SHIFT AC =; ya tiene la memoria limpia.

Se introduce el valor xi, luego SHIFT, la tecla que tiene la coma.


Aparece en la pantalla xi; ahora introduzca el valor de fi y una vez que
tenga en la pantalla xi; fi recién apriete M+ ; continúe así hasta introducir
todos los valores de su serie, para el cálculo de la media, desviación
estándar y varianza se procede luego apretando las teclas indicadas
anteriormente.

Cuando se trabaja con todos los datos de una población para el


cálculo de la desviación estándar se aprieta SHIFT y la tecla 2

GUÍA DE EJERCITACIÓN

Actividad 1

a) Los siguientes son pesos individuales de 10 alumnos de primer año de


EGB:
30, 32, 30.5, 31, 33, 31, 32.9, 34, 34.6, 35

b) En la etapa de diagnóstico destinada a implementar un Plan de Salud


Bucal en alumnos de EGB, en una escuela el odontólogo determinó el
número de caries que presentaba cada alumno. Los siguientes son número
de caries que presentaban 9 de dichos alumnos:

71
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

2, 4, 0, 2, 3, 5, 1, 2, 2

c) En un curso se tomó ocho alumnos al azar y se les preguntó cuál era el


salario que percibía mensualmente su padre. Ellos son los siguientes:
3000, 1000, 570, 400, 600, 1500, 500, 570

1.- En cada caso determine y clasifique el tipo de variable que se


considera.

2.- ¿Cómo se denomina en cada caso el conjunto de datos obtenidos para


la variable que se estudia?

3.- Determine en cada uno de los incisos a, b y c, la Media Aritmética,


Mediana y Modo.

4.- En cuál de los casos arriba detallados ¿la media no es una Medida de
Posición adecuada?

Actividad 2

a) En cada una de las series de datos de la Actividad 1, calcule Rango,


Desviación Media, Desviación estándar y Coeficiente de Variación.
b) Si Ud. quiere comparar la variabilidad de los datos de cada una de las
series presentadas en la Actividad 1, cuál medida de dispersión emplearía?

72
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Actividad 3

Para realizar una evaluación del Número de puntos obtenidos en una


Prueba de Matemáticas realizada a los 30 alumnos de 6° de EGB, se
ordenó dicha variable en la siguiente serie de frecuencias:

N° de puntos 0 1 2 3 4 5 6 7 8 9 10
xi
N° de alumnos 0 1 0 4 3 8 6 4 1 2 1
fi

a) Calcule Media, Mediana y Modo.

b) Determine Desviación Estándar, Varianza y Coeficiente de Variación.

c) Indique si la distribución que se analiza es simétrica o no. En caso de


ser asimétrica, indique que tipo de asimetría presenta.

d) A los fines de la evaluación, cuál de las tres Medidas de Posición sería


más correcta utilizar?

Actividad 4

Los siguientes datos corresponden a Tipo de Deportes que prefieren


los alumnos de una escuela.

Tipo de deportes N° de alumnos


fi
Basquet 220
Fútbol 500
Pelota al cesto 180
Hockey 100
Total 1000

a) Indique qué tipo de variable es.


b) Determine la Medida de Posición que corresponda a este caso.

73
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Actividad 5

Las alturas de alumnos de un curso de Polimodal en una escuela se


muestran en la siguiente Tabla:

altura fi
(m)
1.10-1.15 3
1.15-1.20 4
1.20-1.25 6
1.25-1.30 5
1.30-1.35 9
1.35-1.40 9
1.40-1.45 6
1.45-1.50 2
1.50-1.55 1
1.55-1.60 1
1.60-1.65 1

a) Qué tipo de variable se considera?

b) Encuentre frecuencias acumuladas, porcentajes y porcentajes


acumulados.

c) Encuentre Media Aritmética, Mediana y Modo.

d) Calcule Desviación estándar y Coeficiente de variación.

e) Realice el gráfico de la distribución porcentual acumulada.

f) Determine gráfica y analíticamente el rango percentil para las siguientes


alturas:
1.18, 1.47, 1.56, 1.62.

g) Determine gráfica y analíticamente las alturas correspondientes a los


percentiles:
10, 25, 50, 75

74
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

UNIDAD IV

PROBABILIDADES Y DISTRIBUCIONES DE
PROBABILIDADES – INFERENCIA ESTADÍSTICA

1.- INTRODUCCIÓN

La teoría de probabilidad tiene sus orígenes en la teoría de la


casualidad. Históricamente, la teoría de la Probabilidad comenzó con el
estudio de los juegos de azar, tales como la ruleta y las cartas.

La teoría de la Probabilidad no es tan extraña como pudiera


pensarse. Sin duda alguna, en la vida diaria con mucha frecuencia
emitimos juicios probabilísticos, aunque a menudo no lo reconocemos
como tales.

Por ejemplo, supongamos que, por razones diferentes, usted no está


preparado para la clase de hoy. Seriamente usted considera faltar a clase.
¿Qué factores influirán en su decisión? Obviamente una consideración
será la probabilidad de que el profesor descubra su falta de preparación. Si
el riesgo es alto, usted decide no ir a clase. Veamos, hay dos alternativas
posibles:

1. Su falta de preparación será descubierta.


2. Su falta de preparación no será descubierta.

Hay incertidumbre en esta situación porque hay más de una


alternativa posible. Su decisión de asistir a clase, dependerá del grado de
certeza asociado con cada una de estas alternativas. Así, si usted está
bastante seguro de que prevalezca la primera alternativa, usted decidirá no
ir a clase.

Supóngase que su profesor con frecuencia pide a los estudiantes que


participen en clase activamente. De hecho, usted ha notado que la mayoría
de los estudiantes son interrogados en cada sesión de clase. Este es un
ejemplo en el cual hay un alto grado de certeza asociada con la primera
alternativa. Dicho de esta manera, la probabilidad del primero es mayor
que la del segundo. Por consiguiente usted decide no ir a clase. Usted ha
tomado una decisión con base en un empleo intuitivo, de la probabilidad.

Antes de estudiar la teoría de la probabilidad, es conveniente


comprender bien uno de los conceptos más importantes de la Inferencia
Estadística: el concepto de azar

75
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

2.- EL CONCEPTO DE AZAR

Definimos una población como el conjunto completo de individuos,


objetos o medidas que tienen alguna característica común observable. Muy
rara vez se puede estudiar una población. Seleccionamos muestras de una
población con la esperanza de que los estadísticos de la muestra nos
permitan calcular los parámetros de la población. Para obtener una
correspondencia entre un estadístico y un parámetro, la muestra debe
representar una selección aleatoria de la población. Una forma de obtener
una muestra aleatoria, es mediante el Muestreo al Azar Simple, de tal
manera que cada individuo , objeto o medida tenga igual probabilidad de
ser seleccionado. Una característica sobre los sucesos aleatorios, es que
ningún suceso tiene efecto predecible sobre el siguiente. Podremos
comprender más clara y fácilmente el concepto de azar en relación con los
“juegos de azar, si suponemos que se juegan limpiamente. Conocer el
resultado del lanzamiento de una moneda al aire, del lanzamiento de un
dado, del resultado de un juego de ruleta, no nos ayudará en absoluto en
la predicción de los resultados por venir. Esta característica de los sucesos
al azar se conoce como independencia. Si la independencia existe,
podemos hablar de sucesos realmente al azar.

La segunda característica importante del azar es que cuando la


muestra se extrae de una población, cada elemento debe tener una
probabilidad igual de selección. Así, si nuestra selección o modo de
selección favorece ciertos sucesos o ciertas colecciones de sucesos, no
podemos afirmar que los resultados son al azar.

3.- PROBABILIDAD Y ESTADÍSTICA

La Estadística Descriptiva, hace referencia a los datos que se tienen


en la mano. Cuando se quiere ir más allá de los datos disponibles, es
necesario inferir o sea utilizar la Estadística Inferencial. Como ella infiere
el todo (población) a partir de la información que da una parte de ese todo
(muestra), el conocimiento que adquiere es incompleto y por lo tanto no
“totalmente cierto” es decir, se debe trabajar con probabilidades. Por ello,
antes de estudiar las aplicaciones de la Estadística Inferencial es necesario
estudiar probabilidades.

76
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

4.- TEORÍAS DE PROBABILIDAD

Se puede considerar la probabilidad como la teoría que tiene que ver


con los posibles resultados de los experimentos. Estos deben ser
potencialmente repetitivos, es decir, debemos ser capaces de reproducirlos
bajo condiciones similares. Debe ser posible enumerar cada resultado que
pueda ocurrir, y debemos ser capaces de establecer las frecuencias
relativas de estos resultados.

Se distingue el enfoque clásico , frecuencial y axiomático de la teoría


de probabilidad.

4.1.-EXPERIMENTOS ALEATORIOS. ESPACIO MUESTRAL. EVENTOS.

El lanzamiento de un dado, o de una moneda, la extracción de un


naipe de la baraja, de las bolillas de la lotería son experiencias aleatorias,
pues sus resultados dependen del azar. También son aleatorios: el tiempo
de espera de una persona en la parada del autobús, sexo de los hijos en
un matrimonio, el número de hijos que tendrá un matrimonio, etc.

Los primeros (lanzamiento, extracciones) son fáciles de seguir, pues


se pueden repetir tantas veces como se quiera de forma rápida. A partir de
ellos se obtienen leyes que rigen los fenómenos aleatorios y se aplican al
estudio de situaciones aleatorias.

Conceptos necesarios para definir probabilidades

Experimentos aleatorios: son aquellos que, repetidos bajo idénticas


condiciones, no arrojan un único resultado sino un conjunto de
ellos.
 Ejemplos: Arrojar un dado
 Arrojar una moneda

Espacio muestral. Es el conjunto de los resultados posibles de un


experimento aleatorio y se denota con M.

Ejemplos.
 Para el caso de arrojar un dado, el espacio muestral resultante
es:

77
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

M= 1,2,3,4,5,6
 Para el caso de arrojar una moneda, el espacio muestral
resultante es:

M={C, S}

Para el caso de arrojar una moneda y un dado


simultáneamente ,el espacio muestral resultante es:

M = (cara, 1) , ( cara , 2 ) .....,(cara , 6) , (sello , 1),...(sello, 6)

Evento simple .Es cada uno de los resultados de un experimento aleatorio


que no puede desglosarse en componentes más simples. Se
designan con la letra minúscula.

Ejemplos
 Para el caso de arrojar un dado. Obtener el número 1, es un
evento simple, lo mismo ocurre con los números restantes
e={1}
e={2}
 Para el experimento aleatorio arrojar una moneda al aire, los
evento simples son
e={c}
e={s}

Evento compuesto. Es un subconjunto del Espacio Muestral. Es el


resultado de la unión de eventos simples. Se lo representa con letra
mayúscula.
 Para el caso de arrojar un dado. El espacio muestral es
M= 
1,2,3,4,5,6
 Obtener número par, es el resultado de la unión de los
eventos simples 2, 4, 6, y constituyen un subconjunto del
espacio muestral.
P={2, 4, 6}

 Obtener número impar


I={3, 5, 7}

 Obtener un número menor que 4


A={1, 2,3}

Suceso seguro: es el conjunto total M(espacio muestral).

78
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Suceso imposible: es el conjunto vacío.

Operaciones con sucesos

En las aplicaciones de la teoría de probabilidades trataremos


muchas veces con eventos relacionados entre sí, más que con un solo
evento. Por esta razón consideraremos ahora un experimento aleatorio
arbitrario, con su espacio muestral correspondiente M, y cualesquiera dos
eventos A y B en el experimento. Entonces:

*Union de Eventos A  B ( A unión B , A o B ) representa el evento que


ocurre si, y solo si ocurre A u ocurre B o ambos ( Una notación más
antigua que representa a A  B es A + B, y el nombre
correspondiente es suma de dos eventos)

*Intersección de Eventos. A  B ( A intersección B ó A y B ) representa


el evento que ocurre si, y solo si, ocurren A y B simultáneamente,
esto es, si ocurren en la misma ejecución del experimento en
consideración.

Eventos mutuamente exclusivos. Son los eventos que no ocurren


simultáneamente. Este caso se representa solamente cuando
A  B = Ø, el evento vacío, de tal manera que A y B no tienen puntos en
común.
*. El evento A es el complemento del evento A con respecto al espacio
muestral M y contiene a todos los resultados de M que no se encuentran
en A.
 Ejemplo Para el caso del arrojar una dado, el espacio muestral es
M= 1,2,3,4,5,6

 Evento A obtener un nº par

A={2, 4, 6}

A ={1, 3, 5 }

 Ejemplo:

Un experimento consiste en tirar un dado y observar el número de


puntos que aparece en la cara superior. El espacio muestral se puede

79
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

describir fácilmente, ya que es finito. Las posibilidades para el dado son


seis: 1, 2, 3, 4, 5, 6. Por lo tanto, los posibles resultados son:

M = {1, 2, 3,4, 5, 6}

b) Describir los siguientes eventos:


A: Sale un numero par.
B: Sale un número impar.
C: Sale un número menor que 4
D: Sale un número mayor que 3.
E: Sale un número impar o mayor que 3.
F. Sale un número par y menor que 4.
G: Sale un número par y un impar.
Solución

 El evento:”Sale un número par” , está representado por la


letra A, su descripción puede realizarse mediante el
siguiente conjunto :

A = 2,4,6 ,

 El evento “ Sale un número impar ”, está representado por


la letra B, su descripción puede realizarse mediante el
siguiente conjunto :

B =  1 , 3 , 5 .

 El evento “ Sale un número menor que 4” ”, está


representado por la letra C, su descripción puede realizarse
mediante el siguiente conjunto :

C= 1 , 2 , 3 

 El evento “Sale un número mayor que 3”, está


representado por la letra D, su descripción puede realizarse
mediante el siguiente conjunto :

D= 4 , 5 , 6 

 El evento “ Sale un número impar o mayor que 3”, se


representa por la letra E, está formado por todos los
resultado de B o de D o de ambos. Este evento recibe el
nombre de unión de B y D, se denota por B  D y su

80
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

descripción puede realizarse mediante el siguiente


conjunto:

B  D = E =1 , 3 , 4 , 5 , 6

 El evento “ Sale un número par y menor que 4”, se


representa por la letra F, está formado por los resultados
comunes tanto a A como a C. Este evento recibe el nombre
de intersección de A y C, se denota por A  C y su
descripción puede realizarse mediante el siguiente conjunto
:

A  C = F = 2 

 El evento “ Sale Un número par y un número impar”, se


representa mediante la letra G, está formado por la
intersección de los eventos A y B, estos eventos no tienen
nada en común, por lo tanto la intersección de ellos es
vacía. A y B son mutuamente excluyentes o disjuntos..

A  B = G =  = 

4.2. DEFINICIÓN CLÁSICA DE PROBABILIDAD (PROBABILIDAD A


PRIORI)

Supóngase que queremos conocer la probabilidad de que una


moneda caiga con la cara hacia arriba. Como hay solo dos posibles
resultados (cara o seca) adoptamos una situación ideal en la cual
esperamos que cada resultado tenga igual probabilidad de ocurrir. Así, la
1
probabilidad de que se presente una cara, P ( C) = 2

Definición :La probabilidad de un evento A en un experimento aleatorio


está dado por: el cociente entre el número de casos favorables y el número
de casos igualmente posibles

N º de casos favorables a A
P( A) 
N º total de casos igualmente posibles

Por ejemplo, la probabilidad de extraer el as de espada de una baraja


ordinaria de 52 cartas es 1/52.

81
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

 Pero la probabilidad de sacar un as de espada rojo es cero


(puesto que no hay figuras de espadas rojas en la baraja) no hay
sucesos posibles que favorezcan este resultado.

 Si los eventos son mutuamente excluyentes (esto es, si los dos


eventos no pueden ocurrir simultáneamente), pues A  B = Ø , la
P (Ø ) = 0

4.3. DEFINICIÓN DE PROBABILIDAD FRECUENCIAL


(PROBABILIDAD A POSTERIORI)

Las probabilidades se aproximan después de realizar la experiencia.


Por ejemplo, para saber cuál es la probabilidad de obtener el as con un
dado determinado, se arroja el dado 600 veces en las cuales se obtienen
113 veces un as.

La probabilidad de obtener un as con ese dado es estimada por la


frecuencia relativa = 113/600 = 0.1883.

Realice ( u observe) un procedimiento un gran número de veces y


cuente las ocasiones que el suceso A ocurre en realidad. Con base en estos
resultados reales, P(As) se estima de la siguiente forma :
f (As)
P(As)   f r(As)
f

4.4. AXIOMAS DE PROBABILIDAD

1.- Si E es un evento cualquiera en un espacio muestral M , entonces

0≤ P ( E ) ≤ 1
La probabilidad de un suceso varía entre 0 y 1.

2.- Al espacio muestral M completo le corresponde

P(M)=1

3.- Si A y B son eventos mutuamente exclusivos, entonces se cumple

P(AB)=P(A)+P(B)

82
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Si el espacio muestral es infinito, debemos reemplazar el axioma 3 por

3* .- Si E1 , E 2 , . . . . son eventos mutuamente exclusivos, entonces


tenemos que

P (E1  E 2  . . . ) = P ( E1 ) + P ( E 2 ) + ........

4.5. PROPIEDADES:

1.- Si Ø es el conjunto vacio, entonces P (Ø ) = 0 . Imposibilidad

Por ejemplo, la probabilidad de extraer el as de espada de una baraja


ordinaria de 52 cartas es 1/52. Pero la probabilidad de sacar un as de
espada rojo es cero (puesto que no hay figuras de espadas rojas en la
baraja).no hay sucesos posibles que favorezcan este resultado.

2.- Si E c es el complemento de un evento E , entonces

P (E c ) = 1 – P( E )

3.- Si A  B , entonces P ( A ) menor o igual a P ( B ).

 La probabilidad de que ocurra el evento A , es decir que al


lanzar un dado salga un número par , se calcula como
P(A) =3/6 = 1/2
donde:
 el número de resultados favorables es 6, ya que A = 2, 4, 6 ,
tiene 3 elementos.
 el número total de resultados es 6, ya que M= {1 , 2 , 3 , 4 ,5, 6}
tiene 6 elementos.

 La probabilidad de que ocurra el evento B, es decir que al


lanzar un dado salga un número impar , se calcula como
P(B) =3/6 = 1/2
donde:
 el número de resultados favorables es 6, ya que B = 1,3,5 ,
tiene 3 elementos.
 el número total de resultados es 6, ya que M = {1 ,2 ,3, 4, 5 , 6}
tiene 6 elementos.

83
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

 La probabilidad de que ocurra el evento C, es decir que al


lanzar un dado salga un número menor que 4 , se calcula
como
P(C) =3/6 = 1/2
donde:
 el número de resultados favorables es 6, ya que C= 1 ,2, 3 ,
tiene 3 elementos.
 el número total de resultados es 6, ya que M = {1 , 2, 3, 4, 5 , 6}
tiene 6 elementos.

 La probabilidad de que ocurra el evento D, es decir que al


lanzar un dado salga un número mayor que 3 , se calcula
como
P(D) =3/6 = 1/2
donde:
 el número de resultados favorables es 6, ya que D= 4, 5, 6 ,
tiene 3 elementos.
 el número total de resultados es 6, ya que M = {1 , 2,3 , 4, 5 , 6}
tiene 6 elementos.

 La probabilidad de que ocurra el evento E, es decir que al


lanzar un dado salga un número impar o mayor que 3 , se
calcula como
P(E) =5 / 6
donde:
 el número de resultados favorables es 5,ya que E=1,3,4,5,6 ,
tiene 5 elementos.
 el número total de resultados es 6, ya que M = {1 , 2, 3 , 4 ,5, 6}
tiene 6 elementos.

 La probabilidad de que ocurra el evento F, es decir que al


tirar un dado salga un número par y menor que 4 , se
calcula como
P(F) =1 / 6
donde:
 el número de resultados favorables es 1, ya que F = 2 , tiene 1
elemento.
 el número total de resultados es 6, ya que M = {1,2 , 3 , 4, 5, 6}
tiene 6 elementos.

 La probabilidad de que ocurra el evento G, esta formado


por la intersección de los eventos A y B que son

84
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

mutuamente excluyentes, decir que al lanzar un dado ,”


un número impar y par “ , es cero, ya que es imposible de
que ocurra dicho evento. La probabilidad del evento nulo o
vacio siempre es 0.se calcula como
P(G) = P (Ø ) = 0
donde:
 el número de resultados favorables es vacio, ya que G = .
 el número total de resultados es 6, ya que M = {1, 2, 3, 4 , 5 , 6}
tiene 6 elementos.

4.5.TEOREMA DE LA SUMA DE PROBABILIDADES

Sean A y B dos eventos del espacio muestral M generado por un


experimento aleatorio. El teorema de la suma de probabilidades dice
que la probabilidad de la unión de A y B es la suma de las
probabilidades menos la probabilidad de la intersección. En símbolos:

Sean A y B  M entonces
P(AB)=P(A)+P(B)- P(AB)

Si los eventos son mutuamente excluyentes, el último término


desaparece, pues A  B = Ø y P (Ø ) = 0
P(AB)=P(A)+P(B)

 En el ejemplo, calcule la probabilidad del evento “ sale cara o sale


un número par” correspondiente al experimento de lanzar
simultáneamente un dado y una moneda, utilizando el teorema de la
suma de probabilidades.

El espacio muestral M= {(1,c); (1,s); (2,c); (2,s) ; (3,c); (3,s) ; (4,c); (4,s)
; (5,c); (5,s) ; (6,c); (6,s)

c: salga cara
P: salga número par

P(CP)=P(C)+P(P)- P(CP)
6 6 3 9 3
     0,75
P (C  P )= 12 12 12 12 4

85
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

4.6. PROBABILIDAD CONDICIONAL

Muchas veces necesitamos encontrar la probabilidad de un evento B


si se sabe que ha ocurrido un evento A. Esta probabilidad se llama
probabilidad condicional de B dado A, y se representa como P ( B / A ) .
En este caso A sirve como un espacio muestral nuevo ( reducido ) , y la
probabilidad es la fracción de P( A) que corresponde a A B. Así que

P A  B 
P(B/A) = P A
Del mismo modo, la probabilidad condicional de A dado B es

P A  B 
P A / B  = P  B 

. Volviendo al ejemplo del dado:

a) halle la probabilidad de que aparezca un número menor que 4 dado que


apareció un número mayor que 3

b) halle la probabilidad de que aparezca un número impar dado que


apareció un número mayor que 3

Solución :

a) P ( C / D ) se denomina probabilidad condicional de C dado que ha


ocurrido el evento D , se define como
P ( C / D ) = P ( C  D ) / P( D )

En este caso M = 1 , 2 , 3 , 4 , 5 , 6 

C =  1 , 2 , 3  , D =  4 , 5 , 6  , P( D ) = 3 / 6 = 1 /2 , P( C  ) = 0

P(C/D)= 0/½ =0

b) P ( B / D) es la probabilidad condicional de que aparezca un número


impar dado que apareció un número mayor que 3.

P( D )= 3 / 6 = 1 / 2 P ( B  D ) = 1/6

P ( B / D = P( B  D ) / P( D ) = 1/6 / 12 = 1/3

86
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

4.7..TEOREMA DEL PRODUCTO DE PROBABILIDADES

En ocasiones, nos encontramos con la necesidad de determinar la


probabilidad de ocurrencia simultánea de dos o mas eventos. Para obtener
este resultado, deberemos aplicar la regla de multiplicación

Regla de la Multiplicación : Si A y B son eventos contenidos en un


espacio muestral M , y P ( A )  0 y P ( B )  0, entonces se cumple
que

P ( A y B ) = P(AB) = P(A)  P(B /A) = P ( B )  P ( A


/B)

Cuando los eventos son independientes: En el caso especial en el que la


ocurrencia de A no está en absoluto relacionada con la ocurrencia de B y
viceversa , se dice que los sucesos son independientes. La independencia
se representa simbólicamente por

P ( B/ A ) = P(B) y P (A /B)=P(A).

Cuando los eventos son independientes la regla de la multiplicación se


simplifica a : Si A y B son eventos contenidos en un espacio muestral M y
P(A) 0 y P(B) 0, entonces “La probabilidad de la intersección es el
producto de las probabilidades” :

P ( A y B ) = P(AB) = P(A)  P(B)

En el ejemplo del dado : son A y C independientes?


Si la probabilidad del resultado A no depende de la ocurrencia de un
segundo evento C ( o viceversa) se dice que A y C son eventos
independientes. En términos de probabilidad se expresa que A y C son
eventos independientes si

P ( A / C ) = P ( A ) ó bien P ( C / A ) = P ( C )
En este caso A y C no son eventos independientes ( se denominan
dependientes), debido a que

87
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Si al lanzar un dado

M:{1,2,3,4,5,6}

A: número par
B: numero impar

P (A)= 3
6

P (C)= 3
6

P (A  C)=
1
6

1
6 1
P (A/C): 3 3
6
3 1
P(A)=
6 2

P ( A / C ) = 1 / 3 que no es igual a P ( A ) = 1 / 2 ,
Y

P ( C / A ) = 1/3 que no es igual a P ( C ) = 1/2

Debemos notar que los sucesos mutuamente exclusivos no son nunca in


dependientes, puesto que la ocurrencia de uno niega la posibilidad de
ocurrencia del segundo. Entonces :
P( A/ B ) = P( B/ A) = 0

Muestreo con y sin reemplazo

Hay dos maneras de extraer objetos para obtener una muestra de


un conjunto dado de objetos, conocido como muestreo de una población;
estas son las siguientes.

88
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

1.- Muestreo con reemplazo significa que el objeto que se extrajo al azar
se coloca de nuevo en el conjunto dado, se mezcla completamente y se
precede a extraer al azar el siguiente objeto.

2. Muestreo sin reemplazo significa que el objeto que se extrajo se deja


aparte y no se lo introduce nuevamente.

 Ejemplo

Una caja contiene 10 cuadernos, de los cuales 3 están con fallas.


Dos cuadernos se extraen al azar sin reemplazo. Encontrar la
probabilidad del evento tal que ninguno de los 2 cuadernos tenga fallas.
Solución:
Consideremos los eventos

A : El primer cuaderno extraído no tiene fallas.


B: El segundo cuaderno extraído no tiene fallas.

Es claro que P ( A ) = 7/10, ya que 7 de los 10 cuadernos no son


defectuosos y estamos muestreando aleatoriamente, por lo cual cada
cuaderno tiene la misma probabilidad ( 1/10 ) de ser escogido.

Si A ocurre, entonces quedan 9 cuadernos en la caja, 3 de los cuales


tienen fallas, por lo que

P ( B / A )= = 6 / 9 = 2 / 3

Y por el teorema de la multiplicación, la respuesta es

P ( A  B ) = 7 /10 . 2 / 3 = 0,47

 Ejemplo

Si se seleccionan dos cartas de un paquete de naipes bien barajado,


¿ cuál es la probabilidad de que ambas sean reinas?.

Solución
Hay dos maneras de seleccionar las cartas: 1) Se puede seleccionar
una carta, reponerla en la baraja , barajar y extraer una segunda
carta. (Muestreo con reemplazo). 2) Se pueden seleccionar las dos
cartas consecutivamente sin reemplazar la primera en la baraja
(Muestreo sin reemplazo)

89
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

1º. Sea A el suceso de una reina en la primera extracción, y B el


suceso de una reina en la segunda extracción. Cuando el muestreo
es con reemplazo, la probabilidad de extraer una reina permanece
igual en las dos extracciones. Así, puesto que

P ( A / B ) = P ( A ) y P ( B / A ) = P ( B ) , as dos extracciones son


independientes, por lo tanto

P ( A  B ) = P ( A ) . P ( B ) = 1/13 . 1/13 = 1 / 69

2º. Cuando se emplea el muestreo sin reemplazo la probabilidad de


obtener una reina en la segunda extracción se reduce siempre que la
primera carta seleccionada haya sido una reina. En otras palabras ,
cuando P ( B / A )  P ( B ) o P ( A / B )  P ( A ) , los sucesos no son
independientes.. La probabilidad de extraer una reina en el segundo
intento es 3 / 51. Empleando la fórmula correspondiente,
encontramos que la probabilidad de seleccionar dos reinas en
extracciones consecutivas procedentes de una baraja sin reemplazo ,
es :

P ( A  B ) = P ( A ) . P ( B / A ) = 1 / 13 . 3 / 51 = 1 / 221

Se debe notar que la diferencia entre ambos muestreos es despreciable


cuando la población es grande en relación con el tamaño de la muestra.

 Ejemplo: Para un estudio, se obtiene una muestra de alumnos de


una escuela y se los clasifica según lugar de residencia y el medio de
transporte que utilizan para llegar a la misma, obteniéndose los
siguientes resultados:

Lugar de residencia Medio para llegar a la escuela Total


Caminado Bicicleta Ómnibus
Barrio A 100 20 50 170
Barrio B 50 20 30 100
Barrio C 30 10 5 45
Total 180 50 85 315

Suponga que se selecciona un alumno al azar de este grupo. Obtenga


las probabilidades siguientes

 Que el alumno resida en el barrio A

90
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

170
P(A)  
315 0.5397
 Que el alumno resida en el barrio A o en el B
170 100 270
   0.8571
P(AB)=P(A)+P(B)= 315 315 315
 Que el alumno no sea del Barrio A
315  170 145
P( A)   0.4603
315 = 315
 Que el alumno sea del Barrio A y vaya caminando a la escuela
100
P(AC)= 315 =0.3175
 Probabilidad que el alumno vaya en ómnibus a la escuela dado que
vive en el barrio B
30
P( B  O) 315 30
   0,3
P( B) 100 100
P(B/O)= 315
 Probabilidad que el alumno vaya en ómnibus a la escuela o viva en
el barrio B
85 100 30 155
  
P(OB)=P(O)+P(B)- P(OB)= 315 315 315 315 =0.4921

91
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

5.- DISTRIBUCIÓN DE PROBABILIDAD

Una distribución de probabilidad no es más que, como su nombre lo


indica, la asignación a cada evento posible, de un experimento, de la
probabilidad que le corresponde.

Definición. Cualquier regla o mecanismo que sirva para determinar

P( X = x) , probabilidad de que la variable aleatoria X tome cada


uno de los valores posibles x , se denomina una Distribución
de Probabilidad

Existen dos tipos de distribuciones que son importantes en las


aplicaciones prácticas, a saber: las distribuciones discretas y las
continuas. Una distribución discreta surge al contar ( por ejemplo, obtener
un 6 y un 4 al lanzar dos dados , o bien sacar un rey al extraer una carta
de la baraja española). Una distribución continua aparecerá si se mide (
por ejemplo altura de los alumnos y alumnas de la clase).

Entre todas las distribuciones discretas, la Distribución Binomial es


la más sencilla. Entre las distribuciones continuas veremos la Distribución
Normal.

5.1. VARIABLE ALEATORIA

Una variable aleatoria X es una función cuyos valores son números


reales y dependen del “azar” .

5.2.DISTRIBUCIONES DE PROBABILIDADES DE VARIABLE


ALEATORIA DISCRETA
La siguiente es la distribución de la variable aleatoria
Xi = nº de puntos obtenidos al arrojar un dado perfecto , o sea que todas
sus caras son igualmente posibles:

xi 1 2 3 4 5 6 Total
P(xi) 1/6 1/6 1/6 1/6 1/6 1/6 1

Obsérvese que se cumplen dos condiciones que son necesarias para


que un conjunto de pares ordenados (x,y) sea considerada una
distribución de probabilidades:

92
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

1) Para cada valor de x le corresponde un único valor de y que es un


valor de probabilidad (no negativo y menor o igual a 1),
 Pxi 
2) M =1
3) Esta distribución recibe el nombre de uniforme, es una distribución
de variable aleatoria discontinua y sus parámetros son los valores
mínimo (a) y máximo (b) que puede tomar x. Esto se indica como
X ~ U (a, b).

5.2.1. DISTRIBUCIÓN BINOMIAL.

La variable X toma los valores 0, 1, 2, 3, ... , n. (donde n es finito y bien


determinado). Se puede considerar que la Distribución Binomial es la
repetición de n pruebas independientes (por ejemplo tomar 4 pruebas en
un año). La función de probabilidades es:

P( x)  Cnx p x q n  x ,
x
donde C n son las combinaciones de n elementos tomadas de a x,
p= probabilidad de éxito en una sola prueba,
q = 1- p = probabilidad de fracaso.

x
La combinaciones se calculan como sigue: C n = (n.(n-1). (n-2)...(n-
x+1))/x!

Los parámetros que definen a la distribución Binomial son n y p

Las dos características necesarias de una distribución de probabilidad


consisten en que cada valor de P ( X = xn , p ) tiene que ser mayor o
igual a 0 y que la suma de todos los valores de P ( X = x n , p ) debe ser
igual a 1.

 Ejemplo :Cuando se recibe un envío de lápices en la escuela, se


seleccionan de manera aleatoria, 15 unidades con el propósito de
verificar el porcentaje de unidades defectuosas en el envío. Con base
en información pasada, la probabilidad de tener una unidad
defectuosa es de 0.05. La directora ha decidido no recibir el envío
cada vez que una muestra de 15 unidades tenga dos o más
defectuosas. ¿Cuál es la probabilidad de que, se rechace el envío?

93
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Solución
El modelo de distribución apropiado para esta situación es la distribución
binomial, se puede suponer que las 15 unidades que se seleccionan al día,
constituyen un conjunto de ensayos independientes de manera tal que la
probabilidad de tener una unidad defectuosa es de 0.05 entre ensayos.
Definimos a la variable aleatoria X : “número de unidades defectuosas”
que se encuentran entre las 15 unidades seleccionadas. El evento se
definirá como A : unidad defectuosa.

La probabilidad de A es
P(A) = 0,05
El número de ensayos n = 15
La probabilidad de que el envío no se reciba, es igual a la
probabilidad de que X sea igual o mayor que dos:
P(X  2) = 1 – P(X < 2) = 1 – [P(X = 0) + P(X = 1)]

15!
(0,05) 0 (1  0,05)150
P(0 15, 0,05) = 0! (15 - 0)!
= 1(0,95)15 = 0.4631

15!
(0,05)1 (1  0,05)151
P(1 15, 0,05) = 1! (15 - 1)! =
= 15(0,05)(0,95) = 0,3658
14

P(X  2 15, 0,05) = 1 – P(X < 2) =


=1 – (0,4631 + 0,3658) = 1 – 0,8289 = 0,1711

Por lo tanto la probabilidad de que, el envío sea rechazado es de 0,1711.

La distribución binomial es realmente una familia de distribuciones,


puesto que para cada valor diferente de n y p , que se denominan
parámetros de la distribución binomial, se puede definir una distribución
diferente. Sin tener en cuenta el valor de n , la distribución es simétrica
cuando p = 0,5. Cuando p es mayor que 0,5, la distribución es asimétrica
y su máximo se encuentra a la derecha del centro. Cuando p es menor que
0,5, la distribución es asimétrica y su máximo se encuentra a la izquierda
del centro.

94
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Tablas de la Distribución Binomial El cálculo de las probabilidades


binomiales mediante la ecuación anterior puede resultar laborioso cuando
n es grande .Afortunadamente hay tablas de probabilidades binomiales y
entonces no es necesario el uso directo de la ecuación. Solamente
necesitamos utilizar una tabla con los valores dados de n , p y x para
obtener la probabilidad deseada

Para explicar el uso de la Tabla consideremos nuevamente el


ejemplo en el cuál deseábamos conocer: La probabilidad de que la
dirección rechace el envío es igual a la probabilidad de que X sea igual o
mayor que dos : para hallar esta probabilidad en la tabla ,localizamos
primero n = 15 ,luego la columna de p = 0,05 y finalmente para x ,las filas
marcadas con un 0 y un 1

P(X  2 15 , 005) = 1 – P(X < 2) = 1 – [P(X = 0) + P(X = 1)] = 1 – [0.463 +


0.366] = 0.171

p
n x 0,01 0,05 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 0,95 0,99 x
13 0 878 513 254 055 010 001 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0
1 115 351 367 179 054 011 002 0+ 0+ 0+ 0+ 0+ 0+ 1
2 7 111 245 268 139 045 010 001 0+ 0+ 0+ 0+ 0+ 2
3 0+ 21 100 246 218 111 035 006 001 0+ 0+ 0+ 0+ 3
4 0+ 3 28 154 234 184 087 024 003 0+ 0+ 0+ 0+ 4
5 0+ 0+ 006 069 180 221 157 066 014 001 0+ 0+ 0+ 5
6 0+ 0+ 001 023 103 197 209 131 044 006 0+ 0+ 0+ 6
7 0+ 0+ 0+ 006 044 131 209 197 103 023 001 0+ 0+ 7
8 0+ 0+ 0+ 001 014 066 157 221 180 069 006 0+ 0+ 8
9 0+ 0+ 0+ 0+ 003 024 087 184 234 154 028 003 0+ 9
10 0+ 0+ 0+ 0+ 001 006 035 111 218 246 100 021 0+ 10
11 0+ 0+ 0+ 0+ 0+ 001 010 045 139 268 245 111 0+ 11
12 0+ 0+ 0+ 0+ 0+ 0+ 002 011 054 179 367 351 115 12
13 0+ 0+ 0+ 0+ 0+ 0+ 0+ 001 010 055 254 513 878 13

14 0 869 488 229 044 007 001 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0


1 123 359 356 154 041 007 001 0+ 0+ 0+ 0+ 0+ 0+ 1
2 008 123 257 250 113 032 006 001 0+ 0+ 0+ 0+ 0+ 2
3 0+ 026 14 250 194 085 022 003 0+ 0+ 0+ 0+ 0+ 3
4 0+ 004 035 172 229 155 061 014 001 0+ 0+ 0+ 0+ 4
5 0+ 0+ 008 086 196 207 122 041 007 0+ 0+ 0+ 0+ 5
6 0+ 0+ 001 032 126 207 183 092 023 002 0+ 0+ 0+ 6
7 0+ 0+ 0+ 009 062 157 209 157 062 009 0+ 0+ 0+ 7
8 0+ 0+ 0+ 002 023 092 183 207 126 032 001 0+ 0+ 8
9 0+ 0+ 0+ 0+ 007 041 122 207 196 086 008 0+ 0+ 9
10 0+ 0+ 0+ 0+ 001 014 061 155 229 172 035 004 0+ 10

95
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

11 0+ 0+ 0+ 0+ 0+ 003 022 085 194 250 114 026 0+ 11


12 0+ 0+ 0+ 0+ 0+ 001 006 032 113 250 257 123 008 12
13 0+ 0+ 0+ 0+ 0+ 0+ 001 007 041 154 356 359 123 13
14 0+ 0+ 0+ 0+ 0+ 0+ 0+ 001 007 044 229 488 869 14

15 0 860 463 206 035 005 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0


1 130 366 343 132 031 005 0+ 0+ 0+ 0+ 0+ 0+ 0+ 1
2 0+ 135 267 231 092 022 003 0+ 0+ 0+ 0+ 0+ 0+ 2
3 0+ 031 129 250 170 063 014 002 0+ 0+ 0+ 0+ 0+ 3
4 0+ 005 043 188 219 127 042 007 0+ 0+ 0+ 0+ 0+ 4
5 0+ 001 010 103 206 186 092 024 003 0+ 0+ 0+ 0+ 5
6 0+ 0+ 002 043 147 207 153 061 012 001 0+ 0+ 0+ 6
7 0+ 0+ 0+ 014 081 177 196 118 035 003 0+ 0+ 0+ 7
8 0+ 0+ 0+ 003 035 118 196 177 081 014 0+ 0+ 0+ 8
9 0+ 0+ 0+ 001 012 061 153 207 147 043 0+ 0+ 0+ 9
10 0+ 0+ 0+ 0+ 003 024 092 186 206 103 010 001 0+ 10
11 0+ 0+ 0+ 0+ 001 007 042 122 219 188 043 005 0+ 11
12 0+ 0+ 0+ 0+ 0+ 002 014 063 170 250 129 031 0+ 12
13 0+ 0+ 0+ 0+ 0+ 0+ 003 022 092 231 267 135 009 13
14 0+ 0+ 0+ 0+ 0+ 0+ 0+ 005 031 132 343 366 130 14
15 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 005 035 206 463 860 15

5.3. DISTRIBUCIONES DE PROBABILIDADES DE VARIABLE


ALEATORIA CONTINUA

En estas distribuciones no es posible calcular la probabilidad en


puntos sino que hay que hacerlo en intervalos. Recuérdese que en las
variables discontinuas las probabilidades de intervalos se obtenían
sumando las probabilidades que corresponden a cada punto o valor de la
variable. En variables continuas, los valores que puede tomar la variable
son infinitos por lo que es necesario hacer una suma infinita es decir una
integral. En las variables continuas, la probabilidad de un intervalo se
obtiene integrando la función de densidad.

 Ejemplo: la distribución rectangular X ~ R (0,2).


Esta es una distribución rectangular (todos sus puntos tienen igual
densidad de probabilidad) que se extiende desde 0 a 2. El gráfico de su
función de densidad es el siguiente:

96
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

en el que se puede observar que la función de densidad


f(x) = 1/2
La probabilidad de encontrar valores de variables entre 1 y 2 se encuentra
integrando la función de densidad entre esos límites.
La integral entre esos límites corresponde al área bajo de la curva entre los
mismos.

5.3.1.LA DISTRIBUCIÓN NORMAL

Si una variable es continua, varía desde  hasta   y su


función de densidad es:

1 x 
2

1   
2  
f (x) = e
 2 ,
se dice que x tiene distribución normal con parámetros  y  (media
aritmética y desviación estándar). Esto se simboliza como sigue :
X ~ N ( ,  )

97
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Su gráfica es la siguiente:
0,40

0,30

f (x)
0,20

0,10

0,00
4 6 8 10 12 14
x

La distribución normal presenta las siguientes características:

1) Presenta un máximo en x =  , por lo tanto Mo = 

2) Es simétrica y su eje de simetría es f (  ) , por lo que se deduce que Md =


 = Mo.

3) Tiene dos puntos de inflexión ubicados en x =   

4) Toda transformación lineal de x da otra distribución normal.

5) Algunos sectores usados de la función son:

x =   
corresponde aproximadamente al 68 % central
x =   2
corresponde aproximadamente al 95 % central
x =   3
corresponde aproximadamente al 99 % central

6) f(x) se acerca asintóticamente al eje x o sea que f(x) > 0.



 f ( x)dx = 1
1) Por ser función de densidad, el área bajo de la curva es 

Para calcular la probabilidad de un intervalo en la distribución normal,


por tratarse de una variable continua, debe hacerse mediante la

98
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

integración de la función de densidad, lo cual equivale a calcular el área


bajo de la curva. Considérese por ejemplo que la altura de los alumnos de
la escuela tiene distribución normal con media  = 1,6 m y desviación
estándar  = 0,1 m. La probabilidad de que al seleccionar un alumno al
azar, posea altura comprendida entre 1,5 y 1,65 (P(1,5<x<1,65)) se obtiene
integrando la función de densidad f(x), (en la cual se debe reemplazar los
valores correspondientes de  y  por 1,6 y 0,1 respectivamente) entre los
límites 1,5 y 1,65.

La distribución normal estándar


Usando la propiedad que dice que la transformación lineal
x - 
z =
 conduce a una distribución también normal, cuyos
parámetros son  z = O y  z = 1 , se obtiene una nueva distribución que se
conoce con el nombre de distribución normal estándar o normal 0,1 y
se la describe como

Z ~ N(0,1) cuya representación gráfica es la siguiente:

-5 -3 0 3 5
z

99
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Tablas de la distribución normal

El cálculo de probabilidades en la normal involucra el cálculo de


integrales que son muy engorrosas de resolver manualmente. Por ello, las
integrales están tabuladas para una distribución normal que es la
estándar.
Vamos a aprender el uso de tablas de una cola

Tabla de “1 cola”

En ella, los valores de probabilidad se encuentran en el cuerpo de la


tabla y los valores de z se forman utilizando la primera columna y la
primera fila (es decir en lo que se conoce como matriz de la tabla). En esta
tabla es importante considerar el signo de z.

Como su nombre lo indica, para el valor de z considerado, da el valor del


área bajo de la curva desde menos infinito hasta z. Por ejemplo si z = -2.1
la tabla da P(z < -2.1) = 0.0179.

 Ejemplo :
Una población de pesos de alumnos en gr tiene distribución normal con
media y desviación estándar (  y  ) de 50 y 5 Kg. respectivamente. ¿Cuál
es la probabilidad de

 que los alumnos pesen menos de 55 kg


En símbolos, la probabilidad buscada es P(x  55)

Para solucionar esto es necesario pasar de la normal que nos


interesa a la normal estándar. Esto se consigue mediante el
siguiente cambio de variable:

x - 
en este caso x = 55 ,  = 50 y  = 5 por lo que
z =

z = (55 - 50)/5 = 1.

P(x  55) = P(z  1) = 0,8413

Cuando se busca una valor por menor, la probabilidad se


obtiene directamente en la tabla.

 que los alumnos pesen más de 57,75 kg


En símbolos, la probabilidad buscada es P(x  57,75)

100
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Para solucionar esto es necesario pasar de la normal que nos


interesa a la normal estándar. Esto se consigue mediante el
siguiente cambio de variable:

x - 
en este caso x = 57.75 ,  = 50 y  = 5 por lo que
z =

z = (57,75 - 50)/5 = 7,7/5 = 1,54.

P(x  57,75)= P(z  1,54) = 1- P(z  1,54)=1-0,9382=0,0618

z .00 .01 .02 .03 .04


1.0 0.841 0.843 0.846 0.8485 0.850
3 8 1 8
1.1 0.864 0.866 0.868 0.8708 0.872
3 5 6 9
1.2 0.884 0.886 0.888 0.8907 0.892
9 9 8 5
1.3 0.903 0.904 0.906 0.9082 0.909
2 9 6 9
1.4 0.919 0.920 0.922 0.9236 0.925
2 7 2 1
1.5 0.933 0.934 0.935 0.9370 0.938
2 5 7 2
1.6 0.945 0.946 0.947 0.9484 0.949
2 3 4 5
1.7 0.955 0.956 0.957 0.9582 0.959
4 4 3 1
1.8 0.964 0.964 0.965 0.9664 0.967
1 9 6 1
1.9 0.971 0.971 0.972 0.9732 0.973
3 9 6 8
2.0 0.977 0.977 0.978 0.9788 0.979
2 8 3 3
2.1 0.982 0.982 0.983 0.9834 0.983
1 6 0 8
2.2 0.986 0.986 0.986 0.9871 0.987
1 4 8 5

101
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

 que los alumnos pesen entre de 52,75 kg y 60 kg


En símbolos, la probabilidad buscada es P(52,75  x  60)
Para solucionar esto es necesario pasar de la normal que nos
interesa a la normal estándar. Esto se consigue mediante el

x-
z=
siguiente cambio de variable  , se buscan dos valores de
z, primero para el valor mayor de x, luego para el menor

60 - 50 10 52,75 - 50 2,75
z2 =  2 z1 =   0,55
5 5 5 5

Se buscan los valores en la tabla para z=2; P(z  2)=0,9861


Se buscan los valores en la tabla para z=0,55; P(z  0,55)=0,7088

Luego se restan los valores


P(52,75  x  60)= P(0,55  z  2)=0,9861-0,7088=0,2773

Los valores de z más usados y que determinan intervalos


centrales (1-) son:
z0,10  1,64
 para el 90 % central
z0,05  1,96
 para el 95% central
z0,01  2,58
 para el 99% central

Ejemplo

En la población de pesos X ~ N(50 ; 5) ¿cuál es el intervalo que


corresponde al 95 % central de la población?

En la distribución de z, el 95 % central de la población corresponde al


intervalo que va desde -1.96 a +1.96, o sea  1.96. Es muy simple, si se
desea que en el centro esté el 95 % o, en tanto por uno, 0.95, entonces en
z  1,96
las colas debe quedar el 0.05. el valor que corresponde 0,05 .

Ya se determinó el intervalo en z, ¿cómo se pasa a la normal con media 50


y desviación estándar 5? Se debe hacer el cambio inverso de variable:

x - 
z = entonces x =   z 
 .

102
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Para indicar que el intervalo corresponde a un porcentaje central


determinado se acostumbra a llamar  a lo que queda en las colas.

x =   z 
Volviendo entonces al ejemplo, por ser z  = 1.96, el intervalo que
corresponde al 95 % central de la población de pesos de los alumnos es:

x = 50  1.96 5 = 50  9,80 .

El intervalo del 95 % central entonces va desde 40,20 kg a 59,80 kg.

103
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

GUÍA DE EJERCITACIÓN

Actividad 1

El Director de una escuela debe establecer turnos para que el


establecimiento siempre tenga dos administrativos durante el mes de
enero. Para ello de los cinco empleados que dispone (A, B, C, D, E) debe
formar grupos de dos seleccionados al azar, sin reemplazo.
Describa el espacio muestral de este experimento aleatorio.

Actividad 2

a) ¿Cómo sería el espacio muestral en la actividad anterior si el muestreo


fuera con reemplazo?
b) ¿Cuál es la forma correcta de efectuar este experimento, para que el
Director del establecimiento siempre tenga dos administrativos en el
mes de enero?

Actividad 3

Dé dos ejemplos de sucesos seguros y dos de sucesos imposibles.

Actividad 4
En el experimento aleatorio de la Actividad N°1,
a) ¿Cuántos grupos de dos personas se formaron?
b) ¿En cuántos está A?
c) ¿En cuántos está B?
d) ¿En cuántos están A y B?
e) ¿En cuántos no ha sido seleccionado C?
f) ¿En cuántos han sido seleccionados A ó B ó C?
g) Calcule la probabilidad de cada uno de estos sucesos.

Actividad 5

Una oficina donde asignan becas para estudio a alumnos de EGB, realiza
la selección de los mismos para dos Becas de distinto origen de fondos; los
resultados posibles son Seleccionado (S) o No Seleccionado (NS). El
experimento consiste en tomar al azar un alumno y observar el resultado
en las dos selecciones.
a) Describa el espacio muestral de este experimento (suponga que todos
los alumnos han estado inscriptos en las dos Becas)
b) ¿Cuál es la probabilidad de que el alumno haya sido seleccionado en
las dos Becas?

104
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

c) ¿Cuál es la probabilidad que el alumno no haya sido seleccionado


ninguna de las dos Becas?
d) ¿Cuál es la probabilidad que el alumno haya sido seleccionado en una
Beca por lo menos?
e) ¿Cuál es la probabilidad que el alumno haya sido seleccionado a lo
sumo en una Beca?

Actividad 6

Cada uno de los items siguientes representan las probabilidades de cada


uno de tres eventos simples.
Marque el item correcto, justificando al mismo tiempo su respuesta.

a) P(E1) = 0.8 P(E2) = 0.3 P(E3) = 0.1

b) P(E1) = 0.3 P(E2) = 0.2 P(E3) = 0.5

c) P(E1) = -0.6 P(E2) = 0.2 P(E3) = 0.2

d) P(E1) = 1/3 P(E2) = 1/2 P(E3) = 1/6

Actividad 7

En una encuesta realizada a 90 alumnos que egresan del Polimodal en un


establecimiento educativo, se les preguntaba sobre el nivel de instrucción
alcanzado por los padres y si seguirían estudiando o no una carrera
superior. El resultado de la encuesta figura en la tabla siguiente:

Nivel de educación ¿Seguirán Total


de los padres estudiando?
Si No
Superior 20 10 30
Secundario 30 10 40
Primario 15 5 20
Total 65 25 90

Si se selecciona un alumno al azar, cuál es la probabilidad de:


a) ¿Qué el alumno tenga padres con educación superior?
b) ¿Qué el alumno siga estudiando?
c) ¿Qué el alumno siga estudiando y tenga padres con educación
primaria?
d) ¿Qué el alumno tenga padres con educación superior o secundaria?
e) ¿Qué el alumno tenga padres que no posean educación superior?

105
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

f) ¿Qué el alumno siga estudiando dado que posee padres con educación
primaria?
g) ¿Qué el alumno no siga estudiando dado que posee padres con
educación secundaria?
h) El evento que siga estudiando es independiente del nivel de educación
Superior alcanzado por los padres?

Actividad 8

En un examen de 10 bolillas un alumno no sabe dos de ellas. ¿Cuál es la


probabilidad que le toquen justamente las dos bolillas que no sabe?

Actividad 9

Una prueba tiene 2 preguntas con dos opciones: Verdadero (V) o Falso(F).
a) ¿Cuál es la probabilidad de que acierte en las dos?
b) ¿Cuál es la probabilidad de que acierte por lo menos en una?
c) ¿Cuál es la probabilidad de que a las dos las conteste incorrectamente?

Actividad 10

En una escuela hay tres Profesores de Educación Física. La probabilidad


de que no asistan a clase cada uno de ellos es de 0.05. ¿ Cuál es la
probabilidad de que un día cualquiera falten los tres juntos?

Actividad 11

En un análisis realizado por el Director de un establecimiento educativo,


se determinó que de los alumnos ingresantes en EGB en una cohorte, solo
el 70% (en promedio) completó el polimodal. De ellos solo el 15% lo hizo en
el mismo establecimiento. ¿Cuál es la probabilidad de que un nuevo
alumno ingresante en EGB termine el Polimodal en la misma escuela?

Actividad 12

La probabilidad de que a un alumno le interese Matemáticas en un curso


es de 0.1. Si se toman 3 alumnos de dicho curso al azar:
¿Cuál es la probabilidad de que:
a) No le agrade a ninguno Matemáticas?
b) Le agrade por lo menos a un alumno esta materia?
c) Le agrade como máximo a 2 alumnos?

106
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Actividad 13

La probabilidad de que un alumno apruebe una Prueba Integradora de


conocimientos de Matemática en el último año del Polimodal es de 0.25. Si
se seleccionan al azar 10 alumnos de un curso:
a) ¿Cuál es la probabilidad de que 5 alumnos aprueben?
b) ¿Cuál es la probabilidad de que no apruebe ningún alumno?
c) ¿Cuál es la probabilidad de que todos aprueben?
d) ¿Cuál es la probabilidad de que aprueben como mínimo 5 alumnos?
e) ¿Cuál es la probabilidad de que como máximo aprueben 5 alumnos?

Actividad 14

La probabilidad de que la última semana de clase los alumnos que egresan


cometan un acto de indisciplina serio es de 0.004. De 300 alumnos que
terminan este año:
¿Cuál es la probabilidad de que:
a) 8 alumnos terminen sus estudios con una sanción por este acto de
indisciplina?
b) De qué más de 5 alumnos terminen sus estudios con una sanción por
este acto de indisciplina?
c) De que menos de 4 terminen sus estudios con una sanción por este
acto de indisciplina?
d) De qué ningún alumno cometa un acto de indisciplina serio?

Actividad 15

Los pesos de los alumnos de un curso de EGB se distribuyen normalmente


con  = 48 kg y  = 2 kg.
a) Obtenga los pesos estándar correspondientes a:
43 kg ; 44.5 kg ; 46 kg ; 49.5 kg ; 50 kg
b) ¿Cuál es la probabilidad de que un alumno tenga un peso menor a 44.5
kg?
c) ¿Cuál es la probabilidad de que un alumno tenga un peso mayor a 46
kg?
d) ¿Cuál es la probabilidad de que un alumno tenga un peso entre 44.5
kg y 49.5 kg?
e) ¿Cuál es la probabilidad de que un alumno tenga un peso de por lo
menos 46 kg?
f) Obtenga el Rango Percentil correspondiente a los pesos del item a).
Interprete que significa cada uno de ellos.
g) Si el número de alumnos a los que se ha medido el peso en ese curso
fuera de 200, ¿ cuántos alumnos tendrán un peso inferior a la media?.
¿Cuántos alumnos tendrán un peso superior a 52 kg?

107
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

h) ¿Qué porcentaje de alumnos tienen un peso comprendido entre 45 kg y


47 kg?

Actividad 16

Los puntajes promedio con su correspondiente desviación estándar,


obtenidos por los alumnos del último curso de Polimodal en una escuela
en los exámenes finales de una asignatura son los siguientes:

CURSO  
A 5.9 1.5
B 6.75 1

Se supone que los puntajes se distribuyen normalmente:


a) Si un alumno del Curso A ha obtenido 7 puntos y otro del Curso B
igual puntaje, quiere decir que el nivel de aprendizaje es el mismo en
los dos cursos?. Justifique su respuesta.
b) ¿Qué porcentaje de alumnos obtuvieron más de 5 puntos en cada
curso? Analice en base a esto el rendimiento de cada curso.
c) ¿Qué porcentaje de alumnos obtuvieron más de 7 puntos en cada
curso?
d) ¿Qué porcentaje de alumnos obtuvieron menos de 4 puntos en cada
curso?
e) ¿En base a estos resultados qué conclusión puede enunciar?

108
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

UNIDAD V

INFERENCIA ESTADÍSTICA

1. INTRODUCCIÓN

En capítulos anteriores se vió:

Estadística Descriptiva : Su objetivo es la recolección y reducción de


datos . Se estudian técnicas para presentar los datos de una forma mas
comprensible y así poder visualizar propiedades de los mismos.

Cálculo de Probabilidades :La razón de su estudio es que la Estadística


incluye la toma de decisiones en presencia de incertidumbre. Estas
decisiones tomadas se basan en probabilidades. Aquí conocemos ( o
suponemos conocido) por completo el modelo probabilístico que usamos,
es decir, la población a estudiar la podemos representar por una variable
aleatoria X

Recordemos que una población está constituida por todos los


elementos que poseen unos caracteres por cuyo estudio estamos
interesados. Una muestra, en cambio, es una parte de los elementos de la
población; pero esta parte ha de ser representativa del total.

Cuando el estadístico puede observar todos los elementos de la


población ( observación exhaustiva) , entonces su tarea se reduce a
describir las características y regularidades de la población. Pero si la
observación no puede ser exhaustiva, entonces aquellas características
hay que estudiarlas a través de una muestra representativa.

Hay que distinguir entre poblaciones finitas y poblaciones infinitas.


Se dice que una población es finita si tiene un número limitado de
sucesos o unidades elementales. Ejemplo de población finita son, en un
año dado los salarios recibidos por todos los docentes de un Colegio, los
títulos recibidos por todos los estudiantes de un país. Mientras el número
total de observaciones posibles sea limitado, se trata de una población
finita.

109
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

En cambio, una población infinita es la que, consiste en un


número infinitamente grande de observaciones. Por lo menos es teoría ,
no hay límite alguno al número de unidades que puede abarcar. Por
ejemplo, los resultados obtenidos al jugar dos dados constituyen una
población infinita , lo mismo que los pesos al nacer de todos los seres
humanos.. Una población infinita puede ser siempre generada a partir
de un conjunto finito de valores o unidades si el muestreo se hace con
reemplazo.

2. INFERENCIA ESTADÍSTICA

Definición: La Inferencia Estadística es el


procedimiento por medio del cual se llega a
inferencias acerca de una población mediante
los resultados que se obtienen a partir de una
muestra extraída de esa población.

El objetivo principal de la Estadística Inferencial es la estimación


, esto es que mediante el estudio de una muestra aleatoria seleccionada de
una población se quiere generalizar las conclusiones al total de la misma.

Definición de muestra aleatoria

Todo conjunto de n unidades de observación elementales tomadas


de una población dada, se puede considerar como una muestra de tamaño
n. Pero el tipo de muestra que aquí interesa es el de muestra aleatoria
Una muestra aleatoria se puede tomar con o sin reemplazo. Si la muestra
se toma con reemplazo, de una población , finita o infinita , la unidad
tomada se vuelve a dejar en la población y el número de unidades
disponibles para seguir la operación no se afecta. Esto tambien es cierto
cuando la muestra se toma de una población infinita sin reemplazo, es
decir, cuando la unidad escogida no se vuelve a la población. Cuando se
toma un elemento, sin reemplazar, de una población finita, el número de
unidades que quedan tras cada unidad que se saca se reduce en una
unidad, y en consecuencia la probabilidad de sacar cualquier unidad
restante en operaciones sucesivas se aumenta.

Es necesario formular nuestro concepto en forma precisa. Por


definición, una muestra debe tener ciertas propiedades como sigue:

Se supone que las muestras dan información acerca de la población


a que corresponde, ya que por lo general es demasiado costoso, requiere

110
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

demasiado tiempo, o es imposible observar o medir todos los objetos


pertenecientes a la población.. La muestra debe ser una selección
aleatoria . Es decir, cada elemento de la población debe tener una
probabilidad conocida de ser extraído, esto es, de ser tomado en la
muestra; el caso mas sencillo y más común es en donde la probabilidad es
la misma para todos los elementos de la población , y solo si se satisface
este requisito ( al menos aproximadamente) , los métodos estadísticos
darán resultados razonables y útiles.

Además, es necesario que las n ejecuciones del experimento


aleatorio con el que obtenemos n valores de la muestra sean
independientes, esto es, el resultado de una ejecución no debe influir en
las otras ejecuciones. Esto equivales a decir que la probabilidad de que
cualquier miembro de la población aparezca en una muestra, no depende
de la aparición o no aparición de los otros miembros de la población en la
muestra.

Hay que tener presente que el conocimiento de las características de


una población, salvo algunas excepciones, no puede conseguirse con toda
exactitud mediante una muestra. Si se tiene una población humana y
suponemos que no existen errores de observación, la única manera de
obtener exactamente la estatura media, el porcentaje de analfabetos, , etc.
, en dicha población es observando todos los elementos de ella. Pero si esta
observación exhaustiva no es posible y se utiliza como medio supletorio
una muestra, entonces lo único que puede obtenerse, salvo en algunos
casos particulares, son estimaciones de aquellas características.

El problema de la Inferencia Estadística se acostumbra a enfocar


de dos maneras distintas. Partiendo del hecho cierto de que una muestra,
en ge- neral, no da una información exacta de las características de la
población que deseamos estudiar, puede procederse asi:

1º Utilizar la muestra para estimar dichas


características. Este enfoque origina la Teoría de la
Estimación , mediante la cual se da solución a los
problemas específicos que se plantean.

2º Emitir hipótesis sobre aquellas características


tomando como base la experiencia, otras informaciones
o incluso el presentimiento o la corazonada. Una
hipótesis así formulada tiene, evidentemente, poco valor
científico. Este valor se adquiere tomando una muestra
de la población y utilizándola para verificar o contrastar

111
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

la hipótesis., Este enfoque da lugar a la Teoría de la


Verificación o Contrastación de hipótesis.

Para distinguir claramente entre ambas , considérense los


siguientes ejemplos . Un candidato para un puesto público desea estimar
la proporción real de votantes que lo apoyan mediante la obtención de las
opiniones de una muestra aleatoria de 100 votantes. La fracción de ellos
que lo apoye puede utilizarse como una estimación de la proporción real de
la población total de votantes. Este problema pertenece al área de
estimación.

Ahora considérese el caso en el cual una Profesora se interesa en


determinar si el sistema nuevo de evaluación( A ) implementado por el
Colegio es mejor que el sistema anterior de evaluación ( B ). Esta Profesora
podría suponer que el sistema A es mejor al sistema B y , después de
realizar las pruebas apropiadas , aceptar o rechazar esta hipótesis .En este
ejemplo se intenta tomar una decisión correcta respecto a la hipótesis
preestablecida.( La prueba de hipótesis no se verá en el desarrollo de esta
Asignatura ).

3. DISEÑOS DE MUESTREO

La operación de tomar una muestra de una población se denomina


muestreo y los métodos de muestreo que se utilicen deben garantizar
aquella representatividad para que pueda hablarse correctamente de una
muestra estadística.

Si se desea conocer, por ejemplo, el consumo medio de proteínas por


alumno y dia en una ciudad y tomamos para ello un grupo de familias
integrado por la de mas alto nivel de vida, se concluirá que ese grupo no es
representativo del total de familias de la ciudad.. Por tanto, el consumo
medio que se obtenga del citado grupo no es una buena estimación porque
entraña un error de un tipo distinto del que cabe esperar en una muestra
representativa.

Conviene distinguir entre dos clases de error. De una parte existen


los errores muestrales, que son aquellos que están latentes en toda
muestra representativa, pues aun siéndolo no proporciona , salvo raras
excepciones, una medida exacta de las características de la población; por
ello hay que contar siempre con los errores muestrales o errores de
muestreo.

112
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Y por otra parte están los sesgos, bajo cuya denominación se


incluyen algunos errores específicos de las muestras como los debidos a su
falta de representatividad, y otros que son comunes a toda investigación
estadística, tanto si es exhaustiva como si no lo es. A este último grupo
pertenecen los errores de observación , los originados por definiciones
defectuoasas de los elementos de la población, de los caracteres a
investigar , los debidos a respuestas o medidas mal efectuadas , a
fórmulas inadecuadas, a cálculos equivocados, etc.

Ejemplo :Supongamos que deseamos tomar una muestra de 100


estudiantes de un Colegio para conocer la opinión del alumnado respecto a
la adecuación de las evaluaciones. Un posible método es situarse a las
nueve de la mañana en una entrada del Colegio y preguntar a los 100
primeros alumnos que aparezcan. Con este procedimiento los alumnos que
solo tienen clase por la tarde no estarán representaos en la muestra.
Además, estarán muy poco o nada representados los estudiantes que no
tengan clase a primera hora o los que teniéndola no acudan
habitualmente.

Cuando algunos miembros de la población tienen una probabilidad


más alta que los otros de estar representados en una muestra se dice que
existe un sesgo de selección y la muestra puede no ser representativa de
la población. Por ejemplo, si existen diferencias marcadas de opinión entre
los alumnos nuevos y los veteranos, y la muestra sólo incluye a los
veteranos, tendrá un sesgo de selección.Una forma de evitar este sesgo es
tomar la muestra mediante un procedimiento de selección objetivo que
garantice a todos los elementos de la población la misma oportunidad de
aparecer en la muestra.

El método anterior presenta además el riesgo de un sesgo adicional:


el sesgo por no respuesta. Si los estudiantes que no responden son los
más disconformes con las evaluaciones, la muestra contendrá una
proporción menor de estudiantes de estas categorías y, de nuevo, puede
no ser representativa de la población que tratamos de investigar. El sesgo
de no respuesta no puede evitarse con certeza pero deben tomarse
precauciones para prevenir que ocurra.

3.1. MUESTREO AL AZAR SIMPLE

El muestreo aleatorio simple está fundamentado en el puro azar. Se


puede decir que es un muestreo en el que si se saca al azar una muestra
de n unidades, toda posible muestra de n unidades tiene la misma
probabilidad de ser seleccionada, Una muestra obtenida por este
procedimiento se dice muestra aleatoria simple.

113
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

Uno de los métodos comúnmente utilizados para lograr que la


muestra sea aleatoria es numerar todos los elementos de una población,
escribir los números en tarjetas o fichas o bolillas o cualesquiera cosas
físicamente homogéneas; poner luego en una bolsa estos objetos
numerados y mezclarlos completamente. Se define el tamaño n de la
muestra y se sacan los objetos al azar uno por uno, hasta que se obtenga
el número deseado de partidas para anotar. El procedimiento se puede
simplificar utilizando una tabla de números aleatorios.

3.2. MUESTREO ALEATORIO SISTEMÁTICO

Cuando los elementos de la población están ordenados en listas, una


alternativa más fácil de ejecutar que el muestreo aleatorio simple es el
muestreo sistemático. Muy a menudo, si se desea un muestreo aleatorio
simple se sigue un procedimiento sistemático en vez de un método al azar.
Según el procedimiento sistemático, se obtiene una muestra tomando cada
k-ésima unidad de la población tras numerar las unidades de la población
o haberlas ordenado de alguna manera. La letra k representa un número
entero, que es aproximadamente la razón de muestreo entre el tamaño de
la población y el tamaño de la muestra. Así, si la población consiste en
10.000 unidades de muestreo y se desea una muestra de 500 unidades,
entonces

K = 10.000 / 500 = 20

Y la muestra se obtiene tomando una unidad cada veinte de la


población.

Para que toda unidad de la población tenga igual probabilidad de


salir, el procedimiento debe empezar al azar. Con una razón de muestreo
de 20, se puede utilizar el procedimiento de la bolsa o del bolillero
poniendo 20 bolillas o 20 papelitos numerados de 1 a 20 en el bolillero o
bolsa. Tras revolver y mezclar completamente, se saca una bolilla al azar.
Si se saca la bolilla 11, se empieza con este número y se incluye enla
muestra cada vigésima bolilla a partir de esta, es decir, la treinta y una, la
cincuenta y una , y así sucesivamente.

114
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

3.3. MUESTREO POR ESTRATOS

El muestreo aleatorio simple debe utilizarse cundo los elementos de


la población son homogéneos respecto a la característica a estudiar, es
decir, a priori la predicción que haríamos del valor de la variable sería el
mismo para todos los elementos. Un muestreo que sería mas efectivo que
este, es el muestreo aleatorio por estratos, procedimiento que exige tener
conocimiento previo de la población. El proceso de estratificación
contempla dividir la población en grupos o clases llamados estratos .
Dentro de cada uno de tales estratos, están los elementos situados de
manera más homogénea con respecto a las características que estén en
estudio. Para cada estrato se toma una submuestra mediante el
procedimiento aleatorio simple, y la muestra global se obtiene combinando
las submuestras de todos los estratos.

El muestreo por estratos es el más efectivo cuando se trata de


poblaciones heterogéneas tales como datos de desempleo ( que varían de
ocupación a ocupación ), ventas al por menor ( que difieren entre las
distintas regiones geográficas) , y las actitudes de los consumidores
respecto de malos nuevos modelos de automóviles ( en las que influyen
factores teles como el sexo, la edad, y la categoría de ingreso). Al hacerse la
estratificación, las clases se establecen de modo que las unidades de
muestreo tienden a ser uniformes dentro de cada clase, y las clases
tienden a ser diferentes entre sí. Así se puede controlar la proporción de
cada estrato en la muestra global y no dejarla al azar y queda asegurado
el carácter representativo de la muestra.

El muestreo por estrato es por consiguiente una combinación de


submuestras de los estratos, que son muestras aleatorias simples o
sistemáticas. En cuanto tales, todo elemento disponible de cada estrato
tiene igual probabilidad de ser seleccionado, y esta será la situación aun
en el caso en que la muestra no sea proporcionada, en el cual las
probabilidades de ser seleccionado cada elemento individual de la
población no son iguales.

3.4.MUESTREO POR CONGLOMERADO

Diametralmente opuesto al muestreo por estratos está el muestreo


por conglomerados, que consiste en seleccionar primero al azar grupos,
llamados conglomerados , de elementos individuales de la población, y en
tomar luego todos los elementos o una submuestra de ellos dentro de cada
conglomerado para constituir así la muestra global. Para lograr los mejores

115
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

resultados ern el plan del muestreo por conglomerado, se hacen tan


pequeñas como sea posible las diferencias entre conglomerados, en tanto
que las diferencias entre los elementos individuales dentro de cada
conglomerado se hacen tan grandes como sea posible.

Por ejemplo, si queremos extraer una muestra aleatoria simple de los


estudiantes universitarios de un país sería necesario disponer de una lista
de todos ellos y de sus direcciones y teléfonos. Esta información puede no
estar disponible o ser muy cara de conseguir. Sin embargo, en este caso,
los estudiantes aparecen clasificados en universidades, facultades y
cursos. Podemos seleccionar en una primera etapa algunas universidades,
después algunas facultades al azar de cada universidad, dentro de las
facultades algunas clases y, dentro de las clases, estudiantes mediante
muestreo aleatorio.

Para la primera etapa solo necesitamos una lista de universidades.


Para las universidades seleccionadas es necesario luego conocer las
facultades que incluyen. En las facultades elegidas necesitamos una lista
de las clases, y de las clases que se tomen, una relación de los
estudiantes. Esta información estará disponible por lo que este tipo de
muestreo será factible.

Llamaremos conglomerados a estas unidades amplias donde se


clasifican los elementos de la población. En cada etapa de muestreo , en
lugar de seleccionar elementos al azar , seleccionamos conglomerados. Los
conglomerados se refieren a formas de agrupación física de las unidades
en el espacio o en el tiempo.

Idealmente los conglomerados tienen que ser lo más parecido posible


a muestras aleatorias de la población , de manera que cada conglomerado
sea tan heterogéneo como la población a investigar.

El muestreo por conglomerado tiene la ventaja de simplificar


enormemente la recogida de la información muestral. El inconveniente
obvio es que si los conglomerados son heterogéneos entre sí, como sólo se
analizan algunos de ellos, la muestra final puede no ser representativa de
la población.

116
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

3.5. MUESTREO POR CUOTAS

A veces la estratificación no es posible, o es muy cara, y se recurre


en su lugar al muestreo por cuotas. Por ejemplo, se desea tomar una
muestra de una población para estudiar la proporción de personas que
están de acuerdo con el uso de remedios especiales. Si suponemos que la
edad y el sexo pueden influir en la opinión, deberíamos tomar una
muestra donde estas características sean las mismas que en la población
base, lo que implica una muestra estratificada. Sin embargo, esto requiere
una lista de las personas de la población que incluya su sexo y edad, lo
que puede no estar disponible. Sin embargo, si conocemos la proporción
de cada sexo y la distribución de la edad en la población, una solución
frecuente es exigir que estas características aparezcan en la muestra en la
misma proporción que en la población. Esto conduce a fijar cuotas de
hombres y mujeres por grupos de edad. El entrevistador debe conseguir
los elementos de la muestra respetando esta restricción de cuotas.

4. ESTIMACIÓN DE PARÁMETROS

Algunas cantidades que aparecen en las funciones de distribución,


como p de la distribución binomial ,  y  en la distrIbución normal, se
llaman parámetros. Generalmente estamos interesados en conocer los
parámetros de la población, es decir , aquellas características que sirven
para determinarla. Ahora veremos como obtener estimaciones de
parámetros a partir de una muestra dada.

Dada una población, se trata de estimar, esto es, de valorar, alguno


o algunos parámetros característicos de la misma, como, por ejemplo, a la
media aritmética. Recurriremos a la inferencia estadística, y mediante el
análisis de una muestra obtendremos una estimación de los valores
correspondientes a la población completa.

Esta estimación puede ser por punto o por intervalo, según se


trate de determinar un valor único del parámetro en cuestión o bien un
intervalo dentro del cual quede comprendido, con una cierta probabilidad,
el valor correspondiente al parámetro de toda la población .El intervalo en
cuestión recibe el nombre de intervalo de confianza y la probabilidad, el de
nivel de significación.

117
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

4.1. ESTIMACIÓN PUNTUAL

La Inferencia Estadística está casi siempre concentrada en obtener


algún tipo de conclusión acerca de uno o más parámetros (características
poblacionales). Para hacerlo, se requiere que se obtenga datos muestrales
de las poblaciones en estudio. Entonces, las conclusiones pueden estar
basadas en los valores calculados de varias cantidades muestrales.

Una estimación puntual ó estimación por punto es un solo valor


numérico utilizado para estimar el parámetro correspondiente de la
población. La estimación puntual se obtiene al seleccionar una estadística
apropiada y calcular su valor a partir de datos de la muestra dada.

Sirve como una aproximación del valor exacto desconocido del


parámetro

El estadístico que se utiliza para obtener una estimación puntual


recibe el nombre de estimador puntual del parámetro .

Es conveniente notar que se ha dado el nombre de estimación a un


solo valor calculado. La regla para calcular este valor o estimación se
conoce como estimador. Los estimadores generalmente se presentan
como fórmulas. Por ejemplo la media x de una muestra es un estimador
de la media  de la población correspondiente. El valor numérico
individual que resulta de la evaluación de la fórmula de la media se conoce
como estimación del parámetro . De esta manera se tiene la estimación
  x para 

De forma similar , la variancia muestral, S2 , se puede utilizar para


inferir algo acerca de  2 .

Ejemplo:
Una muestra aleatoria de 3 baterías para calculadora podría
presentar duraciones observadas en horas de x1 = 5.0 , x2 = 6.4 y x3 =
5.9 . El valor calculado de la duración media muestral es x = 5.77 , y es
razonable considerar 5.77 como el valor adecuado de  .

El enunciado : la estimación puntual de  es 5.77 “ se puede


escribir en forma abreviada  = 5.77.

118
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

4.2. ESTIMACIÓN POR INTERVALO EN EL MUESTREO AL ZAR


SIMPLE

Supóngase que un grupo de investigadores quiere estimar la media


de una población que sigue una distribución normal y que, para ello,
extraen una muestra aleatoria de tamaño n de la población y calculan el
valor de x , el cual utilizan como una estimación puntual de  . Aunque
este estimador de  posee todas las cualidades de un buen estimador, se
sabe que, debido a los caprichos del muestreo, no se puede esperar que x
sea igual a .

Un estimador puntual por ser un solo número, no proporciona por sí


mismo información alguna sobre la precisión y confiabilidad de la
estimación. El estimador puntual nada dice sobre lo cercano que está de
 x.

Si se quiere llegar a asignar determinadas garantías o “confianza” a


los resultados de un proceso inferencial de estimación, cabe la posibilidad
de ampliar la óptica de la Estimación Puntual analizada en el tema
anterior, pasando a la estimación mediante Intervalos de Confianza .

En términos estadísticos las “garantías” asignables consisten en


afirmaciones de tipo probabilístico.

La estimación de una magnitud desconocida mediante Intervalo de


Confianza consiste en derivar unos límites aleatorios que contendrán al
parámetro desconocido con una probabilidad fijada de antemano.

Los extremos de un intervalo de confianza son aleatorios, por lo


que podrán o no contener al verdadero parámetro y será posible evaluar la
probabilidad de que así ocurra. A la probabilidad de que un Intervalo de
Confianza contenga al parámetro poblacional objeto de análisis se le
denomina Nivel de Confianza y la denotaremos por  ( 1 -  )

Por ejemplo, si escogemos  = 1 -  = 95 % , implica que 95 % de


todas las muestras daría lugar a un intervalo que incluye  o cualquier
otro parámetro que se esté estimando , y sólo 5 % de las muestras
producirá un intervalo erróneo. Cuánto mayor sea el nivel de confianza
podremos creer que el valor del parámetro que se estima está dentro del
intervalo.

Al estimar un parámetro  , el problema correspondiente debería ser


la determinación de dos cantidades numéricas que dependen de los

119
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

valores de la muestra, y en cuyo intervalo se incluya el valor desconocido


del parámetro con certeza. Sin embargo, sabemos que a partir de una
muestra no podemos obtener conclusiones acerca de la población
correspondiente que sean 100 % verdaderas. Así, tenemos que ser más
modestos y modificar nuestro problema, de la siguiente manera.

Escogemos una probabilidad  cercana a 1 , ( por ejemplo,  = 95 %


, 99 % o alguna semejante) . Luego, determinamos dos cantidades 1 y 2
tales que la probabilidad de que incluyan el valor exacto desconocido del
parámetro  sea igual a  .

Los n valores de la muestra se pueden considerar como valores


observados de n variables aleatorias X1 , X2 , ......., Xn . Entonces 1 y 2
son funciones de estas variables aleatorias y , por lo tanto, también son
variables aleatorias. . Nuestro requisito anterior se puede escribir como

P(1    2 ) = 

Si conocemos 1 y 2 y se dá una muestra, podemos calcular un valor


numérico 1 de 1 , y un valor numérico 2 de 2 . El intervalo con
puntos extremos 1 y 2 se llaman intervalos de confianza o estimación
por intervalo para el parámetro desconocido  , y se representa

CONF  1    2 

Los valores 1 y 2 se llaman límites de confianza inferior y superior


para . El número  se llama nivel de confianza. Se elige  = 95 % , 99%
o algunas veces 99,9 %.

Es evidente que si se intenta obtener una muestra y determinar un


intervalo de confianza correspondiente, entonces  es la probabilidad de
disponer de un intervalo que incluya el valor exacto desconocido del
parámetro.

120
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

4.2.1. INTERVALOS DE CONFIANZA PARA LA MEDIA DE UNA


DISTRIBUCIÓN NORMAL CUYA VARIANCIA ES CONOCIDA

Sea x1 ,     , xn una muestra extraída de una población


distribuida normalmente o , a falta de esto, si n es lo bastante grande,y
cuya variancia  2 es conocida. Suponemos que la media  es
desconocida , y que deseamos -determinar un intervalo de confianza para
 . Los pasos necesarios para determinar un intervalo de confianza bajo
las suposiciones anteriores son .

1 ª paso .Elegir un nivel de confianza  ( 95 % , 99 % ,o uno


semejante ).

2 ª paso . Determinar el valor de z correspondiente mediante la tabla


de distribución normal estandarizada. Por ejemplo:

 0,90 0,95 0,99 0,999


Z 1,645 1,960 2,576 3,291

3ª paso . Calcular la media x de la muestra

4ª paso . Calcular

z 
k= (1)
n

Por lo tanto :

Si x es la media de una muestra aleatoria de tamaño n de


una población con variancia conocida el intervalo de confianza de (  ) 100
% para la media poblacional es.

CONF  x - k    x +k

Z S ≤  ≤ X S
X + Z
n n

Ejemplo:
Se calcula que la media de los promedios de los puntos de calidad de
una muestra aleatoria de 36 alumnos de los últimos años del nivel medio
es 2,6. Encuentre los intervalos de confianza del 95 % y del 99 % para la

121
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

media total de alumnos del último año. Asuma que la desviación estándar
de la población es 0,3.

Solución:

La estimación puntual de  es 2,6. El valor de z para el 95 % es z =


1,96. De aquí que el intervalo de confianza es :

0,3 0,3
( 2,6 – 1,96     2,6 + 1,96  )
36 36

el cual se reduce a, ( 2,50 , 2,70 )

Para encontrar un intervalo del 99 % , se encuentra el valor


de z, donde z = 2,576

0,3 0,3
( 2,6 – 2,576     2,6 + 2,576  )
36 36

o simplemente : ( 2,47 , 2,73 )

Ahora se observa que se requiere un intervalo más grande


para estimar  con mayor precisión.

Si no se conoce la variabilidad de la población y solo se


dispone de la información proporcionada por la muestra, es
decir se conoce X y s, siempre que se trabaje con un
tamaño de muestra grande:

Z S ≤  ≤ X S
X + Z
n n

122
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

GUÍA DE EJERCICIOS

ACTIVIDAD 1

El Departamento de Biología de una escuela desea estimar la


cantidad promedio de agua que consume diariamente cierta especie
animal en condiciones experimentales, para completar un estudio que se
está realizando.Esta investigación supone que la población de valores de
consumo diario de agua está normalmente distribuida y, con base en
experiencias pasadas, que la variancia de la población es de 4 gramos
cuadrados. Una muestra aleatoria de 40 animales arroja una media de
16,5 gramos.

a) Estime puntualmente la cantidad promedio de agua .

b) Con un nivel de confianza del 95 estime la cantidad promedio de


agua.

c) Realice los cálculos solicitados en el inciso b) pero con un nivel


de confianza de 90 % . Compare los intervalos obtenidos.

ACTIVIDAD 2

En una escuela para adultos , se seleccionó una muestra de 100


alumnos aparentemente sanos, de 25 años de edad, donde se muestra una
presión sanguínea media de 125. Si se supone que la desviación estándar
de la población es de 15, calcule
a) El intervalo de confianza del 90 por ciento para 

b) El intervalo confianza del 95 por ciento para 

ACTIVIDAD 3
Una investigación realizada en el área de educación sostiene que la
edad promedio de los docentes del área rural ha disminuido . La edad
promedio de los docentes rurales en elos últimos años fue de 35 años.

Para ello,se extrae una muestra aleatoria de 100 docentes en la que


la edad promedio es de 28 años con una desviación estándar de 8 año.

123
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

¿Confirman estos datos la hipótesis de esta investigación?. Trabaje con


 = 0,01 y  = 0,05.

ACTIVIDAD 4

Una muestra aleatoria que representa el tiempo ( en minutos) que


tardaron 36 estudiantes en familiarizarse con el manejo de un software
adquirido por las Autoridades del Colegio, dio un tiempo promedio de 10
minutos . El tiempo se distribuye normalmente. con una desviación
estándar de 3 minutos.

a) Determine e interprete un intervalo del 95 % de confianza para el


verdadero tiempo promedio.
b) El instructor considera que el tiempo promedio requerido por los
alumnos es mayor que 10 minutos, ¿ qué se puede decir de
acuerdo con el intervalo hallado?.

124
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

ANEXO
TABLAS ESTADÍSTICAS

125
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

126
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

127
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

128
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

129
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

130
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

131
Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa - UNSE

BIBLIOGRAFÍA

- Benítez, Celia de; Pece, Marta G.; Galíndez, Margarita de. (2003).
Serie Didáctica N°7: “Elementos de Estadística para técnicos en
vivero y plantaciones forestales”, con guía de ejercitación.

- Barbancho, A. (1983). Estadística Elemental Moderna . 9a Edición.


Ariel, S. A. – Barcelona. ISBN 84-344-2005-8.

- Daniel, W.W. (1997) Bioestadística. ISBN 968-18-5196-X.

- Kreyszig, E. (1994). Introducción a la Estadística Matemática .


Principios y métodos. LIMUSA. –Noriega Editores. ISBN 968-18-
0729-4.

- Peña, D. y Romo, J. (1999) . Introducción a la Estadística para las


Ciencias Sociales. ISBN 84-481-1617-8.

- Triola, M.F.(2004). Estadística. Novena edición.ISBN 970-26-0519-


9. Editorial Pearson. México. 837 pags.

- Ya-Lun, Chou. (1990). Análisis Estadístico. ISBN 970-10-0046-3.


pags.808.

132

También podría gustarte