100% encontró este documento útil (2 votos)
3K vistas154 páginas

Estadistica Aplicada A La Educacion

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
100% encontró este documento útil (2 votos)
3K vistas154 páginas

Estadistica Aplicada A La Educacion

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS

Universidad del Perú, DECANA DE AMÉRICA


FACULTAD DE EDUCACIÓN

Programa de Licenciatura para Profesores sin


Título Pedagógico en Lengua Extranjera

Estadística aplicada a la educación

Martín Pablo Moreano Vilca


Jessica Graciela Zavaleta Morales
FACULTAD DE EDUCACIÓN

DECANO
Dr. Elías Jesús Mejía Mejía

DIRECTORA ACADÉMICA
Dra. Elsa Julia Barrientos Jiménez

DIRECTOR ADMINISTRATIVO
Mag. Edgar Froilán Damián Núñez

PROGRAMA DE LICENCIATURA PARA PROFESORES SIN


TÍTULO PEDAGÓGICO EN LENGUA EXTRANJERA

DIRECTORA
Mg. María Emperatriz Escalante López

COMITÉ DIRECTIVO
Dra. Edith Reyes de Rojas
Lic. Walter Gutiérrez Gutiérrez

Estadística aplicada a la educación


Martín Pablo Moreano Vilca / Jessica Graciela Zavaleta Morales

Serie: Textos para el Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera
Primera edición
Lima, agosto de 2012

© Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera Facultad de Educación, Univer-
sidad Nacional Mayor de San Marcos
Av. Germán Amézaga s/n. Lima 1, Ciudad Universitaria UNMSM - Pabellón Administrativo de la Facultad de Educación
2.º piso, oficina 203, teléfono: 619-7000 anexos 3021, 3022 / E-mail: prog_idiomas_edu@[Link]
Página web: [Link]/educacion/licenciatura/[Link]
Diseño, diagramación e impresión: Centro de Producción Editorial e Imprenta de la UNMSM.
Este libro es propiedad del Programa de Licenciatura para Profesores sin título Pedagógico en Lengua Extranjera de la
Facultad de Educación de la Universidad Nacional Mayor de San Marcos. Ninguna parte de este libro puede ser repro-
ducida o utilizada por cualquier medio, sea este electrónico, mecánico o cualquier otro medio inventado, sin permiso por
escrito del Programa.
Contenido
Introducción 9
Unidad 1
Conceptos Básicos de Estadística Descriptiva. Organización de datos
1.1. Breve historia de la estadística 13
1.2. Importancia de la estadística en el campo educativo 14
1.3. Estadística 15
1.3.1. Estadística Descriptiva 15
1.3.2. Estadística Inferencial 15
1.4. Conceptos estadísticos 15
1.4.1. Población 15
1.4.2. Muestra 17
1.4.3. Variables 17
1.4.4. Unidad elemental o estadística 18
1.4.5. Dato 18
1.4.6. Parámetro 19
1.5. Medidas y escalas de medición 19
1.5.1. Escala nominal 19
1.5.2. Escala ordinal 19
1.5.3. Escala intervalar 20
1.5.4. Escala de razón 20
1.6. Organización y clasificación de datos 20
1.6.1. Datos no agrupados 20
1.6.2. Datos agrupados 21
1.7. Tipos de frecuencia 21
1.7.1. Frecuencia absoluta simple (fi) 21
1.7.2. Frecuencia absoluta acumulada(Fi) 21
1.7.3. Frecuencia relativa simple (hi) 22
1.7.4. Frecuencia relativa acumulada (Hi) 22
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

1.8. Elaboración de tablas y distribución de frecuencias 22


1.8.1. Distribución de frecuencia para datos no agrupados 23
1.8.2. Distribución de frecuencias de clases o de datos Agrupados 25
1.9. Gráficos Estadísticos 28
1.9.1. Principales tipos de gráficas 29
1.9.2. Para datos sin agrupar correspondientes a variables cualitativo
y/o cuantitativas discretas 30
1.9.3. Para datos agrupados en intervalos correspondientes
a un carácter cuantitativo 32
Ejercicios resueltos 33
Ejercicios propuestos 42
Autoevaluación de la unidad 1 46
LECTURA N.º 1 49

Unidad 2
Medidas de Tendencia Central, Dispersión y Forma
2.1. Medidas de tendencia central o posición 57
2.1.1. Media aritmética 57
2.1.2. Mediana (Me) 60
2.1.3. Moda (Mo) 64
2.2. Medidas de posición no central (Cuantiles) 67
2.2.1. Cuartiles (Qk) 67
2.2.2. Deciles (Dk) 69
2.2.3. Percentiles (Pk) 69
2.3. Medidas de Dispersión 70
2.3.1. Medidas de Dispersión Absoluta 70
2.3.2. Medidas de Dispersión Relativa 75
2.4. Medidas de Forma 76
2.4.1. Coeficiente de asimetrías o sesgo de Pearson 76

6
Estadística aplicada a la Educación

2.4.2. Diagrama de caja 79


Ejercicios resueltos 81
Ejercicios propuestos 86
Autoevaluación de la Unidad 2 87
LECTURA N.º 2 89

Unidad 3
Probabilidades
3.1. Nociones de probabilidad 95
3.1.1. Experimentos Aleatorios. 95
3.1.2. Espacio Muestral (Ω) 96
3.1.3. Suceso o evento 96
3.1.4. Probabilidad de un suceso 96
3.1.5. Propiedades de las probabilidades 97
3.2. Probabilidad condicional 99
3.3. Probabilidad conjunta 103
3.4. Sucesos independientes 105
Ejercicios resueltos 107
Ejercicios propuestos 112
Autoevaluación de la unidad 3 113
LECTURA N.° 3 116

Unidad 4
Regresión y Correlación
Introducción 121
4.1. Conceptos básicos 121
4.1.1. Regresión 121
4.1.2. Tipos de relación entre las variables 122
4.2. La regresión lineal 124

7
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

4.2.1. La recta de regresión 125


4.3. Correlación lineal 128
4.3.1. Propiedades del coeficiente de correlación 128
Ejercicios resueltos 131
Ejercicios propuestos 138
Autoevaluación de la unidad 4 140
LECTURA N.° 4 142
Solucionario de los ejercicios propuestos 148
Claves de respuesta de las autoevaluaciones 154
Bibliografía 155

8
Introducción

Este texto tiene como finalidad proporcionar información teórica y práctica de algunos
aspectos básicos de la estadística y su aplicación en el campo educativo.
El contenido del libro está dirigido a los participantes del Programa de Licenciatura para
Profesores sin Título Pedagógico en Lengua Extranjera de la Universidad Nacional Mayor
de San Marcos, quienes encontrarán en este texto una herramienta de lectura y de apoyo
para el desarrollo del curso de Estadística Aplicada a la Educación.
El libro está organizado en cuatro unidades. La primera unidad corresponde a la intro-
ducción al campo de la estadística, los conceptos básicos, la organización de datos y sus
representaciones básicas. La segunda unidad hace referencia a las medidas de tenden-
cia central, de dispersión y forma, indicando su aplicación e interpretación en el campo
educacional. En la tercera unidad se presentan algunas nociones básicas del cálculo de
probabilidades y sus aplicaciones con el propósito de valorar su importancia en la vida
cotidiana. Finalmente, en la cuarta unidad se estudian los conceptos de regresión y corre-
lación, que son técnicas muy útiles para analizar la relación entre dos variables.
Cada uno de estos capítulos presentan aspectos teóricos acompañados de una serie
de ejercicios resueltos, ejercicios propuestos y un cuestionario de autoevaluación que
servirá para reflexionar sobre los aprendizajes logrados.
Asimismo, expresamos nuestro sincero agradecimiento a la Mg. María Escalante, directo-
ra del Programa de Licenciatura para Profesores sin Título en Lenguas Extranjeras, quien
nos brinda la posibilidad de compartir nuestros conocimientos con ustedes, al profesor
Víctor Ochoa Grados, por sus aportes y a todos aquellos que contribuyeron en la elabo-
ración de este texto.

Los autores
Unidad 1

Conceptos Básicos de Estadística


Descriptiva. Organización de datos

Capacidades a desarrollar
¾¾ Analizar los conceptos esenciales sobre estadística.

¾¾ Elaborar e interpretar tablas de frecuencias simple y


con intervalos.

¾¾ Elaborar e interpretar gráficos estadísticos.


Estadística aplicada a la Educación

Introducción
La palabra ‘estadística’ nos trae a la mente una serie de ideas como son: números apila-
dos en tablas, cifras relativas a nacimientos, muertes, etc. La estadística es mucho más
que solo números; es una rama de las matemáticas con origen remoto y en continua
evolución y desarrollo. El término ‘estadística’ tiene su raíz en la palabra Estado y apa-
rece cuando se hace necesario cuantificar conceptos. En la mayoría de los casos, esta
cuantificación se realiza con fines económicos o militares.
Actualmente, la estadística es una ciencia que nos proporciona un conjunto de métodos
que se utilizan para recolectar, resumir, clasificar, analizar e interpretar el comportamien-
to de los datos con respecto a una característica materia de estudio o investigación y
resulta una herramienta de suma utilidad para la toma de decisiones en cualquier campo
de la ciencia.

1.1. Breve historia de la estadística


Ruiz (2011) nos ofrece una aproximación histórica a esta ciencia. Señala que sus oríge-
nes radican en el antiguo Egipto, pues los faraones lograron recopilar, hacia el año 3050
A.C, datos relativos a la población y la riqueza de su país. De acuerdo con el historiador
griego Herodoto, dicho registro facilitó la construcción de las pirámides. Asimismo, Ram-
sés II realizó un censo de las tierras con el objeto de verificar un nuevo reparto.
La Biblia también nos proporciona información sobre un análisis estadístico en el libro de
los Números, además recordemos que el rey David ordenó a su general del ejército hacer
un censo de Israel con el objeto de conocer el número de la población.
Sin embargo, fueron los romanos quienes mejor supieron emplear los recursos de la
estadística. Es sabido que el emperador César Augusto decretó que todo el imperio fuera
sometido al pago de impuestos, para lo cual previamente se efectuó un censo de las
personas. Para el nacimiento de Jesús se produjo uno de estos célebres empadrona-
mientos bajo la autoridad del imperio. No obstante, durante la caída del Imperio Romano
se realizaron muy pocas operaciones estadísticas, salvo las que posteriormente fueron
compiladas por Pipino el Breve en 758 y por Carlomagno en 762 D.C.
Asimismo, es sabido que nuestros antepasados, los incas, fueron eficientes en la reco-
lección de datos para la administración del Estado haciendo uso del quipu, el cual es
considerado uno de los instrumentos más sofisticados para la contabilización del Estado.
En Inglaterra, Guillermo el Conquistador ordenó que se hiciera un registro de todos los
bienes que existían en Inglaterra, para fines tributarios y militares, descritos en el Domes-
day Book o Libro del Gran Catastro (1086). Dicha obra está considerada como el primer
compendio estadístico de Inglaterra.

13
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

En 1660 surgió la “Aritmética Política”, destinada a la descripción de los sucesos políticos.


Esta ciencia, que nació en la universidad alemana de Haltustadt y se extendió por distintas
universidades alemanas y suizas, fue denominada Estadística por el alemán Schmeitzel.
Entre 1800 y 1820 se desarrollaron dos conceptos matemáticos importantes para la teo-
ría estadística: la teoría de los errores de observación, aportada por Laplace y Gauss, y
la teoría de los mínimos cuadrados desarrollada por Laplace, Gauss y Legendre. A finales
del siglo XIX, sir Francis Gaston ideó el método conocido por Correlación, que tenía por
objeto medir la influencia relativa de los factores sobre las variables. De aquí partió el
desarrollo del coeficiente de correlación creado por Karl Pearson y otros cultivadores de
la ciencia biométrica como J. Pease Norton, R. H. Hooker y G. Udny Yule, que efectuaron
amplios estudios sobre la medida de las relaciones.
Posteriormente, la estadística se vincula al análisis matemático mediante el cálculo de
probabilidades, gracias a Bernoulli, Leibnitz, Bayes, Laplace, Chebychev, Kolmogorov y
Markov. Asimismo, a partir de la aparición de la computadora, que revoluciona la metodo-
logía estadística, se abren enormes posibilidades para la construcción de modelos más
complejos que hoy en día son de gran utilidad para todas las disciplinas.

1.2. Importancia de la estadística en el campo educativo


La estadística al igual que la matemática son dos disciplinas esenciales para desenvol-
vernos en la vida cotidiana. Algunas técnicas estadísticas se aplican en mercadotecnia,
contabilidad, estudios de consumidores y en otras actividades. Por ejemplo, los inge-
nieros de control de calidad recopilan datos sobre la fiabilidad de partes y productos
fabricados, calidad de procesos, etc., para el mejoramiento del producto. En política, los
funcionarios que ocupan cargos directivos hacen uso de la estadística para definir qué
quieren sus votantes.
En educación, la estadística es considerada como la base de la planificación, ya que para
planificar y obtener resultados válidos hay que disponer de estadísticas. Usualmente,
el docente y los directivos hacen uso de ella para organizar datos sobre la cantidad de
estudiantes en la escuela, el rango de edad de sus estudiantes, sus calificaciones, el
número de aulas, cuántos maestros(as) hay en la escuela clasificados por género, años
de servicio, etc.
Por otra parte, la mayoría de las investigaciones especializadas contienen resultados
basados en el análisis estadístico, los cuales sirven para dimensionar el comportamiento
de ciertos hechos de una determinada población, realizar estimaciones y proyecciones.
Asimismo, la estadística está íntimamente ligada con el método científico, pues apoya a
la investigación en la recolección y el análisis de datos para verificar o formular nuevas
hipótesis y la toma de decisiones. Es decir, no es tan solo un conjunto de fórmulas y/o
procedimientos matemáticos, sino que permite la organización de datos en toda investi-
gación científica.

14
Estadística aplicada a la Educación

En todo trabajo de investigación científica, luego de haber establecido el problema, es ne-


cesario elaborar un plan de análisis estadístico que facilite la solución del problema, este
nos permitirá analizar las características de la población y dichos resultados nos orientan
a la toma de decisiones. Si uno deja de lado el análisis estadístico podrían existir ciertas
dificultades para diseñar un plan de investigación y por tanto se nos hará más complejo
conocer una determinada realidad.

1.3. Estadística
Rincón G. (2011) afirma que la estadística es una ciencia que estudia situaciones prác-
ticas que se manifiestan bajo incertidumbre. Asimismo, esta ciencia se divide en dos
grandes ramas, según podemos observar en este esquema:
Ramas de la Estadística

(VWDGtVWLFD
'HVFULSWLYD
(VWDGtVWLFD

(VWDGtVWLFD
,QIHUHQFLDO

1.3.1. Estadística Descriptiva


Es una de las ramas de la estadística que se encarga de analizar los métodos que com-
prenden la recolección, presentación y caracterización de un conjunto de datos (mediante
gráficos o de forma analítica) con el objetivo de describir un conjunto de datos, sus carac-
terísticas y resaltar las propiedades de los elementos bajo estudio.

1.3.2. Estadística Inferencial


Esta rama de la estadística se encarga de obtener conclusiones sobre el comportamiento
total de un fenómeno basándose únicamente en la información recolectada sobre una
parte de ese mismo fenómeno. Estas conclusiones se obtienen bajo incertidumbre. Igual-
mente, permite estimar el comportamiento futuro de un fenómeno.

1.4. Conceptos estadísticos


1.4.1. Población
Es el colectivo finito o infinito de elementos que interesan a un estudio, además posee al-
guna característica común observable. Es el conjunto sobre el que recae la investigación
y de cuyos elementos se obtienen datos de sus características o atributos.

15
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Toda población debe delimitarse temporal y espacialmente, de modo que ante la presen-
cia de un potencial integrante de la misma se pueda decidir si forma parte o no de la po-
blación bajo estudio. Por lo tanto, al definir una población, se debe cuidar que el conjunto
de elementos que la integran se encuentre perfectamente determinado.
De acuerdo a Rincón (2011), para delimitar una población se debe ordenar de acuerdo a
la siguiente sintaxis:

TODOS(AS) + DESCRIPCIÓN DEL ELEMENTO + CONDICIÓN RESTRICTIVA

Significa que una definición de población debe empezar por la palabra “todos” o “todas”
seguida de una descripción del elemento que se está observando más una restricción al
alcance de la palabra “todos(as)”.
Por ejemplo: En un estudio del nivel salarial de los docentes de la UGEL 3 – Lima en el
año 2012, una definición de población podría ser la siguiente:
Todos los docentes de la UGEL 3 de la ciudad de Lima, año 2012.
Asimismo, las poblaciones se dividen en dos clases:
• Poblaciones finitas
• Poblaciones infinitas
Las poblaciones finitas son aquellas a las cuales se les pueden determinar fácilmente
el número de elementos que la componen. Por ejemplo:
La edad de los estudiantes de la Facultad de Educación de
Situación o fenómeno:
la UNMSM en el año 2012.
Todos los estudiantes de la Facultad de Educación de la
Población:
UNMSM en el año 2012.
Finita, porque se pueden contabilizar sus elementos
Tipo de población: acudiendo a la oficina de la institución que registra estos
datos.

Las poblaciones infinitas son aquellas físicamente imposibles de numerarlas o determi-


nar su cantidad por razones económicas o de tiempo. Por ejemplo:
Accidentes por día en un cruce de calles en el distrito de
Situación o fenómeno:
San Miguel.
Población: Todas los días mientras exista este cruce.
Infinita. Es imposible determinar cuántos elementos tiene
Tipo de población:
esta población.

16
Estadística aplicada a la Educación

1.4.2. Muestra
Es un subconjunto de análisis de la población dada y está constituida por elementos
seleccionados de una manera deliberada con el objeto de investigar las propiedades de
la población.
Las causas por las cuales se seleccionan muestras son muchas. Puede ocurrir que la po-
blación que se defina tenga tamaño infinito y, en consecuencia, no fuera posible observar
a todos sus elementos. En otras ocasiones, el costo de la observación exhaustiva puede
ser muy elevado o el tiempo de recolección de la información resulte ser muy extenso. Sin
embargo, debemos considerar que la muestra debe ser representativa de la población;
esto significa que debe ser de tamaño adecuado y debe tener las mismas propiedades
de la población.

1.4.3. Variables
Representan y sintetizan conceptualmente las propiedades o características de las uni-
dades de análisis a las cuales se les pueden adjudicar distintos valores numéricos. Es
decir, es una característica observable que puede tomar diferentes valores, los cuales se
pueden expresar en varias categorías.
Por ello, todas las variables tienen una escala de registro y pueden poseer una caracte-
rística medible como: peso, ingreso, coeficiente de inteligencia, etc., o una cualidad no
medible como: estado civil, nacionalidad, sexo, etc.
La variable se denota por una letra mayúscula X. A su vez cada una de estas variables
puede tomar distintos valores, colocando un subíndice x1, x2, x3,… xk.

[Link]. Clasificación de las variables


De acuerdo con la naturaleza de las variables, estas pueden ser:
• Variables cualitativas o categóricas
Es cuando indican una cualidad, característica o atributo y sus datos se expresan me-
diante una palabra y no con una expresión numérica. Por ejemplo: El estado civil, el lugar
de nacimiento, las profesiones, etc.
• Variables cuantitativas
Es cuando el val or de la variable se expresa mediante una cantidad, es decir, es de ca-
rácter numérico. Así tenemos: el número de hijos en una familia, los ingresos, el número
de alumnos por aula, etc. Estas variables se clasifican en discretas y continuas.
– Variable cuantitativa discreta
El resultado de este tipo de variable resulta del conteo y su valor está representado
en correspondencia biunívoca con los números naturales. Por ejemplo: el número de
accidentes por día, los trabajadores de una empresa, el número de habitaciones de
una casa, etc.

17
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

– Variable cuantitativa continua


El resultado de este tipo de variable resulta de la medición o comparación con una unidad o
patrón de medida. Las variables cuantitativas continuas pueden tener cualquier valor den-
tro de un rango o recorrido, por lo tanto se expresa mediante un número real. Por ejemplo:
los ingresos de una familia, la estatura, el peso, la temperatura de una persona, etc.

1.4.4. Unidad elemental o estadística


Es el objeto o elemento indivisible que será estudiado en una población sobre la cual
se va a obtener datos. También se le llama unidad de observación si los datos han sido
recolectados mediante la observación y se le llama unidad experimental si los datos han
sido recolectados a través de la experimentación.
Por ejemplo:
Ejemplo de
Variables Tipo de variable Unidad estadística
observaciones

X: Grado de x1: Primaria


instrucción de los Cualitativa Cada padre de familia x2: Secundaria
padres de familia x3: Superior

Y: Peso de los y1: 34 kg


Cuantitativa
alumnos del 3er año de Cada alumno y2: 38 kg
continua
secundaria y3: 40 kg
Fuente: Adaptado de Fernández, J. (2005)
1.4.5. Dato
Es el valor o respuesta que adquiere la variable en cada unidad de análisis y es el resul-
tado de las observaciones o recopilación en general.
Un dato está constituido por tres elementos: La unidad de observación, la variable y el
valor.
Ejemplo:
Si se aplica un cuestionario de encuesta a un alumno X de una muestra de 400 alumnos
de la UGEL 2 y su respuesta a una pregunta sobre su edad en años cumplidos es 16
años. Sus elementos de este dato son:
• La unidad de observación : el alumno X
• La variable : edad
• El valor : 16 años
Asimismo, dicha recolección de datos implica tres actividades:
a) Seleccionar o desarrollar un instrumento de medición.

18
Estadística aplicada a la Educación

b) Aplicar ese instrumento de medición (obtener las mediciones y observaciones de las


variables de interés).
c) Preparar las mediciones obtenidas para que puedan analizarse correctamente.

1.4.6. Parámetro
Es un valor obtenido para describir en forma resumida las características más resaltantes
de la población, es decir, son las medidas de resumen de la población.
Ejemplos: La media, la diferencia de promedios, la varianza, la desviación estándar, etc.

1.5. Medidas y escalas de medición


Para realizar un análisis correcto de los datos es fundamental conocer previamente el tipo
de medida de la variable, ya que para cada una de ellas se utiliza diferentes estadísticos.
La clasificación más convencional de las escalas de medida las divide en cuatro grupos
denominados: Escala nominal, escala ordinal, escala intervalar y escala de razón.

1.5.1. Escala nominal


La escala nominal se establece mediante la distinción de elementos en diversas catego-
rías, basándose en sus atributos, sin implicar algún orden entre ellas.
Ejemplos:
• Sexo (masculino, femenino).
• Estado civil (soltero, casado, viudo, divorciado).
• Principal fuente de energía para cocinar (electricidad, gas, kerosene, leña, ninguna,
otros).
• Material predominante en las paredes exteriores de la vivienda (ladrillo, adobe, esteras,
otros).

1.5.2. Escala ordinal


La escala ordinal está referida a un orden o jerarquía, es decir, las características expre-
san una posición de orden.
Ejemplos:
• Nivel de satisfacción del curso (Muy de Acuerdo, Acuerdo, Poco de Acuerdo, en
Desacuerdo, Muy en desacuerdo).
• Nivel Socioeconómico (Alto, Medio, Bajo).
• Opinión sobre las condiciones de salubridad de un distrito (Muy Bueno, Bueno, Malo,
Muy Malo, otro).
• Grado de instrucción (Inicial, Primaria, Secundaria, Superior).

19
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

1.5.3. Escala intervalar


La escala intervalar supone orden y a su vez grados de distancia entre las diversas ca-
tegorías, pero no tienen un origen natural sino convencional. Parten del cero relativo, el
cual no representa vacío.
Ejemplos:
• Coeficiente de inteligencia
• Temperatura
• Puntuación obtenida en una escuela
• Presión arterial
• Rendimiento escolar

1.5.4. Escala de razón


La escala de razón comprende los casos anteriores, distinción, orden, distancia y origen
único natural, el valor se representa con un número real y tiene un cero absoluto el cual
representa la ausencia de la característica estudiada.
Ejemplos:
• Edad
• Peso
• Ingresos
• Número de hijos
• Accidentes de tránsito

1.6. Organización y clasificación de datos


Los datos constituyen una información básica para iniciar un estudio, conocer y analizar
las características de los elementos de una población. En estadística, los datos deben
ser clasificados, ordenados y presentados de tal manera que facilite la comprensión,
descripción y análisis del fenómeno estudiado para extraer conclusiones válidas para la
toma de decisiones.
El primer paso para organizarlos consiste en identificar el tipo de datos que se tiene, los
cuales pueden ser cualitativos o cuantitativos.
Asimismo, estos datos se pueden organizar en:
• Datos no agrupados
• Datos agrupados
A continuación explicaremos cada una de ellas.

1.6.1. Datos no agrupados


Los datos no agrupados son los datos sin procesar y usualmente el punto de inicio de
los análisis.
20
Estadística aplicada a la Educación

Por ejemplo, si tenemos doce elementos en la muestra y estos datos son analizados sin
necesidad de formar clases con ellos, los llamamos datos no agrupados.

1.6.2. Datos agrupados


Los datos agrupados se refieren al hecho de que estén ordenados, clasificados, conta-
dos y significan que hay menos datos con los cuales trabajar. Estos pueden presentarse
con intervalos y sin intervalos.

1.7. Tipos de frecuencia


En el siguiente esquema podemos apreciar los diferentes tipos de frecuencia:
Esquema: Tipos de frecuencia

Frecuencia absoluta simple fi

Frecuencia absoluta acumulada Fi

Frecuencia relativa simple hi

Frecuencia relativa acumulada Hi

A continuación, desarrollaremos cada una de ellas.

1.7.1. Frecuencia absoluta simple (fi)


La frecuencia absoluta simple nos indica el número de veces que se repite un valor en
un conjunto de datos. Además, la suma de todas las frecuencias absolutas es igual al
total de la población.

1.7.2. Frecuencia absoluta acumulada(Fi)


La frecuencia absoluta acumulada resulta de la suma de las frecuencias absolutas sim-
ples correspondientes a los datos menores e iguales al dato en referencia.
La última frecuencia absoluta acumulada es igual al tamaño de la muestra n. Así tenemos:
F1 = f1
F2 = f1+ f2
Fn = f1 + f2 +… + fn-1 + fn = n

21
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

1.7.3. Frecuencia relativa simple (hi)


La frecuencia relativa de un valor es el cociente de su frecuencia absoluta entre el tamaño
de la muestra.

La suma de todas las frecuencias relativas es 1.

1.7.4. Frecuencia relativa acumulada (Hi)


La frecuencia relativa acumulada de un dato es el cociente de su frecuencia absoluta
acumulada entre el tamaño de la muestra.

Fi
Hi =
n

Para interpretar hi y Hi se suele emplear su valor expresado en porcentaje, el cual se


obtiene al multiplicar por 100 cada uno de estos valores.

1.8. Elaboración de tablas y distribución de frecuencias


Una vez que se ha extraído una muestra de la población, el siguiente paso es organizar
los datos con el objetivo de analizarlos con comodidad. Para ello, haremos uso de las
tablas de frecuencias.
Una tabla de frecuencias presenta en forma ordenada los distintos valores de una varia-
ble y sus correspondientes frecuencias, la cual permite percibir con claridad determina-
das características de la masa de datos que se investiga.
La distribución de frecuencias es la representación estructurada de la información que
se ha recogido sobre la variable en estudio, esta distribución puede realizarse de acuerdo
a la agrupación de los datos.
Las tablas de frecuencias deben explicarse por sí mismas; es decir, deben ser fáciles de
entender por cualquier persona que las lee.
Toda tabla de frecuencia contiene lo siguiente:
a) El título, el cual nos muestra brevemente el contenido de la información, debe ser
claro y preciso.

22
Estadística aplicada a la Educación

b) El encabezamiento, se encuentra en la primera fila y nos indica la naturaleza de con-


tenido de cada columna.
c) El cuerpo, está formado por un conjunto de filas y columnas y nos presenta la infor-
mación de la investigación
d) La fuente, está ubicada al final de la tabla y nos indica a la entidad responsable de
donde se obtuvieron los datos.
En el siguiente gráfico se muestran las partes de la tabla de frecuencia.
Gráfico: Partes de una Tabla de Frecuencia
Título
Encabezado

Cuerpo

Fuente: Adaptado de Fernández, J. (2005)


La distribución de frecuencia se puede organizar de la siguiente manera:
• Distribución de frecuencia para datos no Agrupados.
• Distribución de frecuencia de clase o de datos Agrupados.

1.8.1. Distribución de frecuencia para datos no agrupados


Es la distribución que indica las frecuencias con que aparecen los datos estadísticos,
desde el menor de ellos hasta el mayor sin que se haya hecho ninguna modificación al ta-
maño de las unidades originales. En estas distribuciones los valores de cada variable han
sido solamente reagrupados siguiendo un orden lógico con sus respectivas frecuencias.
Por ejemplo, en la siguiente tabla fi es la frecuencia absoluta, Fi frecuencia acumulada,
hi frecuencia relativa y Hi frecuencia relativa acumulada de la i-ésima categoría (clase),
respectivamente.
Variable Frecuencias absolutas Frecuencias relativas
(Valor) Simple (fi) Acumulada (Fi) Simple (hi) Acumulada (Hi)
X1 f1 F1= f1 h1 = f 1 / n H1 = h1
X2 f2 F2 = F1 + f2 h2 = f 2 / n H2 = H1 + h2
... ... ... ... ...
Xk fk Fk = n hk = f k / n Hk = 1
Total n 1

23
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Por ejemplo, al medir la altura de los niños de una clase, se obtienen los siguientes re-
sultados (en metros).

Alumno Estatura Alumno Estatura Alumno Estatura


Alumno 1 1,25 Alumno 11 1,23 Alumno 21 1,21
Alumno 2 1,28 Alumno 12 1,26 Alumno 22 1,29
Alumno 3 1,27 Alumno 13 1,30 Alumno 23 1,26
Alumno 4 1,21 Alumno 14 1,21 Alumno 24 1,22
Alumno 5 1,22 Alumno 15 1,28 Alumno 25 1,28
Alumno 6 1,29 Alumno 16 1,30 Alumno 26 1,27
Alumno 7 1,30 Alumno 17 1,22 Alumno 27 1,26
Alumno 8 1,24 Alumno 18 1,25 Alumno 28 1,23
Alumno 9 1,27 Alumno 19 1,20 Alumno 29 1,22
Alumno 10 1,29 Alumno 20 1,28 Alumno 30 1,21
Fuente: extraído de [Link]

A partir de estos datos, podemos construir nuestra tabla de frecuencias:

Distribución de alturas de alumnos de una clase


(Valor) fi Fi hi Hi
1,20 1 1 0,03 0,03
1,21 4 5 0,13 0,16
1,22 4 9 0,13 0,29
1,23 2 11 0,07 0,36
1,24 1 12 0,03 0,39
1,25 2 14 0,07 0,46
1,26 3 17 0,10 0,56
1,27 3 20 0,10 0,66
1,28 4 24 0,13 0,79
1,29 3 27 0,10 0,89
1,30 3 30 0,10 1,00
n = 30 ∑hi = 0,99 ≅ 1

24
Estadística aplicada a la Educación

Observación:

La suma de todas las frecuencias relativas simples debe de ser 1, pero


como en nuestro ejemplo, debido a las aproximaciones realizadas es
posible que la suma no resulte 1.

Interpretación:
• f1 = 1, significa que 1 alumno mide 1,20 cm.
• F4 = 11, significa que 11 alumnos a lo más miden 1,23 cm.
• h3 = 0,13, significa que el 13% de los alumnos miden 1,22 cm.
• H7 = 0,56, significa que el 56% de los alumnos miden a lo más 1,26 cm.

1.8.2. Distribución de frecuencias de clases o de datos agrupados


La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las
variables toman un número grande de valores o la variable es continua o cuando los datos
son discretos pero muy numerosos. También se utilizará este tipo de distribución cuando
se requiera elaborar gráficos lineales como el histograma o el polígono de frecuencia.

[Link]. Construcción de una tabla de datos agrupados


Estas tablas se usan comúnmente para resumir grandes cantidades de datos continuos.
Fernández (2005) señala que cualquier tabla de frecuencia con datos agrupados en inter-
valos debe presentar las siguientes características:
a) Uniformidad, pues cada clase debe tener la misma amplitud.
b) Unicidad, ya que dos clases no se superponen.
c) Completitud, puesto que cada uno de los datos pertenece a alguna clase.
A continuación, veamos cómo se construye una tabla de datos agrupados a través del
siguiente ejemplo:
Durante el mes de julio se realizó una investigación en la I.E. Miguel Grau sobre el nú-
mero de horas que los estudiantes usan el Internet durante una semana, de la cual se
obtuvo los siguientes datos:

10 19 25 19 26 23 22 17 12 20 18 25 21
16 19 27 27 25 15 21 23 26 14 23 24

Para ello, es necesario tener en cuenta los siguientes conceptos:

25
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Concepto Definición De acuerdo al ejemplo anterior


Rango o Es la diferencia entre el
R = 27 – 10 = 17
amplitud mayor y el menor dato.
[16,19〉 es un posible intervalo de clase
Intervalo de Es una clasificación de los donde se debe considerar a los niños
clase datos en subgrupos. que usan Internet desde 16 horas hasta
menos de 19 horas semanales.
Son los valores extremos
del intervalo de clase; es
L = 16
Límites de clase decir, [Li, Ls, donde Li es i
Ls= 19
el límite inferior y Ls es el
límite superior.
Es la diferencia entre el
límite superior e inferior de
Ancho de clase cada intervalo.
o amplitud del Si tenemos el intervalo [Li, W= 19 – 16 = 3
intervalo (W) Ls〉, el ancho o amplitud de
clase es:
W = Ls - Li
Es el punto medio de
cada intervalo; es decir, la
Marca de clase semisuma de los límites de 16 + 19
cada intervalo. x' = = 17,5
(X’) 2
Li + L s
x' =
2

Otras consideraciones:
• La regla de Sturges
Es una de las más usadas en Estadística Descriptiva. Debido a que no existen reglas
fijas para determinar el número de clases (K), el cual si es muy pequeño significaría
la pérdida de información y si es muy grande produciría irregularidades, es necesario
obtener el valor aproximado del número de clases (K) y para ello se usa la regla de
Sturges, la cual es:

K = 1 + 3,3 log n
Donde: n = tamaño de la muestra o número de datos.
Del ejemplo anterior:
Como hemos obtenido un valor decimal, es necesario redondearlo a cantidades enteras
y para ello diremos que K = 6 con ello estamos garantizando que los valores mayores se
encuentren en el último intervalo.

26
Estadística aplicada a la Educación

• Ancho de clase común


Para ello haremos uso de la siguiente ecuación:

rango r
W= =
Nº de clases k

17
Del ejemplo anterior: W = 6 = 2,83; no obstante es necesario redondearlo a W=3, ya
que la información de horas semanales de uso del Internet está expresado en números
enteros. Para el cálculo de la amplitud de clase es necesario considerar algunos criterios
de redondeo de decimales, tal es el caso de que si trabajamos con una cifra decimal,
entonces el TIC deberá estar expresado con una cifra decimal y si trabajamos con dos
cifras decimales, la amplitud de clase deberá tener dos cifras decimales.
En resumen, si queremos elaborar una tabla de frecuencia para datos agrupados (con
intervalos), realizamos lo siguientes pasos:
Paso 1: Hallamos el rango: R = 27 – 10 = 17.
Paso 2: Hallamos el número de clases (usamos la regla de Sturges).
K = 1 + 3,3 log 25 = 1 + 3,3 (1,40) = 5,62  redondeamos K = 6
Paso 3: Hallamos el ancho de clase común.
W = r = 17 = 2,83 redondeamos W = 3
k 6

Paso 4: Elaboramos la tabla de frecuencia.

Tabla: Distribución de número de horas semanales de uso de Internet


K Intervalos X’ fi Fi hi Hi
1 [10,13〉 11,5 2 2 0,08 0,08
2 [13,16〉 14,5 2 4 0,08 0,16

3 [16,19〉 17,5 3 7 0,12 0,28

4 [19,22〉 20,5 6 13 0,24 0,52

5 [22,25〉 23,5 5 18 0,20 0,72

6 [25,28〉 26,5 7 25 0,28 1,00


25 1,00
Fuente: Adaptado de Fernández (2005)

27
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Interpretación:
• f2 = 2; es decir, 2 estudiantes usan Internet entre 13 y 16 horas, inclusive 13.
• F4 = 13; es decir, 13 estudiantes usan Internet menos de 22 horas.
• h5 = 0,20; es decir, el 20% de los estudiantes usan Internet entre 22 y 25 horas, inclusive
22.
• H3 = 0,28; es decir, el 28% de los estudiantes usan Internet menos de 19 horas.

1.9. Gráficos estadísticos


Aunque una tabla estadística encierra la información disponible sobre el carácter en estu-
dio, es necesario graficarla para realizar una síntesis visual.
Un gráfico es la expresión arbitraria de datos reales, los cuales permiten visualizar, al gol-
pe de vista, hechos, cantidades y comportamientos de las variables. Moya (2010) señala
que el gráfico tiene mayor ventaja sobre el cuadro ya que permite apreciar rápidamente
los datos y abarcar todo su conjunto. No obstante, posee limitaciones pues no puede
presentar tantos grupos de datos como una tabla y muchas veces se hace uso de valores
aproximados.
Al igual que las tablas de frecuencia, los gráficos estadísticos deben estar compuestos
de lo siguiente:
• El título, es una descripción resumida referida al contenido del gráfico; debe indicar
claramente la naturaleza del fenómeno representado.
• El cuerpo, es el gráfico en sí que representa la información referida en el título.
• La leyenda, es la información complementaria del gráfico. En algunos casos es
opcional, dependiendo de la determinación del investigador.
• La fuente, indica el origen de los datos que están representados en el gráfico (solo
cuando la información ha sido proporcionada por alguna persona o institución).
A continuación, mostramos un gráfico que ilustre las partes de un gráfico estadístico.

28
Estadística aplicada a la Educación

Gráfico: Partes de un gráfico estadístico

1.9.1. Principales tipos de gráficas


[Link]. Para datos correspondientes a variables cualitativas
La representación gráfica de este tipo de datos está basada en la proporcionalidad de las
áreas a las frecuencias absolutas o relativas. Así tenemos:
• Diagrama de sectores
Se le llama también gráfico de pastel y es bastante útil para representar proporciones o
porcentajes. Esta representación gráfica consiste en dividir un círculo en tantos sectores
circulares como modalidades presente el carácter cualitativo, asignando un ángulo cen-
tral a cada sector circular proporcional a la frecuencia absoluta (fi), consiguiendo de esta
manera un sector con área proporcional también a fi.
Su uso más frecuente es con fines comparativos, cuando se quiere mostrar los diversos
componentes de una serie de valores de la variable comparados con el total.
Veamos mediante un ejemplo cómo elaborar un diagrama de sectores.
Ejemplo: se sometió a una encuesta a un grupo estudiantes del 2.º grado de educación
secundaria de la I.E. 2023 acerca de sus preferencias musicales, en la cual se obtuvieron
los siguientes datos:
Solución:
1. Para ello, calculamos la amplitud de cada sector; es decir dividimos 360°/ 40 = 9°.
2. Luego, multiplicamos la amplitud de cada sector por la fi.

29
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Tipos de música Número de casos Ángulo (grados) %


Reggaeton 26 9°(26) = 234° 65
Rock 3 9°(3) = 27° 7
Salsa 10 9°(10) = 90° 25
Baladas 1 9°(1) = 9° 3
Total 40
3. Su representación en un diagrama de sectores será:

1.9.2. Para datos sin agrupar correspondientes a variables cualitativo y/o


cuantitativas discretas
Estudiaremos dos tipos de representaciones gráficas correspondientes a distribuciones
de frecuencias de variables cualitativas y/o cuantitativas discretas.
• Diagramas de barras
Un diagrama de barras está formado por barras de altura proporcional a la frecuencia de cada
valor y se representan en el eje de coordenadas (X) las modalidades, y en abscisas (Y) las
frecuencias absolutas o relativas. Se utiliza con datos cualitativos o cuantitativos discretos.
Moya (2010) nos da algunas recomendaciones para su construcción.
• Todas las barras deben ser del mismo grosor.
• El espacio entre las barras debe ser de la misma magnitud.
• La escala de la frecuencia debe empezar de cero.
• No se deben recargar las barras tratando de expresar muchos productos en cada una
de ellas.

30
Estadística aplicada a la Educación

• Si el gráfico tiene muchas barras es preferible hacer uso de un diagrama lineal.


Ejemplo: un estudio hecho a 20 alumnos de una clase con el objetivo de determinar su
grupo sanguíneo ha dado el siguiente resultado:

Total

• Polígonos de frecuencia
Un polígono de frecuencia o lineal es una representación que se realiza uniendo con una
línea poligonal los extremos superiores de las barras en un diagrama de barras. Se utiliza
con datos cualitativos y cuantitativos discretos.
Ejemplo: un estudio hecho a un conjunto de estudiantes sobre el número de libros que
leen mensualmente arrojó lo siguiente:

31
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

[Link] datos agrupados en intervalos correspondientes a un carácter


cuantitativo
• Histograma
El histograma se utiliza para representar una tabla de frecuencias de intervalos de clase,
donde se muestra una representación por áreas en el cual hay que distinguir si los inter-
valos en los que aparecen agrupados los datos son o no de igual amplitud.
El gráfico consiste en un conjunto de rectángulos adyacentes cuya base representa un in-
tervalo de clase y cuya altura representa la frecuencia del intervalo. El área que hay bajo
el histograma entre dos puntos cualesquiera indica la cantidad (porcentaje o frecuencia)
de individuos en el intervalo.
Pueden construirse para distribuciones de frecuencias de datos no agrupados (sin inter-
valos) y para datos agrupados (con intervalos).
Ejemplo: hemos medido la estatura en centímetros a un grupo de 30 personas, y hemos
obtenido los siguientes resultados:

160 – 163 – 165 – 164 – 162 – 168 – 175 – 167 – 159 – 160
161 – 164 –167 – 168 – 154 – 163 – 164 – 167 – 164 – 165
166 – 168 – 165 – 167 – 169 – 164 – 150 – 166 – 147 – 170
Solución:
Por una parte, la variable que estamos estudiando es continua (la estatura). Además,
entre los datos que tenemos hay una gran variedad. Por tanto, debemos agrupar los
datos en intervalos.

32
Estadística aplicada a la Educación

Ejercicios resueltos

1. Identifica en cada uno de los siguientes casos los conceptos estadísticos: población,
muestra, unidad estadística, variable, tipo de variable y la escala de medición:

Caso N.º 1
Un equipo de especialistas en temas educativos realiza una inves-
tigación sobre el grado de desnutrición de los estudiantes de la I.E.
José María Arguedas del distrito de Comas. Para realizar el estudio
elige al azar 33 estudiantes para determinar si el grado de desnutri-
ción influye en su desarrollo académico.
Solución:
Leemos detenidamente el enunciado y extraemos los conceptos estadísticos.
Estudiantes de la I.E. José María Arguedas del
Población
distrito de Comas
Muestra 33 estudiantes
Unidad estadística Cada estudiante
Variable Grado de desnutrición
Tipo de variable Cualitativa
Escala de medición Ordinal

Caso Nº. 2
Se necesita tener cierta información para abastecer la demanda
educativa en la I.E. Miguel Grau ubicada en la provincia de Cora
Cora, departamento de Ayacucho. Para ello se realiza un estudio
sobre el número de hermanos menores de 24 estudiantes de la I.E.
Miguel Grau.
Solución:
Leemos detenidamente el enunciado y extraemos los conceptos estadísticos.
Población Estudiantes de la I.E. Miguel Grau.
Muestra 24 estudiantes
Unidad estadística Cada estudiante
Variable Número de hermanos menores
Tipo de variable Cuantitativa discreta
Escala de medición De razón

33
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

2. El Programa de Lenguas Extranjeras desea implementar la biblioteca con libros ac-


tuales y especializados, para ello realiza una encuesta a 50 alumnos del PROLEX
sobre el número de libros leídos durante el mes de enero del 2012.
Los datos obtenidos son los siguientes:

2 1 4 1 2 0 2 3 2 1
4 2 3 3 2 1 0 4 2 4
1 2 0 1 1 2 4 2 1 2
2 3 2 1 3 1 1 2 0 3
0 2 1 2 2 0 1 3 2 1

a) Elabora una tabla de frecuencias.


b) Interpreta f3, F2, h4 y H3.
c) Representa gráficamente los datos obtenidos.
Solución:
a) Realizamos el conteo de los datos y completamos la tabla. Tenemos que indicar que
en la mayoría de los casos trabajaremos con las frecuencias relativas porcentuales:
xi fi Fi hi (%) Hi (%)
0 6 6 12% 12%
1 14 20 28% 40%
2 18 38 36% 76%
3 7 45 14% 90%
4 5 50 10% 100%
Total n=50 100%

b) Interpretamos:
f3 : 18 alumnos del PROLEX han leído dos libros durante el mes de enero del 2012.
F2 : 20 alumnos del PROLEX han leído a lo más un libro durante el mes de enero del
2012.
h4: El 14% de los alumnos del PROLEX han leído tres libros durante el mes de enero
del 2012.
H3 : El 76% de los alumnos del PROLEX han leído a lo más dos libros durante el mes
de enero del 2012.
c) Elaboramos el gráfico respectivo con los datos obtenidos.

34
Estadística aplicada a la Educación

3. Se ha medido la estatura, en centímetros, de 40 alumnos del [Link] año de secundaria


de la I. E. Alfonso Ugarte de la UGEL 3, para escoger al batallón que representará al
colegio en el desfile escolar.
Los datos obtenidos se muestran a continuación:

162 156 161 160 156 167 162 164

174 161 177 155 159 171 163 162

163 179 162 173 156 161 158 160

178 169 173 157 182 174 176 155

169 165 158 159 170 160 171 166

a) Elabora una tabla de frecuencias con intervalos.


b) Interpreta f4, F2, h6 y H3.
c) Representa gráficamente los datos obtenidos.
Solución:
a) Para elaborar nuestra tabla de frecuencias con intervalos seguiremos el siguiente or-
den:

35
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

• Determinación del rango (R)


Es la diferencia entre el valor máximo y el valor mínimo.
R = Xmáx - Xmín
En nuestro ejemplo:
R = 182 – 155
R = 27
• Número de intervalos (K)
Consiste en dividir el rango en un número conveniente de intervalos de clase, por lo
general del mismo tamaño. Existen varias formas para calcular el número de intervalos,
nosotros usaremos la fórmula de Sturges:
K = 1 + 3,3log(n)
En nuestro ejemplo:
K = 1 + 3.3log(40)
K = 6,28 ≈ 7

• Amplitud del intervalo (C)


Es conveniente que los intervalos de clase tengan el mismo tamaño.

C= R
K
En nuestro ejemplo:

C = 27 = 3,85≈4
7

• Determinación de los límites de clases


Se recomienda que el límite inferior del intervalo de la primera clase sea el menor de
los datos, después se agrega el valor de la amplitud C para obtener el límite superior de
dicha clase.
En nuestro ejemplo, el intervalo semiabierto de la primera clase es [155 – 159〉.
• Marca de clase X′
Es el punto medio del intervalo de clase.

36
Estadística aplicada a la Educación

En nuestro ejemplo:

Ahora sí podemos elaborar nuestra tabla:

[Li – Ls 〉 X′ fi Fi hi (%) Hi (%)


[155 – 159 〉 157 8 8 20% 20%
[159 – 163 〉 161 12 20 30% 50%
[163 – 167 〉 165 5 25 12.5% 62.5%
[167 – 171 〉 169 4 29 10% 72.5%
[171 – 175 〉 173 6 35 15% 87,5%
[175 – 179 〉 177 3 38 7.5% 95.5%
[179 – 183 〉 181 2 40 5% 100%
Total n = 40 100%

b) Interpretamos:
f4: 4 alumnos del [Link] año de secundaria de la I. E. Alfonso Ugarte miden entre 167 cm
y 171 cm, incluso 167 cm.
F2: 20 alumnos del [Link] año de secundaria de la I. E. Alfonso Ugarte miden menos de
163 cm.
h6: El 7,5% de los alumnos del [Link] año de secundaria de la I. E. Alfonso Ugarte miden
entre 175 cm y 179 cm, incluso 175 cm.
H3: El 62.5% de los alumnos del [Link] año de secundaria de la I. E. Alfonso Ugarte
miden menos de 167 cm.

c) Elaboramos el gráfico respectivo con los datos obtenidos.

37
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

155 159 163 167 171 175 179 183

4) La siguiente tabla corresponde al número de palabras en inglés que aprenden a la


semana las alumnas del [Link] de secundaria de la I. E. Teresa Gonzales de Fanning.

Número de palabras fi
6 5
7 11
9 6
10 4
12 3
13 1
Total n=30
a) Completa la tabla de frecuencias
b) Interpreta: f5, h6, F3, H2
c) Elabora un gráfico de barras
Solución:
a) Completamos la tabla:

38
Estadística aplicada a la Educación

Número de palabras fi Fi hi (%) Hi (%)

6 5 5 16,67% 16,67%

7 11 16 36,67% 53,33%

9 6 22 20% 73,33%

10 4 26 13,33% 86,67%

12 3 29 10% 96,67%

13 1 30 3,33% 100%

Total n=30 100%

Nota: Los valores de las frecuencias relativas hi y Hi las presentamos en términos


porcentuales, para lo cual hemos multiplicado cada valor por cien.
b) Interpretamos de acuerdo a la tabla de frecuencias:
f5: 3 alumnas del [Link] de secundaria de la I. E. Teresa Gonzales de Fanning aprenden
a la semana 12 palabras en inglés.
H6: El 3,33% de las alumnas del [Link] de secundaria de la I. E. Teresa Gonzales de
Fanning aprenden a la semana 13 palabras en inglés.
F3: 22 alumnas del [Link] secundaria de la I. E. Teresa Gonzales de Fanning aprenden
a la semana a lo más 9 palabras en inglés.
H2: El 53,33% de las alumnas del [Link] de secundaria de la I. E. Teresa Gonzales de
Fanning aprenden a la semana a lo más 7 palabras en inglés.
c) Elaboramos el gráfico de barras respectivo:

39
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

5) El siguiente cuadro nos muestra a los alumnos del IV ciclo del Programa de Licencia-
tura en Lenguas Extranjeras, según el estado civil.

Estado civil fi
Solteros 128
Casados 26
Divorciados 19
Viudos 4
Convivientes 13

a) Elabore la tabla de frecuencias respectiva.


b) Elabore un gráfico de sectores.
Solución:
a) Completamos la frecuencia relativa porcentual ya que se trata de una variable cualita-
tiva o categórica.

40
Estadística aplicada a la Educación

Estado civil fi hi (%)


Solteros 128 60,95%
Casados 26 12,38%
Divorciados 19 9,05%
Viudos 4 1,90%
Convivientes 33 15,71%
Total 210

b) Para elaborar nuestro gráfico de sectores necesitamos los ángulos correspondientes,


para lo cual multiplicamos 360°, correspondiente al total de la medida angular de la cir-
cunferencia, por el porcentaje correspondiente dividido entre 100.

Estado civil fi hi (%) operación ángulo


Solteros 128 60,95% (360°x60,95) ÷100 219,42°
Casados 26 12,38% (360°x12,38) ÷100 44,57°
Divorciados 19 9,05% (360°x9,05) ÷100 32,58°
Viudos 4 1,90% (360°x1,90) ÷100 6,84°
convivientes 33 15,7% (360°x15,71) ÷100 56,56°

Total 210

41
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Ejercicios propuestos

1. En los siguientes enunciados, indicar si se trata de una muestra (M) o una población
(P), colocando un aspa:

Enunciado P M

a) Número de enfermos con diabetes, observados durante un año


en la Clínica San Marcos.

b) Número de estudiantes egresados de una institución educativa


en el año 2011.

c) Estudio del 42% de estudiantes egresados de una institución


educativa en el año 2011.

d) Número de personas con proceso judicial por pensión de ali-


mentos en el año 2011.

e) Análisis de precios de productos de primera necesidad en 10


mercados de Lima Metropolitana.

f) Estudio de los precios de todos los productos farmacéuticos


importados por el Perú en el año 2011.

g) Se aplica una encuesta a 90 profesores de secundaria de la


UGEL 5 para averiguar la especialidad a la que pertenecen.

h) Se desea conocer la estatura promedio de los alumnos de la


Institución Educativa Melitón Carvajal, para ello se seleccio-
nan 200 alumnos.

i) En la UGEL 1 de 1350 docentes, se selecciona un grupo repre-


sentativo de 300 para conocer su estado civil.

j) Se realiza una encuesta en un distrito a 150 familias para ave-


riguar el número de habitaciones que tienen sus respectivas
viviendas.

42
Estadística aplicada a la Educación

2) Completa el tipo de variable y la escala o nivel de medición de las siguientes variables.

CLASIFICACIÓN DE ESCALA O NIVEL


VARIABLE
LA VARIABLE DE MEDICIÓN

Número de niños nacidos durante el día


en el Hospital Maternidad de Lima.

Edad en años cumplidos de los profesores


del PROLEX.

Nivel de instrucción de los profesores.

Número de menores abandonados en los


hospitales durante el año 2011.

Tipo de diabetes.

Ingreso per cápita.

Horas de prácticas profesionales.

Categoría docente.

Número de hogares con servicio eléctrico


en Jicamarca.

Lugar de nacimiento de los alumnos del


PROLEX.

Grado de desnutrición.

Número de hermanos menores.

Profesiones de los socios del club Los


Toribianitos.

Notas obtenidas en el curso de Estadística

Número de asignaturas aprobadas en un


año de estudios.

43
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

3) A continuación lee los siguientes casos y completa las tablas con la información co-
rrecta.

Caso N.º 1
Se realizó una encuesta telefónica a 142 estudiantes del Programa
de Lenguas Extranjeras de las UNMSM con la finalidad de conocer
el grado de satisfacción de los servicios académicos ofrecidos por
el Programa, se consideraron las siguientes categorías: Mala, Bue-
na, Muy buena, Excelente.
Solución:
Población
Muestra
Unidad estadística
Variable
Tipo de variable
Escala de medición

Caso N.º 2
En el distrito de Jesús María se desea conocer las preferencias de
sus vecinos por las razas caninas, por tal motivo se realiza una en-
cuesta con la pregunta ¿si tuviera la oportunidad de obtener un can
como mascota de qué raza le gustaría que fuera? Se aplica dicha
encuesta a 128 vecinos al azar.

Solución:
Población
Muestra
Unidad estadística
Variable
Tipo de variable
Escala de medición

44
Estadística aplicada a la Educación

Caso N.º 3
Un postor desea concursar en una licitación pública para cubrir la
administración del kiosco de ventas de golosinas de la I. E. Merce-
des Indacochea de Barranco, para ello decide realizar una encues-
ta entre un grupo de 86 alumnas de diferentes turnos para conocer
la cantidad de dinero que gastan a la semana en golosinas.

Solución:
Población
Muestra
Unidad estadística
Variable
Tipo de variable
Escala de medición

4) Se ha preguntado a 45 alumnos del segundo año de secundaria de la I. E. Bartolomé


Herrera la edad (en años) que tienen, y se han obtenido los siguientes datos:

12, 13, 12, 14, 13, 15, 13, 12, 14, 15, 13, 12, 14, 15, 13, 12, 14, 15,
13, 14, 15, 12, 16, 12, 14, 15, 13, 15, 13, 15, 14, 15, 13, 14, 15, 15,
13, 14, 15, 13, 13, 13, 13, 16, 14.

a) Elabora una tabla de frecuencias.


b) Elabora el gráfico correspondiente.
5) La profesora Carmen Díaz del curso de Inglés ha realizado una encuesta a los 52 alum-
nos del 1.º de secundaria de la I. E. Pedro Ruiz Gallo de Trujillo, sobre la estación del
año en la que han nacido para poder festejar sus cumpleaños al inicio de cada estación.
Para el recuento, le asignamos letras a cada categoría: Primavera = P, Verano = V,
Otoño = O e Invierno = I, obteniéndose los siguientes resultados.
P, I, V, I, O, P, V, O, V, O, I, V, I, O, P, V, O, V, O, I, V, P, P, I, I, O, I, P, P, V, V, O, O,
I, P, P, V, V, O, I, P, V, O, I, I, P, V, O, V, O, I, P
a) Construye una tabla de frecuencias.
b) Elabora el gráfico respectivo.

45
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Autoevaluación de la unidad 1

CASO 1: Se hizo un estudio descriptivo, con una muestra de 300 estudiantes de Educa-
ción, de la especialidad idioma Inglés, de la Universidad Nacional Mayor de San Marcos
matriculados en el presente semestre académico, para determinar la relación existente
entre la motivación interna y el rendimiento académico. La recolección de los datos se
hizo a través de un cuestionario elaborado por el equipo de investigadores para averiguar
las actitudes motivacionales más comunes hacia el aprendizaje del inglés y las caracte-
rísticas demográficas de la muestra. Por ejemplo, se recolectaron datos de las siguientes
variables:

Variable Categorías/Niveles o valores

Sexo Masculino, Femenino

Estrato socioeconómico Muy Alto, Alto, Medio, Bajo, Muy Bajo


Edad (años cumplido) De 18 a 30 años
Tiempo de permanencia en la
Más de un año
universidad (en años)
Marcar la alternativa correcta para cada ítem:
1. La población está conformada por:
a) 300 estudiantes de Educación de la especialidad de idioma Inglés, de la Universidad
Nacional Mayor de San Marcos matriculados en el presente semestre académico.
b) Estudiantes de Educación de la especialidad de idioma Inglés, de la Universidad Na-
cional Mayor de San Marcos matriculados en el presente semestre académico.
c) 300 estudiantes de Educación de la Universidad Nacional Mayor de San Marcos ma-
triculados en el presente semestre académico.
d) Estudiantes de la Universidad Nacional Mayor de San Marcos matriculados en el pre-
sente semestre académico.
2. La unidad estadística es:
a) Un alumno de la EAP de Educación, especialidad idioma Inglés.
b) Un alumno de la Universidad Nacional Mayor de San Marcos.
c) Un alumno de la EAP de Educación, especialidad idioma Inglés, de la Universidad
Nacional Mayor de San Marcos matriculado en el presente semestre académico.
d) Un alumno de la Facultad de Educación de la Universidad Nacional Mayor de San
Marcos.

46
Estadística aplicada a la Educación

3. La variable Edad (años cumplidos) está medida bajo escala:


a) Nominal b) Ordinal c) Intervalar d) De razón
4. La variable Estrato socioeconómico es de tipo:
a) Cuantitativa discreta b) Categórica c) Cuantitativa continua d) Nominal
5. La variable sexo está medida bajo la escala:
a) Nominal b) Ordinal c) Intervalar d) De razón

CASO 2: En la colonia austro-alemana de Pozuzo se han recolectado los datos corres-


pondientes a la estatura, expresados en metros, de 80 alumnos de la I. E. Alexander Von
Humboldt, siendo los resultados:
1,67 1,72 1,81 1,72 1,74 1,83 1,84 1,88 1,92 1,75
1,84 1,86 1,73 1,84 1,87 1,83 1,81 1,77 1,73 1,75
1,78 1,77 1,67 1,83 1,83 1,72 1,71 1,85 1,84 1,93
1,82 1,69 1,70 1,81 1,66 1,76 1,75 1,80 1,79 1,84
1,86 1,80 1,77 1,80 1,76 1,88 1,75 1,79 1,87 1,79
1,77 1,67 1,74 1,75 1,78 1,77 1,74 1,73 1,83 1,76
1,83 1,77 1,75 1,77 1,77 1,84 1,83 1,79 1,82 1,76
1,76 1,76 1,79 1,88 1,66 1,80 1,72 1,75 1,79 1,77

Elabora una tabla de frecuencias con 6 intervalos de amplitud igual a 5 y responde las
siguientes preguntas:
6. ¿Cuántos alumnos miden menos de 1.85 m?
a) 20 b) 22 c) 70 d) 78
7. ¿Cuál es la frecuencia absoluta de los alumnos que miden entre 1.75 m y 1.80 m
incluso 1.75 m?
a) 30 b) 48 c) 8 d) 78
8. ¿Cuál es la frecuencia relativa acumulada de los alumnos cuya estatura es menor de
1.80 m?
a) 15% b) 87.5% c) 37.5% d) 60%

47
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

CASO 3: El siguiente gráfico nos muestra la variación del precio de un televisor observa-
do durante seis meses en la tienda de artefactos “El Huequito”.

9. ¿En qué período mensual el aumento en el precio fue mayor?


a) mayo - junio b) junio - julio c) julio - agosto d) agosto - setiembre
10. ¿Cuál fue el precio promedio en el período mayo-agosto?
a) 400 b) 420 c) 1600 d) 800

48
Estadística aplicada a la Educación

LECTURA N.º 1

La estadística, una ciencia en la controversia


Osvaldo Ferreiro P.
Pedro Fernández de la R.
Revista Universitaria N.º 25,1988.
En nuestros días se habla mucho de la estadística, de sus usos y abusos. Por ello y porque no
siempre se conoce su significado real es que ha surgido la idea de hacerle frente a este tema.
Los autores nos entregan además de una reseña histórica, conceptos sobre la estadística como
ciencia y la controversia que se deriva de que su aplicación siempre esté referida a fenómenos
reales sobre los que todos tenemos percepciones distintas.
Pedro Fernández de la Reguera es doctor en Estadística por la Uni-
versidad de Oxford (1983) y profesor del Departamento de Probabi-
lidad y Estadística de la Universidad Católica. Previamente fue pro-
fesor y pro-decano de la Facultad de Ciencias Físico-Matemáticas
de la Universidad Austral. Osvaldo Ferreiro se tituló de Ingeniero
Matemático de la Universidad de Chile (1976) y PhD. en estadística
en la Universidad de Wisconsin (1985). Es director del Departamen-
to de Probabilidad y Estadística de la Facultad de Matemática y
presidente de la Sociedad Chilena de Estadística.
E. F. Schumacher, en su libro Small is
Beautiful, presenta el campo de la estadística en forma ingeniosa, di-
ciendo: Cuando Dios creó el mundo y la gente —una empresa que,
de acuerdo a la ciencia moderna, tomó un largo tiempo— razonó así:
“Si hago todo anticipable, los seres humanos, a quienes he dotado de
buenos cerebros, aprenderán a predecir todo y no tendrán motivos para
trabajar, pues se darán cuenta que el futuro está totalmente predetermi-
nado y que no puede ser influido por acciones humanas. Por el contrario,
si hago todo impredecible, descubrirán gradualmente que no hay bases
racionales para las decisiones y, como en el primer caso, no tendrán
motivos para trabajar. Ninguno de los dos esquemas tiene sentido. Debo
crear una mezcla de ambos. Sean algunas cosas predecibles y otras impredecibles. Ellos tendrán
así, entre otras muchas cosas, la tarea de descubrir cuál es cuál”.
La estadística nos permite, pues, explicar las condiciones regulares en
los fenómenos de tipo aleatorio, que componen buena parte de nuestro
mundo.
Algunos de los “padres” de la
estadística:
1. R. A. Fisher (1890-1962)
2. Karl Pearson (1857-1936)
3. Jerzy Neyman (1894-1981)

49
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Algo de historia
En reuniones sociales una persona puede decir que es médico y los concurrentes empiezan con
dolores y tratan de obtener una consulta gratuita. Si dice que es matemático, ¡Ah!, ¿por qué estu-
diaste algo tan difícil?, y lo miran con esa mezcla de admiración, horror y respeto con que se mira
a un brujo tribal. Si dice que es estadístico, sigue a sus palabras un silencio profundo. El motivo de
este silencio puede deberse a muchas razones: ignorancia, IPC u otras.
El quehacer estadístico es muy antiguo. Parece iniciarse con la invención del dado, hace 7.000
años aproximadamente. Antes fueron astrágalos, pequeños huesitos del talón de animales, con
los cuales aún nuestros abuelos jugaron. Se usaban como elementos de juego, adivinaciones,
comunicaciones con dioses o quizás como dinero.
Estos huesitos no son simétricos como los dados y se pensó que los distintos resultados posibles
eran controlados por los dioses. Así, Cicerón plantea esta idea cuando pone en boca de Quintus
las frases: “... ¿Dices que son fortuitas? ¡Vamos!, ¿realmente piensas eso?... Cuando los cuatro
(dados) producen un Venus puedes hablar de accidente, pero si Venus aparece 100 veces en 100
lanzamientos, ¿llamarías a eso accidental? ...”.
Problemas de notación matemática (no resueltos hasta el 1500), problemas religiosos y muchas
otras especulaciones impidieron el desarrollo de las probabilidades hasta que Cardano (1525)
publicara su Liber de Ludo Aleae. Fue el primer tratado famoso, pues había otros anteriores en el
tema, luego de miles de años de juegos de azar.
El adjetivo statisticus se puso en boga en el siglo XVII. Posiblemente se originó del italiano statista,
para referirse a la persona ocupada con los asuntos del Estado (ragione di Stato). Así surgió una
disciplina híbrida, la del Estado, aglomeración de historias constitucionales, algo de economía
política y descripción de las constituciones de los países. Fue Gotfried A. Achenwall, en 1752, el
que usó la palabra estadística para esta rama del conocimiento. Fundó la Escuela de Göttingen,
y es conocido por los alemanes como el padre de la estadística, reconocimiento que Achenwall
atribuye a Hermann Conrig (1606-1681).
En Londres existía la Escuela de Aritmética-Política, que hacía estudios demográficos, actuariales
y llevaba datos oficiales. Ya sea por su nombre u otro motivo, no era muy cotizada. Un día, sir John
Sinclair, un escocés, robó a los germanos las palabras
“estadísticas” y “estadística”, robo que reconoce públi-
camente por escrito, por ser palabras que “pegaban”.
Resultando un escándalo y los aritmético-políticos sal-
taron al primer plano internacional. Las agrias discusio-
nes y duros ataques entre Londres y Göttingen termina-
ron con la Escuela de Göttingen. Esta se disolvió, y así
surgió la estadística como disciplina aceptada. Luego,
Galton daría las directrices para que pasar a ser una
ciencia.
Abraham de Moivre (1667-1754), francés de nacimien-
to, expulsado de Francia por protestante, apátrida, radi-
cado en Inglaterra, premio de la Academia de Ciencias
de París (como “extranjero”), sentó las bases de la es-

50
Estadística aplicada a la Educación

tadística demográfica, del Estado y otras que más tarde pondrían a Francia a la cabeza del tema y
cuya herencia la tenemos en los modernos institutos nacionales de estadística existentes en todos
los países. En particular, el INE chileno lleva estadísticas sociales; demográficas; de seguridad
social, justicia y policía; económicas (Cuenta Nacional, agrícolas, pecuarias, manufactureras, ser-
vicios esenciales, transporte, turismo, gasto social, etc.), además de la contaminación ambiental,
energía, incendios forestales, meteorológicas y, por supuesto, el IPC.
La revolución industrial trae las estadísticas del caso a fin de controlar la calidad de la producción,
y, más tarde, la planificación de experimentos para obtener productos nuevos, mejores y más
baratos.
Investigadores como Karl y Egon Pearson, Gossett, Neyman y, especialmente, Ronald Fisher
colaboran notablemente al desarrollo de la estadística. Este último, un destacado científico, incur-
siona en campos como la genética, la biología y la agronomía, siendo considerado por muchos
el padre de la estadística moderna. Los aspectos científicos siguen el trabajo aparecido en 1933,
en alemán, del ruso A. N. Kolmogorov, considerando el punto de vista probabilístico y matemático
para el desarrollo de métodos nuevos y más confiables.
Además de la probabilidad, un aspecto de la mayor importancia es la muestra. Cuando se desea
obtener datos, considerar una población completa es complicado, caro e impreciso. La muestra
es preferible, siempre que se la tome con los confiables métodos estadísticos. Cuando la muestra
se ha extraído adecuadamente y los datos son suficientemente precisos, la teoría estadística nos
permite, por ejemplo, estimar la proporción de la población que tiene una determinada caracterís-
tica y juzgar qué tan confiable es esta estimación.
Los estadísticos profesionales trabajan, por lo común, en equipos mixtos. Lo hacen en investiga-
ción científica estadística, biología, negocios, demografía, economía, educación, ingeniería, salud,
seguros, investigaciones de mercado y del consumidor, medicina, operaciones y administración,
sicología, sicometría, ciencias espaciales y muchas otras. La mayoría de las personas procuran
planificar para el futuro y necesitan de los estadísticos. La estadística pretende descubrir las ca-
racterísticas esenciales del pasado y, apoyándose en ellas, predecir el futuro.
La estadística como disciplina científica
Desde un primer punto de vista, la estadística es una ciencia que tiene un desarrollo por sí misma.
Como toda ciencia ha desarrollado teorías, teniendo gran cantidad de investigación en líneas pro-
pias. Está en pleno progreso siendo frecuente la creación de nuevas metodologías.
Son numerosas las revistas internacionales que constituyen un importante canal de comunicación
entre los estadísticos. La revista de la «Sociedad Chilena de Estadística» cumple dicho papel en
nuestro país.
Por otro lado, el campo de sus aplicaciones es tan amplio que existe una tendencia a incluirla
parcialmente dentro de otras disciplinas. Además, las diferentes definiciones de ella la ponen en
contextos desde el propio al utilitario, pasando por el matemático y social: para el mencionado Karl
Pearson trata de las aplicaciones de la teoría matemática a la interpretación de observaciones
masivas; Jerzy Neyman la incluye dentro del cálculo de probabilidades; Harald Cramér dice que in-
vestiga la posibilidad de extraer de datos estadísticos inferencias válidas elaborando los métodos

51
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

mediante los cuales se pueden obtener dichas inferencias. El ejemplo final es de Alexander Mood,
para quien la estadística no es otra cosa que la tecnología del método científico.
Las discusiones sobre lo que realmente es la estadística son actuales, incluso en su taxonomía:
¿Qué clase de ciencia es esta? La UNESCO la clasifica dentro de las ciencias sociales pero FON-
DECYT la incluye dentro de la matemática y a esta en las ciencias exactas y naturales.
Como sea, estamos hablando de la ciencia de
la recolección y análisis de datos para la toma
de decisiones. Transforma datos en informa-
ción. En su método comienza presentando
técnicas de diseño y recolección de datos
respecto a un fenómeno. Luego, mediante la
estadística descriptiva se resume lo medular
de la información. La inferencia estadística
extiende las conclusiones obtenidas de la
muestra a la población de la que ella es parte,
además de postular modelos que se ajusten
a los datos. Entre estas técnicas de modela-
miento se puede mencionar la regresión lineal
y no-lineal, modelos para series de tiempo,
modelos para variables categóricas.
La estadística está muy relacionada con el método científico. Apoya la investigación en todas las
otras disciplinas, especialmente en la recolección y el análisis de datos para verificar o formular
nuevas hipótesis. A su vez, los procesos comerciales, administrativos y tecnológicos necesitan
estos métodos para tomar decisiones y hacer predicciones de valores futuros. Obtener indicacio-
nes y conclusiones con rigurosidad, pasando por un proceso de establecimiento y verificación de
hipótesis, trabajando en base a modelos (expresiones matemáticas) que potencialmente siguen
las variables en estudio y que se comprueban utilizando los datos recogidos, es el quid del asunto.
Usos y abusos
Veamos algunos ejemplos de aplicaciones estadísticas en otras áreas. En medicina permite de-
terminar el mejor efecto de una droga nueva probada en una muestra de pacientes. En sicología
ayuda a la calibración de tests, en geografía colabora en la confección de mapas y estudios de
migraciones, en la educación permite formular modelos de respuesta en ítems, a fin de estudiar
efectos demográficos y evaluar pruebas con respecto a su discriminación. En letras, tiene su
aporte en estudios sociolingüísticos. Los economistas conocen bien la aplicación de la estadística
en econometría, determinando parámetros de modelos económicos y evaluando su adecuación
a la realidad. Los agrónomos, los ingenieros forestales, los biólogos, además de los médicos,
hacen uso de la biometría. La ingeniería tiene un uso cada vez mayor de ella, en especial con la
cada vez más importante área de la estadística conocida como mejoramiento de la calidad y de
la productividad.
Uno de los usos más conocidos de la estadística se observa en la realización de encuestas de
investigación de mercados de preferencias de consumo, de opiniones políticas, etc. Una encuesta

52
Estadística aplicada a la Educación

pretende reflejar, mediante entrevistas a un grupo de personas, las opiniones y/o preferencias de
toda una población.
La muestra debe escogerse al azar, y de acuerdo a criterios muy precisos predeterminados que
dependen del tipo de población y de los objetivos del estudio. Al basarse en una muestra, los
resultados tendrán cierto grado de incerteza que debe ser evaluado. De allí la necesidad de me-
dir el error de las estimaciones. Un adecuado esquema de muestreo y la construcción correcta
de sus detalles técnicos (el diseño de la muestra)
es crucial para la validez de los resultados. Las
preguntas del cuestionario deben ser elegidas y
redactadas cuidadosamente de modo que apunten
al objetivo de la investigación, sean comprendidas
adecuadamente por el encuestado y carezcan de
frases u otros distractores que sesguen la respues-
ta que se va a obtener.
El trabajo de terreno, la toma de la encuesta es
usualmente difícil, particularmente en el acceso
real a las personas que resultaron seleccionadas.
El análisis requiere procedimientos estadísticos, en
particular para evaluar la confiabilidad de las esti-
maciones.
Para ingresar al club de los estadísticos no basta una fuerte vocación. Hay que pasar bien todas
las pruebas de ingreso. Al aplicar estadística hay dos peligros: no saber extraer toda la información
útil existente en los datos y dejar de realizar un modelamiento correcto, lo que conduce a conclu-
siones no avaladas por ellos.
La insuficiente capacitación de expertos en otras materias, para enfrentar problemas estadísticos
complejos, la proliferación de programas computacionales y las crecientes necesidades de tener
los resultados “para ayer”, hacen de la estadística una herramienta fácilmente usable, aun por los
más profanos en la materia. Aquí se inician muchas de las controversias.
El abuso más corriente de la estadística, al menos para el hombre de la calle, está en la presen-
tación de los resultados y en la confiabilidad de las estimaciones. Por motivos llamados técnicos
o de dramatización se distorsionan gráficos, se limitan tablas y se entra, si no con intención, en
prácticas reñidas con cualquier ética estadística.
Por fortuna, este no es siempre el caso. La utilización correcta de técnicas estadísticas es cada
vez más frecuente. El lenguaje estadístico se incorpora crecientemente a nuestra vida diaria. El
público es cada vez más crítico con respecto a los resultados que se le presentan y hay un mayor
interés en hacer mejores aplicaciones. H. G. Wells, autor de The War of the Worlds y The Time
Machine, decía que “el pensamiento estadístico será algún día tan necesario para el buen ciuda-
dano como la habilidad para leer y escribir”.

53
Unidad 2

Medidas de Tendencia Central,


Dispersión y Forma

Capacidades a desarrollar
¾¾ Calcular e interpretar las medidas de tendencia
central.

¾¾ Calcular e interpretar las medidas de dispersión.

¾¾ Calcular e interpretar las medidas de forma.


Estadística aplicada a la Educación

Introducción
En la anterior unidad hemos visto la utilidad de las tablas de distribución de frecuencia y
los gráficos estadísticos, los cuales nos facilitan el procesamiento e interpretación de los
datos. Sin embargo, para el análisis de datos es necesario hacer uso de técnicas más
precisas y para ello emplearemos las medidas de tendencia central, de dispersión y las
medidas de forma. El cálculo de cada una de estas medidas está definido, usualmente
mediante una fórmula aritmética obtenida a partir de datos de la población.

2.1. Medidas de tendencia central o posición


Las medidas de tendencia central nos indican en torno a qué valor (centro) se distribu-
yen los datos. Las principales medidas de tendencia central son:la media aritmética, la
mediana y la moda.

2.1.1. Media aritmética ( )


Es también conocido como promedio o solamente como media. La media aritmética es
el valor obtenido al sumar todos los datos y dividir el resultado entre el número total de
datos.

Siendo el símbolo de la media aritmética, tenemos:

Donde n es el tamaño de la muestra y x son todos los valores que toma la muestra.
A la media aritmética se la denomina también centro de gravedad de la distribución.

[Link]. Características de la media aritmética


• Es el estadígrafo de posición más importante.
• La media aritmética viene expresada en las mismas unidades que la variable.
• En su cálculo intervienen todos los valores de la distribución.
• Es el centro de gravedad de toda la distribución, representando a todos los valores
observados.
• Es única y su significado es de fácil entendimiento.

57
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

• Su principal inconveniente es que se ve afectada por los valores extremadamente


grandes o pequeños de la distribución.

[Link]. Cálculo de la media aritmética


• Para datos sin agrupar

Ejemplo 1: Los pesos de seis profesores del Programa de Licenciatura de Lenguas Ex-
tranjeras son: 84, 91, 72, 68, 87 y 78 kg. Hallar la media aritmética de los pesos e inter-
pretar.
Solución:

Interpretación: El peso promedio de seis profesores de Lenguas Extranjeras es 80 kg.


Ejemplo 2: Los puntajes obtenidos en 5 exámenes de estadística de una clase son: x1 =
13; x2 = 10; x3 = 14; x4 = 11; x5 = 10. Halla el promedio de notas e interpreta.
Solución:

Interpretación: El puntaje promedio de la clase en el curso de estadística es 11,6 puntos.


• Para datos agrupados sin intervalos

58
Estadística aplicada a la Educación

Ejemplo 1: Los pesos de diez docentes expresados en kg se expresan en la siguiente


tabla. Hallar su media aritmética e interpretar.
xi fi x i fi
54 2 108
59 3 177
63 4 252
64 1 64
10 601

Interpretación: El peso promedio de diez docentes es de 60,1 kg.


• Para datos agrupados con intervalos

Donde:
x’ marca de clase
Si los datos están agrupados en una tabla de frecuencia de variable continua, se trabaja
de la misma forma, pero haciendo uso del valor de la variable y el valor de la marca de
clase.
Ejemplo 1: La siguiente tabla muestra las notas obtenidas en el examen parcial de Esta-
dística de un grupo de estudiantes del segundo ciclo de la Facultad de Educación de la
UNMSM.

[Li – Ls〉 X’ fi X’ fi

00,0 – 03,5 01,75 6 10,50

03,5 – 07,0 05,25 13 68,25

07,0 – 10,5 08,75 14 122,50


10,5 – 14,0 12,25 12 147,00

14,0 – 17,5 15,75 7 110,25

n = 52 SX’fi = 458,50

59
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Solución:
La media aritmética será:

Interpretación: La nota promedio del grupo es de 08,82 puntos.

2.1.2. Mediana (Me)


Es el valor que divide a la distribución en dos partes iguales, es decir, en un 50% inferior
y un 50% superior, cuando estos están ordenados en forma ascendente o descendente.
Sin embargo, se recomienda ordenar los datos en forma ascendente.
La mediana se representa por Me y puede hallarse solo para variables cuantitativas.

[Link]. Características de la mediana


• Como estadígrafo de posición, le sigue en importancia y uso a la media.
• Es fácil de calcular y es única.
• En la mediana solo influyen los valores centrales y es insensible a los valores extremos
u “outliers”.
• En su determinación no intervienen todos los valores de la variable.
• La mediana no necesariamente será un valor de los datos de la lista original.

[Link]. Cálculo de la mediana

• Para datos sin agrupar


Para calcular la mediana para datos sin agrupar, consideramos lo siguiente:
a) Ordenamos los datos de menor a mayor.
b) Cuando n es impar, hay un término central, que será el valor de la mediana; es decir,
la mediana es la puntuación central de la misma.

Si tenemos los valores:2, 3, 4, 4, , 5, 5, 6, 6, entonces la Me= 5


c) Cuando n es par, hay dos términos centrales y la mediana será el prome-
dio de estos dos valores.

60
Estadística aplicada a la Educación

Si tenemos los valores: 7, 8, , 11, 12, entonces la Me= 9.5, la cual es la semisuma
de 9 y 10, los cuales son los valores centrales.
Ejemplo 1: Dado las edades de 7 profesores: 27, 30, 26, 24, 35, 25, 50 años. Halla la
mediana e interpreta.
Solución:
1. Ordenamos los datos en forma ascendente: 24, 25, 26, 27, 30, 35, 50.
2. Ubicamos el valor central: Me = 27.
Interpretación: El 50% inferior de los profesores tiene edades iguales o menores que
27 años y el otro 50% superior tiene edades iguales o mayores a 27 años.
Ejemplo 2: Los siguientes datos corresponden a las calificaciones obtenidas por Peter en
el ciclo 2009-1 del curso de Gramática: 12 – 13 – 08 – 10 – 10 – 14 – 14 – 18 – 11 – 19.
Solución:
1. Ordenamos los datos: 08 – 10 – 10 – 11 – 12 – 13 – 14 – 14 – 18 – 19.
2. Como el número de datos es par, realizamos la semisuma de los valores centrales.

Interpretación: El 50% inferior de las calificaciones obtenidas por Peter en el curso de


Gramática son menores o iguales a 12,5 puntos y el otro 50% superior de las calificacio-
nes son mayores o iguales a 12,5 puntos.

• Para datos agrupados sin intervalos


Si los datos están agrupados en una tabla de frecuencias, se procede de la siguiente
manera.
Ejemplo 1: De la siguiente tabla, donde se muestran las edades de un grupo de estudian-
tes del último ciclo de la Facultad de Educación de la UNMSM.

61
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Xi fi Fi
23 3 3
24 6 9
25 9 18
26 5 23
27 2 25
Total 25
Solución
1. Se calcula la columna de frecuencias absolutas acumuladas (Fi).
2. Luego, se encuentra la mitad del número total de datos, es decir se calcula .

3. Se ubica Fj que sea mayor o igual que (debe de ser el menor de todos).
Xi fi Fi
23 3 3
24 6 9
25 9 18 → Fj
26 5 23
27 2 25
Total n= 25
4. La mediana será el valor de la variable asociada a dicha frecuencia.
En nuestro ejemplo, la mediana es el valor de la clase asociada a Fj. Me = 25
Interpretación: El 50% de los profesores tienen edades menores o iguales a 25 años y el
otro 50% tienen edades mayores o iguales a 25 años.
Ejemplo 2: De la tabla a continuación, se muestran las edades de un grupo de estudiantes
del último ciclo de la Facultad de Educación de la UNMSM.
Xi fi Fi
23 3 3
24 6 9
25 9 18
26 10 28
27 8 36
Total n= 36

62
Estadística aplicada a la Educación

Solución:
1. Se calcula la columna de frecuencias absolutas acumuladas (Fi).
2. Calculamos la mitad del número total de datos, es decir se calcula .

3. Se ubica Fj que sea mayor o igual que (debe de ser el menor de todos).
Xi fi Fi
23 3 3
24 6 9
25 9 18 → Fj
26 10 28
27 8 36
Total n = 36
4. La mediana será la semisuma de los valores 25 y 26, ya que Fj = :

Interpretación: El 50% de las edades son menores o iguales a 25 años y el otro 50% son
mayores o iguales a 26 años.

• Para datos agrupados con intervalos


Esto se logra utilizando la siguiente fórmula:

Donde:
• Lij : Límite real inferior de la clase de la mediana
• n : Número total de observaciones
• Fj-1 : Suma de todas las frecuencias simples que preceden a la clase de la mediana
• fj : Frecuencia de la clase de la mediana
• Cj : Amplitud de la clase de la mediana
Veamos el siguiente ejemplo:
Los siguientes datos corresponden a la consulta psicológica de un grupo de trabajadores
de la EAP de Educación de la UNMSM clasificada según edad.

63
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

GRUPO DE EDAD CASOS


Fi
(años) fi
15 – 25 77 77
25 – 35 167 244
35 – 45 123 367
45 – 55 100 467
55 – 65 44 511
Más de 65 33 544
TOTAL 544
Solución:
1. Se calcula la frecuencia acumulada ( Fi ).
2. Se halla el valor de :

3. A continuación, se busca la Fj inmediatamente superior a 272. En este caso, dicha


frecuencia toma el valor de367, lo cual nos indica que la mediana se encuentra en este
intervalo.
4. Finalmente, se aplica la fórmula:
Me = 35 + 10 272 – 244 = 35 + 2,3 = 37,3 años
123
Interpretación: El 50% inferior de las edades de los trabajadores son menores o iguales a
37,3 años y el otro 50% superior son mayores o iguales a 37,3 años.

2.1.3. Moda (Mo)


La moda es el valor de la variable que más veces se repite, y en consecuencia, en una
distribución de frecuencias, es el valor de la variable que viene afectada por la máxima
frecuencia de la distribución.
No obstante, la moda no siempre es única, si hay dos se dice que se tiene una distribu-
ción bimodal, si hay dos o más modas se dice que es multimodal. Pero, puede suceder
que la distribución no tenga moda, en este caso se dice que la distribución es amodal.

[Link]. Características de la Moda


• Su cálculo es sencillo y no necesariamente es única.
• Es de fácil interpretación.
• Le sigue en importancia a la media y la mediana.
• Es un estadígrafo muy útil cuando los datos son de tipo cualitativos.

64
Estadística aplicada a la Educación

• El cálculo de la moda es independiente del valor de los datos.


• La moda no se puede operar matemáticamente.

[Link]. Cálculo de la Moda

• Para datos no agrupados


En las distribuciones sin agrupar, la obtención de la moda es inmediata.
Ejemplo 1: Una muestra de las edades de la última promoción de graduados se presenta
en la siguiente tabla:

26 20 25 21 22 26 25 20 22 28
30 22 23 22 24 28 24 26 24 22
20 22 21 26 21 22 22 31 28 26

A simple vista, el valor que más se repite es 22 años por lo que este es el valor modal,
es decir, 22 años.
En este caso hay un solo valor modal.
Ejemplo 2: Los puntajes alcanzados en un instituto de idiomas, en una escala de 100
puntos, en exámenes finales se presentan en la siguiente tabla:

71 68 70 55 57 57 85 68 45 68
36 51 57 68 40 76 49 39 57 25

Aquí observamos que los puntajes que más se repiten son 57 y 68 con una frecuencia
de 4 puntajes, por ello el conjunto de datos tiene 2 modas, es decir: 57 puntos y 68
puntos.
Cuando un conjunto de datos tiene dos modas, como en este caso, se llama bimodal.

• Para datos agrupados

Primer caso: Datos de variable discreta agrupados sin intervalos


En este caso la moda corresponde al valor de la variable que tiene la frecuencia más alta.
Ejemplo1: Una muestra del número de libros de inglés que vende por semana un distri-
buidor se presenta en la siguiente tabla:

65
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

N.º de libros semana


0 1
1 3
2 5
3 12
4 19
5 16
6 10
Más de 6 4
La más alta frecuencia corresponde a la quinta clase, por lo tanto la moda es 4, lo cual
quiere decir que la distribución es unimodal, pues presenta una sola moda.
Interpretación: El volumen de venta más frecuente es de 4 libros por semana.

Segundo caso: Datos de variable cualitativa


Ejemplo 1: Se preguntó a un grupo de docentes, escogidos al azar, de un instituto de idio-
mas, por la marca de celular que utilizan y el resultado se presenta en la siguiente tabla:
Marca de celular N.º de docentes
BlackBerry 20
Motorola 12
LG 14
Nokia 27
iPhone 10
Samsung 23
La más alta frecuencia corresponde a la marca Nokia, por lo tanto, esta es la moda.
Interpretación: La marca de celular más frecuente que utilizan el grupo de docentes del
instituto de idiomas es Nokia.
Tercer caso: Datos de variable discreta o continua agrupados con intervalos
Se utiliza la siguiente expresión:

Donde:
j : Número de la clase que tiene la mayor frecuencia (fj).

66
Estadística aplicada a la Educación

Lij: Límite inferior de la clase modal.


Cj: Amplitud del intervalo de clase.
Ejemplo: Se muestra en la siguiente tabla, los salarios mensuales del personal adminis-
trativo de la I. E. Virgen del Carmen.
K Sueldo: [LIi – Lsi〉 fi
1 [400 – 500〉 2
2 [500 – 600〉 8
3 [600 – 700〉 4
4 [700 – 800〉 10
5 [800 – 900] 6

Solución:

Donde:
j = 4  [700 – 800〉 Lij = 700 Cj= 100
= f4 = 10; fj + 1 = f3 = 4; fj + 1 = f5 = 6
d1 = |10-4| = 6 d2 = |10-4| = 4
Luego:

Interpretación: La mayor parte de trabajadores administrativos de la I. E. Virgen del Car-


men tiene un sueldo mensual de 760 nuevos soles aproximadamente.

2.2. Medidas de posición no central (Cuantiles)


Los cuantiles son aquellos valores de la variable que, ordenados de menor a mayor,dividen
a la distribución en partes iguales, de tal manera que cada una de ellas contiene el mismo
número de frecuencias.
Los cuantiles más conocidos son: cuartiles, deciles y percentiles.

2.2.1. Cuartiles (Qk)


Son valores de la variable que dividen a la distribución en cuatro partes iguales, cada una
de las cuales engloba el 25% de las mismas.
Estos valores corresponden a:

67
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

• Primer cuartil o Q1: Es el valor por debajo del cual se encuentra la cuarta parte de los
datos o 25% de los datos cuando están ordenados de menor a mayor.
• Segundo cuartil o Q2: Es el valor por debajo del cual se encuentrala mitad de los datos
o 50% de los datos cuando están ordenados de menor a mayor, es decir, es el mismo
valor que la mediana (Q2 = Me).
• Tercer cuartil o Q3: Es el valor por debajo del cual se encuentran las tres cuartas partes
de los datos o el 75% de los datos cuando están ordenados de menor a mayor.

Cálculo de cuartiles
• Para datos no agrupados
Cuando los datos no están agrupados se procede con la posición de cualquier cuartil, cuan-
do los datos están ordenados de menor a mayor, se calcula con la siguiente expresión:

Esto significa la posición que ocupa el cuartil cuando los datos están ordenados de menor
a mayor, de tal manera que Qi corresponde a Q1= 25, Q2= 50, o Q3 = 75.
Ejemplo: La tabla a continuación muestra la cantidad de casos atendidos por mesa de
partes en la I. E. Julio C. Tello.

febrero marzo abril mayo junio julio agosto setiembre octubre noviembre diciembre

15 5 20 10 23 8 3 13 18 28 32

Solución:
1. Ordenamos de menor a mayor.

68
Estadística aplicada a la Educación

3 5 8 10 13 15 18 20 23 28 32
  
Q1 Q2 Q3
2. Como se puede observar los números 8, 15 y 23 dividen el conjunto en cuatro partes
iguales. Estos valores reciben, respectivamente, los nombres de Primer Cuartil, Segundo
Cuartil y Tercer Cuartil.
Interpretación: En la distribución anterior, el cuartil Q2= 15 representa el 50% de los casos
atendidos por mesa de partes.

2.2.2. Deciles (Dk)


Son los valores de la variable que dividen a la distribución en diez partes iguales, cada una
de las cuales engloba el 10 % de los datos. En total habrá nueve deciles (Q2 = D5 = Me).

2.2.3. Percentiles (Pk)


Son los valores que dividen a la distribución en cien partes iguales, cada una de las cua-
les engloba el 1% de las observaciones. En total habrá noventa y nueve percentiles (Q2
= D5 = Me = P50).

Cálculo de cuantiles
Para calcular los cuartiles, deciles y percentiles se sugiere seguir los siguientes pasos:
• Para datos no agrupados:
Paso 1: Primero se ordenan de menor a mayor los n datos.
Calcular el valor:

69
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Si A es entero, entonces el percentil k corresponde al valor medio de las observaciones


ubicadas en las posiciones A y A+1.
Si A no es un entero, el percentil k corresponde a la observación ubicada en la posición
entera siguiente, es decir [A+1].
Ejemplo: Determinar los percentiles 25 y 60 de los siguientes datos 3, 5, 5, 8, 12, 15, 21,
23, 25, 26, 29, 35.
Solución:
Para P25: A=
Aquí, resulta un entero, por tanto el P25 corresponde al promedio de las observaciones en
las posiciones 3º y 4º, es decir, P25=
Para P60: A =
En este caso A no es un entero, nos movemos al entero siguiente, es decir, a la octava
posición, por lo tanto el percentil 60 será el valor asociado a dicha posición.
P60 = 23 (observación en la 8va posición).

2.3. Medidas de Dispersión


Las medidas de dispersión tratan de medir el grado de dispersión que tiene una variable
estadística en torno a una medida de posición o de tendencia central, indicándonos lo re-
presentativa que es la medida de posición. A mayor dispersión, menor representatividad
de la medida de posición y viceversa.

2.3.1. Medidas de Dispersión Absoluta


Son aquellas que se expresan en unidades de la variable, siendo las más usadas: rango
o amplitud, varianza, desviación estándar llamada también desviación típica, y rango in-
tercuartílico.

[Link]. Rango o amplitud (R)


Se define como la diferencia entre el máximo y el mínimo valor de la variable:

R = valor máximo – valor mínimo

Características del rango


• Es fácil de entender y calcular. Sus unidades son las mismas que las de la variable.
• No utiliza todas las observaciones, solo dos de ellas.
• Se puede ver muy afectada por alguna observación extrema.

70
Estadística aplicada a la Educación

• No se puede calcular con distribuciones de frecuencia que tienen clases de extremo


abierto.
Ejemplo 1: En la siguiente tabla se muestran liquidaciones recibidas por cuatro docentes
en dos institutos de idiomas A y B. Halla el rango e interpreta.
A 100 120 350 370
B 225 230 240 245
R(A) = 370 – 100 = 270
R(B) = 245 – 225 = 20 Distribución menos dispersa
Interpretación: El instituto de idiomas B muestra una amplitud menos dispersa en relación
al instituto A.
Ejemplo 2: El ingreso mensual de 4 profesores de estadística, contratados en un colegio
particular son 424 nuevos soles, 424,50 nuevos soles, 424 nuevos soles y 423,50 nuevos
soles. Halla el rango e interpreta.
Solución:
R = 424,50 – 423,50 = 1
Interpretación: Los datos tienen un rango o amplitud igual a 1. Es decir, es una muestra
homogénea.

[Link]. Varianza (S2)


La varianza mide la mayor o menor dispersión de los valores de la variable respecto a
la media aritmética. Cuanto mayor sea la varianza, mayor dispersión existirá y por tanto
menor representatividad tendrá la media aritmética.
La varianza se expresa en las mismas unidades que la variable analizada pero elevadas
al cuadrado.
La varianza se representa por S2.

Características de la varianza
• La varianza siempre es un valor no negativo que puede ser igual o distinto de 0.
• La varianza es la medida de dispersión cuadrática óptima.

71
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Ejemplo 1: Los datos corresponden a la estatura de cinco profesores 1,70; 1,64; 1,60;
1,62; y 1,64. Halla la varianza e interpreta.
Solución:
1. Necesitamos el valor de la media aritmética.

Luego, la varianza estará dado por:

Interpretación: Las estaturas de los profesores se dispersan en promedio 0,00112 m2 con


respecto al valor central.
[Link]. Desviación estándar (S)
Conocida también como desviación típica, se define como la raíz cuadrada con signo
positivo de la varianza.

Ejemplo 1: El tiempo que utilizan 6 niños de igual edad para desarrollar la misma tarea es
16, 12, 15, 18, 13, 14 minutos. Halla la desviación estándar o típica e interpreta.

72
Estadística aplicada a la Educación

Solución:

2. º Hallamos

(16 − 14,7)2 + (12 − 14,7)2 + (15 − 14,7)2 + (18 − 14,7)2 + (13 − 14,7)2 + (14 − 14,7)2
=
6

(1 ,3) 2 + (−2 ,7) 2 + (0 ,3) 2 + (3 ,3) 2 + (−1 ,7) 2 + (0 ,7) 2


=
6

23,34
=
6

= 1,97

Interpretación: El tiempo utilizado por los niños para desarrollar las tareas se dispersa en
promedio 1,97 minutos con respecto al valor central.
Ejemplo 2: En la tabla se muestra el número de niños por familia en un grupo de veinte
familias. Si el número promedio de hijos por familia es 2,9, encontrar la desviación están-
dar e interpretarla.
Número de niños
fi xi2fi
por familia (xi)
1 3 3
2 4 16
3 8 72
4 2 32
5 3 75

Solución:
Calculamos la desviación estándar de acuerdo a la siguiente fórmula:

73
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

198 2
= 20
− ( 2,9 )

S= 1,22

Interpretación: El promedio de hijos por familia se dispersa en 1,22 con respecto al valor
central.

[Link]. Rango Intercuartílico (IQR)


Resulta de la diferencia que existe entre los cuartiles Q3 y Q1 y por lo tanto es el intervalo
que contiene el 50% central de los datos.

IQR = Q3 – Q1

Se usa como medida de dispersión cuando se ha empleado la mediana como medida de


posición.
Ejemplo 1: El curso de Gramática se dicta en 2 grupos, se desea determinar la dispersión
del rendimiento en este curso a partir de la siguiente información:

TURNO Q1 Q3
mañana 12,3 22,7
tarde 15,6 21,6
Calcula el rango intercuartílico para ambos turnos e interpreta.
Solución:
Turno mañana: Turno tarde:
1.º IQRM = Q3 – Q1 1.º IQRT = Q3 – Q1
2.º IQRM = 22,7 – 12,3 2.º IQRT = 21,6 – 15,6
3.º IQRM = 10,4 3.º IQRT = 6

74
Estadística aplicada a la Educación

Interpretación: El grupo que tiene rendimiento más homogéneo con respecto a la media-
na es el turno de la tarde por tener menor rango intercuartílico.

2.3.2. Medidas de Dispersión Relativa


Son aquellas que no se expresan en unidades de la variable, siendo la más usada, el
coeficiente de variación.

[Link]. Coeficiente de variación


Resulta del cociente entre la desviación típica y la media aritmética, es decir:

Este coeficiente se suele multiplicar por cien para expresarlo en porcentaje. Cuanto
mayor sea el coeficiente de variación, mayor será la dispersión de los datos.
Características del coeficiente de variación
• Cuando CVx < CVy significa que x es más representativa que y o que la media de x
representa mejor a su distribución que la media de y a la suya.
• Se considera que la dispersión es óptima si CVx es igual o menor que 0,3.
• Se puede expresar sin considerar la unidad de la variable.
• Compara la dispersión de datos de variables diferentes.
• No es recomendable calcular cuando la media tiende al valor cero o variables con
valores negativos.
Ejemplo: En la siguiente tabla, se recogen los puntos conseguidos por dos jugadores de
baloncesto en los últimos siete partidos. Calcula el coeficiente de variación y analiza la
dispersión de los puntos.

Jugador A 20 22 30 21 20 24 22
Jugador B 32 28 34 28 20 10 12

Jugador A Jugador B
= 21,29 = 23,43
S = 1,39 S = 8,86
CVA = 0,07 = 7% CVB = 0,38 = 38%

75
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Interpretación:
El jugador B tiene una media superior al jugador A pero es mucho más irregular.
El jugador B tiene un CVx de 38%, mientras que el A lo tiene de7%.

Ejemplo 2: En un grupo A de personas, la estatura media es 165 cm con una desviación


típica de 10,5 cm. En el grupo B, la estatura media es 140 cm y su desviación típica es
de 8,4 cm. Calcula el coeficiente de variación en los dos casos y compara la dispersión
de ambos grupos.
Solución:
Grupo A Grupo B
= 165 cm = 140 cm
S = 10,5 cm S = 8,4 cm
CVA = 0,0636 = 6,36 % CVB = 0,06 = 6 %
Interpretación: La dispersión es mayor en el grupo A.

2.4. Medidas de forma


Hasta ahora, hemos estado analizando y estudiando la dispersión de una distribución,
pero parece evidente que necesitamos conocer más sobre el comportamiento de una
distribución. En esta parte, analizaremos las medidas de forma, las cuales nos permiten
comprobar si una distribución de frecuencias tiene determinadas características especia-
les, el nivel de concentración de datos, etc. Asimismo, las medidas de forma son indi-
cadores estadísticos que permiten identificar si una distribución de frecuencias presenta
uniformidad.

2.4.1. Coeficiente de asimetrías o sesgo de Pearson


El objetivo de la medida de la asimetría es, sin necesidad de dibujar la distribución de
frecuencias, estudiar la deformación horizontal de los valores de la variable respecto al
valor central de la media. Estas medidas de forma pretenden estudiar la concentración de
la variable hacia uno de sus extremos.
Una distribución es simétrica si a ambos lados de la media existe el mismo número de va-
lores, equidistantes dos a dos de la media y además con la misma frecuencia. Asimismo,
para hacer uso del coeficiente de asimetría la distribución debe ser unimodal.
Una distribución es simétrica si = Me = Mo
En caso contrario, decimos que la distribución es asimétrica y entonces puede ser de
dos tipos:

76
Estadística aplicada a la Educación

Asimétrica a la izquierda:
Es el caso en que Mo ≥ Me ≥ x

Curva asimétrica a la izquierda o asimetría negativa


Asimétrica a la derecha:
Es el caso en que Mo ≤ Me ≤ x

Curva asimétrica a la derecha o asimetría positiva


Cálculo del coeficiente de asimetría de Pearson
La medida obtenida depende de las unidades que se usen, por ello, para comparar la
asimetría de dos o más curvas es necesario estandarizar los sesgos, obteniéndose la
siguiente fórmula:
• Primer coeficiente de asimetría:

• Si A1> 0, la asimetría de la distribución de frecuencias es positiva.


• Si A1 = 0, la distribución de frecuencias es simétrica.
• Si A1< 0, la asimetría de la distribución de frecuencias es negativa.
En distribuciones que no son muy asimétricas se cumple la siguiente relación:

77
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Moda = – 3(media – mediana)

• Segundo coeficiente de asimetría

• Si A2> 0, la asimetría de la distribución de frecuencias es positiva.


• Si A2 = 0, la distribución de frecuencias es simétrica.
• Si A2< 0, la asimetría de la distribución de frecuencias es negativa.

• Tercer coeficiente de asimetria

• Si A3> 0, la asimetría de la distribución de frecuencias es positiva.


• Si A3 = 0, la distribución de frecuencias es simétrica.
• Si A3< 0, la asimetría de la distribución de frecuencias es negativa.
Ejemplo: Para la variable edad de los estudiantes del Programa de Licenciatura de Len-
guas Extranjeras, se obtuvieron los valores de las siguientes medidas: =40,1; Me =38,75;
Mo =37,4 y S =9,915. Calcular el coeficiente de asimetría.
Solución:
Haciendo uso del segundo coeficiente de asimetría:

Interpretación: La distribución de las edades presenta una moderada asimétrica positiva.

2.4.2. Diagrama de caja


Los diagramas de Caja-Bigotes (boxplots o box and whiskers) son una presentación visual que
describe varias características importantes al mismo tiempo, tales como la dispersión y la simetría.
Para su realización se representan los tres cuartiles y los valores mínimo y máximo de los datos
sobre un rectángulo alineado horizontal o verticalmente.

78
Estadística aplicada a la Educación

• Construcción del diagrama de caja


Una gráfica de este tipo consiste en una caja rectangular donde los lados más largos
muestran el recorrido intercuartílico. Este rectángulo está dividido por un segmento
vertical que indica dónde se posiciona la mediana y por lo tanto su relación con los cuarti-
les primero y tercero (recordemos que el segundo cuartil coincide con la mediana).
Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores
mínimo y máximo de la variable. Las líneas que sobresalen de la caja se llaman bigotes.
Estos bigotes tienen un límite de prolongación, de modo que cualquier dato o caso que no
se encuentre dentro de este rango es marcado e identificado individualmente.
Por ejemplo: En la siguiente tabla mostramos las edades de un grupo de 20 docentes:

36, 25, 37, 24, 39, 20, 36, 45, 31, 31,
39, 24, 29, 23, 41, 40, 33, 24, 34, 40.

Solución:
1.° Ordenamos la distribución.
20, 23, 24, 24, 24, 25, 29, 31, 31, 33, 34, 36, 36, 37, 39, 39, 40, 40, 41, 45.
2.° Calculamos los cuartiles.
Q1, el Primer cuartil es el valor mayor que el 25% de los valores de la distribución. Como
n = 20 resulta que n/4 = 5, el primer cuartil es la semisuma de dicho valor y el siguiente:

Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribución, es el valor de la


variable que ocupa el lugar central en un conjunto de datos ordenados. Como =10, la
mediana es la media aritmética de dicho valor y el siguiente:

Q3, el Tercer Cuartil es el valor que sobrepasa al 75% de los valores de la distribución.
En nuestro caso, como , resulta:

3.° Dibujamos la gráfica: 20 24,5 33,5 39 45


Xmin Q1 Q2 Q3 Xmáx

79
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

El bigote de la izquierda representa al colectivo de edades ( Xmín, Q1).


La primera parte de la caja a (Q1, Q2).
La segunda parte de la caja a (Q2, Q3).
El bigote de la derecha viene dado por (Q3, Xmáx).
Interpretación:
• La parte izquierda de la caja es mayor que la derecha, ello quiere decir que las edades
comprendidas entre el 25% y el 50% de la población está más dispersa que entre el
50% y el 75%.
• El bigote de la izquierda (Xmím, Q1) es más corto que el de la derecha, por ello el 25%
de los más jóvenes están más concentrados que el 25% de los mayores.
• El rango intercuartílico = Q3 - Q1 = 14,5; es decir, representa el 50% central de los
datos.

80
Estadística aplicada a la Educación

Ejercicios resueltos

1. La profesora Jessica decide comparar las notas obtenidas en el examen final del curso
de Inglés entre dos grupos de estudiantes. Ella obtiene los siguientes datos:

Grupo A 16 11 08 12 15 16 18 16
Grupo B 14 17 16 18 08 08 12 19

a) Halla el promedio de cada grupo e interpreta.


b) Calcula la mediana de cada grupo e interpreta.
c) Halla la moda de cada grupo e interpreta.
d) De acuerdo a los estadígrafos estimados cuales serían tus conclusiones. Fundamenta
tu respuesta.
Solución:
a) El promedio del grupo A.

Interpretación: El promedio de las notas obtenidas en el examen final del curso de


Inglés por el grupo A es de 14 puntos.
El promedio del grupo B

Interpretación: El promedio de las notas obtenidas en el examen final del curso de


Inglés por el grupo B es de 14 puntos.

81
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

b) Para calcular la mediana de ambos grupos ordenamos los datos en forma ascen-
dente. Como el número de datos es par, la mediana es el resultado de la semisuma
de los valores centrales.
Mediana para el grupo A:
MeA= 8 – 11 – 12 – 15 – 16 – 16 – 16 – 18
MeA = 15,5
Interpretación: El 50% inferior de los estudiantes del grupo A obtuvieron notas iguales
o menores a 15,5 puntos y el otro 50% superior obtuvieron notas iguales o mayores a
15,5 puntos en el examen final del curso de Inglés.
Mediana para el grupo B:
MeB = 8 – 8 – 12 – 14 – 16 – 17 – 18 – 19
MeB = 15
Interpretación: El 50% inferior de los estudiantes del grupo B obtuvieron notas iguales
o menores a 15 puntos y el otro 50% superior obtuvieron notas iguales o mayores a
15 puntos en el examen final del curso de inglés.
c) La moda es el valor que se repite con mayor frecuencia.
Grupo A:
Interpretación:La nota más frecuente en el grupo A es 16 puntos en el examen final
del curso de Inglés.
Grupo B:
Interpretación:La nota más frecuente en el grupo B es 08 puntos en el examen final
del curso de inglés.
2. Se ha realizado un estudio sobre el número de veces que un grupo de alumnos del
PROLEX han asistido a la biblioteca durante el mes de enero del 2012, obteniéndose los
siguientes datos:

xi 0 1 2 3 4 5

fi 4 12 10 18 9 7

a) Calcula la media aritmética e interpreta el resultado.


b) Halla la mediana e interpreta el resultado.
c) Determina la moda e interpreta el resultado.
Solución:
a) Hallamos la media aritmética

82
Estadística aplicada a la Educación

xi fi x i fi ∑ .
=
0 4 0
1 12 12
157
2 10 20 =
60
3 18 54
4 9 36 = 2,62
5 7 35
Total 60 157

Interpretación: Los alumnos de PROLEX han asistido en promedio 2,62 veces a la


biblioteca durante el mes de enero del 2012.
b) Hallamos la mediana, para lo cual procedemos de la siguiente manera:
Completar Fi
xi fi Fi
0 4 4 Calcular: :
1 12 16
2 10 26
3 18 44
Ubicamos un en nuestro caso la 4ta
4 9 53 clase.
5 7 60
La mediana es el valor asociado a fi
n=60

Interpretación: El 50% inferior de los estudiantes asistió a la biblioteca 3 o menos


veces a la biblioteca y el otro 50% superior asistió 3 o más veces a la biblioteca.
c) La moda es el valor asociado a la más alta frecuencia.
En nuestro caso M0 = 3
Interpretación: La mayoría de los alumnos del PROLEX han asistido tres veces a la
biblioteca durante el mes de enero del 2012.
3. En la familia del profesor Gómez, el salario mensual del padre es de S/. 800 y el salario
de la madre es de S/. 1500. En la familia del profesor Pérez, el padre gana S/. 1860 y la
madre S/. 540. ¿Cuál es el rango en cada familia? ¿En cuál de ellas es mayor la disper-
sión?
Solución:

83
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

R Gómez = 1500 – 900= 600


R Pérez = 1860 – 540 = 1320

∴Hay mayor dispersión en la familia del profesor Pérez, también se puede decir que la
familia Gómez presenta mayor homogeneidad en los salarios.

4. El profesor de Educación Física de la I. E. María de Los Ángeles duda entre seleccionar


a Elena o María para el equipo de básquet. El puntaje conseguido en una semana de
entrenamiento, por cada una de ellas, fueron los siguientes:

Elena 18 23 22 24 19 25 16

María 18 26 18 28 22 17 18

Calcular la desviación estándar y analiza cuál de las dos es más regular.


Solución:
a) Para Elena

b) Para María


∴ Es más regular Elena porque la dispersión de datos es menor.
5. Según los datos de una encuesta realizada entre estudiantes de Lenguas Extranjeras
de la UNMSM, la estatura media de dichos estudiantes es de 167,67 cm con una desvia-
ción de 8,49 cm y el peso medio es de 61,61 kg con una desviación de 11,27 kg. ¿Cuál
de las dos variables presenta mayor dispersión en torno a su media?

84
Estadística aplicada a la Educación

∴ La estatura presenta un 5,06% de variación respecto a su media, y el peso un 18,29%


por lo que se concluye que el peso está más disperso en relación a su media.

85
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

EJERCICIOS PROPUESTOS

1. Los siguientes datos corresponden al tiempo en minutos que utiliza un grupo de alum-
nos del PROLEX en trasladarse desde sus hogares a la universidad los días sábados:
48 53 45 52 45 58 62
48 51 60 48 51 51 56
a) Halla el promedio e interpreta el resultado.
b) Calcula la mediana e interpreta el resultado.
c) Hallar la moda e interpreta.
1. La coordinación académica del Programa de Licenciatura en Lenguas Extranjeras está
interesada en conocer la cantidad de libros que leyeron sus estudiantes durante los me-
ses de enero, febrero y marzo del 2012. Para tal efecto realiza una encuesta dirigida a
dos grupos, uno de la promoción 2010 y el otro de la promoción 2011, obteniéndose los
siguientes datos:
Promoción 2 0 5 4 5 1 0 2 4
2010 1 2 3 1 4 3 3 3 5

Promoción 5 4 2 0 0 5 3 2 6
2011 1 3 3 4 2 3 1 3 1
a) Halla el promedio de cada grupo e interpreta.
b) Calcula la mediana de cada grupo e interpreta.
c) Halla la moda de cada grupo e interpreta.
d) De acuerdo a los estadígrafos estimados, cuáles serían tus conclusiones.
3. Los siguientes datos corresponden a las edades de un grupo de estudiantes de la
Facultad de Educación de la UNMSM, las cuales son: 20, 25, 20, 22, 21. Calcula la des-
viación estándar y la varianza e interprete.
4. Los gastos mensuales de la Facultad de Educación de la UNMSM tiene una media de
S/ 60 000 y una desviación estándar de S/ 7 500. En la Facultad de Letras, la media es
de S/ 9 000 y la desviación estándar es de S/. 1 500. Calcula mediante el coeficiente de
variación, cuál de las dos tiene más variación relativa.
5. Los tiempos que un grupo de estudiantes de la Facultad de Educación de la UNMSM
han empleado en hacer un examen de estadística se distribuyen entre 0 y 50 minutos.
Construye el diagrama de caja sabiendo que Q1 = 23, Me = 34 y Q3 = 39.

86
Estadística aplicada a la Educación

AUTOEVALUACIÓN de la Unidad 2

1. Cuando una muestra es asimétrica, el mejor estadístico de centralización que puede


emplearse es la:
a) Media aritmética.
b) Moda.
c) Mediana.
d) Media geométrica.
e) Media armónica.
2. Es un estadístico de dispersión:
a) Moda.
b) Rango.
c) Mediana.
d) Media armónica.
e) Media geométrica.
3. Para comparar correctamente, desde un punto de vista descriptivo la dispersión de dos
o más variables, debe utilizarse:
a)La desviación típica.
b) La amplitud.
c) El coeficiente de variación.
d) La covarianza.
e) La desviación media.
4. ¿Cuál de los siguientes estadísticos descriptivos es de posición?
a) Media geométrica.
b) Media ponderada.
c) Varianza.
d) Percentil.
e) Covarianza.
5. El coeficiente de asimetría de una distribución de frecuencias simétrica es:
a) 0

87
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

b) –1
c) 1,96
d) 1
e) –1,96
6) Indique cuál de las siguientes frases define el concepto estadístico de rango:
a) Diferencia existente entre dos medias.
b) Relación entre la desviación típica y el valor real de la magnitud medida.
c) Diferencia entre los límites de confianza superior e inferior.
d) Diferencia entre los límites de tolerancia superior e inferior.
e) Diferencia entre el valor más alto y el más bajo de una serie de medidas.
7. La desviación típica de un conjunto de datos es:
a) El cuadrado de la varianza.
b) La desviación más grande.
c) La raíz cuadrada positiva de la varianza.
d) El cuadrado de la media armónica.
e) La diferencia entre la media y la moda.
8. El diagrama de caja:
a) Se construye con medidas basadas en momentos.
b) Conserva los datos originales.
c) Permite localizar valores extremos de la distribución.
d) Solo es útil para distribuciones simétricas.
e) Permite localizar la media aritmética.
9. La diferencia entre el valor correspondiente al tercer cuartil y el valor correspondiente
al primer cuartil indica
a) Cuánto vale la mediana.
b) Cuánto vale la media.
c) Cuánto vale la desviación típica.
d) Cuánto vale el rango intercuartílico.
e) Cuánto vale la varianza.

88
Estadística aplicada a la Educación

10. En un colegio el 80% de los estudiantes obtienen una puntuación en el examen de


Inglés igual a 14. ¿Qué representa el valor 14 de esta distribución?
a) La media.
b) El percentil 80.
c) La moda.
d) El decil 2.
e) El coeficiente de variación.

LECTURA N.º 2

La estadística, un pilar básico en la educación


Manuel Molina Fernández
Catedrático de Estadística
Universidad de Extremadura
La estadística se ha consolidado en el siglo XX como una ciencia moderna de gran utilidad en la
investigación experimental. Estudia procedimientos para la recogida de conjuntos de datos, para
la organización, representación gráfica, resumen, análisis de la información recogida y para la
obtención de conclusiones científicas sobre las poblaciones en las que han sido seleccionados los
datos. Es una disciplina de obligada consulta para los investigadores que realizan su actividad en
ciencias de la salud, ciencias humanas o ciencias sociales. La metodología estadística interviene
en la etapa inicial de identificación y formulación de los problemas, en la planificación y el diseño
de la investigación, en la recogida de la información, en su análisis, en la elaboración de resultados
y conclusiones, en su presentación y en la propuesta de acciones futuras.
La estadística es una ciencia en continua evolución que tiene cada vez más influencia en la
sociedad. En los medios de comunicación aparecen diariamente resultados estadísticos sobre
economía, salud, opinión política, etc. Cuando están basados en datos ciertos proporcionan una
información muy valiosa. En un país estadísticamente avanzado, la mayoría de sus decisiones
sociales y económicas están apoyadas en estadísticas relevantes, sus medios de comunicación
proporcionan información veraz basada en informes estadísticos rigurosos y existe un buen siste-
ma de enseñanza de la estadística en sus diferentes niveles educativos.
La estadística en los niveles educativos no universitarios
La estadística es una parte de la educación general deseable para los futuros ciudadanos que ne-
cesitarán adquirir la capacidad de saber interpretar la gran cantidad de información que, en forma
de tablas y gráficos estadísticos, aparece constantemente en los medios de comunicación sobre
temas muy variados. El interés por la enseñanza de la estadística se ha visto impulsado notable-
mente por las enormes potencialidades que hoy ofrecen ordenadores que han facilitado el uso
de los procedimientos estadísticos a un número creciente de personas. Todo ello ha motivado la
necesidad de una formación básica en estadística que, en los niveles educativos no universitarios,

89
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

ha sido encomendada a los profesores de matemáticas. Su finalidad principal es que los alumnos
comprendan y aprecien el papel de la estadística en la sociedad, que conozcan sus diferentes
campos de aplicación y que valoren la importancia de los métodos estadísticos.
Si se pretende que el alumno aprecie la importancia de la Probabilidad y la Estadística, los ejem-
plos desarrollados en las clases deben incluir aplicaciones de su mundo biológico, físico, social
y político. En este sentido, son de gran interés metodológico la realización de trabajos aplicados
que permitan a los alumnos elegir un tema de su interés en el que tendrán que precisar objetivos,
proceder a la recogida de datos, seleccionar las muestras necesarias y analizar e interpretar la
información recogida para proporcionar una adecuada respuesta a los objetivos planteados. Tales
trabajos, además de introducir a los alumnos en la investigación, hacen que se interesen por la
estadística y que la valoren como una herramienta de gran utilidad para solucionar problemas de
la vida real.
En la Comunidad Autónoma de Extremadura, los currículos de educación primaria y secundaria
incluyen recomendaciones sobre la enseñanza de la estadística y, en el Decreto 115/2008 dele 6
de junio del 2008, por el que se establece el currículo del bachillerato, en las Matemáticas I (Mo-
dalidad de Ciencias y Tecnología) se incluye un bloque de Estadística y Probabilidad, con conte-
nidos básicos de estadística descriptiva bidimensional, correlación y regresión lineal, probabilidad
y distribuciones binomial y normal.
Lamentablemente, dicho bloque no tiene continuidad en las Matemáticas II, donde no se incluye
ningún contenido de Estadística. En consecuencia, muy condicionados por las pruebas de acceso
a la universidad son pocos los profesores que imparten los contenidos de Estadística y en otros
casos se tratan muy brevemente. En las Matemáticas Aplicadas a las Ciencias Sociales I y II
(Modalidad de Humanidades y Ciencias Sociales) sí se incluyen bloques de Probabilidad y Esta-
dística, con contenidos sobre estadística descriptiva (unidimensional y bidimensional), correlación
y regresión lineal, probabilidad, distribuciones de probabilidad binomial y normal, implicaciones
prácticas de algunos resultados límite y una introducción básica al muestreo estadístico y a la
inferencia estadística.
La estadística en los niveles educativos universitarios
La rápida evolución que experimentaron las tecnologías de la información y de la comunicación
en los países avanzados, permitiendo almacenar, recuperar y manejar grandes cantidades de
datos, contribuyeron significativamente a la demanda de profesionales capacitados para resolver
las necesidades de empresas e instituciones. Profesionales que debían poseer capacidad para el
pensamiento analítico y habilidad para el tratamiento e interpretación de diversa información, de
manera que cuando se tuvieran que enfrentar a situaciones definidas de manera imprecisa fuesen
capaces de crear o identificar el modelo adecuado, trabajar con los datos disponibles, realizar el
análisis apropiado de ventajas e inconvenientes y saber presentar conclusiones a los responsa-
bles de la toma de decisiones. Para la formación de tales profesionales se hizo necesario disponer
de alguna titulación específica en estadística.
En el último cuarto del siglo XX, fue cuando dentro de un contexto de crecimiento de la universidad
española resultó factible la creación de nuevas titulaciones en Estadística y se empezó a perfilar la
formación de un profesional de la materia equiparable en conocimientos y habilidades a cualquiera
de los países más avanzados. Con fecha 20 de noviembre de 1990 se creó el título de Diplomado

90
Estadística aplicada a la Educación

en Estadística y con fecha 6 de diciembre de 1994 el título (de solo segundo ciclo) de Licenciado
en Ciencias y Técnicas Estadísticas. La necesaria adaptación de los estudios universitarios al nue-
vo escenario del Espacio Europeo de Educación Superior, ha originado la creación de un título de
Grado en Estadística que viene a reemplazar a los títulos anteriores de Diplomado en Estadística
y de Licenciado en Ciencias y Técnicas Estadísticas.
El grado en estadística, fruto del acuerdo de los 17 centros de las 15 universidades públicas en
los que se venía impartiendo alguno de los dos títulos oficiales de Estadística, ha surgido con
el objetivo de formar profesionales capacitados para la aplicación de los métodos y modelos de
la Estadística y la Investigación Operativa, así como para la realización de tareas específicas
que acompañan a cualquier proceso de análisis de datos. Es un título que cubre una demanda
específica de estadísticos profesionales y es homologable con títulos similares de los países más
avanzados de nuestro entorno socioeconómico. En la actualidad se imparte, bajo diversas deno-
minaciones, en 13 universidades públicas. En la Universidad de Extremadura, bajo la denomina-
ción de Grado en Estadística, se viene desarrollando desde el curso académico 2010-2011 en la
Facultad de Ciencias.
A partir de los estudios sobre inserción laboral realizados, se han obtenido como conclusión que
los titulados en estadística son profesionales polivalentes muy solicitados en diversos sectores
laborales. Sus perfiles profesionales se centran principalmente en actividades relacionadas con
la administración pública, el campo de la salud y de las ciencias naturales, la economía y las
finanzas, la industria y servicios, la docencia y la investigación. A partir de la información recogida
en encuestas realizadas a los empleadores, se desprende que existe una creciente demanda de
titulados en estadística y que los conocimientos específicos de lamisma se encuentran entre los
más valorados en el sector empresarial.

Algunos organismos relacionados con la difusión de la estadística


Instituto Internacional de Estadística ([Link] )
Fundado en 1885, el International Statistical Institute (ISI) tiene entre sus objetivos fundamentales
favorecer la educación estadística. Colabora en la producción y difusión de ayudas para la ense-
ñanza (libros de texto, bibliografías específicas y diccionarios de términos estadísticos), trata de
impulsar la introducción de la estadística en las escuelas y promueve la celebración de conferen-
cias y reuniones sobre la educación estadística entre las que cabe mencionar las Conferencias
Internacionales sobre la Enseñanza de la Estadística que desde su primera edición en 1982 se
han celebrado cada cuatro años. Con la finalidad de promover, desarrollar y mejorar la educación
estadística en el ámbito internacional, el ISI creó la International Association for Statistical Educa-
tion: ([Link]
Instituto de Estadística de la Organización de las Naciones Unidas para la Educa-
ción, la Ciencia y la Cultura (UNESCO).
Es el depositario de la Organización de Naciones Unidas en materia de estadísticas mundiales
en la educación, la ciencia, la tecnología, la cultura y la comunicación. Se creó en 1999 con el
fin de mejorar el programa de estadística de la UNESCO así como para desarrollar y suministrar
estadísticas exactas, oportunas y políticamente relevantes requeridas en un contexto actual cada

91
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

vez más complejo y rápidamente cambiante. Entre las publicaciones que edita, cabe mencionar el
Compendio Mundial de la Educación 2010 donde se proporciona una exhaustiva comparación de
las estadísticas relativas a la educación en el mundo. Véase la página web:
[Link]
Instituto Nacional de Estadística
([Link]
El Instituto Nacional de Estadística (INE) se creó en 1945 con la misión de elaborar y perfeccio-
nar las estadísticas demográficas, económicas y sociales existentes en nuestro país, crear otras
nuevas y coordinar los servicios estadísticos de las diversas áreas provinciales y municipales.
En la página web: [Link] se proporciona información sobre
las operaciones estadísticas elaboradas por el INE en materia educativa. En este sentido, cabe
también reseñar la página web: [Link] elabo-
rada por el Ministerio de Educación, Cultura y Deporte, en la que se muestra información sobre
estadísticas de educación y enlaces de interés de información estadística nacional e internacional
relevante para el sector educativo.
Sociedad de Estadística e Investigación Operativa ([Link]
Es una organización autónoma, creada en 1962 con el objetivo de desarrollar, mejorar y promover
los métodos y aplicaciones de la Estadística y de la Investigación Operativa en su sentido más
amplio. Con dicha finalidad, organiza congresos ordinarios y reuniones monográficas, edita revis-
tas profesionales y boletines de información, estimula la investigación, potencia intercambios na-
cionales e internacionales y promociona actividades de consulta en sectores públicos y privados.
Instituto de Estadística de Extremadura
([Link]
Creado en el año 2009, es un organismo autónomo adscrito a la Consejería competente en mate-
ria de economía de la Junta de Extremadura, al que se confiere la responsabilidad de la actividad
estadística de interés para Extremadura.

Nota biográfica
Manuel Molina Fernández nació en Granada, es Doctor en Ciencias Matemáticas por la Universi-
dad de Granada y desarrolla su actividad docente como Catedrático de Estadística en la Universi-
dad de Extremadura donde se le ha concedido recientemente el premio a la excelencia docente.
Coordina los estudios de Estadística en la Facultad de Ciencias de la misma universidad, ha for-
mado parte de la Comisión Nacional encargada de la elaboración del libro blanco del título de Gra-
do en Estadística, es miembro de la Conferencia Interuniversitaria de Estudios de Estadística, del
Consejo Ejecutivo de la Sociedad de Estadística e Investigación Operativa y también del Consejo
Superior de Estadística de Extremadura. Su investigación se desarrolla en el campo de la Proba-
bilidad y la Estadística. Ha realizado informes científicos para diversas instituciones y organismos
internacionales y nacionales, ha participado en varios proyectos de investigación nacionales y es
autor de numerosos artículos científicos publicados en revistas internacionales de gran prestigio.

92
Unidad 3

Probabilidades

Capacidades a desarrollar
¾¾
Interpretar espacios muestrales y sucesos de un
experimento aleatorio dado.

¾¾
Calcular e interpretar probabilidades de eventos
simples y compuestos.
Estadística aplicada a la Educación

Introducción
Frecuentemente se usa el término probabilidad para sugerir que existe duda o incerti-
dumbre sobre lo que ocurrió, lo que ocurre u ocurrirá. La experiencia humana demuestra
que existe una serie de hechos, acontecimientos y experimentos cuyos resultados no se
pueden determinar anticipadamente; sin embargo, es posible definir, estimar o predecir
el probable resultado. Podemos conocer el pasado pero nunca el futuro, mas existe un
permanente interés por despejar las incertidumbres.
Es así como nace el concepto de probabilidad, partiendo del deseo del hombre por
conocer con certeza los eventos venideros. Por ello, el estudio de las probabilidades
surge como una herramienta utilizada por los nobles para ganar en los juegos y pasa-
tiempos de la época. El desarrollo de estas herramientas fue asignado a los matemá-
ticos de la corte.
Con el tiempo estas técnicas matemáticas se perfeccionaron y utilizaron en otras ac-
tividades muy diferentes para las que fueron creadas. Actualmente, con el avance de
la computación, se han desarrollado programas para el estudio de las probabilidades
disminuyendo considerablemente el margen de error en el cálculo.
La probabilidad permite cuantificar la posibilidad de que ocurra un evento.

3.1. Nociones de probabilidad


En el campo de las probabilidades se hacen uso de algunos términos especiales, por lo
cual es necesario conocer cada uno de ellos.

3.1.1. Experimentos aleatorios


Los experimentos aleatorios son aquellos cuyo resultado depende del azar: lanzar un
dado, una moneda, extraer una bola, una carta, etc.
En condiciones iniciales no se permite predecir un resultado a pesar de que se conozcan
todos los resultados posibles.
• Se lanza un dado y se anota el número que sale en la cara superior.
• De un grupo de 30 estudiantes, se cuentan cuántos conocen el Cañón del Colca.
• En una carrera en la que participan 10 caballos enumerados del 1 al 10, se indica quién
va a ganar.
Sin embargo, hay experimentos en que sí se puede predecir el resultado, estos se llaman
experimentos deterministas (o no aleatorios). Se podrá repetir el experimento varias ve-
ces y el resultado será siempre el mismo.

95
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

3.1.2. Espacio Muestral (Ω)


El espacio muestral es el conjunto de todos los resultados posibles de un experimento
aleatorio. Generalmente se le representa por omega (Ω).
Ejemplos:
¿Cuál es el espacio muestral al lanzar un dado?
Al arrojar un dado los resultados posibles son: 1, 2, 3, 4, 5, 6.
Luego: Ω = {1, 2, 3, 4, 5, 6}
¿Cuál es el espacio muestral al lanzar una moneda?
Ω = {C, S}
¿Cuál es el espacio muestral al elegir una persona de diferente sexo de un grupo de
personas?
Ω = {hombre, mujer}

3.1.3. Suceso o evento


Es un subconjunto (una parte) del espacio muestral. Generalmente se le representa con
una letra mayúscula.
Ejemplos:
Luego de lanzar un dado, cuyo espacio muestral es Ω = {1, 2, 3, 4, 5, 6}
El evento de obtener un número menor que 3 es A = {1, 2}
El evento de obtener un número primo es B = {2, 3, 5}
El evento de obtener un número mayor que 6 es C = {}
El evento de obtener un número menor que 7 es D = {1, 2, 3, 4, 5, 6}

3.1.4. Probabilidad de un suceso


La probabilidad de un suceso A se define como un cociente entre la cantidad de ele-
mentos que tiene dicho suceso (casos favorables) y el número de elementos del espacio
muestral (casos posibles).

P(A) Se lee “Probabilidad del suceso A”

96
Estadística aplicada a la Educación

Ejemplos:
Con los resultados del ejemplo anterior, calcula la probabilidad de ocurrencia para cada
suceso:
• P (obtener un número menor que 3)

• El evento de obtener un número primo es B = {2, 3, 5}

• El evento de obtener un número mayor que 6 es C = {}

El evento de obtener un número menor que 7 es D = {1, 2, 3, 4, 5, 6}

3.1.5. Propiedades de las probabilidades


Las propiedades fundamentales de las probabilidades son tres:
a) La probabilidad es un número positivo menor o igual a uno.

0 ≤ P(A) ≤ 1

Además:

P(A) = 0, si A = { } Probabilidad nula


P(A) = 1, si A = Ω Probabilidad segura

b) La probabilidad de que no ocurra un evento es igual a uno menos la probabilidad de


que si ocurra el evento.

P(no A ) = 1 – P(A)

97
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

c) La probabilidad de que ocurra al menos uno de dos eventos es igual a la suma de las
probabilidades de esos eventos menos la probabilidad de que sí ocurran los dos eventos
a la vez.

Ejemplo 1: En una bolsa hay 3 bolas verdes y cuatro amarillas. ¿Cuál es la probabilidad
de sacar una bola azul?

Solución:

No existe probabilidad de sacar una bola azul. A esto llamaremos: Probabilidad impo-
sible o nula.

Ejemplo 2: En una bolsa hay 15 bolas verdes. ¿Cuál es la probabilidad de sacar una
verde?

Solución:

En este caso existe cien por ciento de certeza que el suceso ocurra, entonces es una:
Probabilidad segura.

Ejemplo 3: Una carta es escogida al azar desde un paquete ordinario de cartas. Hallar la
probabilidad de no obtener un siete.
Solución:
Sea el suceso A, obtener un siete, entonces:
P (obtener un siete) = P (A) =
Nos piden: P (no obtener un siete) = P (A’), aplicando la propiedad.
P (A’) = 1 – P(A) =
Interpretación: Existe un 92% de probabilidades de no obtener un siete.

Ejemplo 4: La probabilidad de que un alumno apruebe matemática es de 0,6, de que


apruebe comunicación es 0,5 y de que apruebe las dos asignaturas es 0,3. Se elige un
alumno al azar, calcule la probabilidad de que apruebe al menos una asignatura.

98
Estadística aplicada a la Educación

Solución:
Definimos los eventos y las probabilidades correspondientes:
A = Aprobar matemática → P (A) = 0,6
B = Aprobar comunicación → P (B) = 0,5
A ∩ B = Aprobar matemáticas y aprobar comunicación → P (A ∩ B) = 0,3
A ∪ B = Aprobar matemática o comunicación (al menos una)
P(A ∪ B) = P(A) + P (B) – P(A ∩ B), deducimos que
P(A ∪ B) = 0,6 + 0,5 – 0,3 = 0,8
Luego, la probabilidad de que un alumno apruebe al menos una materia es 0,8 u 80%.
Ejemplo 5: En un concurso entre dos personas la probabilidad de que Juan gane es de
0,3 y la de que Mario gane 0,4. Si no puede haber empate, ¿cuál es la probabilidad de
que gane Juan o Mario?
Solución:
Definimos los sucesos y sus probabilidades respectivas:
J = Juan gana el concurso → P (J) = 0,3
M = Mario gana el concurso → P (M) = 0,4
J ∩ M = Ambos ganan el concurso.
Por la condición de que no hay empate, se infiere que no se puede dar el caso de que
ambos ganen el concurso.
P (J ∩ M) = 0
Cuando esto sucede, se dice que estos eventos son mutuamente excluyentes, es decir,
que ambos eventos no pueden ocurrir al mismo tiempo.
Nos están pidiendo: J ∪ M = Juan o Mario gane el concurso.
P(J ∪ M) = P(J) + P (M) – P(J ∩ M)
P(J ∪ M) = 0,3 + 0,4 – 0 = 0,7
Por lo tanto, la probabilidad de que gane Juan o Mario es de 0,7 o 70%.

3.2. Probabilidad condicional


Es la probabilidad que ocurra un evento sabiendo que ha ocurrido antes otro. Es decir,
si se tienen dos sucesos A y B, donde P(B) > 0, se denota la probabilidad de A sabiendo
que ocurrió B como: P(A/B) y se calcula de la siguiente manera:

99
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Ejemplo 1: En un aula que tiene 40 alumnos se ha detectado que 18 de ellos tienen


problemas de comprensión lectora, 24 presentan dificultades numéricas y 8 ambas defi-
ciencias. Se elige un alumno al azar:
a) ¿Cuál es la probabilidad de que el alumno tenga problemas de comprensión lectora si
se sabe que presenta dificultades numéricas?
b) Si se conoce que el alumno tiene problemas de comprensión lectora, ¿cuál es la pro-
babilidad de que presente dificultades numéricas?
Solución:
Definimos los eventos y calculamos sus probabilidades:
A = tiene problemas de comprensión lectora →

B = presenta dificultades numéricas →

A ∩ B = muestra ambas deficiencias →

a) Se conoce que el alumno presenta dificultades de habilidad matemática (evento que


ya sucedió), nos piden la probabilidad de que el alumno tenga problemas de compren-
sión lectora, (suceso que depende o está condicionado por el evento anterior), entonces
tenemos que calcular P(A/B):

Interpretación: Existe un 33,33% de probabilidades de que un alumno que presenta difi-


cultades numéricas tenga también problemas de comprensión lectora.
b)De la misma manera se sabe de antemano que el alumno tiene problemas de compren-
sión lectora (evento que ya sucedió), nos piden la probabilidad de que el alumno presente
dificultades numéricas (suceso que está condicionado por el evento ya ocurrido), enton-
ces tenemos que hallar P(B/A):

100
Estadística aplicada a la Educación

Interpretación: Existe un 44,44% de probabilidades de que un alumno que presenta pro-


blemas de comprensión lectora tenga también dificultades numéricas.
Ejemplo 2: Se realizó una encuesta a 170 alumnos del Programa de Licenciatura de
Lenguas Extranjeras de la UNMSM y se obtuvieron los siguientes datos acerca del géne-
ro y sector donde laboran:
Sector
Estatal Privado
Género
Hombre 40 60
Mujer 20 50
Si se elige un alumno al azar:
a) ¿Cuál es la probabilidad de que el alumno trabaje en el sector estatal, si se sabe que
es hombre?
b) Sabiendo que el alumno labora en el sector privado, ¿cuál es la probabilidad de que
sea mujer?
c) Determina la probabilidad de que el alumno trabaje en el sector estatal si se trata de
una mujer.
Solución:
Llenamos la tabla y simbolizamos los eventos.

Sector Estatal Privado


Total
Género (E) (P)

Hombre (H) 40 60 100

Mujer (M) 20 50 70

Total 60 110 170

a) Nos piden calcular la, por lo tanto, aplicamos la probabilidad condicional:

Debemos ubicar estos valores en el cuadro:

101
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Sector Estatal Privado


Total
Género (E) (P)
Hombre (H) 40 60 100

Mujer (M) 20 50 70

Total 60 110 170

Reemplazando los valores respectivos:

Interpretación: Si se sabe que un alumno es hombre, la probabilidad de que trabaje en el


sector estatal es del 0,40 o 40%.
b) En este caso se debe calcular la, es decir:

Ubicamos estos valores en el cuadro:


Sector Estatal Privado
Total
Género (E) (P)
Hombre (H) 40 60 100

Mujer (M) 20 50 70

Total 60 110 170

Luego:

Interpretación: Sabiendo que una alumna labora en el sector privado, la probabilidad de


que sea mujer es de 0,45 o 45%.
c) Ahora nos piden, entonces:

Observamos el cuadro:

102
Estadística aplicada a la Educación

Sector Estatal Privado


Total
Género (E) (P)
Hombre (H) 40 60 100
Mujer (M) 20 50 70

Total 60 110 170

Por lo tanto:

Interpretación: La probabilidad de que un alumno trabaje en el sector estatal si se trata de


una mujer, es 0,29 o 29%.

3.3. Probabilidad conjunta


De la definición de probabilidad condicional y haciendo uso de propiedades de conjuntos
se obtiene la siguiente expresión llamada multiplicación de sucesos.

Esta fórmula nos proporciona la probabilidad de que dos eventos ocurran a la vez. Esto
es igual a multiplicar la probabilidad de que ocurra el primer evento, por la probabilidad de
que ocurra el segundo evento sabiendo que el primero ya sucedió.
Ejemplo 1: En una urna se tienen 6 bolas azules y 9 bolas blancas. Si se extraen al azar
y sucesivamente dos bolas sin devolución o reemplazo, calcular la probabilidad de que:
a) La primera bola sea azul y la segunda blanca.
b) La primera bola sea blanca y la segunda azul.
c) Ambas sean blancas.
Solución:
Simbolizamos los sucesos:
A = extraer bola azul.
B = extraer bola blanca.
a) De acuerdo al enunciado nos piden calcular , es decir:

103
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

La primera bola debe ser azul →

Por lo tanto, nos quedan 14 bolas en total ya que la primera (azul) se extrae sin devolverla
a la urna.
Sabiendo que la primera fue azul, la segunda debe ser blanca.

Sustituyendo los valores respectivos, tenemos:

Interpretación: La probabilidad de extraer primero una bola azul y luego una blanca es de
0,26 o 26%.
b) Ahora nos piden hallar , en consecuencia:

De acuerdo a los criterios aplicados en el ejercicio anterior, podemos obtener:

Por lo tanto:

Interpretación: La probabilidad de extraer primero una bola azul y luego una blanca es de
0,26 o 26%.
c) Si ambas son blancas, tenemos que determinar , por consiguiente:

La primera bola debe ser blanca →

Luego, nos quedan en total 14 bolas y 8 de estas son blancas.


La segunda debe ser blanca, sabiendo que la primera fue también blanca.

104
Estadística aplicada a la Educación


Sustituyendo los valores respectivos, tenemos:

Interpretación: La probabilidad de extraer primero una bola blanca y luego otra del mismo
color es de 0,26 o 26%.

3.4. Sucesos independientes


Se dice que los sucesos A y B son independientes cuando la ocurrencia de uno de ellos
no afecta la probabilidad de que el otro ocurra. Luego, debe cumplirse que:

Como consecuencia de esta propiedad, la probabilidad conjunta para sucesos indepen-


dientes será:

Si los eventos A y B no cumplen los dos primeros criterios se dicen que son eventos de-
pendientes; es decir, la ocurrencia de uno de ellos cambia la probabilidad de ocurrencia
del otro
Ejemplo 1: Del ejemplo anterior, si se extraen al azar y sucesivamente dos bolas con
devolución o reemplazo, halla la probabilidad de que:
a) La primera bola sea azul y la segunda blanca.
b) La primera bola sea blanca y la segunda azul.
c) Ambas sean blancas.
Solución:
a) De acuerdo al enunciado, calcular:

105
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Hacemos un análisis previo: al sacar la primera bola (que debió ser azul), en la urna
quedarían 14 bolas en total, lo cual afectaría la probabilidad del suceso siguiente: que la
bola sea blanca. Pero de acuerdo al enunciado la primera bola se repone o se devuelve
a la urna, por consiguiente este evento no afecta la probabilidad del suceso siguiente.
Entonces podemos concluir que A y B son eventos independientes, luego:

b) Ya que A y B son independientes, entonces:

c) Debemos calcular , ambos eventos son independientes puesto que las bolas
se restituyen o devuelven a la urna, por consiguiente:

106
Estadística aplicada a la Educación

Ejercicios resueltos

1. Un estudiante responde al azar dos preguntas de verdadero (V) o falso (F).


a) Escriba el espacio muestral de este experimento aleatorio.
b) Describa los elementos de los siguientes sucesos y su probabilidad de ocurrencia:
A = Responde falso a una sola pregunta.
B = Contesta verdadero al menos una pregunta.
Solución:
a) Para este experimento aleatorio el espacio muestral será:
Ω = {(V,V), (V,F), (F,V), (F,F)}
Un estudiante puede responder en total de cuatro maneras.
b) El suceso A tendrá los siguientes elementos:
A = {(V,F), (F,V)}
Existen dos maneras de contestar
Entonces:
El suceso B estará conformado por:
B= {(V,V), (V,F), (F,V)}
Se presentan tres formas de contestar
Entonces:

2. Para el viaje de promoción de un colegio privado, se han propuesto dos lugares: Cuzco
y Paracas. Se elige a tres alumnos al azar para conocer su preferencia:
a) Determine el espacio muestral.
b) Describa los elementos de los siguientes eventos y su probabilidad de ocurrencia:
A: Todos prefieren viajar a Cuzco.
D: Solamente uno elige Paracas.
F: Por lo menos dos escogen Cuzco.
c) Realiza las siguientes operaciones y sus respectivas probabilidades:
(A ∪ D)
(D ∩ F)
Solución:

107
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Para este experimento aleatorio simbolizamos las posibles respuestas de un alumno:


Viajar a Cuzco: C
Viajar a Paracas: P
a) El espacio muestral será:
Ω = { (C,C, C,), (C, C, P), (C, P, C), (C, P, P), (P, C, C,), (P, C, P), (P, P, C), (P, P, P)}
Los tres alumnos pueden elegir de ocho formas.
b) Encontramos los elementos de cada uno de los tres eventos:
A = {(C, C, C)}
Entonces:
D = {(C, C, P), (C, P, C), (P, C, C)}
Entonces:
F = {(C, C, C), (C, C, P), (C, P, C), (P, C, C)}
Entonces:
c) Realizamos las operaciones respectivas.
(A ∪ D) = {(C, C, C), (C, C, P), (C, P, C), (P, C, C)}
Entonces: = 50%
(D ∩ F) = {(C, C, P), (C, P, C), (P, C, C)}
Entonces: P(D ∩ F)
3. En un grupo del Programa de Lenguas Extranjeras de la UNMSM hay 10 alumnas ru-
bias, 20 morenas, 5 alumnos rubios y 10 morenos. Un día asisten 45 alumnos, encontrar
la probabilidad de que un alumno:
a) Sea hombre.
b) Sea mujer morena.
c) Sea hombre o mujer.
Solución:
a) Sea hombre.

b) Sea mujer morena.

c) Sea hombre o mujer.

108
Estadística aplicada a la Educación

4. Un estudio realizado en una institución educativa sobre problemas visuales, detectó


que el 14% de los alumnos tenía miopía, el 18% presentaba astigmatismo y el 5% ambos
problemas. Si se escoge un alumno al azar, calcularla probabilidad de que:
a) Tenga miopía, astigmatismo o ambos problemas.
b) No sufra de astigmatismo.
c) Padezca solamente de miopía.
d) No tenga estas enfermedades.
e) Presente miopía y a la vez astigmatismo.
Solución:
Definimos los eventos:
A: Alumno con miopía.
B: Alumno con astigmatismo.
Las probabilidades dadas en el problema son:
P (A) = 0,14
P(B) = 0,18
P (A ∩ B) = 0,05
a) Nos están pidiendo P(A ∪ B), entonces, aplicamos la siguiente propiedad:

Sustituyendo los valores:

Por lo tanto la probabilidad de tener miopía, astigmatismo o ambos problemas es del


27%.
b) Nos piden P(B'), empleamos la propiedad del evento complementario:

Reemplazando valores:

En consecuencia la probabilidad de no tener astigmatismo es del 82%.


c) Debemos calcular la P(A - B), usamos la propiedad del evento diferencia:

109
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Sustituyendo los valores:

Luego la probabilidad de padecer únicamente miopía es del 9%.


d) Se procede de manera similar al ejercicio “b”, pero para la unión de eventos realizamos
lo siguiente:

Sustituyendo los valores:


Entonces la probabilidad de no sufrir estos problemas es del 73%.
Ahora nos piden P(A/B), utilizamos la probabilidad condicional:

Luego, la probabilidad de padecer miopía sabiendo que se tiene astigmatismo es del


28%.
5) En una encuesta realizada a los alumnos del Programa de Licenciatura de Lenguas
Extranjeras de la UNMSM se obtuvo los siguientes datos acerca del motivo de su elección
de la universidad para estudiar dicha profesión:

Prestigio Costo Otros


Hombres 420 395 75
Mujeres 400 530 50

Si se elige un alumno al azar:


a) ¿Cuál es la probabilidad de que sea mujer?
b) Determinar la probabilidad de que el motivo de su elección haya sido por el pres-
tigio.
c) ¿Cuál es la probabilidad de que sea hombre y el motivo del costo?
d) Si es mujer, ¿cuál es la probabilidad de que el prestigio de la universidad sea el
motivo de su elección?
e) ¿Cuál es la probabilidad de que sea hombre si se sabe que el motivo de su elección
fue el costo?

110
Estadística aplicada a la Educación

f) Calcula la probabilidad de que sea mujer o que otros fueron los motivos de su
elección.
Solución:
Colocamos los totales en la tabla:

Prestigio Costo Otros Total


Hombres 420 395 75 890
Mujeres 400 530 50 980
Total 820 925 125 1870

a) Tenemos que hallar la: P(mujer):


P(mujer) = = 0,5241 = 52,41%
b) Nos piden calcular la P(prestigio):
P(prestigio) = = 0,4385 = 43,85%
c) Se pide la P (hombre ∩ costo):
P (hombre ∩ costo) = = 0,2112 = 21,12%
d) Debemos calcular la P(prestigio/mujer), aplicamos la probabilidad condicional:

P(prestigio/mujer) = = = 0,4082 = 40,82%

e) Al igual que en el ejercicio anterior se debe encontrar la P (hombre/costo):

P (hombre/costo) = = = 0,4270 = 42,70%

f) Ahora nos piden la P(mujer ∪ costo), utilizamos la propiedad de unión de eventos:


P(mujer ∪ otros) = P(mujer) + P (otros) - P(mujer ∩ otros)
= = 0,5642 = 56,42%

111
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Ejercicios propuestos

1. En un grupo de 30 estudiantes del Programa de Licenciatura de Lenguas Extranjeras


de la UNMSM estudian al menos una de las siguientes materias: Lógica o Estadística, 20
alumnos asisten a Lógica, 21 a Estadística. Encontrar la probabilidad de que un estudian-
te escogido al azar estudie ambos cursos.
2. Se quiere seleccionar por sorteo a un comité conformado por 4 miembros para elaborar
las actividades extraescolares en la I.E. San Mateo Apóstol, entre 10 profesores y los 5
alumnos. Hallar la probabilidad de que dicho comité incluya:
a) Dos profesores y dos alumnos.
b) Un alumno.
3. Un estudiante de la Facultad de Educación resuelve dos pruebas en un mismo día.
La probabilidad de que supere la primera es de un 60%, la posibilidad de que supere la
segunda es de 80% y de que supere las dos es de 50%. Calcular:
a)La probabilidad de que supere, al menos, una de las pruebas.
b) La probabilidad de que no supere ninguna prueba.
4. En una reunión hay 50 ex alumnos, de los cuales 20 hablan francés y 40 inglés.
a) ¿Cuál es la probabilidad de que eligiendo a un conferenciante al azar solo hable
inglés?
b) ¿De que hable francés?
c) ¿De que hable inglés y alemán?
d) ¿Cuál es la probabilidad de que dos miembros elegidos al azar no puedan enten-
derse?
5. Un grupo de alumnos del PROLEX está formado por 10 hombres y 10 mujeres, la mitad
de las mujeres y la mitad de los hombres han elegido francés como asignatura optativa.
a)¿Cuál es la probabilidad de que una persona elegida al azar sea hombre o estudie
francés?
b)¿Y la probabilidad de que sea mujer y no estudie francés?

112
Estadística aplicada a la Educación

Autoevaluación de la unidad 3

1. La probabilidad de un evento seguro toma valor igual a:


a) 1,00
b) 0,344
c) 0,00
d) 0,75
e) 0,10
2. La probabilidad de un evento puede tomar valor igual a:
a) 2,478
b) 0,344
c) 5,44
d) 10,25
e) 1,01
3. Un estudio dirigido a docentes de la especialidad de inglés del nivel secundario de la
UGEL 5 reporta que el 20% prefiere escuchar la estación radial Oxígeno y un 30% pre-
fiere Radio Miraflores, mientras que un 40% escucha Oxígeno o Miraflores. Si se elige al
azar un docente de la población, cuál es la probabilidad de escuche ambas radios.
a) 12%
b) 10%
c) 16%
d) 18 %
e) 40%
4) A un congreso internacional de Educación asisten 40 mujeres, de cuales 10 hablan
francés, y también estás presentes 30 hombres, 4 de ellos hablan francés. Se elige un
congresista al azar, calcular la probabilidad de que sea mujer o hable francés.
a) 0,68
b) 0,40
c) 0,63
d) 0,60
e) 0,50

113
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

5. Las probabilidades de que un hombre y una mujer de 40 años de edad vivan hasta los
75 años son 0,49 y 0,53, respectivamente. Hallar la probabilidad de que ninguno llegue
a los 75 años.
a) 0,30
b) 0,20
c) 0,26
d) 0,24
e) 0,10

6. En una institución educativa, 22 de cada 100 chicas y 5 de cada 10 chicos llevan lentes.
Si el número de chicas es tres veces superior al de los chicos, hallar la probabilidad de
que un estudiante elegido al azar sea chica, sabiendo que lleva lentes.
a) 0,57%
b) 0,50%
c) 0,60%
d) 0,54%
e) 0,55%

7. El departamento de selección de personal de la Facultad de Educación entrevista a 65


docentes para el dictado del curso de Estadística Aplicada a la Educación en el Programa
de Lenguas Extranjeras. De ellos, 35 poseen experiencia laboral previa y 40 disponen de
un título universitario. ¿Cuál es la probabilidad de que se elija a un docente que tenga
experiencia laboral y un título universitario?
a) 15,38%
b) 18,53%
c) 16,23%
d) 23,18%
e) 14,92%
8. Las estadísticas deportivas en vóley de los equipos de la UNMSM y la UNI son las
siguientes: el 25% de las veces ha ganado el equipo de la UNMSM, el 45% de las veces
ha ganado la UNI y el 30% han empatado. En el próximo torneo van a enfrentarse en
tres ocasiones. ¿Cuál es la probabilidad de que el equipo de la UNMSM gane los tres
partidos?

114
Estadística aplicada a la Educación

a) 2,56%
b) 3,56%
c) 4,24%
d) 1,56%
e) 2,32%
9. En un aula de 24 estudiantes de 1ero de educación secundaria, los profesores de
Matemáticas, Comunicación e Inglés revisan cada día al azar los cuadernos a algunos
alumnos. El de Matemática a 4 alumnos, el de Comunicación a 6 y el de Inglés a 8. ¿Ha-
llar la probabilidad de que a un alumno, le revisen 2 cuadernos en un mismo día?
a) 16,08%
b) 13,82%
c) 15,21%
d) 17,46%
e) 18,06%
10. Completa la siguiente tabla de contingencia que muestra la distribución de tres sec-
ciones del 4to año de una institución educativa.

Alumnos Alumnas
A 30
B 60 100
C 78
100 232

Sabiendo que es alumna, ¿cuál es la probabilidad de que corresponda a la sección C?


a) 32,32%
b) 36,36%
c) 35,64%
d) 34,21%
e) 33,42%

115
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

LECTURA N.° 3

Primeras definiciones y teoremas básicos


Laplace, Pierre-Simon
Ensayo filosófico sobre las probabilidades
El primero en dar la definición clásica de probabilidad fue Jacob Bernoulli (1654–1705), matemá-
tico suizo que trabajó en la universidad de Basilea en 1687, en su obra “Ars conjectandi” (El arte
de la conjetura) que fue publicada algunos años después de la muerte del autor. En esta obra en-
contramos, entre otras cosas, la importante proposición conocida como el Teorema de Bernoulli,
mediante el cual la Teoría de la Probabilidad fue elevada por primera vez del nivel elemental de
conjunto de soluciones de problemas particulares a un resultado de importancia general. Bernoulli
siempre destacó la importancia de que los fenómenos aleatorios dejaran de enfocarse como casos
particulares y se intentara ver los conceptos generales que habían detrás de ellos, solo así se
avanzaría y profundizaría en el entendimiento de esta materia.
Más adelante, el matemático francés exiliado en Inglaterra Abraham De Moivre (1667-1754) acep-
tó la definición dada por Bernoulli y la reformuló en términos más modernos para la época: «Una
fracción en la que el numerador es igual al número de apariciones del suceso y el denominador es
igual al número total de casos en los que el suceso pueda o no pueda ocurrir. Tal fracción expresa
la probabilidad de que ocurra el suceso».
La definición clásica de la probabilidad, en su forma actual, está basada en el concepto de equi-
probabilidad de los resultados basado a su vez en la simetría. Se supone que un experimento se
puede descomponer en n sucesos equiprobables y mutuamente excluyentes B1… Bn llamados
sucesos básicos o ‘elementales’. Así, la probabilidad de suceso A es el número del intervalo [0,1]
que expresa el cociente entre los m sucesos elementales que componen A y el número total n
de posibles sucesos elementales. La traba fundamental que encuentra esta interpretación de la
probabilidad es la dificultad de descomponer un suceso en sucesos elementales equiprobables;
lo que es fácil para problemas sencillos (cartas, dados, etc.), pero representa gran dificultad en
problemas más complicados.
Además, otro de los descubrimientos importantes de Bernoulli fue el saber obtener la probabilidad
de ocurrencia de un suceso sin necesidad de contar los casos favorables (bien por omisión de
datos o bien por la imposibilidad de contarlos). Para ello inventó la probabilidad a posteriori, es
decir: “mediante la observación múltiple de los resultados de pruebas similares”. De esta manera,
introdujo el concepto de probabilidad ‘estadística’: asignar como probabilidad de un suceso el re-
sultado que se obtendría si el proceso se repitiera en condiciones similares un número grande de
veces. Sin embargo, estas condiciones no eran muy concretas y con ellas no se podía dar lugar a
una definición seria y rigurosa de todos los conceptos que manejaba Bernoulli. En primer lugar, se
habla de un ‘número grande’ de veces, pero no se da ninguna indicación sobre cuál es ese número
o lo suficientemente grande que debe ser, no se especifica tampoco que significa condiciones
similares y tampoco se establece cuál es el error admitido respecto al resultado teórico.
Precisamente, fueron la necesidad de precisar con exactitud qué se entiende por un ‘número grande’
de repeticiones y de calcular el error del resultado obtenido respecto del resultado teórico, lo que
llevaron a Jacob Bernoulli a idear, en su forma más intuitiva y básica, la Ley de los Grandes Números.

116
Estadística aplicada a la Educación

A continuación expondremos los tres teoremas más importantes de la probabilidad clásica. Estos
teoremas fueron ideados por Bernoulli (Teorema de la suma, formalizado por Bayes), De Moivre
(Teorema de la multiplicación) y Bayes (Teorema de la probabilidad condicionada), aunque todos
los conceptos que se manejan en estos teoremas aparecen ya de forma implícita y muy frecuente
en los diferentes trabajos de Pascal, Fermat y Huygens.

Teorema de la Suma
Pascal dio a entender implícitamente que sabía cómo calcular los casos favorables de un suceso
A, si conocía los casos favorables de sucesos Aj disjuntos cuya unión es A (es decir, si los Aj
son una partición de A). Jacob Bernoulli también fue consciente de ello y fue más lejos al darse
cuenta de que la probabilidad de la unión no es la suma de las probabilidades si los sucesos no
son disjuntos, aunque no supo dar la razón. No fue ninguno de ellos quien formuló finalmente el
teorema de la suma de las probabilidades, sino el reverendo inglés Thomas Bayes (1702-1761),
cuyo trabajo fue leído póstumamente en 1763. En esta obra, Bayes propone la primera definición
rigurosa y explícita de sucesos disjuntos y enunció la fórmula ahora conocida:

Teorema de la Multiplicación
Al igual que el teorema anterior, el teorema de la multiplicación de probabilidades era conocido por
casi todos los matemáticos anteriores a través de resultados particulares. No obstante, fue Abraham
De Moivre el primero que lo enunció rigurosamente. De Moivre fue un hugonote francés que debido a
su religión se ausentó de Francia y vivió como refugiado en Inglaterra. Allí publicó su obra The doctri-
ne of chances (Doctrina de las Probabilidades) en 1711. De Moivre presentó el importante concepto
de independencia de sucesos aleatorios, así escribió: “Diremos que dos sucesos son independien-
tes, si el primero de ellos no tiene ninguna relación con el otro” y procedió a definir los sucesos depen-
dientes: “Dos sucesos son dependientes si están ligados el uno al otro y la probabilidad de ocurrencia
de uno de ellos influye en la probabilidad de ocurrencia del otro”. Una vez hecho esto, De Moivre lo
aplicó al cálculo de probabilidades: «La probabilidad de ocurrencia de dos sucesos dependientes es
igual a la probabilidad de ocurrencia de uno de ellos dividida por la probabilidad de que el otro ocurra
si el primero ya ha ocurrido». Esta regla puede generalizarse para varios sucesos. El caso de varios
sucesos lo describía así: “Se necesita elegir uno de ellos como el primero, otro como el segundo y
luego, la ocurrencia del primero debe considerarse independiente de todas las demás, el segundo
debe considerarse con la condición de que el primero ha ocurrido: el tercero con la condición de que
tanto el primero como el segundo han ocurrido. De aquí, la probabilidad de que las ocurrencias de
todos los sucesos es igual al producto de todas las probabilidades”. Esto es:

117
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

La obra de De Moivre contó con tres ediciones, lo cual da una idea del gran interés que despertó
esta materia en aquella época. En las dos últimas ediciones de la obra, el autor también da las
primeras indicaciones acerca de la distribución normal de las probabilidades, las cuales más tarde
presentarían un rol sumamente importante en el desarrollo la teoría de la probabilidad.
Teorema de Bayes:
El trabajo De Moivre fue seguido y difundido en la mayoría de los círculos científicos importantes
de Europa y fue el británico Thomas Bayes, probablemente alumno de De Moivre en Londres,
quien extendió el trabajo del francés y expresó la probabilidad condicional en función de la proba-
bilidad de la intersección:

Además, el teorema que lleva su nombre no es solo suyo, ya que Bayes no estaba en condiciones
de formular con probabilidades totales. Fue Pierre-Simon Laplace (1749-1827) quien mejoró y
desarrolló la mayor parte del teorema de Bayes en su Théorie analytique des probabilités (Expe-
riencia en la Filosofía de la Teoría de la Probabilidad) en 1812.
Sea A un suceso que ocurre en conjunción con uno solo de los n sucesos disjuntos B1… Bn. Si se
sabe que el suceso A ha ocurrido, ¿cuál es la probabilidad de que el suceso BJ también? Laplace
respondió de la siguiente manera: “La probabilidad de existencia de una de esas causas es igual
a una fracción con un numerador igual a la probabilidad del suceso que se sigue de esta causa
y un denominador que es la suma de las probabilidades relativas a todas las posibles causas. Si
estas diferentes causas a priori no son equiprobables, entonces, en lugar de tomar la probabilidad
del suceso que sigue a cada causa, se toma el producto de esta probabilidad por tantas veces la
probabilidad de la causa”. Esta fórmula se escribe en notación más actual de la siguiente manera:

Aparte de esta revisión importantísima del teorema de Bayes, Laplace incluye en su obra una ex-
posición sistemática muy completa de la teoría matemática de los juegos de azar con aplicaciones
a una gran variedad de cuestiones científicas y prácticas. En su libro citado anteriormente dedica
una extensa introducción escrita para los lectores no matemáticos y explica sus puntos de vista
generales sobre todas las cuestiones y apreciaciones de los resultados alcanzados con la ayuda
de la teoría de la probabilidad.
El estudio de esta introducción es muy famoso y se recomienda a todos los interesados en la
historia de la ciencia.

118
Unidad 4

Regresión y Correlación

Capacidades a desarrollar
¾¾ Determinar la relación de dependencia entre dos
variables.
¾¾ Calcular e interpretar los coeficientes de correlación
Estadística aplicada a la Educación

Introducción
En muchas situaciones cotidianas se presentan circunstancias en las que parecen estar
relacionadas dos o más variables. Por ejemplo:
• El gasto de una familia y el ingreso familiar.
• Las horas de práctica del curso de Estadística y el número de estudiantes que lo
reprueban.
• El tiempo efectivo de servicio de los trabajadores y la edad.
• La producción y venta de una fábrica.
Existe una técnica para establecer matemáticamente la relación que puede existir entre
variables como las señaladas anteriormente. Esta técnica es el análisis de regresión.

4.1. Conceptos básicos


4.1.1. Regresión
La regresión es un método de cálculo para establecer una relación matemática entre dos
o más variables. Este método aplicado a la estadística permite predecir matemáticamente
el comportamiento de una variable a partir del comportamiento conocido de otra u otras
variables. Esta relación entre las variables se establece a través de una ecuación que se
llama Ecuación de Regresión.
Al establecer la relación entre dos variables encontramos una variable independiente, la
cual en el plano cartesiano se sitúa en el eje “x” y otra dependiente, la cual se sitúa en el
eje “y”.
Ejemplo:
El gasto de una familia y el El ingreso familiar: independiente.
ingreso familiar.
El gasto de una familia: dependiente.

Podemos representar esta relación mediante un gráfico de dispersión, el cual es la repre-


sentación gráfica en el plano cartesiano de los valores que toma la variable independiente
(x) y la variable dependiente (y).
Veamos:
Al analizar la edad y el tiempo de servicio de los trabajadores se consideró lo siguiente:
Edad x 48 40 30 42 27 34 40 32
Tiempo de servicio y 24 18 9 22 4 10 16 8

121
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

La representación gráfica de los valores de esta tabla en el plano cartesiano recibe el


nombre de Gráfico de Dispersión, así tenemos:

4.1.2. Tipos de relación entre las variables


Como ya sabemos, la relación entre dos o más variables recibe el nombre de regresión,
cuya clasificación la podemos apreciar en el siguiente esquema:

Esquema: Tipos de Regresión

Fuente: Adaptado de Rincón (2011).

122
Estadística aplicada a la Educación

Así es como los tipos de relación entre variables van de acuerdo:


1. A la cantidad de variables que se relacionan, pueden ser: regresión univariada o mul-
tivariada.
a) Regresión univariada, solo interviene una variable independiente.
b) Regresión multivariada, interviene más de una variable independiente.
2. A la representación gráfica de la ecuación de regresión, pueden ser: regresión lineal
o curvilínea.
a) Regresión lineal, cuando la representación gráfica de la ecuación de regresión es una
línea recta. Al mismo tiempo, esta regresión lineal puede ser directa e inversa.
• Regresión lineal directa, Sucede cuando al aumentar el valor de la variable
independiente aumenta en forma proporcional el valor de la variable dependiente.
Por lo tanto, una recta parece describir de manera apropiada la relación entre estas
variables. Gráficamente, podemos apreciar lo siguiente:

• Regresión lineal inversa, Sucede cuando al aumentar el valor de la variable


independiente disminuye el valor de la variable dependiente en una proporción similar.
A continuación, veamos su representación gráfica:

123
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

b) Regresión Curvilínea, cuando la representación gráfica de la ecuación de regresión


es una línea curva, esta regresión también puede ser directa e inversa.
• Regresión curvilínea directa, Sucede cuando al aumentar el valor de la variable
independiente, la variable dependiente aumenta más que proporcionalmente.
La representación gráfica de una regresión curvilínea directa se representa de la siguien-
te manera:

• Regresión curvilínea inversa, Sucede cuando al aumentar el valor de la variable


independiente, la variable dependiente disminuye más que proporcionalmente.
La representación gráfica de una regresión curvilínea inversa viene a ser de la siguiente
manera:

4.2. La regresión lineal


Cuando los puntos del gráfico de dispersión se pueden relacionar mediante una línea
recta que pase muy cercana a todos los puntos.
Esta recta tiene por ecuación:

124
Estadística aplicada a la Educación

Donde:
y = variable dependiente
x = variable independiente

4.2.1. La recta de regresión


Si deseamos ajustar la nube de puntos haremos uso de la recta de regresión. La recta de
regresión pasa por el punto ( ) llamado centro de gravedad.
a) Recta de regresión de y sobre x
La recta de regresión de y sobre x se utiliza para estimar los valores de la variable y a
partir de los valores de la variable x.
La pendiente de la recta se calcula a partir del cociente entre la covarianza y la varianza
de la variable x.

b)Recta de regresión de x sobre y


La recta de regresión de x sobre y se utiliza para estimar los valores de la variable x a
partir de los valores de la variable y.
La pendiente de la recta se calcula a partir del cociente entre la covarianza y la varianza
de la variable y.

Si la correlación es nula, r = 0, las rectas de regresión son perpendiculares entre sí y sus


ecuaciones son:

125
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Antes de resolver algunos ejemplos sobre regresión lineal y correlación, es bueno tener
presente las fórmulas que nos van ayudar a encontrar tanto las rectas de regresión como
el coeficiente de correlación también llamado correlación de Pearson.

Media aritmética

Varianzas

Desviaciones típicas o estándares

Covarianza

Recta de regresión y sobre x Recta de regresión x sobre y

Veamos a continuación el siguiente ejemplo:


Las participaciones de doce alumnos de la I. E. Santo Tomás de Aquino en la clase de
Matemática y Física son las siguientes:

Matemática 2 3 4 4 5 6 6 7 7 8 10 10
Física 1 3 2 4 4 4 6 4 6 7 9 10

Solución:
Hallando las rectas de regresión.

126
Estadística aplicada a la Educación

xi yi xi · y i xi2 yi2
2 1 2 4 1
3 3 9 9 9
4 2 8 16 4
4 4 16 16 16
5 4 20 25 16
6 4 24 36 16
6 6 36 36 36
7 4 28 49 16
7 6 42 49 36
8 7 56 64 49
10 9 90 100 81
10 10 100 100 100
∑=72 ∑=60 ∑=431 ∑=504 ∑=380
1.º Hallamos las medias aritméticas:

2.º Calculamos la covarianza:

3.º Calculamos las varianzas:

4.º Recta de regresión de y sobre x:


y = 0,986 x – 0,916

127
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

5.º Recta de regresión de x sobre y:



x = 0,888 y + 1,56

4.3. Correlación lineal


La correlación es la forma numérica en que se evalúa la relación de dos o más variables;
por lo tanto, mide la dependencia de una variable con respecto de otra variable inde-
pendiente. El coeficiente de correlación lineal resulta de dividir la covarianza entre el
producto de las desviaciones típicas de ambas variables.
El coeficiente de correlación lineal se expresa mediante la letra r y se calcula median-
te la siguiente ecuación:

4.3.1. Propiedades del coeficiente de correlación


• El coeficiente de correlación no varía al hacer la escala de medición, es decir, si
expresamos la altura en metros o en centímetros el coeficiente de correlación no varía.
• El signo del coeficiente de correlación es el mismo que el de la covarianza.
• Si la covarianza es positiva, la correlación es directa, si la covarianza es negativa, la
correlación es inversa y si la covarianza es nula, no existe correlación.
• El coeficiente de correlación lineal es un número real comprendido entre −1 y 1.
−1 ≤ r ≤ 1
• Si el coeficiente de correlación lineal toma valores cercanos a −1, la correlación es
fuerte e inversa y será más fuerte cuanto más se aproxime r a −1.
• Si el coeficiente de correlación lineal toma valores cercanos a 1, la correlación es fuerte
y directa y será más fuerte cuanto más se aproxime r a 1.
• Si el coeficiente de correlación lineal toma valores cercanos a 0, la correlación es débil.
• Si r = 1 o −1, los puntos de la nube están sobre la recta creciente o decreciente. Entre
ambas variables hay dependencia funcional.
Veamos el siguiente ejemplo:
Las participaciones de doce alumnos de una clase en Matemáticas y Física son las si-
guientes:

128
Estadística aplicada a la Educación

Matemática 2 3 4 4 5 6 6 7 7 8 10 10
Física 1 3 2 4 4 4 6 4 6 7 9 10

Hallar el coeficiente de correlación de la distribución e interpretarlo.


Solución:
xi yi xi . y i xi2 yi2
2 1 2 4 1
3 3 9 9 9
4 2 8 16 4
4 4 16 16 16
5 4 20 25 16
6 4 24 36 16
6 6 36 36 36
7 4 28 49 16
7 6 42 49 36
8 7 56 64 49
10 9 90 100 81
10 10 100 100 100
∑=72 ∑=60 ∑=431 ∑=504 ∑=380

1.º Hallamos las medias aritméticas:

2.º Calculamos la covarianza:


3.º Calculamos las desviaciones típicas:

129
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

4.º Aplicamos la fórmula del coeficiente de correlación lineal:

Interpretación: Al ser el coeficiente de correlación positivo, la correlación es directa y


como está muy próximo a 1, la correlación es muy fuerte.

130
Estadística aplicada a la Educación

Ejercicios resueltos

1. En la I. E. Juana Alarco se realiza una investigación 5 cinco niños de los niveles de


inicial y primaria de 2, 3, 5, 7 y 8 años de edad, los cuales pesan 14, 20, 32, 42 y 44 kilos,
respectivamente,
a) Hallar la ecuación de la recta de regresión de la edad sobre el peso y viceversa.
b) ¿Cuál sería el peso aproximado de un niño de seis años?
Solución:
Elaboramos la siguiente tabla:
Edad Peso
xi2 yi2 xi . y i
xi yi
2 14 4 196 28
3 20 9 400 60
5 32 25 1 024 160
7 42 49 1 764 294
8 44 64 1 936 352
∑=25 ∑=152 ∑=151 ∑=5 320 ∑=894
Luego:
a) Hallamos las medias:


Hallamos las varianzas:


Hallamos la covarianza:


La recta de regresión edad sobre peso:
x – 5 = 0,192 (y – 30)
x = 0,192y – 0,76
La recta de regresión peso sobre edad:
y – 30,4 = 5,154 (x – 5)

131
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

y = 5,15x + 4,65
b) y = 5,15 (6) + 4,65
y = 35,57 kg

2. Las notas obtenidas por cinco alumnos de la I.E. Miguel Grau en Francés e Inglés son:

Francés 06 04 08 05 03,5
Inglés 06,5 04,5 07 05 04
Determinar las rectas de regresión y calcular la nota esperada en Inglés para un alumno
que tiene 7,5 en Francés.

Solución:
Francés Inglés
xi2 yi2 x i. y i
xi yi
6 6,5 36 42,25 39
4 4,5 16 20,25 18
8 7 64 49 56
5 5 25 25 25
3,5 4 12,25 16 14
∑=26,50 ∑=27 ∑=153,25 ∑=152,50 ∑=152
Determinando las rectas de regresión.
1.º Hallamos las medias:


2.º Hallamos las varianzas:


3.º Hallamos la covarianza:


4.º Hallamos la recta de regresión de y sobre x

132
Estadística aplicada a la Educación

5.º Hallamos la recta de regresión de x sobre y

x = 1,328y – 1,873
Calculando la nota esperada:
y = 0,695(7,5) + 1,715
y = 6,928

3. En la tabla siguiente se indica la edad (en años) y la conducta agresiva (medida en una
escala de 0 a 10) de 10 niños.
Edad 6 6,4 6,7 7 7,4 7,9 8 8,2 8,5 8,9
Conducta agresiva 9 6 7 8 7 4 2 3 3 1
Calcular
a) Obtener la recta de regresión de la conducta agresiva en función de la edad.
b) A partir de dicha recta, obtener el valor de la conducta agresiva que correspondería a
un niño de 7,2 años.
Solución:
Conducta
Edad
agresiva xi2 yi2 xi . y i
xi
yi
6 9 36 81 54
6,4 6 40,96 36 38,4
6,7 7 44,89 49 46,9
7 8 49 64 56
7,4 7 54,76 49 51,8
7,9 4 62,41 16 31,6
8 2 64 4 16
8,2 3 67,24 9 24,6
8,5 2 72,25 4 17
8,9 1 79,21 1 8,9
∑=75 ∑=49 ∑=570,72 ∑=313 ∑=345,2

133
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Hallamos las medias:


Hallamos las varianzas:

Hallamos la covarianza:

Hallamos la recta de regresión de y sobre x:


y – 4,9 = -2,713 (x – 7,5)
y = -2,713x+ 25,248
b) y = -2,713 (7,2) + 25,248
y = 5,714

4. El número de horas dedicadas al estudio de una asignatura y la calificación obtenida


en el examen correspondiente de ocho personas es:

Horas (X) 20 16 34 23 27 32 18 22
Calificación (Y) 6,5 6 8,5 7 9 9,5 7,5 8

Calcular:
a) La recta de regresión de y sobre x.
b) Calificación estimada para una persona que hubiese estudiado 28 horas.

Solución:

134
Estadística aplicada a la Educación

Horas Calificación
xi xi xi2 yi2 xi . y i
16 6 256 36 96
18 7,5 324 56,25 135
20 6,5 400 42,25 130
22 8 484 64 176
23 7 529 49 161
27 9 729 81 243
32 9,5 1 024 90,25 304
34 8,5 1156 72,25 289
∑=192 ∑=62 ∑=4 902 ∑=491 ∑=1534
Hallamos las medias:


Hallamos la varianza:

Hallamos la recta de regresión de y sobre x:

y = 0,156x + 4,006
b) y = 0,156(28) + 4,006
y = 8,4

5. Las estaturas y pesos de 10 jugadores del equipo de basquet de la UNMSM son las
siguientes:

Estatura (x) 186 189 190 192 193 193 198 201 203 205

Peso (y) 85 85 86 90 87 91 93 103 100 101

135
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Calcular:
a) La recta de regresión de y sobre x.
b) El coeficiente de correlación.
c) El peso estimado de un jugador que mide 208 cm.
Solución:

xi yi xi2 yi2 xi · y i

186 85 34 596 7 225 15 810

189 85 35 721 7 225 16 065

190 86 36 100 7 396 16 340

192 90 36 864 8 100 17 280

193 87 37 249 7 569 16 791

193 91 37 249 8 281 17563

198 93 39 204 8 649 18 414

201 103 40 401 10 609 20 703

203 100 41 209 10 000 20 300

205 101 42 025 10 201 20 705

1 950 921 380 618 85 255 179 971

a) Hallamos las medias:


Hallamos las varianzas:


Hallamos las desviaciones típicas o estándar:

136
Estadística aplicada a la Educación

Hallamos la recta de regresión de y sobre x.


y – 92,10 = 1,02 (x – 195)
y= 1,02x – 106,80
b)

Correlación positiva muy fuerte.


y = 1,02(208) – 106,80
y = 105,36 kg

137
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Ejercicios propuestos

1. Un investigador cree que la inteligencia de los niños, medida a través del coeficiente
intelectual (CI en puntos) depende del número de hermanos de este. Entonces, toma
una muestra aleatoria de 15 niños y ajusta una regresión lineal simple. Los resultados
aparecen en la tabla adjunta.

CI 110 115 120 118 110 108 105 104 98 99 98 100 90 93 90

Hermanos 0 1 1 1 2 2 2 3 3 4 4 5 5 5 6

Calcular:
La recta de regresión de y sobre x.
El coeficiente de correlación.

2. Hay interés en conocer qué tipo de relación existe entre el número de horas diarias de-
dicadas al estudio por 10 alumnos universitarios y la nota que obtienen al final del curso.
La información obtenida fue la siguiente:

N.º horas de estudio 3 4 3 5 6 7 5 8 8 10

Nota final 12 13 13 16 17 17 16 17 18 18

Calcular:
a) La recta de regresión de y sobre x.
b) El coeficiente de correlación.

3. La información siguiente corresponde a puntajes obtenidos por 8 estudiantes en su


examen final del curso de Estadística y su nota promedio del campus virtual.
a) Determinar la ecuación de regresión lineal de y sobre x.
b) Calcular el coeficiente de correlación lineal.

138
Estadística aplicada a la Educación

Examen Final 10 16 15 14 12 11 17 14

Promedio de Campus Virtual 11 15 14 12 12 12 16 15

4. Se ha realizado una encuesta a un grupo de docentes, preguntándoles por el número


de personas que habitan su hogar y el número de habitaciones con los que cuenta la
casa. La tabla siguiente recoge la información obtenida:

N.° de personas 3 5 4 6 5 4

N.° de habitaciones 2 3 4 4 3 3

Hallar el coeficiente de correlación. ¿Cómo es la relación entre las dos variables?

5. La estatura, medida en centímetros, de seis chicos de la misma edad y la de sus pa-


dres es determinada en la siguiente tabla:

Hijo: x 160 150 160 170 180 170

Padre: y 180 170 175 185 180 175

a) Hallar las dos rectas de regresión.


b) Observando el grado de proximidad entre las dos rectas, ¿cómo crees que será la
correlación entre las dos variables?

139
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Autoevaluación de la unidad 4

Responde las preguntas 1 y 2 de acuerdo al siguiente estudio:


Se ha preguntado a los alumnos de la I. E. República de Chile cuál es el número
de horas de estudio diario (X) y el número de asignaturas aprobadas al final del año
escolar (Y). A la nube de puntos resultado de la encuesta se ha ajustado la recta de
regresión y = 3,8x + 0,2.

1. Para aprobar 4 asignaturas, ¿cuánto tiempo de estudio deberían emplear?


a) 30 minutos
b) 1 hora
c) 1 hora y media
d) 2 horas
e) 2 horas y media
2. Y para superar las 11 asignaturas, es decir, todas, ¿cuál sería la recomendación de
horas de estudio?
a) 1,84 horas
b) 1,96 horas
c) 2,54 horas
d) 2,76 horas
e) 2,84 horas
De acuerdo a los siguientes datos, responde las preguntas 3, 4 y 5.
La media de los pesos de un grupo de alumnos del PROLEX es de 72 kilogramos y la de
sus estaturas, 173 centímetros. Las desviaciones típicas son de 4 kilogramos y 9 centí-
metros, mientras que la covarianza es 35.
3. ¿Cuál es el coeficiente de correlación?
a) 0,6922
b) 0,7211
c) 0,8355
d) 0,9722
e) 0,9988
4. Calcula la recta de regresión del peso respecto a la estatura.

140
Estadística aplicada a la Educación

a) y = 0,1675x + 16,5
b) = 1,3875x + 15,5
c) y = 2,1875x + 15,5
d) y = 2,7275x + 14,5
e) y = 2,1641x + 13,5
5. ¿Cuál es el peso estimado para un individuo de 182 centímetros?
a) 76,1143 kg
b) 72,3012 kg
c) 78,4628 kg
d) 68,4311 kg
e) 69,2865 kg

141
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

LECTURA N.° 4

La estadística en la investigación educativa


Javier Gil Flores
Extracto de la revista de Investigación Educativa, 2003
Vol. 21, N.º 1, págs. 231-248
Pocas objeciones pueden hacerse a la idea de que la estadística es una herramienta fundamental
para la investigación científica y consideramos que esta afirmación es igualmente válida en el caso
de la investigación educativa. De ahí, que muchas titulaciones universitarias, y en particular las del
ámbito de las Ciencias de la Educación, incluyan en sus planes de estudios asignaturas de con-
tenido estadístico que frecuentemente encuentran una continuidad en la formación investigadora
dispensada a través de los programas de tercer ciclo. Sin embargo, la estadística trasciende el
contexto académico y está presente en distintos ámbitos de la actividad humana. Si examinamos
el sentido que popularmente se da a la estadística, encontramos que la opinión pública está más
familiarizada con el término estadísticas, en plural. Con frecuencia aparecen en los medios de
comunicación informaciones acerca de acontecimientos de la esfera política, económica o social,
que son expresadas en forma de o acompañadas de estadísticas. Así, podemos referirnos a las
estadísticas sobre los resultados de comicios, la evolución del IPC en las distintas comunidades
autónomas, la superficie forestal devastada por los incendios en la última década, etc. En definiti-
va, la idea de estadísticas en el hombre de a pie quedaría asociada a la de información numérica, a
veces apoyada en la representación gráfica con la que se pretende expresar la importancia cuanti-
tativa o magnitud de algunos fenómenos, sucesos, realidades o se muestra comparativamente su
modificación al variar las coordenadas espacio-tiempo.
Las estadísticas, desde esta percepción, se traducen en un conjunto de datos numéricos reco-
gidos sobre una realidad o a los productos de su procesamiento a través de la aplicación de un
método sistemático de trabajo. Los procedimientos para llegar a esos resultados, consistentes
en la recopilación, ordenación y presentación constituirían la estadística (esta vez en singular).
El estadístico, por tanto, aparece como alguien que recopila grandes cantidades de información
cuantitativa y después consigue obtener valores numéricos representativos de esa información,
los cuales permitirán y tal vez fundamentar la adopción de medidas de tipo político, económico,
administrativo. Sin embargo, la recopilación y descripción de conjuntos de datos numéricos es solo
una de las tareas de la estadística.
Esta idea de la estadística asociada a conjuntos de informaciones expresadas numéricamente ha
estado presente desde sus orígenes, pero el concepto de estadística ha evolucionado histórica-
mente. Las definiciones iniciales que limitaban la estadística a los métodos de recopilación y orde-
nación de datos, clasificados y corregidos, acerca de aspectos de interés para la administración
de los Estados, dieron paso en una etapa posterior a otras que caracterizan la estadística como
una verdadera ciencia, estrechamente conectada a la teoría de las probabilidades. Tras fusionarse
en el siglo XIX con la corriente de estudios sobre el cálculo de probabilidades, se constituyó en
una rama de la matemática aplicada, entendiendo esta como el uso de los principios y modelos
matemáticos en diversos ámbitos de la ciencia o la técnica. Dentro de la propia estadística, a su
vez, podemos diferenciar dos vertientes: una que ha sido denominada con los calificativos de

142
Estadística aplicada a la Educación

formal, teórica, matemática o pura, y otra que conocemos como estadística aplicada. Esta última
juega un papel clave en muchos ámbitos científicos, al servicio de la investigación y el análisis de
la realidad.
Alcanzar una definición única de la ciencia estadística resulta una tarea difícil. De acuerdo con los
datos aportados por Piatier (1967), ya en 1870 el número de definiciones se elevaba a 63 y, en
1935, Willcox presentaba hasta un total de 115 definiciones en su artículo «Definitions of statis-
tics», publicado en N.º 3 de la Revue de l’Institut International de Statistique.
En este sentido, cabe también mencionar la conocida afirmación que realizara sir M.G. Kendall
en 1945, señalando que entre los temas respecto a los que los estadísticos no están de acuerdo,
se encuentra precisamente la definición de su propia ciencia. Y llegaríamos a la conclusión de
que esta idea posiblemente conserva cierta vigencia si examináramos la variedad de definiciones
que muchos manuales dedicados a esta materia incluyen en prefacios, introducciones o capítulos
iniciales que tratan de concretar el campo de estudio en el que se centrará la obra. Desde nuestro
punto de vista, en una definición de estadística resultarían característicos rasgos como los que
sintetizamos a continuación:
• La estadística es una ciencia que tiene por objeto el estudio de métodos y técnicas para el
tratamiento de conjuntos de datos numéricos.
• Las técnicas estadísticas permiten la descripción de conjuntos de datos y la inferencia sobre
conjuntos más amplios.
• Los métodos desarrollados por la estadística pueden ser aplicados en distintos campos del
saber, constituyendo un importante instrumento para el estudio científico.
Centrando la atención sobre la estadística aplicada al campo de la investigación educativa, la esta-
dística habrá de ser vista como un conjunto de métodos, técnicas y procedimientos para el manejo
de datos, su ordenación, presentación, descripción, análisis e interpretación, que contribuyen al
estudio científico de los problemas planteados en el ámbito de la educación y a la adquisición de
conocimiento sobre las realidades educativas, a la toma de decisiones y a la mejora de la práctica
desarrollada por los profesionales de la educación.
Volviendo a la imagen popular de la estadística, entre las personas que no se cuentan entre sus
estudiosos o aplicadores ha sido a veces objeto de definiciones —o mejor, calificaciones— que
encierran una cierta crítica, tratando de cuestionar los métodos del conocimiento estadístico y en
consecuencia los resultados derivados de la aplicación de los mismos. Lógicamente se trata de
definiciones que desde el punto de vista epistemológico no tienen mayor interés, pero que apun-
tan hacia concepciones que podrían encontrarse entre las ideas previas del ciudadano común y
también del profano que inicia el estudio sistemático de esta disciplina. Así, la caricaturización de
la estadística queda reflejada en afirmaciones de tono humorístico como: «La estadística es la
ciencia que explica cómo si tú te comes dos pollos y yo ninguno, nos hemos comido uno cada uno
por término medio» (Peña, 1987:19-20) o la frase de Bernard Shaw «Si un hombre tiene la cabeza
en un horno y los pies en la nevera, su cuerpo está a una temperatura media ideal». La estadística,
desde este punto de vista, sería la ciencia que permite ocultar las diferencias individuales a través
de los valores promedio. Esta creencia de que puede servir, más que para revelar, para ocultar
información ha dado lugar a que la estadística haya podido ser considerada un instrumento al ser-

143
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

vicio del engaño o la manipulación. El estadístico, según Glass y Stanley (1980), ha sido tachado
de mentiroso y se le ha acusado de ejercer el arte de mentir con estadísticas, manteniendo una
apariencia de objetividad y veracidad. Macauley (citado en Piatier, 1967) afirmaba que «Las cifras
dicen siempre lo que un hombre inteligente quiere que digan», y se atribuye a Benjamin Disraeli,
político conservador británico que llegó a ser Primer Ministro de la Reina Victoria, la frase «Hay
tres clases de mentiras: la mentira ordinaria, la mentira mal intencionada y la estadística».
Contrarrestar estas opiniones, que dibujan una imagen de la estadística apoyada en actitudes de
temor, recelo o desprecio, exige que hagamos hincapié en un correcto uso de los métodos estadís-
ticos, para lo cual resulta imprescindible un buen conocimiento de los mismos, de las condiciones
en que pueden ser aplicados y del significado de los resultados obtenidos. En realidad, las «men-
tiras» de la estadística derivan no de esta en sí misma, sino de la eventual falta de conocimientos
o sentido común por parte de quienes la aplican y del uso interesado de la misma. Sobre estas
consideraciones acerca del uso abusivo de la estadística, volveremos más adelante, cuando abor-
demos los riesgos que entraña la utilización de la estadística en el estudio de la realidad educativa.

La estadística en el proceso de investigación


Habitualmente se acepta que la estadística resulta una herramienta de trabajo útil en la investiga-
ción educativa en la medida en que ofrece técnicas y procedimientos que pueden ser aplicados en
la etapa de análisis de datos. Aceptando que esta es la aplicación de mayor peso en el contexto
de la investigación educativa, a través de los párrafos que siguen, trataremos de atenuar el valor
de lo que podrían suponer concepciones reduccionistas, ocupándonos del papel que la estadística
también desempeña en momentos del proceso de investigación diferentes a la fase de análisis
de datos.

a) Planteamiento del problema y formulación de hipótesis


La estadística está presente en la formulación del problema de investigación. El proceso de in-
vestigación constituye un todo interrelacionado en el que las decisiones sobre cualquiera de los
elementos suponen condicionantes ante los restantes elementos del proceso. Desde esta pers-
pectiva, la formulación del problema determinará en buena medida el tipo de dato que es nece-
sario recoger, las técnicas de recolección adecuadas para ello y los procedimientos estadísticos
que se utilizarán en el análisis. Por otra parte, entre las características que debe poseer cualquier
problema de investigación se encuentra su resolubilidad, aspecto que a veces solo queda garan-
tizado si contamos con técnicas estadísticas adecuadas, capaces de abordar los interrogantes de
partida. Por ejemplo, el planteamiento de problemas que supongan comparaciones entre múltiples
grupos no podría llevarse a cabo sin contar con técnicas como el análisis de la varianza. Un gran
número de problemas de investigación en los que se incluyen múltiples dimensiones o variables
simultáneamente de hecho no han llegado a ser estudiados hasta contar con técnicas de análisis
multivariante que permitan abordarlos.
El mismo argumento podría utilizarse para justificar la presencia de la estadística en la formulación
de hipótesis. La formulación de hipótesis no puede omitir consideraciones acerca de las técnicas
estadísticas que permitirán su contrastación.

144
Estadística aplicada a la Educación

Como afirman Arnal, Del Rincón y La Torre (1992), el investigador se ve en la necesidad de salva-
guardar la coherencia entre la teoría, la hipótesis y el posterior análisis estadístico que le permitirá
aceptarla o rechazarla. En el marco de los programas de investigación positivista, la hipótesis
científica suele ser expresada en términos estadísticos para ser contrastada, dando paso a la
aplicación de técnicas para el contraste de hipótesis.
En el planteamiento del problema y la posterior formulación de hipótesis han de tenerse en cuenta
tanto el marco teórico como los trabajos previos realizados sobre el mismo tema, a cuya revisión
podrían contribuir técnicas de metaanálisis aplicadas a la síntesis e interpretación tanto de los
resultados obtenidos en la investigación como de los métodos utilizados para ello (Gómez Beni-
to:1987; Sánchez y Ato:1989). Los resultados a los que nos conduce el metaanálisis son síntesis
de los obtenidos en las diferentes investigaciones realizadas sobre un tema, nos informan sobre
el rigor de la misma, los métodos empleados, la representatividad de las muestras, la fiabilidad y
validez de los estudios. Una vía para determinar las tendencias dominantes en el modo de abordar
el estudio de un tema, los aspectos del mismo que son objeto de mayor atención por parte de la
comunidad científica o los autores que por encontrarse entre los más citados gozan de mayor
autoridad, la constituye la utilización de revisiones bibliométricas en las que a través de estudios
estadísticos se pueden poner de manifiesto las tendencias que se dibujan en publicaciones o in-
vestigaciones sobre un tema. Las bases documentales informatizadas permiten con facilidad rea-
lizar estadísticas acerca del número de registros relativos a diferentes tópicos, lo cual nos aporta
cierta aproximación a la importancia y relevancia de distintos objetos de investigación o modos de
abordarlos a lo largo de una determinada época.
Todo este tipo de resultados estadísticos en ningún modo sustituyen a la revisión exhaustiva de
la literatura y el estudio del marco teórico-conceptual en el que se inscribe el trabajo de investi-
gación, pero constituyen una información complementaria en manos del investigador a la hora de
concretar el objeto de interés y fundamentar su estudio. Por otra parte, a veces la formulación del
problema no se apoya solo en resultados de investigaciones anteriores, sino que el investigador
recurre a trabajos descriptivos previos o estudios pilotos, en los que el empleo de la estadística
puede contribuir a clarificar el problema en estudio. Los resultados de una descripción estadística
acerca de determinadas variables implicadas en algún fenómeno educativo podrían dar pie a la
formulación de hipótesis en las que se contemplen la relación entre variables; y estudios basados
en la obtención de medidas estadísticas de correlación entre estas facilitarían el planteamiento de
problemas y la formulación de hipótesis que suponen relaciones de causalidad. Tatsuoka y Tiede-
man (1963), en su trabajo sobre la estadística en el método científico, insisten en esta posibilidad
afirmando el papel de las técnicas estadísticas en el desarrollo de constructos teóricos e hipótesis
acerca de las relaciones entre ellos. De este modo, la estadística está presente en la fase inductiva
del método científico contribuyendo a la creación de modelos teóricos a partir de los cuales se
deducirán hipótesis contrastables que relacionan variables observables.

b) Diseño de investigación
La estadística forma parte de los diseños de investigación experimentales. Como es sabido, en el
concepto de diseño es posible contemplar por un lado la organización de los aspectos que consti-
tuyen el experimento y, de otro, el procedimiento estadístico que hará posible la interpretación de
los resultados (Fisher, 1953). Para Kerlinger (1981:214), el principio estadístico en el que descan-

145
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

sa el diseño es maximizar la varianza sistemática, regular la varianza sistemática extraña y minimi-


zar la varianza de error. Las técnicas estadísticas constituyen una parte contemplada en el diseño
del experimento en la medida en que facilitarán el análisis de los datos y posibilitarán el control de
la varianza debida a variables extrañas. Si dentro del diseño del experimento se consideran grupos
experimentales y grupos de control que antes de la aplicación de los tratamientos han de ser equi-
valentes, el investigador necesitará recurrir a técnicas estadísticas para el contraste de hipótesis
acerca de la existencia de diferencias entre los grupos y comprobar de ese modo la equivalencia
pretendida. Además, la estadística está presente cuando el diseño incluye la selección de sujetos.
La teoría de muestras proporcionará tanto los procedimientos de selección como la determinación
del tamaño muestral necesario para mantener el error y la confianza dentro de límites aceptables.
La recogida de datos es una tarea en la que aparentemente no parecen jugar un papel las técni-
cas estadísticas. Sin embargo, la estadística está de manera implícita presente si consideramos
el modo en que se elaboran los instrumentos utilizados para el recojo de datos (tests, cuestio-
narios, protocolos de observación, etc.). A esta disciplina de corresponde un papel crucial en la
construcción de tales instrumentos, dado que las técnicas estadísticas están en la base de los
procedimientos por los cuales se analizan sus características técnicas. Por citar algunos ejemplos,
la determinación de la fiabilidad y validez de algunos instrumentos se apoyan directamente en
coeficientes de correlación; la aplicación de técnicas de análisis de componentes principales o
análisis factorial permite explorar o confirmar la dimensionalidad de los instrumentos; los métodos
para el análisis de ítems, en la teoría clásica de los tests o en la teoría de respuesta al ítem, se
basan en correlaciones y en la estimación de parámetros recurriendo a diferentes procedimientos
estadísticos, tales como los métodos de máxima verosimilitud o los métodos de inferencia bayesia-
na; tests como el de chi-cuadrado permiten valorar el grado de ajuste de las respuestas a los ítems
a modelos logísticos de uno, dos o tres parámetros. Al margen de todo el aparato estadístico que
se esconde tras la elaboración o el análisis de los instrumentos de recojo de datos, la estadística
puede participar indirectamente en la operación de recogida proporcionando primeras elaboracio-
nes de los datos en el momento mismo de su registro. Por ejemplo, cuando tras aplicar un test se
registran los resultados en forma de percentiles o eneatipos resultantes de la comparación de la
puntuación del sujeto con un grupo normativo.

c) Análisis de datos
Ya hemos destacado la importancia de las técnicas estadísticas en la fase de análisis de datos.
Para insistir en esta idea haremos referencia a las palabras de De la Orden (1985:XXI) cuando
afirma que «la forma más adecuada de razonar sobre la base del gran número de observaciones
exigidas para el estudio experimental de la educación, con pretensión generalizante, es la Esta-
dística». De acuerdo con el concepto de estadística que hemos apuntado, le corresponden tareas
de organización, descripción, análisis y presentación de datos acerca de las muestras estudiadas
y también de generalización de los resultados a las poblaciones de donde las muestras fueron
extraídas. El análisis estadístico de los datos supone una descripción de estos, el descubrimiento
de regularidades y la inferencia de características relativas a conjuntos más amplios que los direc-
tamente estudiados.

146
Estadística aplicada a la Educación

d) Obtención de conclusiones y redacción del informe


Recordando las palabras de Siegel (1991:20), «La estadística nos proporciona herramientas que
formalizan y uniforman nuestros procedimientos para sacar conclusiones». De alguna forma, las
conclusiones están predeterminadas por el tipo de técnicas estadísticas que utilicemos. Un aná-
lisis de regresión, por ejemplo, nos permitirá obtener conclusiones acerca de la posibilidad de
que determinadas variables independientes puedan predecir el valor observado en una variable
dependiente; un análisis de conglomerados nos llevará a concluir sobre formas de agrupamiento
entre los individuos u objetos que estudiamos, un análisis simple de la varianza supondrá llegar
a conclusiones acerca de las diferencias significativas entre las medias de diferentes grupos, etc.
En cualquier caso, la estadística estará presente a la hora de elaborar las conclusiones aportando
las claves para la interpretación de los resultados del análisis.
La presentación de las conclusiones, así como de todo el proceso de investigación, debe contar
con la inclusión de resultados estadísticos. Aunque no se trata de una aplicación de técnicas esta-
dísticas en el momento de redactar el informe, la estadística está de algún modo presente a la hora
de mostrar los resultados. Las conclusiones de un estudio se verán convenientemente ilustradas
mediante la presentación de tablas, cuadros, etc., recogiendo medias, porcentajes, coordenadas,
correlaciones o cualquier otro tipo de datos estadísticos. La inclusión de los pesos factoriales de
las variables consideradas en un análisis factorial, por ejemplo, es imprescindible si queremos ilus-
trar el modo en que cada factor se ve saturado por las variables observadas. Otro tanto podemos
decir acerca de los resultados estadísticos expresados gráficamente.
La utilización de determinadas técnicas estadísticas y la intención posterior de comunicar los re-
sultados obtenidos requieren incluir representaciones estrechamente vinculadas a aquellas en
los informes de investigación. Técnicas como el análisis de conglomerados, el path-analysis o el
análisis de correspondencias son indisociables de formas de representación gráfica como dendo-
gramas, diagramas de flujos o gráficos factoriales, respectivamente.
En cuanto a la calidad de las investigaciones, la estadística aporta sus procedimientos para ga-
rantizar la validez interna y la validez externa en los experimentos. Procedimientos de muestreo
aleatorio y técnicas estadísticas como el análisis de la covarianza para controlar el efecto de va-
riables intervinientes que pudieran enmascarar el efecto de las variables independientes, resultan
recursos útiles en este sentido.

147
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Solucionario de los ejercicios propuestos

UNIDAD 1
1. a) Población e) Muestra i) Muestra
b) Población f) Población j) Muestra
c) Muestra g) Muestra
d) Población h) Muestra

2. Clasificación de la variable Escala de medición


a) Cuantitativa discreta Razón
b) Cuantitativa discreta Razón
c) Cualitativa o categórica Ordinal
d) Cuantitativa discreta Razón
e) Cualitativa o categórica Nominal
f) Cuantitativa continua Intervalar
g) Cuantitativa discreta Intervalar
h) Cualitativa o categórica Ordinal
i) Cuantitativa discreta Razón
j) Cualitativa o categórica Nominal
k) Cualitativa o categórica Ordinal
l) Cuantitativa discreta Razón
m) Cualitativa o categórica Nominal
n) Cuantitativa discreta Intervalar
o) Cuantitativa discreta Intervalar

3. Caso 1
Alumnos del Programa de Lenguas
Población
Extranjeras de la UNMSM.
142 alumnos del Programa de
Muestra
Lenguas Extranjeras de la UNMSM.

148
Estadística aplicada a la Educación

Un alumno del Programa de


Unidad estadística
Lenguas Extranjeras de la UNMSM.
Variable Grado de satisfacción.
Tipo de variable Cualitativa o categórica.
Escala de medición Ordinal
Caso 2
Población Vecinos del distrito de Jesús María.
128 vecinos del distrito de Jesús
Muestra María.
Un vecino del distrito de Jesús
Unidad estadística María.
Variable Razas caninas.
Tipo de variable Cualitativa o categórica.
Escala de medición Nominal.
Caso 3
Alumnas de la I. E. Mercedes
Población
Indacochea de Barranco.
86 alumnas de la I. E. Mercedes
Muestra
Indacochea de Barranco.
Una alumna de la I. E. Mercedes
Unidad estadística
Indacochea de Barranco.
Variable Gastos en golosinas.
Tipo de variable Cuantitativa continua.
Escala de medición Intervalar.
4. a) La tabla queda de la siguiente manera:

xi fi Fi hi (%) Hi (%)
12 7 7 15,56 15,56
13 14 21 31,11 46,67

14 10 31 22,22 68,89

15 12 43 26,67 95,56

16 2 45 4,44 100,0

n = 45 100,0

149
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

5. a) La tabla queda de la siguiente manera, recuerda que es una variable cualitativa, por
lo tanto, solo representamos fi y hi así como su ángulo central.

xi fi hi (%) Operación Ángulo

Primavera 12 23,08 (360°x23,08)÷100 83.09°

Verano 14 26,92 (360°x26,92)÷100 96.91°

Otoño 13 25,00 (360°x25,00)÷100 90°

Invierno 13 25,00 (360°x25,00)÷100 90°

n = 52 100,0

b)

Nacimiento por estación del año de los alumnos


del primer año de la I. E. Pedro Ruiz Gallo de Trujillo

Invierno Primavera
25% 23%

Otoño Verano
25% 27%

150
Estadística aplicada a la Educación

UNIDAD 2
1.
a) = 52
Interpretación:
Los alumnos del PROLEX utilizan en promedio 52 minutos para trasladarse desde sus
hogares hasta la universidad los días sábados.
b) Me = 51
Interpretación:
El 50% inferior de los alumnos del PROLEX utilizan 52 minutos o menos y el otro
50% superior utiliza 52 o más minutos para trasladarse desde sus hogares hasta la
universidad los días sábados.
c) La distribución presenta dos modas: Mo1 = 48 y Mo2 = 51 (es bimodal)
Interpretación:
El tiempo más utilizado por los alumnos de PROLEX para trasladarse desde sus ho-
gares hasta la universidad los días sábados es de 48 y 51 minutos.
2. Promoción 2010
a) 2010
= 2,67
Interpretación:
Los estudiantes del PROLEX leyeron en promedio 2,67 libros durante los meses de
enero, febrero y marzo del 2012.
b) Me2010 = 3
Interpretación:
El 50% inferior de los alumnos del PROLEX leyeron 3 o menos libros y el otro 50%
superior leyeron 3 o más libros durante los meses de enero, febrero y marzo del 2012.
c) Mo2010 = 3
Interpretación:
La mayoría de los alumnos del PROLEX leyeron 3 libros durante los meses de enero,
febrero y marzo del 2012.
Promoción 2011
a) 2011
= 2,67

151
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Interpretación:
Los estudiantes del PROLEX leyeron en promedio 2,67 libros durante los meses de
enero, febrero y marzo del 2012.
b) Me2011 = 3
Interpretación:
El 50% inferior de los alumnos del PROLEX leyeron 3 o menos libros y el otro 50%
superior leyeron 3 o más libros durante los meses de enero, febrero y marzo del 2012.
c) Mo2011 = 3
Interpretación:
La mayoría de los alumnos del PROLEX leyeron 3 libros durante los meses de enero,
febrero y marzo del 2012.
Conclusión: Ambos conjuntos de datos presentan igual promedio, mediana y moda.
3. Desviación estándar:
S = 1,85
Interpretación:
Las edades de un grupo de estudiantes de la Facultad de Educación presenta como
promedio 1,85 años con respecto a su valor central.
Varianza:
S2 = 3,44
Interpretación:
Las edades de un grupo de estudiantes de la Facultad de Educación presenta en
promedio 1,85 años2 con respecto a su valor central.
4. CV(E)= 0,125 = 12,5% CV(L) = 0,1667 = 16,67%
De los resultados podemos afirmar que los gastos mensuales de la Facultad de Letras
presentan mayor variación que la Facultad de Educación.
5. El gráfico se representa:

0 5 10 15 20 25 30 35 40 45 50

Q1 Me Q3

152
Estadística aplicada a la Educación

UNIDAD3
1. La probabilidad del que el estudiante estudie ambos cursos es de 0,3667 o 36,67%.
2. a) 450
b) 600
3. a) 90%
b) 10%
4. a) = 0,6 = 60%
b) = 0,4 = 40%
c) = 0,2 = 20%
d) = 0,8 = 86%

5. a) 0,75
b) 0,75

UNIDAD 4
1. a) y = - 0,172x + 20,798
b) r = - 0,902
2. a) y = 0,853x + 10,667
b) r = 0,898
3. a) y = 0,672x + 4,219
x = 1,178x – 2,131
b) r = 0,631
4. r = 0.631
La relación entre las dos variables presenta una correlación significativa.
5. a) y = 0.318x + 125.03
x = 1.273y – 60,958
b) La correlación entre las dos variables es significativa.

153
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Claves de respuesta de las autoevaluaciones

Unidad 1 Unidad 2 Unidad 3 Unidad 4

1 B 1 C 1 A 1 B

2 C 2 B 2 B 2 E

3 D 3 C 3 B 3 D

4 B 4 D 4 A 4 C

5 A 5 A 5 D 5 A

6 C 6 E 6 A

7 A 7 C 7 A

8 D 8 C 8 D

9 C 9 D 9 E

10 A 10 C 10 B

154
Estadística aplicada a la Educación

Bibliografía

ÁNGELES, C. y LA HOZ, A. Estadística aplicada a la Educación. Lima, UNMSM, 1997.


ARON, A. y ARON, E. Estadística para psicología. Sao Paulo, Ed. Pearson, 2001.
ÁVILA, R. Estadística elemental. Lima, Estudios y Ediciones RA, 2010.
FERNANDEZ, J. Estadística descriptiva: Una invitación a la investigación. Lima, Fondo
Editorial Pedagógico San Marcos, 2005.
FERREIRO, O. y FERNÁNDEZ, P. «La estadística, una ciencia de la controversia», Re-
vista Universitaria N.º 25, Instituto de Matemáticas y Física, Talca, Universidad de Talca,
1988.
MENDENHALL, W; BEAVER, R. y BEAVER, B. Introducción a la Psicología y Estadística.
México D. F., Ed. Language Learning, 2008.
MOYA, R. Estadística descriptiva. Lima, Ed. San Marcos, 2010.
NOLBERTO, V. Estadística aplicada a la educación. Lima, UNMSM, 2009.
RINCÓN, G. Apuntes docentes: Estadística. Santander, Unidades Tecnológicas de San-
tander, 2011.
RUIZ, D. Manual de estadística. Editado por [Link]. Universidad de Málaga, 2004.

155
Cepredim
Se terminó de imprimir en setiembre de 2012
en los talleres gráficos del
Centro de Producción Editorial e Imprenta
de la Universidad Nacional Mayor de San Marcos
Jr. Paruro 119, Lima 1.
Telf: 619-7000 anexo 6009 / fax: 1004, 6016
E-mail: [Link]@[Link]
Tiraje: 1000 ejemplares

Estadística aplicada a la educación
Martín Pablo Moreano Vilca
Jessica Graciela Zavaleta Morales
UNIVERSIDAD NACIONAL MAYOR D
Estadística aplicada a la educación
Martín Pablo Moreano Vilca / Jessica Graciela Zavaleta Morales
Serie: Textos para el Prog
Contenido
Introducción	
9
Unidad 1
Conceptos Básicos de Estadística Descriptiva. Organización de datos
1.1. Breve historia de
6
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera
1.8. Elaboración de tablas y distribuci
7
Estadística aplicada a la Educación
2.4.2. Diagrama de caja	
79
Ejercicios resueltos	
81
Ejercicios propuestos	
86
Autoeval
8
Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera
4.2.1. La recta de regresión 	
125
4.3.
Introducción
Este texto tiene como finalidad proporcionar información teórica y práctica de algunos 
aspectos básicos de la e
Unidad 1
Conceptos Básicos de Estadística 
Descriptiva. Organización de datos
Capacidades a desarrollar
¾
¾ Analizar los conc

También podría gustarte