Está en la página 1de 165

EAE - estadística aplicada a la educación

EDUBP | GIE | segundo cuatrimestre

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 1


índice

 presentación 3

 programa 5
contenido módulos

 mapa conceptual 6

 macroobjetivos 7

 agenda 8

 material 9
material básico
material complementario

 glosario 10

 módulos *
m1 | 11
m2 | 26
m3 | 49
m4 | 81
m5 | 109
m6 | 140

* cada módulo contiene:


microobjetivos
contenidos
mapa conceptual
material
actividades
glosario

 evaluación 165

impresión total del documento 165 páginas !

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.2


p r e sentación

Bienvenido a ESTADÍSTICA APLICADA A LA EDUCACÓN

Estadística Aplicada a la Educación

Presentación

Bienvenido a la asignatura Estadística


Aplicada a la Educación (EAE) de la
Licenciatura en Gestión de Instituciones
Educativas. Hoy comienza el cursado a
distancia de esta materia.

Estadística es una materia que combina tanto


aspectos formativos como instrumentales. Es
formativa por que lo introduce a usted en una
forma especial de pensamiento, es instrumen-
tal por cuanto brinda valiosas herramientas de
trabajo, sumamente pertinentes a la orientación de esta carrera.
Sabemos que estamos viviendo tiempos de grandes cambios, en los que el
común denominador es la globalización. Las transformaciones a las que debe-
mos enfrentarnos son continuas, generales y vertigino-
sas.
Frente a este panorama, nuestra capacidad en la toma
de decisiones inteligentes a través de un eficaz manejo
D
de los datos que a diario nos rodean, y la posibilidad
de realizar predicciones basadas en dicha información,
juegan un papel fundamental.
Estamos hablando del manejo de destrezas tales como
recolectar, organizar, presentar e interpretar datos. Es en este marco donde
aparece en escena la estadística. Frente a un conocimiento imperfecto de
las situaciones planteadas y a un grado considerable de incertidumbre, esta
disciplina, a través de los métodos y técnicas que elabora, nos ayudará a tomar
decisiones eficientes y oportunas. Si se conocen los métodos y las técnicas
adecuados, prácticamente cualquier conjunto de datos puede dar información
útil.

Estadística Aplicada a la Educación brindará las herramientas que a usted le


per­mitirán investigar y comprender distintas problemáticas presentes en el
ámbito educativo desde un enfoque cuantitativo. Le permitirá saber cómo,
cuándo y dónde utilizar procedimientos estadísticos relevantes para responder
interrogan­tes que emerjan de su accionar profesional. Asimismo, se busca que
desarrolle un posicionamiento crítico frente a resultados difundidos en diver-
sos medios sobre temáticas educativas. Esto será posible a partir del dominio
conceptual y técnico de la esta­dística, lo cual le posibilitará también interpretar
y comprender las referencias estadísticas que posean las distintas publicacio-
nes especializadas en temáticas educativas, necesarios para la permanente D
actualización en materia de las últimas investigaciones que se estén realizando
en el campo educativo. Por otro lado, se brindarán las herramientas necesarias
para que aprenda a diseñar, implementar e interpretar correctamente diseños
estadís­ticos en investigaciones educativas.

L
e
EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 3

La
en
Introducción a la Estadística Aplicada a la Educación:
El programa de la asignatura inicia con la presentación de lo que es la estadís-
tica como un recurso valioso para realizar investigaciones en el ámbito educa-
tivo y con una introducción a conte­nidos que le permitirán pensar con qué tipo
de variables se está trabajando, y según ello, determinar su posible nivel de
medición y los consecuentes procedi­mientos estadísticos aptos para ello. Se
estudian también en esta unidad conceptos primarios como: población, mues-
tra, unidad estadística, variable y dato.
El segundo módulo presenta contenidos que le permitirán construir una base
de datos con la información recogida y presentar los resultados utilizando dis-
tintas estrategias de síntesis, ya sea por medio de tablas y gráficos.
El tercero lo introduce en el tema de las medidas que permiten resumir un
conjunto de datos en coeficientes y estimadores a los fines de facilitar la lectura
de ellos, como por ejemplo las medidas de tendencia central, como la media,
el modo, la mediana o medidas de dispersión como la varianza, el rango o
la desviación estándar. A su vez se introducen procedimientos que permiten
indagar la presencia de asociaciones o correlaciones entre variables.

El módulo cuarto, es uno de los que presentan mayor complejidad teórica, pero
es el que permite entender la lógica de la estadística aplicada, y nos introduce
en las relaciones entre variables analizando: asociación, relación, intensidad,
independencia. Como también la covarianza, su sentido y análisis.

En el quinto módulo se presenta un repaso de conceptos básicos de


probabilidad y sus aplicaciones. Luego la definición del concepto de
probabilidad, eventos y los cálculos de probabilidad de la union, de la
intersección, de la diferencia, del complemento, del evento imposible,
probabilidad condicionadas. Por último se estudia la distribución normal.
Características del modelo , búsqueda en tablas , ejercicios y problemas
de aplicación. La regla empírica y su aplicación en diferentes tipos de
distribuciones.

El sexto módulo presenta el tema de muestreo (probabilístico y no


probabilístico). Se estudiará, muestreos: aleatorio simple, aleatorio sistemático,
estratificado, conglomerados; no probabilísticos: por cuotas, intencional, bola
de nieve, discrecional. Además estudiaremos conceptos vinculados como: plan
de muestreo – error muestral- .
Se desarrollan diferentes instrumentos de recoleccion de datos: entrevistas,
encuestas, revisión en el sitio, observación, entrevistas, cuestionarios,
encuestas.
Por último estudiaremos cómo se hace una investigación. La investigación-
acción. Pasos a seguir para el planteo de una investigación.

Las actividades que le iremos proponiendo han surgido de las distintas áreas
que conforman la currícula del plan de estudio.

Para concluir esta presentación y para iniciar esta nueva etapa de enseñanza-
aprendizaje les dejo dos pensamientos para reflexionar:

“Estudia no para saber algo más sino para saber algo mejor.”
(Lucio Anneo Séneca)

“Uno de los principales objetivos de la educación debe ser ampliar


las ventanas por las cuales vemos al mundo”
( Philippe Meirieu)

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.4


programa

Módulo I: Introducción a la Estadística Aplicada a la Educación :


Concepto de Estadística. Aplicación de la Estadística en los distintos
campos de las ciencias sociales y la investigación. Recolección de datos.
Población y muestra. Unidad de relevamiento- Marco muestral. Variable –
Dato- Clasificación de las variables. Niveles de medición. Fuentes de datos.
Elaboración de Informes Apartados de un informe de resultados.

Módulo II: Organización de los Datos – Análisis Exploratorio de Datos

Tablas estadísticas, construcción. Partes de una tabla estadística .


Distribuciones unidimensionales. Series simples y distribuciones de
frecuencias. Frecuencias absolutas, relativas, simples y acumuladas. Tablas
para
datos cualitativos y cuantitativos ( discretos y continuos) . Gráficos estadísticos
interpretación y análisis: Barras, Pastel ,Bastones, Acumulativo, Histograma ,
Polígono de frecuencias. – Pictogramas .

Módulo III: Medidas de tendencia central, medidas de dispersión.

Medidas de posición (diferenciando el cálculo según el tipo de variable que se


analice) media aritmética, mediana, modo, cuartiles. Medidas de dispersión
(diferenciando el cálculo según el tipo de variable que se analice):
varianza, desviación estándar, coeficiente de variación, desviación
cuartílica. Interpretación.
Medidas de forma: asimetría y puntiagudez. Diagrama de tallo y
hojas. Diagrama de Caja.

Módulo IV: Relaciones entre Variables:

Relaciones entre variables: asociación, relación, dirección, intensidad,


independencia estadística, tablas de contingencia, Chi cuadrado, coeficiente Q
de Kendall, Pearson, Spearman.
Distribuciones bidimensionales: covarianza.

Módulo V: Probabilidad- Modelos de Probabilidad

Introduccion a la probabilidad , repaso de nociones de la teoria de conjuntos.


Eventos simples y compuestos. Evento imposible. Calculo de probabilidad .
Probabilidad de la union, de la interseccion, de la diferencia, del complemento,
del evento imposible, probabilidad condicionadas. La distribución normal.
Características del modelo, busqueda en tablas, ejercicios y problemas
de aplicación. La regla empirica y su aplicación en diferentes tipos de
distribuciones.

Módulo VI: Muestreo y estimación :

Nociones básicas sobre muestreo. Tipos de muestreos: Probabilísticos:


aleatorio simple, aleatorio sistemático, estratificado, conglomerados; No
Probabilísticos: por cuotas, intencional, bola de nieve, discrecional. Plan de

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 5


muestreo – Error muestral- Instrumentos de recoleccion de datos: entrevistas,
encuestas, revisión en el sitio, observación. Entrevista: concepto, preparación,
conducción de la entrevista, procesamiento y análisis de datos obtendidos
a través de una entrevista. Tipos de entrevista. Cuestionarios. Encuesta:
concepto. Diseño de encuestas, procesamiento y análisis de datos obtendidos
a través de una encuesta. Como se hace una investigación. Investigacion
¿cualitativa o cuantitativa? La investigación-acción.

m a p a c o nceptual

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.6


m a c r o objetivos

         Dimensionar claramente el concepto básico de Estadística y sus aplica-


ciones a las distintas áreas de conocimiento, a fin de interpretar las principales
áreas del conocimiento donde se aplica la metodología estadística.

          Analizar la necesidad que tiene el investigador de organizar y presentar


los datos en cuadros o tablas de distribución de frecuencias para poder dis-
tinguir los procedimientos a utilizar según se trate de variables cualitativas o
cuantitativas.

          Conocer los diferentes procedimientos estadísticos para poder interpre-


tar resultados o leyendas estadísticas presentes en distintos medios de publi-
caciones científicas y facilitar la conducción de investigaciones que utilicen
metodologías cuantitativas para arribar a resultados.

          Organizar la información recolectada utilizando adecuadamente las téc-


nicas para elaborar tablas de frecuencias, en una matriz de datos que permita
comenzar a procesar e interpretar los datos obtenidos.

         Elaborar diferentes gráficos estadísticos para comunicar resultados de


una información de manera clara, concisa y significativa.

         Interpretar las diferentes medidas de posición, dispersión y forma, dis-


tinguiendo los procedimientos a utilizar según se trate de variables cualitativas
o cuantitativas -en forma manual y utilizando herramientas tecnológicas- para
caracterizar información presente en diversos contextos, a fin de caracterizar
cada conjunto de datos y extraer conclusiones válidas sobre los mismos.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 7


agenda

MODULOS PORCENTAJES ESTIMADOS


1 15 %
2 15 %
3 25 %
4 15 %
5 10 %
6 20 %

Cronograma
Representación de porcentajes en semanas

  MODULOS
SEMANAS 1 2 3 4 5 6
1            
2            
3            
4            
5            
6            
7            
8            
9 PARCIAL 1      
10            
11            
12            
13            
14            
15       PARCIAL 2

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.8


material

Material Básico:
• Desarrollos teóricos de la asignatura, los que están disponibles en el
apartado contenidos, de cada uno de los módulos.

• Bologna E. (2011) (Comp). Estadística aplicada a la Psicología y a la


Educación. Córdoba: Editorial Brujas.

Material Complementario
• Mendenhall, W.; Scheaffer, R. & Ott, L. (2001) Elementos de muestreo.
España: Thompson.

• Peña, D. (2001) Fundamentos de Estadística. Alianza Editorial: Madrid.


• Aron, A. y Aron, E. (2001) Estadística para Psicología. Pearson:
Educación.

• Bisquera, R. (2005) Metodología de la investigación educativa. Madrid:


La Muralla.Blalock, H. M. (1986) Estadística Social. México: Fondo de
Cultura Económica.

• Etxeberría, J.; Tejedor, F. J. (2005) Análisis descriptivo de datos en


educación. Madrid: la Muralla.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 9


glosario

Categoría: son los valores que puede asumir una variable.


Desviación estándar: es la raíz cuadrada de la varianza.
Distribución normal: se trata de una distribución con una curva simétrica,
mesocúrtica, en forma de campana. Si las puntuaciones sobre una medición
se distribuyen normalmente, mientras más grande sea la diferencia entre una
puntuación y la media, menor será la probabilidad de obtener la puntuación.
Exhaustividad: otra característica que deben cumplir las variables, sus catego-
rías deben agotar todas las posibilidades de variación de manera tal que todos
los valores posibles estén contemplados.
Frecuencia absoluta acumulada: es la cantidad de casos en esa variable que
asumen un valor y todos los valores menores a él.
Frecuencia absoluta relativa: es la proporción de casos en esa variable que
asumen un valor y todos los valores menores a él.
Frecuencia absoluta simple: es el número de casos en esa variable, que
asumen un valor determinado.
Frecuencia relativa simple: es la proporción de casos en esa variable, que
asumen un valor determinado.
Frecuencias conjuntas: indican la cantidad de casos que corresponden
simultáneamente a una determinada categoría de la variable de las filas y una
categoría de la variable de las columnas.
Frecuencias marginales: son las frecuencias absolutas de las categorías de la
variable que se ubican en las filas y en las columnas.
Intensidad de una relación: es una medida de la fuerza con que los cambios
en una variable afectan los cambios en la otra, o bien, de la frecuencia con que
los cambios de una variable acompañan a los de la otra.
Media: es un valor de la variable obtenido sumando todas las observacio-
nes multiplicadas por su frecuencia absoluta y dividiendo el resultado por el
número total de casos.
Mediana: valor de la variable que deja por debajo a la mitad de las observacio-
nes. La mediana deja la misma cantidad de casos por debajo y por encima de
ella.
Modo: es la categoría de la variable que tiene mayor frecuencia.
Muestra: es un subconjunto de la población que comparte sus características
en los aspectos de interés para la investigación.
Muestreos no probabilísticos: es un tipo de muestreo en donde no se cumple
el requisito de la aleatoriedad en la selección de los elementos que componen
la muestra. Los resultados no se pueden generalizar de manera probabilística
más allá de los casos observados.
Muestreos probabilísticos: en este tipo de muestreos, las muestras obteni-
das permiten generalizar los resultados obtenidos en ellas a toda la población
de referencia. El requisito para que una muestra sea probabilística es que sus
elementos hayan sido elegidos al azar.
Mutuamente excluyentes: característica que deben cumplir las variables, en
donde a cada individuo le corresponde no más de una categoría.
Parámetro: es la característica poblacional que pretende conocerse mediante
una investigación por muestreo.
Población: conjunto de unidades de análisis que son objeto de un estudio par-
ticular. Tal conjunto puede estar definido con precisión en el tiempo y el espa-
cio o no, a él se referirán los resultados obtenidos por medio de un muestreo.
Rango o recorrido: es la diferencia entre los valores máximos de una variable
y el mínimo.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.10


Relación asimétrica: una relación entre dos variables es asimétrica cuando
una de las variables antecede a la otra y puede identificarse a una como ante-
cedente y a la otra como consecuente.
Relación directa: la relación entre dos variables es directa cuando los valores
de una de ellas aumentan a la vez que los valores de la otra variable también lo
hacen.
Relación inversa: la relación entre dos variables es inversa cuando los valores
de una de ellas aumentan mientras que los valores de la otra disminuyen.
Relación simétrica: una relación entre dos variables es simétrica cuando es de
variación conjunta y no puede identificarse a una variable como previa a la otra.
Tabla de Contingencia: es una tabla que tiene tantas filas como categorías
tenga una variable y tantas columnas como categorías tenga la otra variable.
Unidad estadística: entes individuales acerca de los que se analizan sus cuali-
dades.
Variable: característica de las unidades de análisis que puede asumir diferen-
tes valores en cada una de ellas.
Varianza: es la suma de los cuadrados de los desvíos alrededor de la media,
dividida por el total de observaciones menos 1.

módulos

m1

m1 microobjetivos

• Obtener una visión panorámica acerca de la Estadística Aplicada a la


Educación en los tiempos actuales para entender las aplicaciones de
esta ciencia en diferentes ámbitos.

• Aplicar apropiadamente los métodos estadísticos en la recolección de


información y procesos matemáticos básicos en cálculos estadísticos,
para facilitar la comunicación de resultados.

• Adquirir los conocimientos y habilidades sobre el tema que les


permitan ser capaces de reconocer los elementos habituales de la
estadística.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 11


m1 contenidos

Introducción al Estudio de la Estadística

¿Qué es la Estadística?

”La palabra Estadística a menudo


nos trae a la mente imágenes de
números apilados en gráficos y
tablas, de volúmenes de cifras
relativas a nacimientos, muertes,
impuestos, poblaciones,
ingresos, deudas, créditos y así
sucesivamente.” (Como dijera
Huntsberger) quien tiene razón
pues al instante de escuchar esta
palabra estas son las imágenes
que pueden formarse en nuestra
imaginación.
La Estadística es mucho más que sólo números apilados y gráficas elaborados,
diariamente utilizamos los conceptos estadísticos en todas las facetas de
nuestra vida.
La noción de Estadística se derivó originalmente del vocablo “estado”, por
haber sido función tradicional de los gobiernos llevar registros de población,
nacimientos, de funciones, cosechas, impuestos y muchas otras clases de
cosas y actividades. Contar y medir estos hechos genera muchas clases de
datos numéricos. Es una ciencia con tanta antigüedad como la escritura, y es
por sí misma una herramienta auxiliar de análisis de muchas y muy variadas
ciencias. Los mercados, la medicina, la ingeniería, las ciencias sociales…

Definición de Estadística

La Estadística es la ciencia cuyo objetivo es reunir una información cuantitativa


concerniente a individuos, grupos, series de hechos, etc. y deducir de ello
gracias al análisis de estos datos unos significados precisos o unas previsiones
para el futuro.

“La Estadística es la ciencia que trata de la recopilación, organización presen-


tación, análisis e interpretación de datos numéricos con el fin de realizar una
toma de decisión más efectiva.”

Las primeras aplicaciones de la estadística se dirigían a poner énfasis en la


importancia de que en lugar de hacer estudios individuales, deberías hacerse
estudios de comportamiento de grupos de individuos. Los métodos de
estadística cubrieron esta necesidad y estos grupos son lo que se entiende
actualmente como población.
El desarrollo mayor de la Estadística surgió como necesidad de mejorar la
herramienta analítica en ciencias agrícolas y biológicas, para mejorar el
proceso de interpretación de datos muestrales y la generalización, que a partir
de ellas, podría hacerse. Por ejemplo: el agricultor siempre está enfrentando el
problema de mantener un alto nivel de productividad en sus cosechas.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.12


Respecto de las áreas principales de aplicación resaltamos las siguientes:

• En las Ciencias Sociales: para medir la relación entre variables y hacer


predicciones sobre ellas.
• Ciencias Políticas: para conocer las preferencias de los electores antes
de la votación mediante sondeos y así orientar las estrategias de los
candidatos.
• Sociología: para estudiar las opiniones de los colectivos sociales sobre
temas de actualidad.
• Psicología: para elaborar las escalas de los test y cuantificar aspectos del
comportamiento humano.
• En las ciencias naturales: se usa en la descripción de modelos
termodinámicos complejos (mecánica estadística), en física cuántica, en
mecánica de fluidos o en la teoría cinética de los gases, entre otros muchos
campos.
• En las ciencias sociales y económicas: es un pilar básico del desarrollo de
la demografía y la sociología aplicada.
• En economía: suministra los valores que ayudan a descubrir interrelaciones
entre múltiples parámetros macro y microeconómicos.
• En las ciencias médicas: permite establecer pautas sobre la evolución de
las enfermedades y los enfermos, los índices de mortalidad asociados a
procesos morbosos, el grado de eficacia de un medicamento, etcétera.
Como podemos ver es amplísimo el campo de aplicación que tiene esta
ciencia, la cual tiene como objeto el estudio de determinadas magnitudes
individuales que supuestamente varían de un modo aleatorio en el seno de
cierta población. Por ejemplo: puede tratarse de la altura de los habitantes de
un país, organizando el estudio en dos fases que constituyen los respectivos
temas propios de la estadística, a saber: deductiva o descriptiva y de la
estadística inductiva o referencia estadística.

Es así que existe una clasificación de la Estadística en Estadística descriptiva


y Estadística Inferencial.

La Estadística Descriptiva estudia un conjunto de métodos para organizar,


resumir y presentar los datos de manera clara para que puedan ser utilizados
por cualquier persona (sin necesidad de que sea un experto en la materia).
Su objetivo es caracterizar conjuntos de datos, la misma pretende poner de
manifiesto las propiedades de estos conjuntos lo cual se puede lograr de forma
gráfica o analítica. La estadística descriptiva se ocupa de recoger, ordenar y
clasificar los datos de interés mediante su obtención y análisis en una muestra
de la población considerada.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 13


La Estadística Inferencial estudia un conjunto de métodos y pruebas utilizados
para saber algo acerca de una población, basándonos en los datos de una
muestra aleatoria. Como consecuencia, la característica más importante del
reciente crecimiento de la estadística ha sido un cambio en el énfasis de los
métodos que describen a métodos que sirven para hacer generalizaciones.

A menudo escuchamos, “por ejemplo: la población que vive en Argentina”…sin


embargo en Estadística la palabra población tiene un significado más amplio y
específico:

“Se llama población al conjunto de todos los individuos, objetos o medidas de


interés, y acerca de los cuales queremos extraer conclusiones”.

El tamaño que tiene una población es muy importante en el proceso de


investigación estadística, y este tamaño viene dado por el número de
elementos que constituyen la población, según el número de elementos la
población puede ser finita o infinita. Cuando el número de elementos que
integra la población es muy grande, se puede considerar a ésta como una
población infinita, por ejemplo; el conjunto de todos los números positivos.
Una población finita es aquella que está formada por un limitado número de
elementos, por ejemplo: el número de habitantes de una región.

Denominaremos con N=tamaño de la población

Cuando la población es muy grande, es obvio que la observación y/o medición


de todos los elementos se hace difícil, en cuanto al trabajo, tiempo y costos
necesarios para hacerlo. Para solucionar este inconveniente se utiliza una
muestra estadística.

“Se llama muestra a un subconjunto de la población bajo estudio. Siempre


que reúna dos características: ser aleatoria y representativa”.

Denominaremos con
n= tamaño de la
muestra

Veamos ahora:

¿Qué es una
muestra aleatoria?

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.14


Una muestra es aleatoria (o al azar) cuando cada uno de los elementos de la
población tiene la misma probabilidad de ser elegidos para formar parte de la
muestra.

¿Cuándo una muestra es representativa? Diremos que una muestra es


representativa si las conclusiones obtenidas a partir de la muestra son válidas
también para la población que se está analizando.

Por ejemplo, estudiamos los valores sociales de una población de 5000


habitantes aproximadamente, sería difícil y costoso, analizar los valores
sociales de todos ellos, por ello, la estadística nos da una herramienta que
es la muestra para extraer un conjunto de población que represente a la
globalidad y sobre la muestra realizar el estudio. Una muestra representativa
contiene las características relevantes de la población en las mismas
proporciones que están incluidas en tal población. Por ejemplo seleccionar al
azar una muestra de tamaño 600 habitantes de esa población. Los expertos
en estadística recogen datos de una muestra. Utilizan esta información para
hacer referencias sobre la población que está representada por la muestra. En
consecuencia muestra y población son conceptos relativos. Una población es
un todo y una muestra es una fracción o segmento de ese todo.

Veamos otro ejemplo:


En una institución educativa se quiere saber la ocupación de los egresados de
la última década. Para esto se convoca a una reunión de egresados de 10 años
hacia atrás y de los asistentes, se encuesta a diez egresados de cada año.
¿Cuáles serían la población y la muestra?
Población: Conjunto de todos los egresados de la última década.
Muestra: Conjunto de los 100 estudiantes seleccionados, 10 de
cada promoción.

Otro concepto importante, asociado al de población y el de muestra, es el


“censo”.
Un censo originariamente es un padrón o lista. Pero en Estadística un “censo
poblacional”, en el cual se realizan un recuento de los habitantes de un
país, dentro del mismo se recogen diversos datos con fines estadísticos.
Ejemplo: “El Gobierno anunció que el año próximo realizará un censo nacio-
nal”, “Los datos recopilados a través del censo permitirán desarrollar políticas
sociales más precisas”, “De acuerdo al último censo, la ciudad ya ha superado
los dos millones de habitantes”.

El censo nos permite determinar el tamaño de una población bajo estudio, pero
su complejidad y costo elevado hace que los censos nacionales se realicen por
lo general cada 10 años. El Gobierno confecciona una planilla con preguntas y
que un amplio equipo de censistas se encargue de recorrer todo el país, casa
por casa. En el formulario se consulta sobre las variables socio demográficas
más relevantes, como edad, cantidad de hijos, situación laboral, características
de la vivienda, etc.

Asociados a estos, veremos otros conceptos fundamentales para la Estadística:

Unidad estadística (o unidad de observación): es cada uno de los elementos


que se está analizando.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 15


Por ejemplo en una muestra de 30 alumnos, la unidad estadística será cada
alumno.

Si en cambio quien está haciendo la investigación es la dirección de un


colegio, a la cual le interesa analizar hábitos alimenticios de las familias de
sus alumnos, y para ello manda en el cuaderno a cada familia una encuesta
sobre hábitos de alimentación, en este caso la unidad de análisis será cada
familia.

Variable: es la característica que se está analizando de la unidad estadística


analizada.

Las variables se clasifican en:

1) Variables cualitativas: son aquellas que se ordenan en categorías


debido a su carácter subjetivo y absoluto. Sus valores no se expresan
por lo general en números. Pueden ser de dos tipos “nominales”, u
“ordinales”.

a) En las variables nominales los valores no pueden ser


sometidos a un criterio de orden o importancia como por
ejemplo “el sexo de una persona” o “el país de origen”.
b) Las variables ordinales pueden tomar distintos valores
ordenados siguiendo una escala establecida, aunque
no es necesario que el intervalo entre mediciones sea
uniforme, por ejemplo: leve, moderado, grave.

2) Variables cuantitativas, son las que sus características están


expresadas en valores numéricos, éstas asumen cualquier valor y
pueden variar en cualquier cantidad, sobre una escala aritmética e
infinita y pueden subdividirse en dos tipos “continuas o medibles” y
“discretas o contables”.
a) Las variables continuas surgen de un proceso de
medición, pueden adquirir cualquier valor dentro de un
intervalo especificado de valores, es así que pueden
presentar valores enteros o bien decimales. Por ejemplo:
el peso, o la estatura de un alumno.
b) Las variables discretas surgen de un proceso de conteo,
solo admiten valores expresados en números naturales
y presentan interrupciones en la escala de valores
que puede tomar. Estas separaciones o interrupciones
indican la ausencia de valores entre los distintos valores
específicos que la variable pueda asumir por número
de miembros de una familia es una variable discreta, se
cuenta y entre dos personas no hay un valor intermedio,
no existe 1.5 personas
Por ejemplo: cantidad de alumnos que no tienen
promedio en Lengua, en un curso analizado.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.16


¿Qué diferencia hay entre una variable y un dato? “el dato es cada uno de los
valores que puede asumir una variable determinada. Por ejemplo: si estamos
analizando las notas de los alumnos de 6to grado en Matemática (esta sería la
variable), ahora cuando tomamos uno de los alumnos y vemos su nota (por
ejemplo: 7) ese valor -7- es un dato.
Escalas (niveles) de medición

1) Escala nominal la característica estudiada se clasifica en una


serie de características no numéricas y mutuamente excluyentes
y no se puede establecer ningún orden entre ellos. Ejemplo:
sexo

2) Escala ordinal el carácter medido no es numérico pero puede


establecerse algún tipo de orden. Ejemplo estudios de una
persona.

3) Escala de intervalos la característica puede cuantificarse


numéricamente, estableciéndose intervalos entre dos
operaciones. Ejemplo: Renta mensual que percibe una persona.

Aplicaciones de la Estadística en los distintos campos de las ciencias sociales


y la investigación:

A medida que las ciencias y en particular las ciencias sociales van avanzando
en el desarrollo de sus teorías, se va haciendo más necesario el uso de
herramientas que nos brinda la matemática, en particular la Estadística. No
es necesario que el investigador en Ciencias Sociales sea un especialista
matemático en estadística, pero sí es importante que sepa comprender
el proceso lógico subyacente al razonamiento matemático-estadístico. Es
decir deberá comprender la estructura del problema en el cual debe utilizar
a la estadística como herramienta, analizar qué elementos están en juego,
la estructura formal del modelo matemático y las condiciones que lo hacen
posible. Tiene que haber un compromiso de manera que se simplifique la
realidad concreta lo suficiente para que el modelo creado a partir de la realidad
sea fácilmente manejable desde el punto de vista instrumental matemático. Es
necesario un buen conocimiento de las bases de estadística, para conocer la
potencia y debilidad de sus técnicas y consiguientemente para saber usarlas
con eficacia y la vez con prudencia.
Desde un punto de vista matemático muchas de nuestras afirmaciones están
incompletas, mal encuadradas o son imprecisas.
Pero, por otro lado, muchas de estas ideas pueden ser entendidas
intuitivamente, y es mejor una comprensión intuitiva que ninguna comprensión
en absoluto.
Es siempre preferible que los ejemplos que se usen en la enseñanza sean
hipotéticos, porque es más importante tener un problema simple y específico
que se pueda comprender y que ilustre el método claramente que otro que
simplemente asombre al estudiante con nuestra sabiduría. Las principales
aplicaciones estadísticas en cualquier campo, no sólo el de las Ciencias
Sociales, descansan sobre el hecho de poder hacer observaciones o

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 17


experimentos repetidos, esencialmente, bajo las mismas condiciones. En
algunas áreas de la investigación, los objetos o fenómenos observados bajo
las mismas condiciones variarán sólo en pequeña medida (en las ciencias
físicas, donde las observaciones controladas dan prácticamente los mismos
resultados).
Pero, por otro lado, especialmente en las Ciencias Sociales, aunque el
experimentador haga un esfuerzo sobrehumano para observar repetidamente
bajo las mismas condiciones, se encontrarán diferencias entre las
observaciones y las diferencias, ordinariamente, no serán despreciables.
La estadística es la rama de la matemática que le facilita al hombre el estudio
de datos masivos, para que pueda pasar de sacar conclusiones válidas
y efectuar predicciones a partir de ellos que sean válidas también para la
población bajo estudio. Además permite describir y comparar diferente tipo
de datos, es decir que nos proporciona métodos científicos para recopilar,
organizar, resumir, representar y analizar datos sobre hechos referidos a
situaciones concretas de la realidad.
Son innumerables las aplicaciones de la estadística, por ello enumeraremos
algunas de las más utilizadas:
• En educación contribuye el estudio de temática en materias como los
métodos de investigación en educación, los diseños de investigación.
• En psicología contribuye en los estudios de naturaleza psicológica, a
través de la aplicación de técnicas estadísticas como por ejemplo: el
estudio del comportamiento de los sujetos, las aptitudes, los rasgos de
personalidad, etc; se basan en el uso de técnicas estadísticas.
• En sociología la estadística sirve para comprender fenómenos y
relaciones sociales, como así también facilita las comparaciones de
distintas estructuras.
• En humanidades las nuevas metodologías de investigación en historia,
antropología, o literatura aporta métodos de contraste de hipótesis y
predicciones y pronosticaciones con rigor científico.
• En las ciencias jurídicas principalmente en la criminología aporta
técnicas en la prevención de delitos sobre todo por la posibilidad de
aplicar las técnicas de muestreo.

Fuentes de datos:

En el proceso de investigación social se pueden distinguir dos tipos de fuentes


de datos:
a) Fuentes de datos primarias: que son los que se obtienen
directamente de la realidad, recogiéndolos o produciéndolos con
instrumentos propios. En toda investigación social estos tipos de
datos son esenciales como elemento de contraste de nuestras
hipótesis de trabajo con la realidad empírica.
b) Fuente de datos secundarios: son informaciones que ya han sido
producidas por otras personas o instituciones. La utilización de
documentación en la investigación social constituyen, por lo tanto
una fuente secundaria.

Las fuentes secundarias tienen dos usos dentro de toda investigación social:

i. Como marco teórico: usar documentación nos permite


revisar literatura específica sobre el tema que estamos
investigando. Y nos permitirá establecer lo que se denomina:
“estado de la cuestión” es decir ¿Qué se ha escrito y

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.18


planteado sobre el tema? ¿Qué perspectivas de estudio hay
sobre el mismo? ¿Cuáles son las distintas posturas sobre el
tema analizado? etc.
ii. Como material empírico: la documentación estadística permite
contrastar los planteos investigados.

¿Qué es un informe?
La palabra Informe, como derivado del verbo “informar”, consiste en un texto
que describe las cualidades de un hecho analizado y de todos los eventos que
lo rodean. El informe deberá ser entonces el resultado o la consecuencia de la
“acción de informar”.
Este informe es un documento que por lo general tiene una estructura pre
establecida, según los objetivos específicos del mismo. Por lo general surge de
un proceso de investigación, y su objetivo principal es informar.
Pueden ser públicos o privados según sea el objetivo de divulgación. Y pueden
ser también ser simples o complejos de acuerdo a la estructura y el contenido
que tenga.
Si el informe es el final de un proceso de investigación, debe plasmar los
distintos pasos que se han llevado a cabo en el proceso de investigación.
Para ello debe tener una estructura y una organización definida clara y
precisa, porque es de ésta estructura de la que depende que el proyecto sea
comprensible, oportuno para todas las personas que lo tengan a disposición.
Pueden distinguirse básicamente las siguientes partes en un informe:
• Portada: incluye el título de la investigación, el nombre del autor o
autores y su afiliación institucional (para cada autor, si es apropiado)
o el nombre de la organización que patrocina el estudio y la fecha en
que se presenta el informe.
El título debe ser autónomo, comunicar la importancia de la idea
y sintetizar el contenido del informe, en pocas palabras, debe ser
conciso y explicativo.
• Índice: incluye los apartados y sub-apartados que componen el
informe.
• Resumen: es una síntesis del contenido esencial del informe de
investigación, y proporciona de manera concisa y directa suficiente
información para que el lector se entere del propósito y los resultados
de la investigación que se está presentando.
El resumen debe incluir la siguiente información específica resumida:

 Propósito de la investigación o planteamiento del problema


en un solo enunciado
 Descripción de los participantes en la investigación,
incluyendo su número, edad, género, condiciones
especiales u otras características que los identifiquen
 Método
 Resultados más importantes
 Conclusiones principales

• El resumen debe ser comprensible, sencillo, exacto, informativo y
preciso. Nada de extras ni adornos: sólo los hechos.
• Introducción: este apartado proporciona un marco de referencia para
el problema que se está estudiando y un contexto para la expresión
del propósito del estudio del que se informa. Una buena introducción
orienta al lector respecto a la importancia del problema planteado
proporcionándole los antecedentes más importantes, la idea es

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 19


proporcionar al lector suficiente información para que entienda y
aprecie el alcance y la importancia del problema.

La introducción incluye los siguientes elementos:


 Propósito de la investigación o planteamiento del
problema, incluyendo los objetivos y preguntas de
investigación, así como la justificación del estudio.
 Planteamiento de la/s hipótesis (si se considera
pertinente)
 Contexto general de la investigación (cómo y dónde se
realizó)
 Variables o aspectos evaluados
 Términos de la investigación y sus definiciones
 Limitaciones
• Marco teórico (marco de referencia) donde se explicitan las teorías y
conceptos que se utilizarán para interpretar la realidad que se aborda.
• Método: este apartado describe cómo fue llevada a cabo la
investigación. Esta información se presenta con suficiente detalle como
para que cualquier otro investigador pueda consultar esta sección y
duplicar el estudio exactamente como se efectuó originalmente.
El método tiene muchos componentes distintos, que varían de un
informe a otro y suelen emplearse diferentes subtítulos, todo depende
del tipo de investigación específica que se haya llevado a cabo.
• Resultados: en este apartado se presentan los resultados reales de
la investigación, los productos del análisis de datos. Normalmente
se resumen los datos recolectados y se describe el tipo de análisis
de datos realizado. Cuando no se aplican análisis estadísticos
o cuantitativos, los resultados pueden ser frases o afirmaciones
que resuman la información. Se recomienda que primero se
describa brevemente la idea principal que resume los resultados
o descubrimientos y que luego se reporten detalladamente los
resultados. Se recomienda utilizar tablas, gráficos, dibujos o figuras
para representar visualmente los resultados, especialmente si el
estudio posee gran cantidad de resultados numéricos. En este
apartado no se incluyen conclusiones ni sugerencias y no se discuten.
• Discusión: en este apartado el autor del informe está en libertad
de explorar las relaciones importantes entre lo que se ha hecho
en el pasado, el propósito del estudio, la hipótesis planteadas y
los resultados del estudio presentado. Se evalúa lo que se hizo
y se determina si los resultados obtenidos están a la altura de
las expectativas del investigador. Es la oportunidad para que el
investigador haga una recapitulación del propósito y los hallazgos
que se presentan en el informe. Se derivan conclusiones acerca de la
contribución o contribuciones de la investigación realizada, sobre qué
tan bien se contestó la pregunta original y sobre si se cumplieron o no
los objetivos. Igualmente, se comentan las implicaciones y limitaciones
del estudio y se presentan sugerencias para futuras investigaciones.
• Referencias: lista de las fuentes utilizadas por el investigador para
elaborar el marco teórico y el resto de apartados del informe. Se
incluyen desde libros y revistas científicas, hasta comunicaciones
personales, ordenadas alfabéticamente y siguiendo el formato
específico establecido por el estilo de documentación más apropiado
a su área de especialidad (MLA para Literatura y áreas afines, APA
para el área de ciencias sociales y CBE para las ciencias naturales y
aplicadas).

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.20


• Apéndices o Anexos: incluyen información que no es indispensable
para entender el contenido del informe pero que sí es importante
para tener una imagen completa de lo que sucedió. Resultan útiles
para describir con mayor profundidad ciertos materiales sin distraer
la lectura del texto principal del informe o evitar que dichos materiales
rompan con el formato del informe. Algunos ejemplos de apéndices
serían el cuestionario utilizado, un nuevo programa de ordenador
desarrollado, análisis estadísticos adicionales, el desarrollo de una
fórmula complicada, reportes de sesiones de grupos, transcripción del
contenido de entrevistas o grupos de discusión, fotografías, entre otros.

Finalizamos aquí el desarrollo teórico del primer módulo. Lo invitamos a


poner en práctica los conceptos aprendidos realizando las actividades.

m1 material

Material Básico
• Desarrollo teórico del módulo, disponible en el apartado contenidos.
• Bologna E. (2011) (Comp). Estadística aplicada a la Psicología y a la
Educación. Córdoba: Editorial Brujas.

Material complementario
• Aplicaciones estadísticas en las Ciencias Sociales: Juan Camacho
Rosales Profesor Titular de Metodología de las Ciencias del
Comportamiento Departamento de Didáctica e Investigación Educativa
y del Comportamiento Universidad de La Laguna “Curso Universitario
Interdisciplinar Sociedad, Ciencia, Tecnología y Matemáticas” 2003.

• ARON, A. Y ARON, E. (2002). Estadística para Psicología. Pearson


Prentice Hall.

• BALLESTER, L. (2001). Bases metodológicas de la investigación


educativa. Mallorca: Universitat de las Illes Balears.

• CAMACHO ROSALES, J.(2004). Estadística con SPSS (versión 12) para


Windows. Madrid: Ra-Ma.

• FELICIANO, L., JIMÉNEZ, A, y AXPE, A. (2004). Estadística descriptiva


aplicada a la investigación educativa. Tenerife: ARTE Comunicación
Visual.

• LIZASOAIN, L. Y JOARISTI, L. (2003). Gestión y análisis de datos con


SPSS. Madrid: Thomson.

• MURES, J.; ABAD, J.; GARCÍA, A.B. ET AL. (2003). Estadística


descriptiva. Problemas y ejercicios resueltos. Pearson Prentice Hall.

• NIETO MARTÍN, S. (2010). Principios, métodos y técnicas esenciales


para la investigación educativa. Madrid: Dykinson.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 21


m1 actividades

m1 | actividad 1

Clasificación de Variables

Lea las siguientes variables y clasifíquelas en


discretas o continuas:

a) Número de habitantes por kilómetro


cuadrado
b) Número de bacterias de cierto tipo, por
mililitro
c) Densidad de diferentes muestras de un mismo líquido
d) Número de frutos de un árbol de la misma especie
e) Velocidad de un vehículo al pasar por un determinado punto
f) Puntuaciones obtenidas en un test por un grupo de personas
g) Superficie dedicada a cierto cultivo, por hectáreas, en un municipio
h) Peso de un niño al cumplir 3 años

m1 | actividad 2

Aplicación de conceptos primarios

Consigna:
En función de los contenidos estudiados en
el módulo, analice los enunciados y responda
justificando adecuadamente cada uno de los
planteos.

Ejercicio 1:
En la repartición de Espectáculos Públicos de la Municipalidad de Córdoba,
se reciben un gran número de quejas por día, referidas al incumplimiento
de las normas establecidas, en salones de fiestas y afines. Se han estu-
diado 30 días y los datos se graficaron:

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.22


Cantidad de días (ni) 12

10
8

4
2

0
4 5 6 7 8 9 10 11 12
Numero de quejas

Con la información suministrada se pide completar los siguientes enunciados:

“ La población es el conjuntos de todos los………………………… que presentaron una


……………..en el período analizado.”
“La muestra son los…………………… contribuyentes que se analizaron”
“La unidad estadística es…………………………………………….”
“La variable analizada es:……………………………………………………, y se clasifica
como:…………………………….”

Ejercicio 2

En una institución educativa se quiere saber la ocupación de los egresados de la última década.
Para esto se convoca a una reunión de egresados y de los asistentes, se encuesta a diez egresa-
dos de cada año.
En función del caso planteado:

-Determine la población y la muestra.


- ¿Cuál es la variable analizada?¿Qué tipo de variable es?
- ¿Cuál es la unidad estadística?

Ejercicio 3:

Justifique por qué la siguiente situación emplea variables cuantitativas discretas.


En un estudio sobre la cantidad de mascotas que tienen los estudiantes de grado octavo en la
ciudad de Medellín, se selecciona una muestra representativa de cada colegio de la ciudad y
se aplica la encuesta.

Ejercicio 4

Justifique por qué la siguiente situación emplea variables cuantitativas continuas.


En un estudio sobre las diferentes dimensiones de los apartamentos de la ciudad, se toman
como muestra tres proyectos aprobados en los diferentes estratos sociales.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 23


Ejercicio 5

Las encuestas alimentarias permiten obtener información sobre las costumbres


alimentarias y, por ende, el estado nutricional de una determinada población;
también sobre la posibilidad de que una persona o un grupo de personas
ingiera los alimentos necesarios para producir energía y nutrientes para vivir.
Las encuestas sobre nutrición son desarrolladas y analizadas por equipos
interdisciplinarios, en los que se encuentran principalmente personas del área
de la medicina, la estadística, la antropología, la sociología y la enfermería.
A continuación se presentan tres preguntas estándar en una encuesta de este
tipo, explicar a que escala o nivel de medición corresponde c/u

a) ¿Cuántas veces desayuna a la semana?


b) ¿Es igual los fines de semana?
c) ¿Su actividad física es baja, moderada o elevada?

Ejercicio 6
Complete las siguientes frases:

a) Si clasifcamos los estudiantes de un colegio por el grado que


ocupan, hacemos una medición con variables ……………………….
b) Si clasifcamos a los estudiantes por el promedio de califcaciones,
hacemos una medición con escalas ………………….…
c) El número de eventos u objetos que pertenecen a una categoría se
llama……………….…
d) Se puede ordenar a las personas por su estado civil en las
siguientes categorías:…………
…………………………………………………………………………………
…………………………………………………………………………………
………………………………………………
e) En una investigación es necesario …………………….…, y al
comunicar los resultados debe especificarse claramente el tipo de
medición empleado

Ejercicio 7
Determine la población y sugiera la muestra para cada una de las siguientes
situaciones:

a) Una empresa de telefonía celular quiere realizar en la ciudad de


Camacuá un estudio sobre el celular que preferen los jóvenes entre
14 y 18 años de edad.
b) Una empresa de software quiere determinar cuál es el tiempo
promedio que los jóvenes de la ciudad de Bogotá emplean en
Internet para diseñar un nuevo juego que se desarrolle en dicho
tiempo.

Ejercicio 8
Analice y responda c/u de las siguientes situaciones:

a) Se analizó una muestra de trigo y el resultado fue el siguiente: híbrido


30%, centeno 10% y corriente 60%. ¿Qué escala se utilizó?
b) De acuerdo con el ejercicio anterior, explicque qué miden los
porcentajes.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.24


c) En una carrera de caballos se aceptan diferentes apuestas; Pimiento
llegó de primero, Sal de segundo y Ron de tercero.¿Qué tipo de
variables se emplean en las apuestas? ¿Es posible determinar la
distancia entre los caballos? Justifique su respuesta.
d) Invente una situación con variable dicotómica.

m1 glosario

Escala de intervalos: la característica puede cuantificarse numéricamente,


estableciéndose intervalos entre dos operaciones. Ejemplo: Renta mensual que
percibe una persona.

Escala nominal: la característica estudiada se clasifica en una serie de


características no numéricas y mutuamente excluyentes y no se puede
establecer ningún orden entre ellos. Ejemplo: sexo.

Escala ordinal: el carácter medido no es numérico pero puede establecerse


algún tipo de orden. Ejemplo estudios de una persona.

Muestra: subconjunto de la población bajo estudio. Siempre que reúna dos


características: ser aleatoria y representativa.

Muestra representativa: si las conclusiones obtenidas a partir de la muestra


son válidas también para la población que se está analizando.

Población: conjunto de todos los individuos, objetos o medidas de interés, y a


cerca de los cuales queremos extraer conclusiones.

Unidad estadística (o unidad de observación): es cada uno de los elementos


que se está analizando.

Variable: es la característica que se está analizando de la unidad estadística


analizada.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 25


m2

m2 microobjetivos

• Clasificar, organizar, representar y resumir, en suma, hacer entendible


la información obtenida de las variables observadas sobre una muestra
representativa.

• Inferir conclusiones para toda una población a partir de la información


obtenida en la muestra.

• Construir modelos matemáticos que expresen relaciones entre


conjuntos de variables.

• Estructurar la recogida de información (datos) de modo que la


inferencia se realice de forma óptima dentro de las restricciones
existentes (de capacidad de experimentación u observación, de tiempo,
económicas, ...).

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.26


Estadística Aplicada a la Educación m2 contenidos

Módulo 2

Análisis Exploratorio de Datos:

Organización de datos estadísticos

Cuando extraemos un conjunto de datos, ya sean de una población o de una muestra. Lo primero que
nos planteamos es ¿Cómo comenzar a organizarlos?
Es así que surgen los conceptos de: serie simple y distribución de frecuencias.

Serie simple: es un listado de datos, en el orden que fueron apareciendo, por lo general son
pocos datos.

Distribución de frecuencias: agrupamientos de datos en categorías que muestran el número de


observaciones, en cada categoría mutuamente excluyentes. En general se agrupan en tablas
que se denominan: tablas de distribución de frecuencias.

DISTRIBUCIONES DE FRECUENCIAS:

Estudiaremos a continuación cómo organizar los diferentes datos obtenidos al analizar cualquier
variable. Todo conjunto de datos puede organizarse de dos maneras, que no son excluyentes una de
otra.

Tablas estadísticas:

Se denominan “distribuciones de frecuencias” y son tablas que contienen: los diferentes valores que
puede asumir una variable o los intervalos correspondientes, y las diferentes frecuencias (absolutas y
relativas).
Iremos desarrollando el teórico con una serie de ejemplos:

Dentro de toda distribución de frecuencia se pueden determinar cuatro tipos de frecuencias:

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 27


Veamos a cada una de ellas:

Frecuencias absolutas simples: (ni o fa) indican el número de veces que se repite cada uno de los
valores distintos que asume la variable. La suma de las “ni” siempre da como resultado el tamaño de la
muestra “n”, en símbolos Σ ni = n.

Frecuencias absolutas acumuladas: (Ni o Fa) se calculan sumando las frecuencias absolutas
simples correspondientes, por ejemplo:
N1= n1
N2= n1 + n2
N3= n1+ n2 + n3
……
N k = n1 + n2 +….+ nk = n

Frecuencias relativas simples: (hi% o f%) se calculan como: hi = ni / n


La suma de las frecuencias relativas simples siempre debe dar 1 o muy cerca; o bien 100% si se
trabajan multiplicadas por 100, en símbolos Σ hi = 1 o Σ hi % = 100%.

Frecuencias relativas acumuladas:( Hi% o F%) se calculan sumando las frecuencias relativas
simples correspondientes, por ejemplo:
H1= h1
H2= h1 + h2
H3= h1+ h2 + h3
……
H k = h1 +h2 +….+hk = 1

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.28


Gráficos para variables estadísticas:

Veamos a través de un ejemplo resuelto, la aplicación para el caso de una variable cuantitativa
discreta:

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 29


Ejemplo 1:
Una organización no gubernamental que se dedica a ayudar a colegios necesitados realizando
donaciones para cubrir necesidades básicas de niños y jóvenes, decidió realizar una encuesta a los
alumnos del colegio, en la que se les preguntó “la cantidad de pares de zapatillas que tienen” .Los
datos obtenidos fueron:
0-1-1-2-3-1-1-5-4-3-1-2-2-2-3-3-4-2-2-2-3-3-2-2-2-2-0-0-0-1-1-
1-2-2-2-2-0-0-0-1-1-1-2-2-2-2-1-1-0-0-3-0-3-3-0-1-0-3-4-0-2-0-
0-1-0-2-2-2-2-3-3-3-1-1-1-1-2-3-3-3-1-1-1-0-
Ante el caso planteado, ¿qué respondería a las siguientes
preguntas?:

a) ¿Cuál es la variable analizada? Clasifícala.


b) Armar la tabla de distribución de frecuencias para la
variable.
c) Interpretar las siguientes frecuencias: n2, N3, h1, H4.
d) Graficar las frecuencias absolutas simples y analizar.
e) Graficar las frecuencias absolutas acumuladas.
f) ¿Qué conclusión general puede extraer acerca de la
encuesta realizada?¿Cuál sería la decisión de la empresa donante basada en los resultados de
ésta encuesta.

Solución:
a) La variable analizada es:
xi=” la cantidad de pares de zapatillas que tienen”
Es una variable cuantitativa discreta (porque sus valores surgen de un proceso de conteo).

b) Tabla de distribución de frecuencias :

xi ni hi Ni Hi
0 n1= 17 h1=0,20 N1=17 H1=0,20
1 n2= 22 h2=0,26 N2=39 H2=0,46
2 n3= 25 h3=0,30 N3=64 H3=0,76
3 n4= 16 h4=0,19 N4=80 H4=0,95
4 n5= 3 h5=0,04 N5=83 H5=0,99
5 n6= 1 h6=0,01 N6=84 H6=1
Total (� ) n= 84 1 /////////////// ///////////////

c)

n2: “De los 84 alumnos encuestados, hay 22 que tiene 1 par de zapatillas c/u”

N3: “Del total de alumnos encuestados hay 64 que tienen como máximo o hasta 2 pares de zapatillas
c/u”

h1: “Del 100% de los alumnos analizados el 20% (es decir o,20*100) no tienen ningún par de
zapatillas”

H4: “Del total de alumnos analizados el 95% tienen no mas (o como máximo) 3 pares de zapatillas c/u”

d) Gráfico de bastones

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.30


Grafico de bastones

30
cantidad de alumnos (ni)

25
20
15
10
5
0
0 1 2 3 4 5 6
cantidad de pares de zapatillas

Para realizar este gráfico en Excel puedes seguir los siguientes


pasos:
1) Una vez que tengas la tabla en la hoja de trabajo del Excel
(Recuerda que no debes colocarle los rótulos como por Ej. n1=17,
sino tan solo el número, porque sino te lo tomará como un dato
alfanumérico y no podrás realizar el gráfico). Ahora selecciona la
columna correspondiente a ”xi” y la “ni”.
2) En el menú busca “gráfico” o bien “insertar gráfico”
3) Elegí “XY (dispersión)
4) Del menú de la derecha selecciona el primero (el que es como
una nube de puntos, sin ninguna línea), luego coloca “siguiente”
dos veces. Y ahora se abrirá una ventana que te permitirá ponerle:
Título, y nombre a los dos ejes.
5) Arriba hay unas pestañas, selecciona la que dice “leyenda” y
desmarca “Mostar leyenda” (de esta forma desaparecerá el
cartelito que decía serie).
6) Finaliza el gráfico y ahora hacé doble clic con el botón izquierdo
del mouse, en uno de los puntos que te quedaron en el gráfico.
Aparecerá una ventana que dice “Formato de serie de datos” con
varias pestañas, vos debes seleccionar la que dice “barras de error
de y”
7) Donde dice: Presentar, elegí “por defecto”. Luego donde dice:
cuantía de error, dirigirse a porcentaje y cambiá el valor 5
(predeterminado) por un 100.
Da aceptar y observa cómo se transformó tu gráfico.
8) Luego dentro del mismo menú anterior podés elegir tramas y le
cambiás el color, el grosor a los bastones que has dibujado.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 31


e) Gráfico escalonado o acumulativo

Grafico escalonado

90
80
70
60
50
Ni

40
30
20
10
0
0 1 2 3 4 5 6
cantidad de pares de zapatillas

Para realizar este gráfico en Excel puedes seguir los siguientes pasos:
1) Una vez que tengas la tabla en la hoja de trabajo del Excel
Selecciona la columna correspondiente a ”xi” y la “Ni”
2) En el menú busca “gráfico” o bien “insertar gráfico”
3) Elegí “XY (dispersión).
4) Del menú de la derecha, selecciona el primero (el que es como una nube de
puntos, sin ninguna línea), luego coloca “siguiente” dos veces. Y ahora se abrirá
una ventana que te permitirá ponerle: Título, y nombre a los dos ejes.
5) Arriba hay unas pestañas, selecciona la que dice “leyenda” y desmarca “Mostar
leyenda” (de esta forma desaparecerá el cartelito que decía serie)
6) Finaliza el gráfico y ahora hace doble clic con el botón izquierdo del mouse en
uno de los puntos que te quedaron en el gráfico. Aparecerá una ventana que dice
“Formato de serie de datos” con varias pestañas, vos debes seleccionar la que
dice “barras de error de x”.
7) Donde dice: Presentar, elegí “por defecto”. Dale aceptar y ahora debemos
adecuar el eje de las abscisas (X), para eso hace clic algunos de los valores del
eje horizontal y aparecerá una ventana que se denomina “Formato de ejes”, anda
a escala y en el primer valor donde dice “mínimo” coloca “el valor 0”. Fíjate
entonces como quedó tu gráfico.
8) Luego dentro del mismo menú anterior podes elegir tramas y le cambias el
color, el grosor a los bastones que has dibujado.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.32


Veamos a través de un ejemplo resuelto, la aplicación para el caso de una variable cuantitativa
continua:

Cuando trabajamos con variables continuas, la tabla de distribución de frecuencias tiene un aspecto
diferente, porque se divide al conjunto de datos en intervalos (que se denominan intervalos de clases),
para armar estos intervalos seguiremos el siguiente procedimiento, el cual lo estudiaremos a través de
un ejemplo:

Ejemplo 2:
Sean los siguientes valores correspondientes a la edad de un conjunto de personas:

3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47,
39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.

a) ¿Cuál es la variable analizada? Clasifícala.


b) Armar la tabla de distribución de frecuencias para la variable, trabajando con 6 intervalos
c) Interpretar las siguientes frecuencias: n2, N3, h1, H4.
d) Graficar las frecuencias absolutas simples y analizar.

Solución:
a) La variable analizada es la edad - Es una variable cuantitativa continua

b) Para armar la tabla de intervalos seguimos el siguiente procedimiento:

1º - Se localizan los valores menor y mayor de la distribución.

En este caso son V mínimo=3 y V máximo= 48

2º - Se restan y se determina el rango, R= V máximo- V mínimo,

En este caso R= 48- 3 = 45

3º - Determinar la cantidad de intervalos con la que vamos a trabajar. Hay fórmulas para determinar
esto, podemos decir que en la práctica éste número escila entre 5 y 10.

Para el ejercicio vamos a tomar 6 intervalos

4º Determinar la amplitud. A= R/ nº intervalos

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 33


En el ejercicio A = 45 /6 = 7,5

5º Redondeamos la amplitud y determinamos así la amplitud corregida Ac

En el ejercicio Ac= 8

**Si la amplitud da un número entero para determinar la amplitud corregida sumamos una cantidad
arbitraria a la amplitud.

6º Se forman los intervalos considerando que se suma la amplitud corregida. Y teniendo presente que
el límite inferior de una clase pertenece al intervalo, pero el límite superior no pertenece a ese intervalo
sino que se encuentra en el siguiente intervalo.

c) n2= 6 Indica que de las 40 personas analizadas hay 6 cuyas edades oscilan entre 11 y hasta
18 años c/u (el 19 está incluido en el siguiente intervalo)

N3= 13 Del total de personas analizadas, hay 13 que tienen de 3 y hasta 26 años c/u (aquí
se acumulan los tres primeros intervalos)

h1% = 5% Del total de personas analizadas el 5% tienen entre 3 y hasta 10 años c/u

H4%=62.5% De las 40 personas analizadas el 62,5% tienen entre 3 y hasta 34 años c/u.

d)

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.34


Observamos que la gran mayoría están concentrados entre 27 y hasta 42 años
aproximadamente.

Veamos ahora un caso en el cual trabajamos con el otro tipo de variable (cualitativa)

Ejemplo 3:

Se realizó una encuesta en un supermercado, a un grupo de


(45) amas de casas, para determinar su opinión a cerca de
un nuevo jabón en polvo (El Zorrino) que desean lanzar al
mercado. Los resultados se muestran a continuación:

Si-si- no-no-no-no/se – no/contesta- si-si-si-si-si-si-si-no-no-


no-no/se-no/se-no/se-no-no-no-si-si-no-si-no/contesta-no-no-
no-si-no-no-no-no-si-si-no-no-no/se-no-si-si-no

¿Qué respondería a las siguientes preguntas?:

a) ¿Cuál es la variable analizada? Clasifícala.


b) Armar la tabla de distribución de frecuencias para la variable.

Por el tipo de variable, la tabla tendrá la siguiente estructura:

xi ni hi %
Si
No
No/se
No/contesta

c) Interpretar las siguientes frecuencias: n2, h1.


d) Graficar las frecuencias (en los dos tipos de gráficos posibles) y analizar
e) Si usted tuviese que dar su “consejo” a los fabricantes de jabón “El zorrino” basándose en los
resultados de la encuesta ¿Qué opinión daría? ¿Por qué?

Solución:

a) La variable analizada es : “La opinión de cada ama de casa , acerca de si utilizaría o no el


nuevo jabón en polvo el Zorrino”

Clasificación de la variable: CUALITATIVA

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 35


b) Tabla de distribución de frecuencias

xi ni hi %
Si 17 38
No 21 47
No/se 5 11
No/contesta 2 4
45 100

c) Interpretación:

n2= 21 corresponde al valor “no“ de la variable analizada, entonces podemos interpretarlo diciendo
que : “De 45 amas de casas analizadas hay 21 que dijeron que No utilizarían el nuevo jabón en
polvo El zorrino ,que la empresa quiere lanzar al mercado.

h1% = 38% la analizamos diciendo que “El 38 % de las amas de casas analizadas manifestaron que Si
usarían el nuevo jabón en polvo”

d) Gráfico: (puede ser torta o pastel o bien barras)

Grafico de Torta o pastel

no contesta
4%

no sabe
11%
si
38% si
no
no sabe
no contesta

no
47%

Para realizar este gráfico en Excel puedes seguir los siguientes


pasos:
1) Una vez que tengas la tabla en la hoja de trabajo del Excel
(Recordá que no debes colocarle los rótulos como por Ej. n1=17,
sino tan solo el número, (de lo contrario te lo tomará como un dato
alfanumérico y no podrás realizar el gráfico). Ahora selecciona la
columna correspondiente a ”xi” y la “ni”
2) En el menú busca “grafico” o bien “insertar gráfico”
3) Elegí “Circular”
4) Del menú de la derecha selecciona el primero, luego coloca
“siguiente” dos veces. Y ahora se abrirá una ventana que te
permitirá ponerle: Título, ubicar la leyenda y colocar rótulo a los
datos (en este caso yo seleccione : “nombre a las categorías “y
“porcentaje”).
5) Finaliza el gráfico, podes elegir (posicionándote) sobre c/sector
del gráfico e ir cambiando los colores y las tramas.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.36


Grafico de barras
Cantidad de amas de casas
25
21
20
17
15

10
5
5 2
0
si no no sabe no contesta
Opinion

Para realizar este gráfico en Excel puedes seguir los siguientes


pasos:
1) Una vez que tengas la tabla en la hoja de trabajo del Excel
(Recorda que no debes colocarle los rótulos como por Ej. n1=17,
sino tan solo el número (de lo contrario te lo tomará como un dato
alfanumérico y no podrás realizar el gráfico). Ahora selecciona la
columna correspondiente a ”xi” y la “ni”
2) En el menú busca “grafico” o bien “insertar gráfico”
3) Elegí “Columnas” (puede ser también barras)
4) Del menú coloca “siguiente” dos veces. Y ahora se abrirá una
ventana que te permitirá ponerle: Título, y nombre a los dos ejes
5) Arriba hay unas pestañas, selecciona la que dice “leyenda” y
desmarca “Mostar leyenda” (de esta forma desaparecerá el
cartelito que decía serie)
6) Finaliza el gráfico, podes elegir (posicionándote) sobre c/sector
del gráfico e ir cambiando los colores y las tramas.
.

Partes de una tabla estadística:


1- Título
2- Encabezado (o conceptos)
3- Cuerpo
4- Notas al pie
5- Fuente
6- Nota de unidad de medida

Analicemos cada una:


1- Título: Descripción resumida del contenido del cuadro, su redacción debe ser clara, breve y
completa, de forma tal que se pueda deducir cual es la información que contiene el cuadro.
2- Encabezado: descripción de las filas y columnas de la tabla. Se ubica en la parte superior del
cuerpo del cuadro o tabla.
3- Cuerpo: es el contenido numérico de la tabla, es decir los datos de la/s variable/s.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 37


4- Notas al pie: se usan para aclarar algunos términos o siglas y también para indicar que elementos
están o no incluidos en algunos de los conceptos de la tabla.
5- Fuente: es la indicación al pie del cuadro que sirve para nombrar la publicación, entidad, estudio
de donde se obtuvieron los datos utilizados para construir la tabla. Permite verificar o validar los
datos que contiene la tabla.
Hay dos tipos de fuentes:
a) Primarias: cuando se obtienen directamente de la unidad estadística o de los propios
formularios de una encuesta realizada por nosotros-
b) Secundarias: cuando se recurren a datos, encuestas, o trabajos estadísticos publicados o
realizados por otros.
6- Nota de unidad de medida: se escribe debajo del título original, se usa cuando se abrevia la
escritura de las cifras y para expresar las unidades en las que está expresada la variable analizada

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.38


Veamos las partes de una tabla estadística por medio de un ejemplo:

Pictograma:

Es un gráfico con dibujos alusivos al carácter que se está estudiando y cuyo tamaño es proporcional a
la frecuencia que representan; dicha frecuencia se suele indicar.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 39


¿En qué mes se plantaron menos árboles?, ¿y en cuál se hicieron más plantaciones?

Es un tipo de representación que se utiliza para variables cualitativas, y que consiste en representar los
datos con dibujos alusivos a la estadística estudiada. Los pictogramas son muy expresivos, pero poco
precisos.
Hay dos clases de pictogramas:
1. Se utiliza un dibujo que representa la variable estadística y ésta se repite tantas veces como
haga falta (frecuencia absoluta).
2. El dibujo utilizado varía de tamaño dependiendo de su frecuencia; a mayor frecuencia mayor es
el dibujo.

Ejemplo 1: La siguiente tabla muestra la evolución de la población de España desde el año


1900. Realizamos un pictograma para representar los datos de forma gráfica.

Año Población

1900 18.616.630

1920 21.388.551

1940 26.014.278

1960 30.582.936

1980 37.742.561

2000 40.499.791

2010 47.021.031

Ejemplo 2:

Características de los pictogramas


• Su formato es libre.
• Emplean una secuencia de símbolos para representar frecuencias.
• Se emplean para el tratamiento de datos tanto cualitativos como cuantitativos.

Finalizamos aquí el desarrollo teórico del segundo módulo y lo invitamos a realizar las
actividades respectivas.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.40


m2 material

Material
Material Básico
• Desarrollo teórico del módulo, disponible en el apartado contenidos.
• Bologna E. (2011) (Comp). Estadística aplicada a la Psicología y a la
Educación. Córdoba: Editorial Brujas.

Material Complementario
• Barón-López, J. (2005). Bioestadística: métodos y aplicaciones.
Apuntes y material disponible en http://www.bioestadistica.uma.es/
baron/apuntes/ Rius, F., Barón-López, F. J., Sánchez, E. y Parras, L.
(2006).

• Bioestadística: métodos y aplicaciones. Disponible en www.


bioestadistica.uma.es/libro/ Pardo, A. y Ruiz, M. A. (2002). SPSS: Guía
para el análisis de datos. Madrid: McGraw-Hill.

• J. Gabriel Molina y María F. Rodrigo Estadística descriptiva en


Psicología Curso 2009-2010

• Estadística Básica para Docentes de Educación Secundaria Tercer


Diplomado en Didáctica de la Matemática (12/11/2009) Luis María
Dicovskiy Riobóo

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 41


m2 actividades

m2 | actividad 1

Gráficos y tablas estadísticos

Consigna:
Lea la siguiente situación y realice las tareas a continuación.

La asociación de padres y maestros de un pueblo del interior de Córdoba, rea-


lizó en el mes de mayo del corriente año, una encuesta sobre el consumo de
bebida y la conducción, mediante 166 entrevistas telefónicas. La indagación
surgió de la preocupación por una serie de accidentes registrados en el último
año en el pueblo, ocasionados por conductores en estado de ebriedad.
A las personas encuestadas se les preguntó: “¿Piensa Ud. que el problema de
conducir habiendo bebido ha aumentado o disminuido, en el último año?”
Con los resultados obtenidos se confeccionó el siguiente gráfico:

“¿Piensa Ud. que el problema de conducir habiendo bebido ha aumentado o


disminuido, en el último año?”

Sigue igual
22%
Aumentó
58%

Disminuyó
20%

a) Completar la tabla:

Variable Porcentajes Cantidades


Aumentó
Disminuyó 20
Sigue igual 37
Total 100 166

b) ¿Qué conclusión podría extraer en función de los resultados obtenidos y el


problema planteado por los padres?

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.42


Actividad 2: Tablas estadísticas
Marcar la alternativa correcta- Justificar brevemente tu elección:
1. La suma de las frecuencias absolutas simples siempre es igual a:
a) 100%
b) La población
c) La muestra
d) 1

2. La suma de las frecuencias relativas simples porcentuales siempre es


igual a:

a) 1
b) La muestra
c) 100 %
d) Ninguna es correcta

3. La descripción de las filas y columnas de la tabla se denomina:


a) Fuente
b) Cuerpo
c) Notas al pie
d) Título

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 43


m2 | actividad 2

Tablas estadísticas
Marcar la alternativa correcta- Justificar brevemente tu elección:
1. La suma de las frecuencias absolutas simples siempre es igual a:
a) 100%
b) La población
c) La muestra
d) 1

2. La suma de las frecuencias relativas simples porcentuales siempre es


igual a:

a) 1
b) La muestra
c) 100 %
d) Ninguna es correcta

3. La descripción de las filas y columnas de la tabla se denomina:


a) Fuente
b) Cuerpo
c) Notas al pie
d) Título

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.44


m2 | actividad 3

Pictograma

La demanda anual de un tipo particular de vehículos en algunos países de


Suramérica se muestra a continuación:

 
País Demanda
Colombia 20.000
Venezuela 40.000
Argentina 120.000
Chile 150.000
Brasil 160.000

Realizar un pictograma para la tabla anterior.

m2 | actividad 4

Tablas y diagramas

El número de hermanos de los alumnos de una clase es el siguiente:


010032140011201
120112130021235

a) Elabore una tabla de frecuencias en las que se incluyan: frecuencia


absoluta, absoluta acumulada, relativa y relativa acumulada.

b) Dibuje un diagrama de barras con frecuencias absolutas acumuladas y un


polígono de frecuencias absolutas.

c) ¿Qué porcentaje de alumnos son hijos únicos?


d) ¿Cuántos alumnos tienen más de un hermano?

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 45


m2 | actividad 5

Gráficos de Barra y Tortas

Estos son los datos sobre ocupación de la población por sectores económicos:

Agricultura 1.870.000
Industria 2.587.000
Construcción 789.000
Servicios 5.394.500

a) ¿Cuántos trabajadores hay en total?


b) Calcule la frecuencia relativa en porcentaje de cada sector
económico.
c) Represente estos datos en un diagrama de barras.
d) Represente esos datos en un gráfico de torta.

m2 | actividad 6

Gráficos

A continuación, marque la alternativa correcta y justifique siempre su


respuesta.
1. ¿Cuál de los siguientes nombres no corresponde a un gráfico estadís-
tico?

1. Histograma

2. Cartograma

3. Calcograma

2. El diagrama de sectores se utiliza para representar:

1. Sólo caracteres cualitativos

2. Sólo caracteres cuantitativos

3. Caracteres cualitativos y cuantitativos

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.46


3. El polígono de frecuencias se utiliza para representar:

1. Sólo caracteres cualitativos

2. Sólo caracteres cuantitativos

3. Caracteres cualitativos y cuantitativos

Intervalo 0-2 2-6


Frecuencia 10 40
4. En un histograma, queremos representar los siguientes datos:

Sabemos que el intervalo 2-6 está representado por un rectángulo de


10 cm de altura. ¿Cuál debe ser la altura del intervalo 0-2?

1. 6 cm

2. 5 cm

3. 3 cm

5. Si queremos comparar los datos de dos variables en un diagrama de


barras, es aconsejable utilizar:

1. Las frecuencias relativas

2. Las frecuencias absolutas

3. Indistintamente las frecuencias relativas o absolutas

6. Para construir un polígono de frecuencias acumuladas partiendo del


diagrama de barras de una variable discreta,

1. Se unen los puntos medios de las bases superiores del


diagrama de barras

2. Se unen los vértices superiores derechos de los rectángu-


los

3. No se puede construir un polígono de frecuencias acumu-


ladas partiendo de un diagrama de barras.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 47


7. Le hemos preguntado a 150 personas el número de zapatos que
calzan. Dado el siguiente diagrama de sectores ¿cuántas personas
calzan un 42?

1. 33 personas

2. 28 personas

3. 21 personas

m2 glosario

Cuerpo: es el contenido numérico de la tabla, es decir los datos de la/s


variable/s.
Distribución de frecuencias: agrupamientos de datos en categorías que
muestran el número de observaciones, en cada categoría mutuamente
excluyentes. En general se agrupan en tablas que se denominan: tablas de
distribución de frecuencias.

Encabezado: descripción de las filas y columnas de la tabla. Se ubica en la


parte superior del cuerpo del cuadro o tabla.
Fuente: es la indicación al pie del cuadro que sirve para nombrar la
publicación, entidad, estudio de donde se obtuvieron los datos utilizados para
construir la tabla.
Nota de unidad de medida: se escribe debajo del título original, se usa cuando
se abrevia la escritura de las cifras y para expresar las unidades en las que está
expresada la variable analizada.
Notas de pie: se usan para aclarar algunos términos o siglas y también para
indicar que elementos están o no incluidos en algunos de los conceptos de la
tabla.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.48


Pictograma: es un gráfico con dibujos alusivos al carácter que se está estu-
diando y cuyo tamaño es proporcional a la frecuencia que representan; dicha
frecuencia se suele indicar.
Serie simple: es un listado de datos, en el orden que fueron apareciendo, por
lo general son pocos datos.

Tablas estadísticas: contienen: los diferentes valores que puede asumir una
variable o los intervalos correspondientes, y las diferentes frecuencias (absolu-
tas y relativas).
Título: Descripción resumida del contenido del cuadro, su redacción debe ser
clara, breve y completa, de forma tal que se pueda deducir cual es la informa-
ción que contiene el cuadro.

m3

m3 microobjetivos

• Comprender el concepto de las medidas de tendencia central que


tienen como objetivo el sintetizar los datos en un valor representativo,
y el de las medidas de dispersión que dicen hasta qué punto estas
medidas de tendencia central son representativas como síntesis de la
información.

• Caracterizar su distribución de frecuencias mediante algunos valores


numéricos, eligiendo como resumen de los datos un valor central
alrededor del cual se encuentran distribuidos los valores de la variable.

• Desarrollar la capacidad de saber hasta qué punto para una


determinada distribución de frecuencias, las medidas de tendencia
central o de posición son representativas como síntesis de toda la
información de la distribución.

• Elaborar un indicador a través del estudio de las medidas de forma,


que permita establecer el grado de simetría (o asimetría) que presenta
una distribución sin hacer su gráfica.

• Estudiar la distribución de frecuencias en la zona central de la


distribución a través de las medidas de curtosis.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 49


Estadística Aplicada a la Educación
m3 contenidos
Módulo 3

Análisis Exploratorio de Datos:

Medidas de posición

¿Qué es la tendencia central?

La tendencia central se refiere al punto medio de una distribución.

Las medidas de tendencia central se denominan medidas de posición. Veamos cada una de ellas:

Media aritmética o promedio: es la suma de todos los valores de la variable dividida el número
total de observaciones

El cálculo de la media va a variar según se trate de una variable cuantitativa discreta o de una
cuantitativa continua. Y dentro de las discretas será distinto el cálculo si es una serie simple o bien una
distribución de frecuencias.

Iremos analizando cada caso por medio de ejemplos.

Ejemplo 1: variable cuantitativa discreta - presentados los datos en serie simple

Variable: xi= cantidad de hermanos que tienen los alumnos de un grado

Datos: 1 2 2 4 5

La muestra tiene tamaño n=5

La fórmula de cálculo será: M(x) = Σ xi


n

En el ejercicio el cálculo será: M(x) = (1+2+2+4+5) /5 = 14/5 = 2,8 entonces podemos decir que en
promedio estos 5 alumnos tienen aproximadamente 3 hermanos c/u

Ejemplo 2: variable cuantitativa discreta - presentados los datos en distribución de frecuencias

Variable: xi= cantidad de hermanos que tienen los alumnos de un grado

Pero ahora tomamos una muestra mayor y como hay datos que se repiten armamos una tabla de
distribución de frecuencias.
xi ni
1 5
2 8
3 4
4 2
5 1
Total 20

La muestra tiene tamaño n = 20

La fórmula de cálculo será: M(x) = Σ( xi.ni)


n

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.50


Para calcular la media agregamos una tercer columna a la tabla en la cual hacemos el producto xi*ni
es decir cada valor de la variable por su correspondiente frecuencia absoluta simple.

xi  ni  xi*ni 


1  5  1*5 =        5 
2  8  2* 8 =     16 
3  4  3*4 =      12 
4  2  8
5  1  5
Total  20  46

M(x) = Σ( xi.ni) = 46/20 = 2,3 hermanos


N

Entonces podemos decir que en promedio estos 20 alumnos tienen aproximadamente 2 hermanos c/u

Intervalos ni  Yi = Marca de clase  yi*ni


[3 ; 11) 2 ( 3+11)/2    =            7 14
[ 11; 19) 6 (11+19) /2 =           15 90 Ejemplo 3: variable cuantitativa
continua - presentados los datos
[ 19 ; 27) 5 23 115 en distribución de frecuencias
[ 27 ; 35) 12 31 372
39 429 Variable. Yi= edad de un conjunto
[ 35 ; 43) 11
de 40 personas
[ 43 ; 51) 4 47 188
TOTAL 40 ///////////////////// 1208

M(y) = Σ( yi.ni)
n

Pero para la variable continua trabajamos con la marca de clase: yi = que es el promedio de los
límites de cada intervalo.

Y de nuevo en la tercer columna de la tabla se hace el producto yi*ni

Para el ejercicio la media o promedio será igual a:

M(y) = 1208 /40 = 30,2 años

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 51


Entonces podemos decir que la edad promedio de estas 40 personas es de 30 años c/u

Características de la media

• Cada conjunto de datos tiene una media y es única.

• Es útil para llevar a cabo procedimientos estadísticos como la comparación de medias de varios
conjuntos de datos. En estadística inferencial es la medida de tendencia central que tiene mejores
propiedades.

• Aunque la media es confiable en el sentido de que toma en cuenta todos los valores del conjunto
de datos, puede verse afectada por valores extremos que no son representativos del resto de los
datos. La media puede malinterpretarse si los datos no forman un conjunto homogéneo.

• No se pude calcular la media para variables cualitativas

Moda, modo o valor modal: es el valor de la variable que se repite más veces. Es decir el valor de
la variable que corresponde a la mayor de las frecuencias absolutas simples

El cálculo de la moda va a variar según se trate de una variable cuantitativa discreta o de una
cuantitativa continua. Y dentro de las discretas será distinto el cálculo si es una serie simple o bien una
distribución de frecuencias.

Iremos analizando cada caso por medio de ejemplos.

Ejemplo 1: variable cuantitativa discreta - presentados los datos en serie simple

Variable: xi = cantidad de hermanos que tienen los alumnos de un grado

Datos: 1 2 2 4 5

Mo(x) = 2 hermanos

Ejemplo 2: variable cuantitativa discreta - presentados los datos en distribución de frecuencias

Variable: xi = cantidad de hermanos que tienen los alumnos de un grado

xi ni
1 5
2 8
3 4
4 2
5 1
Total 20

Mo (X)= 2 hermanos (pues el valor de la variable que se repite mas veces)

Ejemplo 3: variable cuantitativa continua - presentados los datos en distribución de frecuencias

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.52


IMPORTANTE:

No veremos el cálculo de esta medida para este caso. Existen ejercicios en los que se da esta medida
como dato y solo se pide su utilización en temas que veremos en próximas unidades.

Características de la moda:

• Se puede utilizar para datos cualitativos nominales u ordinales y para datos cuantitativos.

• No se ve afectada por los valores extremos.

• Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, se dice que no tiene moda
Si puede pasar que haya dos valores que se repitan igual número de veces, es decir dos modas,
en este caso la distribución será: bimodal.

Mediana: es el valor que divide al conjunto ordenado de datos, en dos subconjuntos


con la misma cantidad de elementos. La mitad de los datos son menores que la
mediana y la otra mitad son mayores.

El cálculo de la mediana va a variar según se trate de una variable cuantitativa discreta o de una
cuantitativa continua. Y dentro de las discretas será distinto el cálculo si es una serie simple o bien una
distribución de frecuencias.

Iremos analizando cada caso por medio de ejemplos.

En este caso también debemos tener en cuenta si la serie simple es: PAR o IMPAR

Ejemplo 1: variable cuantitativa discreta - presentados los datos en serie simple IMPAR

Variable: xi= cantidad de hermanos que tienen los alumnos de un grado

Datos: 1 2 2 4 5

1) Ordenamos la serie de menor a mayor


1 2 2 4 5

2) Me(X) = X que está en el lugar (n+1) /2

Es decir que la mediana estará en el lugar (n+1) /2 = (5+1) /2= 6/2 =3

La observación que está en el lugar 3

Ejemplo 2: variable cuantitativa discreta - presentados los datos en serie simple PAR

Variable: xi= cantidad de hermanos que tienen los alumnos de un grado

Datos: 1 2 2 4 5 7

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 53


1) Ordenamos la serie de menor a mayor
1 2 2 4 5 7

2) Me(X) = X que está en el lugar (n+1) /2

Es decir que la mediana estará en el lugar (n+1) /2 = (6+1) /2= 7/2 =3,5

La observación que está entre los lugares 3 y el lugar 4, entonces la mediana será el promedio
entre estas dos observaciones

Ejemplo 3: variable cuantitativa discreta - presentados los datos en distribución de frecuencias - PAR

Variable: xi= cantidad de hermanos que tienen los alumnos de un grado

xi  ni  Ni
1 5 5
2 8 13
3 4 17
4 2 19
5 1 20
Total  20 //////////

Me(x) = X en la posición n+1/2 en el ejercicio será

n+1 /2 = 20+1 /2 = 21/2 = 10,5

Me (x) = X10 + X11 = 2+2 = 2 Me (x)


2 2

Ejemplo 4: variable cuantitativa discreta -presentados los datos en distribución de frecuencias


_IMPAR

Variable: xi= cantidad de hermanos que tienen los alumnos de un grado

xi ni Ni 
1 4 4 
2 8 12  
3 4 16 
4 2 18 
5 1 19 
Total  19 ////////////////// 

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.54


Me(x) = X en la posición n+1/2 en el ejercicio será

n+1 /2 = 19+1 /2 = 20/2 = 10

Me (x) = X10 = 2

Ejemplo 5) variable cuantitativa continua - presentados los datos en distribución de frecuencias

Importante:

No veremos el cálculo de esta medida para este caso. Existen ejercicios en los que se da esta medida
como dato y solo se pide su utilización en temas que veremos en próximas unidades.

Características de la mediana:

Se puede utilizar para datos cualitativos ordinales y para datos cuantitativos .

No se ve afectada por los valores extremos. Esta es la propiedad más importante que tiene.

Si hay un gran número de datos, el tener que ordenarlos para hallar la mediana insume
esfuerzo y tiempo.

COMPARACIÓN ENTRE LA MEDIA, LA MEDIANA Y LA MODA

• Las distribuciones simétricas tienen el mismo valor para la media, la mediana y la moda.

• En una distribución con sesgo positivo, la moda se halla en el punto más alto de la distribución, la
mediana está hacia la derecha de la moda y la media más a la derecha.
Es decir Mo < Me < x

• En una distribución con sesgo negativo, la moda es el punto más alto, la mediana está a la
izquierda de la moda y la media está a la izquierda de la mediana.
Es decir, x < Me < Mo

• Cuando la población tiene una distribución sesgada, con frecuencia la mediana resulta ser la mejor
medida de posición, debido a que está siempre entre la media y la moda. La mediana no se ve
altamente influida por la frecuencia de aparición de un solo valor como es el caso de la moda, ni se
distorsiona con la presencia de valores extremos como la media.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 55


Los cuartiles

Con frecuencia es conveniente dividir los datos en cuatro partes, así cada una contiene el 25% de los
datos. A los puntos de división se los llama cuartiles

Q1= primer cuartil o percentil 25

Q2= segundo cuartil o percentil 50

Q3= tercer cuartil o percentil 75

Rango intercuartílico (RIC) es también una medida importante a tener en cuenta, es la


diferencia entre el tercer y primer cuatil

RIC= Q3- Q1
Nos indica el 50 % de las observaciones centrales

Cuartiles: si a un conjunto de datos se ordena de mayor a menor, el valor central es la


mediana, este valor divide el grupo, en dos subgrupos cada uno con el 50 % de los datos. Si a
cada subgrupo ordenado se le marca el valor central, tenemos así tres valores seleccionados
que llamaremos Cuartiles, Q1, Q2 y Q3. Estos valores dividen al conjunto de datos en cuatro
grupos con igual número de términos, cada cuartil contiene el 25% de los datos. La mediana es
el cuartil dos, Q2.

El cálculo de los cuartiles va a variar según se trate de una variable cuantitativa discreta o de una
cuantitativa continua. Y dentro de las discretas será distinto el cálculo si es una serie simple o bien una
distribución de frecuencias.

Iremos analizando cada caso por medio de ejemplos:

Ejemplo1: variable cuantitativa discreta - presentados los datos en serie simple IMPAR

Variable: xi= cantidad de hermanos que tienen los alumnos de un grado

Datos: 2 3 6 7 7 4 5

1) Ordenamos la serie de menor a mayor


2 3 4 5 6 7 7

2) Q1(X) = X que está en el lugar (n+1) /4

Es decir que el primer cuartil Q1(x) estará en el lugar (n+1) /4 = (7+1) /4= 8/4 =2

La observación que esté en el lugar 2 será Q1

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.56


Q2(X) = X que está en el lugar 2 (n+1) /4 = (n+1) /2 es decir que Q2 es la Mediana

Es decir que el segundo cuartil Q2(x) estará en el lugar 2(n+1) /4 =(n+1)/2= (7+1) /2= 8/2 =4

La observación que esté en el lugar 4 será Q2 = Me(x)

Q3(X) = X que está en el lugar 3(n+1) /4

Es decir que el tercer cuartil Q3(x) estará en el lugar 3 (n+1) /4 = 3 (7+1) /4=3. 8/4 = 24/4 =6

La observación que esté en el lugar 6 será Q3

Ejemplo 2: variable cuantitativa discreta - presentados los datos en serie simple PAR

Variable: xi= cantidad de hermanos que tienen los alumnos de un grado

Datos: 2 3 6 7 4 5

1) Ordenamos la serie de menor a mayor


2 3 4 5 6 7

2) Q1(X) = X que está en el lugar (n+1) /4

Es decir que el primer cuartil Q1(x) estará en el lugar (n+1) /4 = (6 +1) /4= 7 /4 =1,75

La observación que esté en el lugar 2 será Q1 por que si bien esta entre las observaciones 1 y la
2 , al dar 1,75 la ubicación está más cerca de la observación 2 que de la 1 .

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 57


**/Aclaración: si hubiese dado por ejemplo 1,25 hubiésemos elegido la observación 1 porque esta
más cerca de la posición 1 que de la 2.
Y si hubiese dado 1,5 deberíamos hacer el promedio entre las dos observaciones

Continuemos con nuestro ejemplo

Q2(X) = X que está en el lugar 2 (n+1) /4 = (n+1) /2 es decir que Q2 es la Mediana

Es decir que el segundo cuartil Q2(x) estará en el lugar 2(n+1) /4 =(n+1)/2= (6+1) /2= 7/2 =3,5

La observación que está justo en el medio entre las observaciones 3 y la 4 entonces Q2 = Me(x)
será igual al promedio entre las dos observaciones

Q3(X) = X que está en el lugar 3(n+1) /4

Es decir que el tercer cuartil Q3(x) estará en el lugar 3 (n+1) /4 = 3 (6+1) /4=3. 7/4 = 21/4 =5,25

La observación que esté en el lugar 5 será Q3 porque si bien está entre la 5 y la 6 , como dio 5,25
está más cerca de la observación 5 , entonces Q3(x) será :

Ejemplo 3: variable cuantitativa discreta - presentados los datos en distribución de frecuencias - PAR

Variable: xi= cantidad de hermanos que tienen los alumnos de un grado

xi  ni  Ni
1 5 5
2 8 13
3 4 17
4 2 19
5 1 20
Total  20 //////////

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.58


1) Los datos ya están ordenados en la tabla

2) Q1(X) = X que está en el lugar (n+1) /4

Es decir que el primer cuartil Q1(x) estará en el lugar (n+1) /4 = (20 +1) /4= 21 /4 =5,25

La observación que esté en el lugar 5 será Q1 por que si bien esta entre las observaciones 5 y la
6 , al dar 5,25 la ubicación está más cerca de la observación 5 que de la 6 . Y ahora para encontrarla
usamos las frecuencias absolutas acumuladas

**/Aclaración: si hubiese dado por ejemplo 1,25 hubiésemos elegido la observación 1 porque esta
más cerca de la posición 1 que de la 2.
Y si hubiese dado 1,5 deberíamos hacer el promedio entre las dos observaciones

Continuemos con nuestro ejemplo

xi ni  Ni
X5=1
X6=2 1 5 5 
  2 8 13 
Q1(x)= 1 17 
3 4
4 2 19 
5 1 20 
Total 20 ////////// 

Q2(X) = X que está en el lugar 2 (n+1) /4 = (n+1) /2 es decir que Q2 es la Mediana

Es decir que el segundo cuartil Q2(x) estará en el lugar 2(n+1) /4 =(n+1)/2= (20+1) /2= 21/2 =10,5

La observación que está justo en el medio entre las observaciones 10 y la 11 entonces Q2 = Me(x)
será igual al promedio entre las dos observaciones

X10= 2
X11=2

Q2(x) = Me(x) = (2+2)/2 = 4/2 =2

Q3(X) = X que está en el lugar 3(n+1) /4

Es decir que el tercer cuartil Q3(x) estará en el lugar 3 (n+1) /4 = 3 (20+1) /4=3. 21/4 = 63/4 =15,75

La observación que esté en el lugar 16 será Q3 porque si bien está entre la 15 y la 16, como dio
15,75 está más cerca de la observación 16 , entonces Q3(x) será :

X15=4
X16=4

Q3(x) = (4+4)/2 = 8/2 =4

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 59


Ejemplo 4: variable cuantitativa discreta -presentados los datos en distribución de frecuencias
_IMPAR

Variable: xi= cantidad de hermanos que tienen los alumnos de un grado

xi ni Ni 
1 4 4 
2 8 12 
3 4 16 
4 2 18 
5 1 19 
Total  19 ////////////////// 

1) Los datos ya están ordenados en la tabla

2) Q1(X) = X que está en el lugar (n+1) /4

Es decir que el primer cuartil Q1(x) estará en el lugar (n+1) /4 = (19 +1) /4= 20 /4 =5

La observación que esté en el lugar 5 será:


Q1(x)= 2

Q2(X) = X que está en el lugar 2 (n+1) /4 = (n+1) /2 es decir que Q2 es la Mediana

Es decir que el segundo cuartil Q2(x) estará en el lugar 2(n+1) /4 =(n+1)/2= (19+1) /2= 20/2 =10

La observación que está justo en el lugar 10

Q2(x) = Me(x) = 2

Q3(X) = X que está en el lugar 3(n+1) /4

Es decir que el tercer cuartil Q3(x) estará en el lugar 3 (n+1) /4 = 3 (19+1) /4=3. 20/4 = 60/4 =15

La observación que esté en el lugar 15 será Q3

Q3(x) = 3

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.60


Diagrama de caja brazos (caja-bigotes)

Una gráfica de este tipo consiste en una caja rectangular, donde los lados más largos muestran
el recorrido intercuartílico. Este rectángulo está dividido por un segmento vertical que indica donde se
posiciona la mediana y por lo tanto su relación con los cuartiles primero y tercero (recordemos que el
segundo cuartil coincide con la mediana).

Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y máximo
de la variable. Las líneas que sobresalen de la caja se llaman bigotes. Estos bigotes tienen un límite de
prolongación, de modo que cualquier dato o caso que no se encuentre dentro de este rango es
marcado e identificado individualmente.

Ejemplo distribución de edades

Utilizamos la distribución de frecuencias que representan la edad de una muestra de 20 personas.

36 25 37 24 39 20 36 45 31 31

39 24 29 23 41 40 33 24 34 40

*Ordenar los datos

Para calcular los parámetros estadísticos, lo primero es ordenar la distribución:

20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45

*Cálculo de cuartiles

Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribución. Como N = 20
resulta que N/4 = 5; el primer cuartil es la media aritmética de dicho valor y el siguiente:

Q1 = (24 + 25) / 2 = 24,5

Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribución, es el valor de la variable que
ocupa el lugar central en un conjunto de datos ordenados. Como N/2 =10 ; la mediana es la media
aritmética de dicho valor y el siguiente:

me= Q2 = (33 + 34)/ 2 =33,5

Q3 , el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribución. En nuestro
caso, como 3N / 4 = 15, resulta

Q2=(39 + 39) / 2 = 39

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 61


*Dibujar la caja y los brazos

El bigote de la izquierda representa al colectivo de edades ( Xmín, Q1)


La primera parte de la caja a (Q1, Q2),
La segunda parte de la caja a (Q2, Q3)
El bigote de la derecha viene dado por (Q3, Xmáx).

* Análisis del gráfico

Podemos obtener abundante información de una distribución a partir de estas representaciones. Por
ejemplo:

• La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las edades
comprendidas entre el 25% y el 50% de la población está más dispersa que entre el 50% y el
75%.
• El bigote de la izquierda (Xmím, Q1) es más corto que el de la derecha; por ello el 25% de los
más jóvenes están más concentrados que el 25% de los mayores.
• El rango intercuartílico = Q3 - Q1 = 14,5; es decir, el 50% de la población está comprendido en
14,5 años.

Seguro que usted obtener más información (¡Utiliza la mediana!).

La mayor utilidad de los diagramas caja-bigotes es para comparar dos o más conjuntos de datos.

• Comparación distribución de edades


• Comparación entrenamientos de un corredor
• Comparación clasificación liga

* Comparación distribución de edades

Análogamente a lo realizado con los diagramas de tallo y hojas, comparamos, mediante estos
diagramas, esta distribución con la del otro ejemplo de distribución de edades.

35 38 32 28 30 29 27 19 48 40

39 24 24 34 26 41 29 48 28 22

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.62


A partir de dicha comparación puede obtenerse bastante información de ambas distribuciones.

* Comparación entrenamientos de un corredor

Un corredor entrena para una determinada carrera y se toman los tiempos que necesita para recorrer
los 200 m, durante 10 días consecutivos (cada día se toman varios tiempos y se calculan mediana,
cuartiles, valores mínimo y máximo)

Observamos que el desplazamiento de las gráficas de caja hacia la izquierda indica que el
entrenamiento ha dado resultado, ya que se tardan menos segundos en recorrer la misma distancia,
siendo la diferencia entre el máximo y el mínimo menor, como así también la diferencia intercuartílica.

* Comparación clasificación liga

Las puntuaciones de los equipos de la liga de futbol BBVA de las temporadas 10/110 y 11/12 se
pueden comparar con un diagrama caja y bigotes, como aparece seguidamente:

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 63


Comparación de tres ligas europeas de futbol de la temporada 11/12

Medidas de dispersión

Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la variabilidad de


una distribución, indicando por medio de un número, si las diferentes puntuaciones de una variable
están muy alejadas de la media.
Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.64


media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos.

En realidad cuando menor sea la varianza la distribución será más homogénea no la media, es decir
que los datos serán más parecidos entre sí y por ende, más similares a la media.

Varianza: es una medida estadística que mide la dispersión de los valores respecto a un valor
central (media), es decir, es el cuadrado de las desviaciones:

**Cuando se trabajo con poblaciones se divide por “n” , en cambio cuando se trabaja con muestras
(como en la mayoría de los casos) se divide por “n-1”

Características de la varianza:

• La varianza es siempre positiva o 0

• Si a los datos de la distribución les sumamos una cantidad constante la varianza no se


modifica.

• Si a los datos de la distribución los multiplicamos una constante, la varianza queda


multiplicada por el cuadrado de esa constante.

• V(x+y) = V(x)+V(y) – Cov (x;y) si x e y son dependientes.

• V(x-y) = V(x)+V(y) – Cov (x;y) si x e y son dependientes.

• V(x+y) = V(x)+V(y) si x e y son independientes (la Cov (x;y) =0)

• V(x-y) = V(x)+V(y) si x e y son independientes (la Cov (x;y) =0)

Desviación estándar es la raíz cuadrada positiva de la varianza

La desviación típica informa sobre la dispersión de los datos respecto al valor de la media; cuanto
mayor sea su valor, más dispersos estarán los datos

El cálculo de la varianza y de la desviación estándar va a diferir según se trate de una variable


cuantitativa discreta o de una cuantitativa continua. Y dentro de las discretas será distinto el cálculo
si es una serie simple o bien una distribución de frecuencias.

Iremos analizando cada caso por medio de ejemplos.

Ejemplo 1: variable cuantitativa discreta - presentados los datos en serie simple

Variable: xi= cantidad de hermanos que tienen los alumnos de un grado

Datos: 1 2 2 4 5

Recordemos que cuando realizamos este ejemplo para la media el valor que obtuvimos para la media
fue de
M(x) =2,8

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 65


Entonces la varianza será calculada de la siguiente manera:
V(x)= ((1-2,8)2 +(2-2,8)2 +(2-2,8)2 +(4-2,8)2 +(5-2,8)2) = 2,7 varianza
5-1

DS(x) = 1,64

Ejemplo 2: variable cuantitativa discreta - presentados los datos en distribución de frecuencias

Variable: xi= cantidad de hermanos que tienen los alumnos de un grado

Pero ahora tomamos una muestra mayor y como hay datos que se repiten armamos una tabla de
distribución de frecuencias.
xi ni
1 5
2 8
3 4
4 2
5 1
Total 20

M(x) = 2,3 hermanos


xi  ni  ni. (xi‐M(x))²
1 5 8,45
2 8 0,72
3 4 1,96
4 2 5,78
5 1 7,29
Total  20 24,2

V(x) = 24,2/19 = 1,27

DS(x) = 1,13

Ejemplo 3: variable cuantitativa continua - presentados los datos en distribución de


frecuencias

Variable. Yi= edad de un conjunto de 40 personas

Intervalos  ni   Yi = Marca de clase ni.(yi‐M(y))²


[3  ;  11)  2  7 1076,48
[ 11; 19)  6  15 1386,24
[ 19 ; 27)  5  23 259,2
[ 27 ; 35)  12  31 7,68
[ 35 ; 43)  11  39 851,84
[ 43 ; 51)  4  47 1128,96
TOTAL   40  ///////////////////// 4710,4

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.66


M(y) = 1208 /40 = 30,2 años

V(y) =4710,4/39= 120,78

DS(y) = 10,99

Desviación cuartílica: es la diferencia entre el Q3-Q1, se utiliza en el diagrama de caja brazos.

Coeficiente de variación: es el cociente entre la desviación estándar dividida por la media, por
lo general se expresa como porcentaje , es decir que al cociente antes mencionado se lo
multiplica por 100

CV(x) = DS(x) *100


M(x)

Características del coeficiente de variación:

• Su fórmula expresa la desviación estándar como porcentaje de la media aritmética, mostrando


una mejor interpretación porcentual del grado de variabilidad que la desviación típica o
estándar.

• Por otro lado presenta problemas ya que a diferencia de la desviación típica este coeficiente es
variable ante cambios de origen.

• A mayor valor del coeficiente de variación mayor heterogeneidad de los valores de la variable; y
a menor coeficiente de variación, mayor homogeneidad en los valores de la variable.

• El coeficiente de variación no posee unidades.

• El coeficiente de variación es típicamente menor que uno. Sin embargo, en ciertas


distribuciones de probabilidad puede ser 1 o mayor que 1.

• Depende de la desviación típica, también llamada "desviación estándar", y en mayor medida de


la media aritmética, dado que cuando ésta es 0 o muy próxima a este valor el C.V. pierde
significado, ya que puede dar valores muy grandes, que no necesariamente implican dispersión
de datos.

Ejemplo:

Una distribución tiene M(x) = 140 y DS(x) = 28.28 y otra M(y) = 150 y DS(y) = 24. ¿Cuál de las dos
presenta mayor dispersión?

Come el CV para la variable x es mayor podemos concluir que:


• La dispersión de la distribución de la variable x es mayor que la dispersión de la distribución de
la variable y (mayor CV mayor dispersión)

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 67


• Los datos de la variable x son más heterogéneos o de otra forma los datos de la variable y son
más homogéneos
• Como la variable x tiene mayor dispersión la mediana será la media de posición más
representativa

Análisis de la Forma de una distribución

I. Lo primero que vamos a analizar si la


distribución es o no simétrica.
La manera más sencilla para analizar la forma de
un conjunto de datos es comparar la forma de sus
histogramas o diagramas de barras para ver si se
distribuyen o no de determinada manera. Para
realizar el análisis de la forma de una sola
distribución deberemos siempre compararla con
una distribución modelo como lo es la Distribución
Normal (con media 0 y desviación estándar 1). En
general se trata de ver si la distribución de la
variable analizada es más o menos puntiaguda
que la Normal (curtosis) o bien si es más, igual o
menos simétrica que la Normal (asimetría)

Otra forma de analizar la simetría es comparando la media, la mediana y la moda como ya se ha visto
en ésta unidad

Ahora veremos de qué forma analizamos la simetría calculando algunos coeficientes:

1) El índice de asimetría intercuartílico se basa en las distancias entre los cuartiles a fin de
establecer en de la asimetría de la distribución. La fórmula es la siguiente:

AsQ = Q3+Q1-2.Q2
Q3-Q1

Interpretación: oscila entre -1 y 1, lo cual facilita su comprensión.

• AsQ < 0 →Asimetría izquierda o negativa


• AsQ = 0 → Simetría
• AsQ > 0 →Asimetría derecha o positiva

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.68


2) Coeficiente de asimetría de Pearson: el coeficiente de asimetría de Pearson se basa en la
relación existente entre la media y la moda en distribuciones unimodales asimétricas (ver más
arriba). Su fórmula es la siguiente:

AsP = M(x) – Mo(x)


DS(x)

Interpretación:
• AsP < 0 →Asimetría izquierda o negativa
• AsP = 0 → Simetría
• AsP > 0 →Asimetría derecha o positiva

No está limitado a un rango de valores.

3) El coeficiente de asimetría de Fisher se basa en las desviaciones de los valores observados


respecto a la media. La interpretación de los resultados proporcionados por este coeficiente es
igual a la del primer coeficiente de Pearson. La fórmula para su cálculo es la siguiente:

AsF =Σ ( xi- M(x))3


n. DS(x)3

Y si es una distribución de frecuencias la fórmula será:

AsF = Σ ni. ( xi- M(x))3


n. DS(x)3

Interpretación:
• AsF < 0 →Asimetría izquierda o negativa
• AsF = 0 → Simetría
• AsF > 0 →Asimetría derecha o positiva

II. Apuntamiento (curtosis)


El apuntamiento o curtosis de una distribución de frecuencias no tiene un referente natural
como en el caso de la simetría, sino que se sustenta en la comparación respecto a una
distribución de referencia, en concreto, la distribución normal o campana de Gauss. En
consecuencia, su obtención sólo tendrá sentido en variables cuya distribución de frecuencias
sea similar a la de la curva normal –en la práctica ello se reduce, básicamente, a que sea
unimodal y más o menos simétrica. El apuntamiento expresa el grado en que una distribución
acumula casos en sus colas en comparación con los casos acumulados en las colas de una
distribución normal cuya dispersión sea equivalente.

Así, de forma análoga a la asimetría, se diferencian 3 grandes categorías de apuntamiento:

• Distribución platicúrtica (apuntamiento negativo): indica que en las colas hay más casos
acumulados que en las colas de una distribución normal.
• Distribución leptocúrtica (apuntamiento positivo): justo lo contrario.
• Distribución mesocúrtica (apuntamiento normal): como en la distribución normal.

Se puede analizar también por medio de distintos coeficientes entre los cuales solo veremos el
coeficiente de apuntamiento de Fisher se basa en las desviaciones de los valores observados
respecto a la media. La fórmula para su cálculo es la siguiente:

4
ApF =Σ ( xi- M(x))
n. DS(x)4

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 69


Y si es una distribución de frecuencias la fórmula será:

ApF = Σ ni. ( xi- M(x))4


n. DS(x)4

Interpretación:
• Si ApF < 0 Distribución platicúrtica (apuntamiento negativo).
• Si ApF > 0 Distribución leptocúrtica (apuntamiento positivo)
• Si ApF = 0 la distribución mesocúrtica (apuntamiento normal): como en la distribución
normal.

No está limitado a un rango de valores.

A continuación graficamos:

Finalizado el desarrollo de estos contenidos, lo invitamos a que realice las actividades respecto de
estos temas, y a realizar las preguntas que sean necesarias a través del espacio tutorial.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.70


m3 material

Material Básico
x Desarrollo teórico del módulo, disponible en el apartado contenidos.
x Bologna E. (2011) (Comp). Estadística aplicada a la Psicología y a la
Educación. Córdoba: Editorial Brujas.

Material Complementario
x Barón-López, J. (2005). Bioestadística: métodos y aplicaciones.
Apuntes y material disponible en http://www.bioestadistica.uma.es/
baron/apuntes/ Rius, F., Barón-López, F. J., Sánchez, E. y Parras, L.
(2006).

x Bioestadística: métodos y aplicaciones. Disponible en www.


bioestadistica.uma.es/libro/ Pardo, A. y Ruiz, M. A. (2002). SPSS: Guía
para el análisis de datos. Madrid: McGraw-Hill.

x J. Gabriel Molina y María F. Rodrigo Estadística descriptiva en


Psicología Curso 2009-2010

x Estadística Básica para Docentes de Educación Secundaria Tercer


Diplomado en Didáctica de la Matemática (12/11/2009) Luis María
Dicovskiy Riobóo

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 71


m3 actividades

m3 | actividad 1

Revisando conceptos de medidas

Seleccione la alternativa correcta, justificando siempre su elección:

I. Si en una distribución la media es de 30, la mediana es de 35 y la moda


es de 40, ello es una pista de que la distribución es posiblemente:
a) Asimétrica negativa
b) Asimétrica positiva
c) Simétrica
d) Ninguna es correcta

II. En términos de curtosis, la distribución normal es catalogada como:


a) Mesocúrtica
b) Leptocúrtica
c) Platicúrtica
d) Ninguna es correcta

III. Señala la alternativa INCORRECTA: Si multiplicamos una constante


positiva a todos los datos de una distribución...
a) la nueva media será la original por la constante
b) la nueva desviación típica será la original por la constante
c) la nueva varianza será la original por la constante
d) La nueva varianza es igual a la original menos la constante

IV. Si a cada una de las puntuaciones de un conjunto de datos le restamos


la media aritmética de los mismos, la media aritmética resultante de los
datos transformados es:
a) Siempre 0
b) Cercana a 0
c) Es 0 cuando la distribución es simétrica
d) Ninguna es correcta

V. Si estamos midiendo la variable ‘religión profesada’, ¿cuál de las


siguientes representaciones gráficas escogerías preferentemente?:
a) Diagrama de tallo-y-hoja
b) Diagrama de caja-y-bigotes
c) Diagrama de sectores
d) Histograma

VI. Una distribución Mesocúrtica:


a) Tiene una altura menor que la de la curva normal
b) Tiene una altura igual que la de la curva normal
c) Tiene una altura mayor que la de la curva normal
d) Ninguna es correcta

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.72


VII. De un total de 100 alumnos, 20 sacaron en el examen un 4, 40 sacaron
un 5, 30 sacaron un 6 y el resto un 7. Calcula la nota promedio.
a) 3,8
b) 5,5
c) 5,3
d) Ninguna es correcta

m3 | actividad 2

Dispersión relativa: coefeciente de variación

En cierta evaluación para optar por una beca, Juan Moreti obtuvo una
calificación de 310 puntos en habilidad verbal, y 218 puntos en habilidad
numérica.
Los parámetros de c/u son:
Habilidad verbal: media = 270 varianza = 900
Habilidad numérica: media =180 varianza = 25
a) ¿En cuál de las dos pruebas obtuvo mejor calificación? Justifique.
b) ¿En cuál de las dos pruebas el grupo es más homogéneo? Justifique.

m3 | actividad 3

Determinación de medidas – Variable discreta

Una fábrica empaqueta en lotes de 100 unidades los tornillos que produce.
Se establece un plan de inspección por muestreo consistente en examinar, de
cada lote, 20 tornillos elegidos al azar y rechazar el lote si de los 20 aparecen
más de 4 defectuosos; almacenar el lote como “revisable” si el número de
defectuosos es menor que 5 pero mayor que 1, y aceptarlo en otro caso.
Se inspeccionan un conjunto de lotes y resulta el siguiente número de tornil-
los defectuosos de cada muestra:
0 -2 -3 -0 -0 -1 -0 -0 -3 -2 -0 -1 -0 -5 -2 -0 -7- 3- 5 – 4 – 6 - 0 – 0 – 0 – 1 -
1-2- 4- 3- 2- 0- 9- 2- 0- 2- 0- 0- 4- 3- 0- 2- 0- 4- 6- 5- 2-0- 0 -1 -0 -3 -2 -0 -7 -1 -4 -3
-0 -2 -1

Con la información suministrada se solicita que:


a) Construya la tabla de frecuencias absolutas y relativas del
resultado de la inspección.

b) Dibuje el diagrama de barras para los resultados de la inspección y


analiza la información.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 73


c) Calcule el promedio, la mediana y el modo, analizando los valores
obtenidos.

d) Calcular la varianza y el desvío estándar.

e) ¿Podría aplicarse aquí la regla empírica? Justifique su respuesta.

m3 | actividad 4

Determinación de medidas – Variable continua

De una encuesta realizada a un grupo de personas en la ciudad de Villa María


se analiza el “gasto per-cápita en esparcimiento y cultura, por semana”.

Intervalos ni Ni hi%
0 a 20 1
20 a 40 2
40 a 60 4
60 a 80 7
80 a 100 12
100 a 120 74
Total

Con la información suministrada se solicita que usted:


a) Complete la tabla de distribución de frecuencias.
b) Grafique las frecuencias absolutas acumuladas.
c) Calcule la media o promedio e interpretarla.
d) Calcule la varianza y la desviación estándar.
e) ¿Podría aplicarse aquí la regla empírica? Justifique su respuesta.
f) Como sería el coeficiente de asimetría en éste caso? (tome como base
de análisis el gráfico realizado).

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.74


m3 | actividad 5

Coeficiente de variación

Ejercicio 1:
Para un conjunto de observaciones se conoce que: la media es $64, la
mediana es $61, la moda es $60, y la varianza $2 36.
Analice la forma del conjunto de datos y calcule el coeficiente de varia-
ción y analice su valor.

Ejercicio 2:
Si en el ejercicio anterior se conoce que Q1=58 $ Q3= 64$ . V máximo=
71$
V mínimo= $55
¿Cómo realizaría el diagrama de caja-brazos? Analícelo.

m3 | actividad 6

Concepto de media

Por un error, un profesor borró la calificación obtenida por uno de diez alum-
nos. Si los otros nueve estudiantes obtuvieron 43, 66, 74, 90, 40, 52, 70, 78 y 92
y la media de las diez calificaciones es 67, ¿Qué calificación borró el profesor?
Explique cómo obtuvo el resultado.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 75


m3 | actividad 7

Determinación de medidas – Serie simple

El tratamiento de los niños con desórdenes de la conducta puede ser complejo.


El tratamiento se puede proveer en una variedad de escenarios dependiendo
de la severidad de los comportamientos. Además del reto que ofrece el trata-
miento, se encuentran la falta de cooperación del niño/niña y el miedo y la falta
de confianza de los adultos.
Para poder diseñar un plan integral de tratamiento, el siquiatra de niños y ado-
lescentes puede utilizar la información del niño, la familia, los profesores y de
otros especialistas médicos para entender las causas del desorden.
Para ello, un siquiatra local ha considerado una muestra aleatoria de 20 niños,
anotando el tiempo necesario que requiere en cada niño para lograr un plan
integral del tratamiento, obteniéndose lo siguiente (en horas):

6 6 6 7 7 7 7 7 8 8 8 8 8 8 8 8 9 9 9 9 9 9 9 9 9 9 10 10 10 10 10 10 10
11 11 11 11
En base a la información analizada se pide:
a) Calcular el promedio, la mediana y el modo, analizando los valores
obtenidos.
b) Calcular la varianza y el desvío estándar.
c) Graficar la información y analizarla.
d) Calcular los cuartiles y realice un diagrama de caja brazos, analizando
e mismo.
e) Calcular alguno de los coeficientes de asimetría y analícelos.
f) Analizar la curtosis de la distribución.
g) ¿Podría aplicarse aquí la regla empírica? Justifique su respuesta.

m3 | actividad 8

Actividad 8: Diagrama de caja y brazos

Se han entrevistado a 23 estudiantes de la Facultad de Ciencias Exactas, a los


que se les consultó sobre la cantidad de materias aprobadas hasta el último
turno de examen. Las respuestas se organizaron en la siguiente tabla.
Nº materias
aprobadas Nº alumnos
19 2
22 10
25 7
28 3
35 1

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.76


Con la información suministrada se pide responder y realizar los siguien-
tes items:
a) ¿Existen valores atípicos? Justifique para ello calcule las medidas que
considere adecuadas y luego grafique el diagrama de caja brazos.

b) Calcule la media aritmética y la mediana, e indique cuál es más


adecuada para describir la posición de los datos.

c) Calcule la desviación estándar.

d) Analice la asimetría y la curtosis, realizando los cálculos que considere


necesario para justificar su análisis.

m3 | actividad 9

Análisis exploratorio de datos


Ejercicio 1
A continuación se presentan algunas estadísticas descriptivas comparadas para el sueldo men-
sual (en pesos) de varones y mujeres para el año 2003, según datos de la Encuesta Permanente
de Hogares.

En base a los datos suministrados, se pide que determine para qué grupo el sueldo es relativa-
mente más disperso.
Justifique mediante el cálculo e interpretación de una medida adecuada.

Ejercicio 2:
En un barrio de una zona urbano marginal de la ciudad de Córdoba, se ha realizado una
encuesta sobre las alturas de sus 150 personas y se ha construido la siguiente tabla de frecuen-
cias:

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 77


Intervalos de hi ni Hi Ni
edad
(12-18) 0,13
(18-24) 0,34
(24-30) 0,24
(30-36) 0,18
Más de 36 0,11
Total 150 /////////// ////////////

Con la información suministrada se pide:


a) Completar la tabla, e interpretar las siguientes frecuencias: n1, h3, N2, H4.
b) Calcular el promedio e interpretarlo.
c) Determinar el desvío estándar.
d) Graficar las frecuencias relativas simples y analizar la forma de la distribución.

Ejercicio 3:
La siguiente tabla muestra las utilidades porcentuales trimestrales de los últimos 8 años de una
empresa de servicios de limpieza.
% Ni Ni hi Hi yi*ni Yi2 *ni
[0 ; 3) 2 0,06 3 4,5
[3 ; 6) 3 5 0,09 0,16 13,5
[6 ; 9) 10 0,31 75
[9 ; 12) 7 22 0,22 0,69
[12 ; 15) 0,13 54 729
[15 ; 18) 3 29 0,91 49,5 816,75
[18 ; 21) 31 0,97 760,5
[21 ; 24) 1 32 0,03 1,00 22,5
Total ///////////////// ///////////////////

En base a la información suministrada y luego de completar la tabla, leer atentamente cada una
de las siguientes preguntas y marcar la alternativa correcta. Justifique siempre su elección:

a) El problema hace referencia a :


I. Una variable cualitativa continua, con promedio igual a 10,31 %
II. Una variable cualitativa discreta con promedio igual a 10,31 %
III. Una variable cuantitativa continua, con promedio igual a 10,31 %
IV. Ninguna es correcta.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.78


b) La variable tiene :
I. Mediana igual a 7,5% y modo igual a 9%.
II. Mediana igual a 9 % y modo igual a 7,5 %.
III. Mediana y modo iguales a 7,5%
IV. Ninguna es correcta.

c) El desvío estándar de la variable analizada es igual a:


I. 1101%
II. 1,101%
III. 11,01%
IV. Ninguna es correcta

d) Para analizar la forma de la variable analizada podría realizar:


I. Un gráfico de barras y calcular el coeficiente de curtosis
II. Un gráfico de bastones y calcular el coeficiente de asimetría
III. Un gráfico logarítmico y calcular el coeficiente de curtosis
IV. Ninguna es correcta

e) En la tabla la frecuencia H3 se interpreta como:


I. El 47% de las personas tienen utilidades de hasta el 9%
II. El 47% de las personas tienen utilidades de un 9%
III. El 47% de los años la empresa ha tenido utilidades de hasta el 9mil
pesos
IV. Ninguna es correcta.
Ejercicio 4:
Una empresa dedicada a la fabricación de pilas ha recibido múltiples reclamos
de sus clientes en el sentido de que las mismas duran menos de 1000 horas,
por esta razón este fabricante desea realizar un estudio estadístico para ana-
lizar la duración de sus productos. Con la información que arrojó dicho estu-
dio, que confeccione el diagrama de Caja –Brazos correspondiente y analice
debidamente el mismo.
Estadística Descriptiva:
N 81
Media 1201
Varianza 12780,14
Valor mínimo 749
Valor máximo 1523
Mediana 1203
Modo 1256
Q1 1121
Q3 1267

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 79


m3 glosario

Coeficiente de variación: es el cociente entre la desviación estándar dividida


por la media.

Cuartiles: si a un conjunto de datos se los ordena de mayor a menor, el valor


central es la mediana, este valor divide el grupo, en dos subgrupos cada uno
con el 50 % de los datos. Si a cada subgrupo ordenado se le marca el valor
central, tenemos así tres valores seleccionados que llamaremos Cuartiles, Q1,
Q2 y Q3. Estos valores dividen al conjunto de datos en cuatro grupos con igual
número de términos, cada cuartil contiene el 25% de los datos. La mediana es
el cuartil dos, Q2.

Desviación cuartílica: es la diferencia entre el Q3-Q1, se utiliza en el diagrama


de caja brazos.
Desviación estándar: es la raíz cuadrada positiva de la varianza.

Media aritmética o promedio: es la suma de todos los valores de la variable


dividida el número total de observaciones.

Mediana: es el valor que divide al conjunto ordenado de datos, en dos


subconjuntos con la misma cantidad de elementos.

Moda, modo o valor modal: es el valor de la variable que se repite más veces.
Es decir el valor de la variable que corresponde a la mayor de las frecuencias
absolutas simples.

Rango intercuartílico (RIC): es también una medida importante a tener en


cuenta, es la diferencia entre el tercer y el primer cuartil.

Tendencia central: La tendencia central se refiere al punto medio de una


distribución.

Varianza: es una medida estadística que mide la dispersión de los valores


respecto a un valor central (media), es decir, es el cuadrado de las
desviaciones.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.80


m4

m4 microobjetivos

x Conocer las características de los métodos de investigación habituales


en educación, tanto con un enfoque cualitativo, como cuantitativo.

x Desarrollar la habilidad para realizar búsquedas documentales


especializadas dentro del ámbito de la investigación aplicada a la
educación.

x Permitir una reflexión teórica y metodológica sobre los fenómenos


que se operan en el proceso educativo puesto que viabiliza la
coparticipación de los sujetos interactuantes en los intercambios
culturales desde el aula de clase, la escuela, la comunidad, la
sociedad.

x Capacitarse para utilizar los conocimientos metodológicos, como


herramienta crítica en la valoración de los trabajos de investigación
producidos en las diferentes áreas de la Educación.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 81


m4 contenidos

Relaciones entre Variables

Los estudios descriptivos o comparativos permiten inferir diferentes


características de la población que se está analizando, en el
presente módulo el objetivo es establecer la relación entre dos o
más variables para luego predecir resultados válidos para la
población.
Establecer una relación estádistica entre variables es analizar y verificar , por medio de diferentes
procedimientos : que cambios en una variable (dependiente o de respuesta ) están asociados a
cambios en la otra variable (independiente o explicativa).

Asociación entre variables

Es el primer tipo de análisis entre variables que vamos a estudiar, el análisis estadístico de la
asociación entre variables comprende: relación, covarianza y correlación. Es una parte
fundamental del análisis de datos porque muchas preguntas e hipótesis planteadas en
investigaciones implican la existencia de relación entre distintas variables consideradas.
El análisis de la existencia de algún tipo de asociación entre dos o más variables se basa sobre
todo en el estudio de algún tipo de tendencia o patrón de emparjamiento entre las variables
analizadas. Según lo explica Solanas: “la existencia de asociación entre dos variables indicaría que
la distribución de los valores de una de las dos variables difiere en función de los valores de la otra
y complementariamente, se habla de independencia entre variables cuando no existe tal patrón de
relación entre los valores de las mismas”.

Para medir la asociación entre dos variables, vamos a distinguir tres situaciones:
I. Medir la asociación de dos variables categóricas
II. Medir la asociación de una variable categórica y una cuantitativa

Tabla: Estado de Ánimo Estado de ánimo


malo regular bueno Total
Lugar de vive en barrio con seguridad 48 42 60 150
residencia no vive en barrio con seguridad 70 105 175 350
Total 118 147 235 500
III. Medir la asociación entre dos variables cuantitativas

Veamos el primer caso:


I. Asociación entre dos variables categóricas:
Para evaluar si ambas variables están relacionadas hay que observar si la distribución de los

valores de una de las variables difiere en función de los valores de la otra, esto es, hay que
comparar las distribuciones condicionadas de una de las dos variables agrupada en función de los
valores de la otra. Si no hay relación entre las variables estas distribuciones deberían ser iguales.
Analicemos esta asociación por medio del siguiente ejemplo:
Consideremos la posible asociación entre las dos variables que se muestran en la tabla: Estado de
Ánimo.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.82


Por ejemplo, podemos comparar las distribuciones de frecuencias absolutas de “Estado de ánimo”
condicionadas a vivir en un barrio con seguridad (48, 42, 60) y a no vivir en un barrio con
seguridad (70, 105, 175).

Si nos fijamos en las distribuciones de frecuencias absolutas de “Estado de ánimo” condicionadas


a los valores de “Lugar de residencia”, se observa que estas distribuciones no son iguales, sin
embargo, esto puede ser debido a que hay más sujetos que no viven en un barrio con seguridad
(350) que sujetos que sí viven en ese tipo de barrios (150). En conclusión, no se deben comparar
las distribuciones condicionadas en frecuencias absolutas si el número de casos difiere en las
categorías de la variable condicionante o agrupadora.

La asociación entre dos variables categóricas aparece más explícita en una tabla de frecuencias
relativas condicionadas, pues de ese modo se relativiza el posible diferente tamaño de los
subgrupos definidos por cualquiera de las dos variables. Este tipo de tabla se puede obtener de 2
formas alternativas, bien dividiendo las celdas de cada fila entre el respectivo marginal (total) de
fila, bien cada columna entre el total de columna. Ambas tablas permitirán llegar al mismo tipo de
conclusiones respecto a la asociación entre las 2 variables.

Si la relación entre las variables es asimétrica, la variable agrupadora o condicionante sería la que
sea considerada la variable explicativa (predictora, independiente). Por ejemplo, en un estudio en

Estadodeánimo 
 malo regular bueno Total
Lugar de viveenbarrioconseguridad 0,32 0,28 0,4 1
residencia noviveenbarrioconseguridad 0,2 0,3 0,5 1
 Total 0,24 0,29 0,47 1

que se evalúa la influencia del “Nivel de estudios” [primarios, secundarios, superiores] sobre la
“Percepción de la influencia de la ciencia en la sociedad” [negativa, indiferente, positiva], dado que
el nivel de estudios sería la variable explicativa, deberíamos comparar las distribuciones de la
percepción de la influencia de la ciencia condicionadas al nivel de estudios, es decir, en cada
categoría de nivel de estudios.
En nuestro ejemplo sobre “Estado de ánimo” y “Lugar de residencia”, dado que la relación es
asimétrica y la variable explicativa es “Lugar de residencia” debemos comparar las distribuciones
de “Estado de ánimo” condicionadas a “Lugar de residencia”:

En la tabla anterior, la comparación de las distribuciones de frecuencias relativas condicionales con


la distribución marginal de la variable de respuesta, nos permitirá comprobar la existencia de
asociación entre las dos variables y, en el caso de que exista, la naturaleza de la misma.
Se observa que la proporción de sujetos que tienen un estado de ánimo negativo entre los que
viven en un barrio con seguridad (0,32) es superior a la correspondiente para aquellos que tienen
un estado de ánimo regular o bueno. Esto parece indicar que sí existe una relación entre ambas
variables.
Si la relación entre las variables es simétrica es indiferente qué variable se elige como agrupadora
o condicionante. Así, por ejemplo, si deseamos valorar si hay relación entre el lugar de residencia
(rural o urbano) y la rama de bachiller cursada (ciencias, sociales, salud o humanidades) y no
consideramos a priori que una de las variables sea la variable explicativa, podríamos comparar, o
bien, las distribuciones de frecuencias relativas de “Lugar de residencia” condicionadas a

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 83


“Bachiller”, o bien, las distribuciones de frecuencias relativas de “Bachiller” condicionadas a “Lugar
de residencia”.

El análisis gráfico de la asociación entre 2 variables categóricas puede realizarse a partir de un


diagrama de barras conjunto de frecuencias absolutas si nos fijamos en la forma de las
distribuciones condicionadas, si bien, resultará más fácil visualizar esta información si lo que se
representa son frecuencias relativas condicionadas, pues así se elimina el efecto del posible
distinto tamaño de los subgrupos. El diagrama de rectángulos partidos obtenido a partir de las
frecuencias relativas condicionadas puede resultar también apropiado para evaluar esa asociación.

Diagrama de barras de frecuencias absolutas

Diagrama de barras de frecuencias relativas condicionadas

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.84


Existen diferentes índices estadísticos orientados a resumir de forma cuantitativa la asociación
entre dos variables categóricas. Aquí nos vamos a centrar en los siguientes:

a) El índice Chi-cuadrado de Pearson (Ȥ2):

El coeficiente ( también se llama “de contingencia cuadrática) y es una medida de la


“intensidad” de las relación entre las características analizadas .
El valor informativo del coeficiente es reducido debido a que su límite superior, es decir, el valor
que asume en el caso de la completa dependencia de las características observadas es
dependiente de la magnitud (dimensión) de la tabla de contingencia (es decir de la cantidad de
valores posibles de las variables) y del tamaño del universo estudiado .
En el caso de la completa independencia de las características, .
El rango de variación de éste coeficiente es :

Siendo el número de filas y el número de columnas de la tabla de contingencia.

Otra versión de esta medida de la intensidad de la dependencia de las características en una tabla
de contingencia es la contingencia cuadrática media, que en lo esencial representa una ampliación
del coeficiente :

Cuanto mayor es esta medida, tanto más intensa es la relación entre las dos características
analizadas. Si ambas características (variables) son independientes, entonces cada uno de los
sumandos se hace 0, a consecuencia de que se hace 0 el numerador de la fracción y con ello la
medida misma también. En el caso de una tabla de contingencia de 2x2 la medida está normada y
asume valores en el intervalo [0,1].

Coeficiente Pearson corregido:


Para poder excluir, además de la influencia del tamaño de la muestra, también la influencia de la
dimensión de las tablas de contingencia consideradas (el número de formas de la característica)
sobre el límite superior del coeficiente y asegurar así la comparabilidad de los resultados, se utiliza
con frecuencia el coeficiente de contingencia corregido (también denominado ) para
medir la relación:

Donde igual que más arriba.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 85


Aquí rige: : Un cercano a 0 indica características independientes.
cerca de 1 señala una mayor medida de dependencia entre las características.Apliquemos a

Estado de ánimo
malo regular bueno Total
Lugar de vive en barrio con seguridad 48 42 60 150
residencia no vive en barrio con seguridad 70 105 175 350
Total 118 147 235 500
nuestro ejemplo el cálculo de éste coeficiente:

A partir de la tabla planteada en el ejemplo (más arriba) , calculamos los valores esperados y
hacemos de nuevo la tabla :

35,4 = (118 *150)/500

Estado de ánimo
malo regular bueno Total
vive en barrio con seguridad 35,4 44,1 70,5 150
Lugar de
residencia no vive en barrio con
82,6 102,9 164,5 350
seguridad
Total 118 147 235 500

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.86


Ahora para calcular el coeficente haremos :

(48*35,4)2 + (42*44,1)2 + ……………+ (175-164,5)2 = 8,78 = X2


35,5 44,1 164,5

Coeficiente Pearson corregido =

K = minimo ( entre filas y columnas de la tabla) = minimo ( 2 (filas ) ; 3 (columnas ) ) = 2


N= tamaño de la muestra

Ckorr = ʈ¥ (2/(2-1)) . ʈ¥ (8,78/(8,78+500)) = 0,186 Que al ser cercano a 0 indica que el estado de
ánimo es independiente del lugar de residencia . Es decir que no depende el estado de ánimo del
lugar donde resida la persona.

b) Coeficiente de contingencia de Cramer V


Es una medida simétrica para la intensidad de la relación entre dos o más variables de la escala
nominal, cuando (por lo menos) una de las dos variables tiene por lo menos dos formas (valores
posibles).

.
: Total de casos (tamaño de la muestra) y X2 es el valor del coeficiente de Pearson

es el menor entre ambos valores «número de filas» y "número de columnas

Interpretación
En cualquier tabla de contingencia – independientemente de la cantidad de filas y columnas –
Cramérs V está entre 0 y 1. Puede usarse para tablas de contingencia de cualquier tamaño. Un

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 87


Por ejemplo: Cramérs V que es mayor que 0,3 es considerado en ciencias sociales como una
correlación significativa.
Rango de valores [0 hasta 1]
Cramérs V = 0: no hay relación entre X e Y
Cramérs V = 1: hay una relación perfecta entre X e Y
Cramérs V = 0,6: hay una correlación relativamente intensa entre X e Y
Dado que Cramérs V es un número siempre positivo, no se pueden hacer afirmaciones acerca de
la dirección de la relación.
El coeficiente varía entre cero y uno.
Si la tabla de contingencia es de dos filas por dos columnas, o es de tres filas por tres columnas,
es válido este coeficiente.
Cuanto más próximo a cero se encuentre, más independientes serán las variables; cuanto
más próximo a uno sea el número, más asociadas estarán las variables que se estudien.
También hay que observar, que para el cálculo del coeficiente de Cramer V, se necesita
previamente tener calculado el estadístico Chi Cuadrado.

II. Asociación de una variable categórica y una cuantitativa


Para analizar la asociación en éste caso lo primero que haremos será comaparar las
distribuciones condicionales de una variable para los distintos valores que toma la otra.Por lo
general , se suele tomar como condicionada a la cuantitativa y como condicionante a la categórica,
si bien, las conclusiones a las que llegaríamos serían las mismas si se hiciese al revés. Si no hay
diferencias entre las distribuciones condicionales, ello indicará que no hay asociación entre ambas
variables.
Veamos el siguiente ejemplo :se quiere analizar la asociación entre las variables “Nota en un
examen de una asignatura [0 a 10]” y “Grupo en el que se está matriculado [1 a 3]”, disponiéndose
de los datos de un grupo de estudiantes de 3 grupos:

Nota escalaqueocupa
5 1
6 2
5 3
4 2
8 3
7 1
2 2
10 3
5 3
6 2
4 1
8 2
9 1
7 2
10 2
3 2
2 1
4 1
2 1
1 3

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.88


3 3
5 2
6 1
8 2
9 3
7 1
4 2
5 1
2 1
5 1
4 2
8 2
6 3
3 2
2 1
5 2
9 3
10 2
2 1
5 2
5 3
5 2
5 3
8 3
9 2
6 3
5 1
8 2
7 3
1 2
5 1
4 2
8 3
6 2
5 1
7 2
2 3
3 2
6 1
5 2
8 3

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 89


9 2
7 1

Dada la dificultad que puede representar comparar las distribuciones condicionales de una variable
cuantitativa, se puede recurrir a representaciones gráficas que faciliten la realización de este tipo
de comparación. A modo de ejemplo, podemos graficar para cada lugar que ocupa , las notas
obtenidas :

nota lugar1
1 0
2 5
3 0
4 2
5 6
6 2
7 3
8 0
9 1
10 0


nota lugar2
1 1
2 1
3 3
4 4
5 5
6 3
7 2
8 4
9 2
10 2


nota lugar3
1 1
2 1
3 1
4 0
5 4
6 2
7 1

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.90


8 4
9 2
10 1

Existen diferentes índices estadísticos orientados a cuantificar la intensidad de la asociación entre


una variable categórica y una variable cuantitativa. Aquí nos vamos a centrar en los siguientes:

a) Indice de asociación de Cohen: dada una variable categórica X dicotómica [a, b] y una variable
cuantitativa Y, el índice de asociación d de Cohen se obtiene a través de la siguiente
expresión:

d = M(Ya) - M(Yb)
Sy

Los valores que puede tomar d no están acotados a un rango, pudiendo ser tanto positivos como
negativos. Si las dos variables consideradas son independientes entonces d será igual a 0,
mientras que cuanto mayor sea la asociación entre ellas, mayor será el valor de d en términos
absolutos. Cohen sugiere las siguientes normas interpretativas, aunque el propio autor afirma que
se deben utilizar sólo en el caso que no se tenga ningún criterio sustantivo que sirva de base
interpretativa: valores absolutos de d entre 0,2 y 0,5 indicarían una intensidad de la asociación
(tamaño del efecto) baja; entre 0,5 y 0,8 media; mientras que a partir de 0,8, alta.

Ejemplo: Sean las variables X (Aplicación de un programa de intervención para favorecer la


interacción social [Sí (1), No (0)]) e Y (Grado de interacción en la hora de recreo, medida por el nº
de minutos en que se ha participado en actividades con otros compañeros), de las que tenemos
datos para un grupo de 20 alumnos de una clase en la que se evaluó la eficacia del citado
programa de intervención. Como caso particular del índice de asociación d de Cohen , el índice ds
se obtendría cuando la variable categórica determina dos momentos temporales, esto es, aquellos
casos en que una misma variable cuantitativa es medida en un mismo grupo de sujetos antes y
después de determinado evento, situación típica en las recogidas de datos que vienen guiadas por
un diseño de medidas repetidas (o intra-sujetos). Fórmula de ds:

ds = DIFmedia
SDIF
donde el numerador representa la media de las diferencias para cada sujeto entre la variable
‘después’ y la variable ‘antes’, y el denominador la desviación típica de esas diferencias.
Ejercicio 5: Tomando como punto de partida el caso planteado en el ejercicio anterior, supóngase
que a los 10 estudiantes a los que se aplicó el programa de intervención para favorecer la
interacción social se les midió también, previó al tratamiento, su grado de interacción en la hora de
recreo (nº de minutos en que se participa en actividades con otros compañeros). Analizar la
relación entre la variable “Grado de interacción” y “Momento temporal en que se realiza la medición
de la anterior variable [pre- y post- tratamiento]” e interpretar los resultados obtenidos.

ID GIͲpre GIͲpost


1 21 22
2 14 13
3 25 27
4 21 19
5 21 23
6 27 29
7 20 16

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 91


8 30 30
9 21 24
10 20 18

El índice f de Cohen permite analizar la relación entre una variable cuantitativa (Y) y una categórica
(X) en el caso en que esta última tenga más de dos valores posibles (k valores). Se basa para ello
en el cálculo de la dispersión de las medias de los diferentes subgrupos definidos por los k valores
de la variable X:

F= Symedia / Sy

Las medias de cada grupo son

GI-pre GI-post
Medias 22 22,1

La media general es igual a : 22, 05 (se calculo ponderando a cada media de los grupos por el
tamanño del grupo y dividiendo luego todo por la suma total de las observaciones analizadas)

La desviación estándar general (Sy) es igual a : 4,91

El valor de Symedia es igual a : la desviacion estándar de las medias de cada grupo respecto la
media general , en el ejercicio planteado sera:

Symedia = (10. (22-22, 05)2 + 10, (22,1-22,05)2 )1/2 /20 = 0,01

En el caso en que las medias de los subgrupos sean iguales o muy próximas, la desviación típica
S y será igual o prácticamente igual a 0, denotando la ausencia de asociación entre ambas
variables. El valor de la f de Cohen será siempre mayor o igual a 0, tanto mayor cuanto más
intensa sea la asociación entre las variables.

III. Asociación entre dos variables cuantitativas

Al igual que en los casos anteriores, la existencia de correlación o asociación entre 2 variables
cuantitativas viene determinada por la presencia de diferencias en las distribuciones condicionales
de una variable para los distintos valores de la otra.

1) Sin embargo, dado el número tan amplio de distribuciones condicionales que se pueden llegar
a obtener en este caso, es más habitual analizar la asociación directamente sobre un diagrama
de dispersión, observando la disposición de la nube de puntos que representa la distribución
conjunta de ambas variables.
Un aspecto relevante del análisis de la correlación entre dos variables cuantitativas es que la
presencia de ésta se puede plantear de acuerdo a diferentes modelos o patrones de
asociación, por ejemplo, en forma de línea recta, tal como en los ejemplos A (relación lineal
directa o positiva) y B (relación lineal inversa o negativa) de arriba, o en forma curvilínea tal
como en D (relación parabólica o cuadrática). Así, la forma de evaluar la intensidad de la
correlación suele consistir en analizar el ajuste de la nube de puntos al modelo de asociación

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.92


que se considere que representa más adecuadamente a la distribución conjunta de ambas
variables.

Es así que pueden darse diferentes situaciones :


a) Correlación Fuerte
Los puntos se agrupan claramente alrededor de una línea imaginaria que pasa por el
centro de la masa de los mismos. Estos casos sugieren que el control de una de las
variables lleva al control de la otra. Los datos parecen confirmar la teoría estudiada, pero
hay que analizar la existencia de otras posibles explicaciones admisibles y relevantes para
dicha relación.
Correlación Fuerte, Positiva: El valor de la variable "Y" (eje vertical) aumenta claramente
con el valor de la variable "X" (eje horizontal).
Correlación Fuerte, Negativa: El valor de "Y" disminuye claramente cuando "X" aumenta.

b) Correlación Débil
Los puntos no están suficientemente agrupados, como para asegurar que existe la
relación. El control de una de las variables no necesariamente nos llevará al control de la
otra. Si lo que se busca es determinar las causas de un problema, se deben buscar otras
variables con una relación mayor o más relevante sobre el efecto.
Correlación Débil, Positiva: El valor de la variable "Y" (eje vertical) tiende a aumentar
cuando aumenta el valor de la variable "X" (eje horizontal)
Correlación Débil, Negativa: El valor de "Y" tiende a disminuir cuando aumenta el valor de
"X".

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 93


c) Correlación compleja
El valor de la variable "Y" parece estar relacionado con el de la variable "X", pero esta
relación no es simple o lineal. En este caso se estudia la relación más profundamente
(¿Hay alguna ley no lineal que explique esta relación ?.
¿ Es esta relación el resultado de componer varias relaciones ?). }

d) Sin correlación
Para cualquier valor de la variable "X", "Y" puede tener cualquier valor. No aparece
ninguna relación especial entre ambas variables. En este caso, nuestra teoría no es
correcta y se deben buscar otros tipos de relaciones.

Posibles problemas y deficiencias de interpretación

I. Correlación sin soporte lógico


Los diagramas de dispersión muestran solamente relaciones, no
prueban relaciones causales. Ha de haber una explicación lógica y
admisible para establecer una relación causa-efecto..

II. Recorrido de los datos


En el análisis del diagrama se limitará su interpretación al recorrido de las observaciones.
Generalizar las pautas de correlación para valores fuera de los límites del gráfico puede llevar a

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.94


conclusiones completamente erróneas. Si se necesita conocer la relación entre dos variables para
un rango de valores determinado, hay que obtener datos alrededor de ese rango.

III. Efecto de la escala


Las escalas de los dos ejes influyen notablemente sobre la interpretación del Diagrama de
Dispersión. Escalas deficientes en alguno de los ejes puede enmascarar una relación o hacer ver
relaciones inexistentes.

IV. Factores de confusión


Con el Diagrama de Dispersión tratamos de estudiar una relación entre dos variables. Debemos
asegurarnos de que la correlación que observamos no sea debida a una variable distinta de la que
estamos registrando.
La forma ideal para tratar los factores de confusión es antes de la recogida de datos. Identificar los
posibles factores de confusión y disponer la toma de datos de forma que se mantengan
razonablemente constantes.
Los factores de confusión se medirán en la toma de datos, y si no ha sido posible mantenerlos
constantes, se construirá un Diagrama de Dispersión estratificado según las condiciones de dichos
factores.

V. Problemas con los datos


Si los datos son deficientes, la interpretación del Diagrama de Dispersión tiene, por fuerza, que ser
deficiente.

En la cuantificación de la asociación entre 2 variables cuantitativas nos vamos a ceñir al supuesto


de que un modelo de relación lineal subyace a la asociación entre ambas. Subrayar que con
frecuencia se obvia en los textos estadísticos que la relación que se analiza es en realidad una
relación de tipo lineal. Los índices más utilizados en la práctica estadística a la hora de analizar la
intensidad o tamaño del efecto de la relación lineal entre dos variables son los tres siguientes:

2) La covarianza

La c o v a r i a n z a de una variable bidimensional es la media aritmética de los productos de las


desviaciones de cada una de las variables respecto a sus medias respectivas.
Cuando a grandes valores de una de las variables suelen mayoritariamente corresponderles los
grandes de la otra y lo mismo se verifica para los pequeños valores de una y la otra, se corrobora
que tienden a mostrar similar comportamiento lo que se refleja en un valor positivo de la covarianza
Por el contrario, cuando a los mayores valores de una variable suelen corresponder en general los
menores de la otra, expresando un opuesto comportamiento, la covarianza es negativa.


El signo de la covarianza, por lo tanto, expresa la tendencia en la relación lineal entre las variables.
La magnitud requiere un esfuerzo adicional de interpretación:
La versión normalizada de la covarianza, el coeficiente de correlación indica la magnitud de la
especificidad de la relación lineal.
La covarianza indica el sentido de la correlación entre las variables
Si ı x y > 0 la correlación es directa.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 95


Si ı x y < 0 la correlación es inversa.
La c o v a r i a n z a presenta como inconveniente, el hecho de que su valor depende de la escala
elegida para los ejes.
Es decir, la
covarianza
Matemáticas 2 3 4 4 5 6 6 7 7 8 10 10
Física 1 3 2 4 4 4 6 4 6 7 9 10
variará si expresamos la altura en metros o en centímetros

Veamos un ejemplo:


Las notas de 12 alumnos de una clase en Matemáticas y Física son las
siguientes:


Xi Yi  
 matemática Física (xiͲm(x))*(yiͲM(Y)) 
 2 1 16 
 3 3 6 
 4 2 6 
 4 4 2 
 5 4 1 
 6 4 0 
 6 6 0 
 7 4 Ͳ1 
 7 6 1 
 8 7 4 
 10 9 16 
 10 10 20 
Promedio 6 5 71 
    
   Covarianza 5,92

Como la covarianza es positiva indica que hay una correlación directa entre las notas de
Matemática y de Física de los 12 alumnos analizados .

Otro ejemplo sería el caso en que los datos están presentados en una tabla bidemensional (de
doble entrada)

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.96


Los valores de dos variables X e Y se distribuyen según la tabla siguiente:

Y/X 0 2 4
1 2 1 3
2 1 4 2
3 2 5 0

Para hallar la covarianza de la distribución.
En primer lugar convertimos la tabla de doble entrada en tabla simple y calculamos las medias
aritméticas.

xi yi fi xi · fi yi · fi xi · yi · fi
0 1 2 0 2 0
0 2 1 0 2 0
0 3 2 0 6 0
2 1 1 2 1 2
2 2 4 8 8 16
2 3 5 10 15 30
4 1 3 12 3 12
4 2 2 8 4 16
 Total 20 40 41 76

Para éste caso la fórmula de covarianza será: COV(x;y)= M(X*Y) – M(X)* M(Y)

COV(x;y)= (76/20) – 2 . 2,05= -0.3

En éste caso como el valor es negativo podemos concluir que existe una correlación inversa pero
débil entre las dos variables analizadas , porque el valor es negativo pero cercano a 0.

La covarianza puede tomar valores tanto positivos como negativos. A nivel interpretativo, un mayor
valor de la covarianza en valor absoluto indicará una relación lineal más intensa entre las dos
variables. Un valor positivo pone de manifiesto una relación lineal directa; uno negativo, una
relación lineal inversa; y si igual o muy próximo a 0, la inexistencia de relación lineal entre las dos
variables.

Los inconvenientes de la covarianza –por una parte, no tiene valores máximo y mínimo y, por otra
parte, depende de las unidades de medida de las variables- se resuelven estandarizando este

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 97


índice al dividirlo por el producto de las desviaciones típicas de ambas variables. Se obtiene así el
conocido como coeficiente de correlación de Pearson

3) Coeficente de correlación:
La cuantificación de la fuerza de la relación lineal entre dos variables cuantitativas, se estudia por
medio del cálculo del coeficiente de correlación de Pearson (1-3). Dicho coeficiente oscila entre –1
y +1. Un valor de –1 indica una relación lineal o línea recta positiva perfecta. Una correlación
próxima a cero indica que no hay relación lineal entre las dos variables.
El realizar la representación gráfica de los datos para demostrar la relación entre el valor del
coeficiente de correlación y la forma de la gráfica es fundamental ya que existen relaciones no
lineales.
El coeficiente de correlación posee las siguientes características :
x El valor del coeficiente de correlación es independiente de cualquier unidad usada para
medir las variables.
x El valor del coeficiente de correlación se altera de forma importante ante la presencia de un
valor extremo, como sucede con la desviación típica. Ante estas situaciones conviene
realizar una transformación de datos que cambia la escala de medición y modera el efecto
de valores extremos (como la transformación logarítmica).
x El coeficiente de correlación mide solo la relación con una línea recta. Dos variables
pueden tener una relación curvilínea fuerte, a pesar de que su correlación sea pequeña.
Por tanto cuando analicemos las relaciones entre dos variables debemos representarlas
gráficamente y posteriormente calcular el coeficiente de correlación.
x El coeficiente de correlación no se debe extrapolar más allá del rango de valores
observado de las variables a estudio ya que la relación existente entre X e Y puede
cambiar fuera de dicho rango.
x La correlación no implica causalidad. La causalidad es un juicio de valor que requiere más
información que un simple valor cuantitativo de un coeficiente de correlación.
x El coeficiente de correlación no varía al hacerlo la escala de medición.
Es decir, si expresamos la altura en metros o en centímetros el coeficiente de correlación
no varía.
x El signo del coeficiente de correlación es el mismo que el de la covarianza.
Si la covarianza es positiva, la correlación es directa.
Si la covarianza es negativa, la correlación es inversa.
Si la covarianza es nula, no existe correlación.
x El coeficiente de correlación lineal es un número real comprendido entre í1 y 1.
í1 ” r ” 1
Si el coeficiente de correlación lineal toma valores cercanos a í1 la correlación es fuerte e
inversa, y será tanto más fuerte cuanto más se aproxime r a í1.
Si el coeficiente de correlación lineal toma valores cercanos a 1 la correlación es fuerte y
directa, y será tanto más fuerte cuanto más se aproxime r a 1.
Si el coeficiente de correlación lineal toma valores cercanos a 0, la correlación es débil.
Si r = 1 ó í1, los puntos de la nube están sobre la recta creciente o decreciente. Entre
ambas variables hay dependencia funcional.

El coeficiente de correlación de Pearson (r) puede calcularse en cualquier grupo de datos, sin
embargo la validez del test de hipótesis sobre la correlación entre las variables requiere en sentido
estricto:
x Que las dos variables procedan de una muestra aleatoria de individuos.
x Que al menos una de las variables tenga una distribución normal en la población de la cual
la muestra procede. Para el cálculo válido de un intervalo de confianza del coeficiente de
correlación de r ambas variables deben tener una distribución normal. Si los datos no
tienen una distribución normal, una o ambas variables se pueden transformar
(transformación logarítmica) o si no se calcularía un coeficiente de correlación no
paramétrico (coeficiente de correlación de Spearman) que tiene el mismo significado que el
coeficiente de correlación de Pearson y se calcula utilizando el rango de las observaciones.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.98


El coeficiente de correlación de Pearson se interpreta de modo análogo a la covarianza pero, al
oscilar entre -1 y 1 como máximo, la interpretación del mismo resulta más intuitiva a la vez que
facilita el establecimiento de comparaciones entre los coeficientes obtenidos para conjuntos de
datos distintos.
En el caso en que la desviación típica de una de las dos variables fuera igual a 0,
la fórmula de
“r” resultaría en una indeterminación, ahora bien, ello ocurrirá en el caso en que
todos los valores de esa variable fueran iguales, caso en el que tampoco se
puede hablar propiamente de una variable sino de una constante.

Es decir que es el cociente de la covarianza dividida el producto de las desviaciones estándar de


cada una de las variables.

En el primer ejemplo que vimos para la covarianza Calculamos las desviaciones típicas.

Aplicamos la fórmula del coeficiente de correlación lineal.

Al ser el coeficiente de correlación positivo, la correlación es directa.


Como coeficiente de correlación está muy próximo a 1 la correlación es muy fuerte.

En el segundo ejemplo que analizamos al estudiar la covarinza:

Calculamos las dos varianzas y luego las desviaciones estándar:

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 99


Y por úlitmo el coefiente de correlación:

Al ser el coeficiente de correlación negativo, la correlación es inversa.


Como coeficiente de correlación está muy próximo a 0 la correlación es muy débil.

4) Coeficente de correlación de Spearman:


El coeficiente de correlación de Spearman es menos sensible que el de Pearson para los valores
muy lejos de lo esperado. En este ejemplo: Pearson = 0.30706 Spearman = 0.76270
En estadística, el coeficiente de correlación de Spearman, ȡ (rho) es una medida de la correlación
(la asociación o interdependencia) entre dos variables aleatorias continuas. Para calcular ȡ, los
datos son ordenados y reemplazados por su respectivo orden.
El estadístico ȡ viene dado por la expresión:

donde D es la diferencia entre los correspondientes estadísticos de orden de x - y. N es el número
de parejas.
Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si éstos
son pocos, se puede ignorar tal circunstancia
Para muestras mayores de 20 observaciones, podemos utilizar la siguiente aproximación a la
distribución t de Student


 

La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de


Pearson. Oscila entre -1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0
cero, significa no correlación pero no independencia. La tau de Kendall es un coeficiente de
correlación por rangos, inversiones entre dos ordenaciones de una distribución normal bivariante.
Los datos hay que traducirlos u ordenarlos en rangos. A los puntajes más elevados le asignamos el
rango 1 al siguiente el rango 2 y así sucesivamente. Si se repiten dos puntajes o más se calculan
las medias aritméticas.

Veamos un ejemplo: La siguiente tabla muestra el rango u orden obtenido en la primera evaluación
(X) y el rango o puesto obtenido en la segunda evaluación (Y) de 8 estudiantes universitarios en la
asignatura de Estadística. Calcular el coeficiente de correlación por rangos de Spearman.
Estudiante X Y
Diana 1 3
Elizabeth 2 4
Mario 3 1
Orlando 4 5
Matías 5 6
Josué 6 2
Anita 7 8

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.100


Lucía 8 7

Para calcular el coeficiente de correlación por rangos de Spearman de se llena la siguiente tabla:

Se aplica la fórmula:


Por lo tanto existe una correlación positiva moderada entre la primera y segunda evaluación de los 8
estudiantes.

A continuación, le propongo realizar las actividades planteadas para el módulo, de modo tal que pueda poner
en práctica los conceptos aquí desarrollados. No dude en canalizar las preguntas que le surjan, en la tutoría.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 101


m4 material

Material Básico
x Desarrollo teórico del módulo, disponible en el apartado contenidos.
x Bologna E. (2011) (Comp). Estadística aplicada a la Psicología y a la
Educación. Córdoba: Editorial Brujas.

Material Complementario
BENALCÁZAR, Marco, (2002), Unidades para Producir Medios Instruccionales
en Educación, SUÁREZ, Mario Ed. Graficolor, Ibarra, Ecuador.

DAZA, Jorge, (2006), Estadística Aplicada con Microsoft Excel, Grupo Editorial
Megabyte, Lima, Perú.

GOVINDEN, Lincoyán, (1985), Introducción a la Estadística, Ed. McGraw Hill.


Interamericana Editores. S.A., Bogotá, Colombia.

JOHNSON, Robert, (2003), Estadística Elemental, Ed. Math Learning, Ed. Ter-
cera, México DF. KUBY, Patricia.

KAZMIER, J. Leonard, (1990). Estadística Aplicada a la Administración y la


Economía, Ed. McGrawHill, Ed. Segunda, Bogotá, Colombia.

LIND, Marchal, (2005), Estadística Aplicada a los Negocios y a la Economía, Ed.


McGraw- Hill, MASON Ed. Décima., Mexico DF.

MARTINEZ, Bencardino, (1981), Estadística Comercial, Ed. Norma, Bogotá,


Colombia.

MORENO, Francis, (1993), Estadística Inferencial, Universidad Particular de


Loja, Loja, Ecuador.

SÁNCHEZ, Jesús, (2007), Introducción a la Estadística Empresarial, Madrid,


España.

SALTOS, Héctor, (1986), Estadística de Inferencia, Ed. Pío XII, Ambato, Ecua-
dor.

SHAO, Stephen, (1980), Estadística para Economistas y Administradores de


Empresas, Ed. Herrero Hnos, México DF.
SPIEGEL, Murray, (2000), Estadística, Serie de Compendios Schaum, Ed.
McGraw-Hill, México

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.102


Artículos Consultados por Internet
x www.estadística.mat.uson.mx/material/elmuestreo.pdf
x http://www.monografias.com/trabajos12/recoldat/recoldat.
shtml#ixzz36cNauhI7
x Matemáticas 1º Bachillerato Sociales. Ramas matemáticas de
Álgebra, Análisis de funciones, Estadística y probabilidad..http://www.
google.com.ar/url?sa=t&rct=j&q=&esrc=s&frm=1&source=web&
cd=2&ved=0CB8QFjAB&url=http%3A%2F%2Fwww.vadenumeros.
es%2Fsociales%2Fmanejo-tabla-normal.htm&ei=qjC9U4aDJNXLsATIyo
KQBg&usg=AFQjCNHKR4KmoYT5O2jCYkJ9N0kPVhJU_Q&bvm=bv.70
138588,d.cWc
x http://www.monografias.com/trabajos12/recoldat/recoldat.
shtml#ixzz36cMvQgzu
x Ander,Egg Ezequiel. Técnicas de investigación social. Humanitas,
Buenos Aires. 1987- (pag 178/190)
x InnOvaciOnes de NegOciOs 4(1): 107-145, 2007 © 2007 UANL,
Impreso en México (ISSN 1665-9627) Papel de la estadística en la
investigación científica (Role of statistics in scientific research)
x Badii, M.H., J. Castillo, J. 1Landeros & K. Cortez UANL, San Nicolás,
N.L., mhbadii@yahoo.com.mx, 1UAAAN, Coah. México
x Bortz, J., Lienert, G.A. & Boehnke, K. (1990). Verteilungsfreie Methoden
in der Biostatistik. (Métodos libres de distribución en la bioestadística)
Springer, Berlin (cap. 8.1, p. 326 y p. 355 y siguientes).

x Diehl, J. M. / Kohr, H.U. (1999). Deskriptive Statistik. («Estadística


descriptiva») 12ª edición. Klotz Eschborn, p.161.

x Zöfel, P. (2003). Statistik für Psychologen. («Estadística para psicólo-


gos») Pearson Studium, Múnich.

x http://www.monografias.com/trabajos85/coeficiente-correlacion-
rangos-spearman/coeficiente-correlacion-rangos-spearman.
shtml#ixzz37JqVnzi9

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 103


m4 actividades

m4 | actividad 1

Coeficiente de correlación
A-
Interprete cada uno de los siguientes coeficientes de correlación y use gráficos
de dispersión para representar como se vería cada una de las relaciones entre
dos variables (x, y) cualesquiera:
a) r = -1,0
b) r = 0,05
c) r = 0,85
B-
Si el coeficiente de correlación para los datos de la tabla es 0,97, responda
a las preguntas siguientes, primero sin realizar ningún cálculo y después,
comprobar las respuestas haciendo los cálculos necesarios con su calculadora
o el programa SPSS.
X 2 3 4 5 6
Y 5 7 8 13 14
Revise los gráficos de dispersión correspondientes y responda cómo cambiaría
este coeficiente si:
a) Sumamos 3 a la variable X
b) Sumamos 3 en ambas variables
c) Multiplicamos la variable X por 2
d) Intercambiamos todos los valores de X por los de Y
e) Cambiamos el último valor de X por el de Y f
f) Sumamos 10 a ambas variables pero sólo en el primer punto
observado

C-
La correlación lineal de X con Y es r = 0,60; la correlación de X con W es de
r = -0,80. ¿Con cuál de las variables Y o W, es mayor el grado de asociación
lineal?

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.104


m4 | actividad 2

Revisión de conceptos I
Cada una de las frases siguientes contiene un error, explique en cada caso qué
es lo que está mal.
a) “Existe una alta correlación entre el sexo de los trabajadores en
Talca y su salario”
b) “Se encontró una alta correlación (r = 1,09) entre las
evaluaciones de los estudiantes a los profesores y los salarios de
los académicos”
c) “La correlación entre el tamaño familiar y los metros cuadrados
del hogar es r = 0,65 metros cuadrados”.

m4 | actividad 3

Revisión de conceptos II

Marque la alternativa correcta justificando su elección:

I. Si el coeficiente de correlación de Pearson entre X e Y es de 0, ello


quiere decir que:
a) Hay relación no lineal entre ellas.
b) No hay relación lineal entre ellas.
c) No hay relación entre ellas.
d) Ninguna es correcta.

II. Tenemos un predictor (X) y una variable predicha (Y) y el diagrama de


dispersión muestra que a mayores valores de X corresponden menores
valores de Y. Si la varianza explicada por la línea de regresión de Y a
partir de X es de 40, y la varianza total de la Y es de 80, ¿cuánto vale el
coeficiente de correlación de Pearson?:
a) -0,25.
b) +/- 0,71
c) -0,71
d) Ninguna es correcta

III. ¿Qué estadístico se emplea para calcular la relación entre dos variables
con escala ordinal?:
a) Coeficiente de correlación de Pearson.
b) Coeficiente de correlación.
c) Coeficiente de correlación de Spearman.
d) Ninguna es correcta.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 105


IV. Un investigador observa que el coeficiente de correlación de Pearson
entre dos variables X y Z es de 0,65, mientras que el coeficiente de
correlación de Pearson entre X y V es de
-0,65. ¿Con qué variable tiene X una relación lineal más fuerte?:

a) La fuerza de la relación es mayor con V.


b) La fuerza de la relación es similar en ambos casos.
c) La fuerza de la relación es mayor con Z
d) Ninguna es correcta

V. En una amplia muestra de sujetos, el coeficiente de correlación


adecuado entre las personas que fuman y las que poseen cáncer
de pulmón mostró una intensa relación positiva. De acuerdo con la
información anterior, cabe señalar que:
a) El hecho de padecer cáncer de pulmón suele provocar una
inclinación a fumar.
b) El hecho de fumar es un factor que suele causar cáncer de
pulmón.
c) Los sujetos con cáncer de pulmón suelen coincidir con los que
fuman.
d) Ninguna es correcta

VI. En una investigación unos psicólogos quieren conocer la relación real


entre ‘número de palabras recordadas en una tarea de recuerdo’ y
‘tiempo empleado en el estudio’, pero eliminando la influencia que la
variable ‘Inteligencia’ pueda tener sobre esa relación. ¿Qué estadístico
tendrán que calcular?

a) Coeficiente de correlación lineal


b) Coeficiente de correlación de Pearson.
c) Coeficiente de correlación de Spearman.
d) Ninguna es correcta.

VII. Señala la alternativa CORRECTA:


a) Si el coeficiente de correlación de Pearson entre ‘nivel de alcohol
en sangre’ y ‘riesgo de tener un accidente de circulación’ es de
-0,05 podemos deducir que el riesgo de accidentabilidad y el
grado de alcoholemia no están asociados linealmente.
b) Si el coeficiente de correlación de Pearson entre ‘nivel de alcohol
en sangre’ y ‘riesgo de tener un accidente de circulación’ es de
0,96 podemos deducir que el riesgo de accidentabilidad está
causado por el grado de alcoholemia.
c) Si el coeficiente de correlación de Pearson entre ‘nivel de alcohol
en sangre’ y ‘riesgo de tener un accidente de circulación’ es de
1,21 podemos deducir que el riesgo de accidentabilidad y el
grado de alcoholemia están asociados linealmente.
d) Si el coeficiente de correlación de Pearson entre ‘nivel de alcohol
en sangre’ y ‘riesgo de tener un accidente de circulación’ es de
0,96 podemos deducir que el riesgo de accidentabilidad no está
causado por el grado de alcoholemia

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.106


VIII. La covarianza es un indicador...
a) Las otras alternativas son correctas.
b) Que sirve para mostrar la relación lineal de dos variables.
c) Que da siempre un valor positivo.
d) Ninguna es correcta

IX. Si al calcular el coeficiente de correlación de dos variables X e Y, se


tiene r=- 0.20 ocurre que:
a) La pendiente de la recta de regresión es pequeña.
b) La pendiente de la recta de regresión es grande.
c) X e Y están poco relacionadas, aunque cuando X decrece, Y
tiene tendencia a crecer.
d) El modelo lineal de regresión explica el 20% de la varianza de
una variable cualquiera en función de la otra.
e) El modelo lineal de regresión explica el 80% de la varianza de
una variable cualquiera en función de la otra.

X. La covarianza de dos variables:


a) Es la raíz cuadrada del coeficiente de correlación.
b) Es la media de las varianzas.
c) Es una medida de la variabilidad común.
d) Es siempre positiva.
e) Todas las anteriores afirmaciones son ciertas.

XI. La recta de regresión de Y sobre X se muestra como una buen modelo


para explicar la relación entre dos variables numéricas. Entonces:
a) Y se puede calcular exactamente como una función matemática
de X.
b) Y es independiente de X.
c) La covarianza de X e Y no es nula.
d) La media de X coincide con la media de Y.
e) Sólo dos de las afirmaciones anteriores son correctas.

XII. Si el coeficiente de correlación lineal de Pearson entre dos variables es


-0,8 podemos decir:
a) La covarianza es negativa.
b) La relación entre las variables es directa.
c) Hay poca relación lineal entre las variables.
d) Hay un error de cálculo.
e) El 80% de las predicciones son correctas.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 107


m4 | actividad 4

&RYDULDQ]D\FRH¿FLHQWHGHFRUUHODFLyQ

Ejercicio 1:
Se sabe que entre el consumo de papel y el número de litros de agua por metro
cuadrado que se recogen en una ciudad no existe relación.

a) ¿Cuál es el valor de la covarianza de estas


variables?
b) ¢&XiQWRYDOHHOFRH¿FLHQWHGHFRUUHODFLyQOLQHDO"

Ejercicio 2:
La varianza de la variable Y es igual a 200, y la varianza de los errores es igual
D¢&XiQWRYDOHHOFRH¿FLHQWHGHFRUUHODFLyQGH3HDUVRQVDELHQGRTXHHV
positivo?

m4 glosario

Coeficiente de elevación: indica las veces que la muestra esta contenida en la


población.

Encuestas: técnica de recolección de datos que consiste en un conjunto de


preguntas normalizadas, dirigida a un conjunto de individuos, para indagar a
cerca de características específicas.

Entrevistas: técnica de recolección de datos en forma verbal, a través de


preguntas del investigador, frente al entrevistado.

Error muestral: cuantificación de la diferencia entre población y muestra.


Fracción de muestreo: es el porcentaje que representa la muestra respecto de
la población.

Investigación-acción: forma de indagación autorreflexiva que tiene por objeto


mejorar la racionalidad en sus propias prácticas pedagógicas , comprender
mejor éstas prácticas y las situaciones en las que las mismas se llevan a cabo.

Muestra: subconjunto de la población bajo estudio, posee dos características:


ser aleatoria y representativa.

Muestreo probabilístico: todos los individuos tienen la misma probabilidad de


ser seleccionados para formar parte de una muestra.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.108


Muestreo: conjunto de técnicas y procedimientos que se realizan para obtener
una muestra.

Muestreos no probabilísticos: la muestra extraída sea no es representativa


porque todos los elementos de la población no tienen la misma probabilidad de
ser elegidos para formar parte de la muestra.

Observación directa: técnica de recolección de datos que consiste en


observar a las unidades estadísticas cuando efectúan determinada actividad
que se está analizando.

Plan de muestreo: procedimiento para selección de la muestra con la cual se


va a trabajar.
Población: conjunto de todos los elementos bajo estudio.

Unidad estadística: cada uno de los elementos que se está analizando.

m5

m5 microobjetivos

ͻ Entender el concepto de espacio muestral, eventos, probabilidad y su


aplicación en situaciones y problemas concretos

x Comprender la conceptualización formal del suceso como subconjunto


de un espacio muestral.

x Comprender el concepto de probabilidad desde las diferentes teorías


que la explican

ͻ Conocer las características de la distribución de probabilidad normal


y aprender a calcular los valores de Z y sus diferentes aplicaciones a
situaciones concretas.

ͻ Estudiar la relación entre el número de sucesos elementales y la


media de experimentos necesarios hasta obtener un suceso elemental
determinado y de la frecuencia de aparición de sucesos que presentan
simetrías o patrones.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 109


m5 contenidos

Probabilidad – Modelos de Probabilidad

Introducción a la probabilidad:

Para poder comprender la unidad de probabilidad deberemos repasar conceptos de la Teoría de


Conjuntos.

El término conjunto se asocia por lo general con la idea de “agrupación de objetos o elementos”,
es decir que denota una colección de elementos que tienen alguna característica en común.
En matemáticas el concepto de conjunto es considerado primitivo y ni se da una definición de éste,
sino que se trabaja con la notación de colección y agrupamiento de objetos, lo mismo puede
decirse que se consideren primitivas las ideas de elemento y pertenencia. La característica
esencial de todo conjunto es la de estar bien definido, es decir que para todo elemento particular
que se esté analizando podremos determinar si éste pertenece o no a cierto conjunto. Por ejemplo
si se considera el conjunto de los números dígitos, sabemos que el 3 pertenece al conjunto, pero el
19 no. Por otro lado el conjunto de las bellas obras musicales no es un conjunto bien definido,
puesto que diferentes personas puedan incluir distintas obras en el conjunto.

Los objetos que forman un conjunto se llaman


elementos. Por ejemplo el conjunto de las letras
de alfabeto; a, b, c, ..., x, y, z. que se puede
escribir así: { a, b, c,..., x, y, z}

Como podemos observar el conjunto se escribe


entre llaves y dentro de éstas a cada elemento lo
separamos por comas. A su vez a cada conjunto
lo denotaremos por una letra mayúscula
(A,B,C,…..) Por ejemplo: sea el conjunto de todas
las vocales: A= { a,e,i,o,u }

Existen distintas formas de definir un conjunto:

1) Por enumeración: si se detallan cada uno de los elementos de un conjunto (sin repetir)
encerrados entre llaves y separados por comas. Ejemplo: A= { a,e,i,o,u }

2) Por propiedad o por compresión : si se describe la característica común a todos los


elementos del conjunto: Ejemplo: A= { x/x es una vocal }

3) Por diagrama de Venn: es una gráfica cerrada en forma de ovalo , dentro del cual se
enumeran los elementos del conjunto indicados por un punto.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.110


4) Ejemplo:

A
*a *e
*i

 X R

Dos conjuntos son iguales si tienen los mismos elementos, por ejemplo: El conjunto { a, b, c }
también puede escribirse: { a, c, b }, { b, a, c }, { b, c, a }, { c, a, b }, { c, b, a }

En teoría de conjuntos se acostumbra no repetir a los elementos por ejemplo el conjunto { b, b, b,


d, d } simplemente será { b, d }.

Inclusión:
La relación de inclusión se da entre dos o más conjuntos.
Si cada elemento de un conjunto A es también un elemento del conjunto B , se dice que A es un
subconjunto de B . La notación A‫ ؿ‬B significa que A está incluido en B y se lee: “ A es subconjunto
de B ” o “ A está incluído en B ”.
B
A

Si no todos los elementos de un conjunto A son elementos del conjunto B , se dice que A no es
subconjunto de B . En este caso la notación A ‫ ف‬B significa que A no es un subconjunto de B .

Pertenecia:
La relación de pertenencia se establece entre un elemento y uno o más conjuntos.
Veamos el concepto a través de un ejemplo: A= { a,e,i,o,u }
Entonces si tomamos el elemento “a” podemos decir que pertenece al conjunto A , en símbolos
dirmeos que: aԖA y si por el contrario tomamos otro elemento por ejemplo “z” diremos que
zԖ A

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 111


Conjuntos disjuntos:
Son aquellos que no tienen elementos en común
Por ejemplo: F = {1, 2, 3, 4, 5, 6} G = {a, b, c, d, e, f} son conjuntos disjuntos

&RQMXQWRVFRQQRPEUHVHVSHFtILFRV

1) Conjunto finito: son aquellos que tienen una cantidad determinada de elementos , de forma
tal que podemos nombrar su último elemento.
A= { x/x es una vocal }

2) Conjunto infinito: son conjunto en los que no


podemos nombrar su último elemento.
B={ x/x es un número natural }

3) Conjunto universal: se denomina así al conjunto formado por todos los elementos del tema
de referencia.
Por ejemplo: U
U={ x/x es un animal }

A B

A={ x/x es un mamífero }

C={ x/x es un reptil }

4) Conjunto vacío: se denomina así al conjunto que no tiene ningún elemento. Se lo denota
de dos formas posibles : { } o bien ‫׎‬
Ejemplo: A = { x/x es un número impar múltiplo de 2 }

2SHUDFLRQHVGHFRQMXQWRV

1) Unión de conjuntos:

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.112


Sean A y B dos conjuntos de un mismo conjunto universal, la unión de A y B, expresada
por A ‫ ׫‬B , es el conjunto de todos los elementos que pertenecen a A o pertenecen a B.

A ‫ ׫‬B = {x | x ‫ א‬A o x ‫ א‬B}

A B

2) Intersección de conjuntos:
Sean A y B dos conjuntos de un mismo conjunto universal, la intersección de A y B,
expresada por A ŀ B, es el conjunto de todos los elementos que pertenecen a A y a B
simultáneamente, es decir:

A ŀ B = {x | x ‫ א‬A y x ‫ א‬B} A

La parte del grafico doblemente pintada


corresponde a la intersección

3) Diferencia de conjuntos:

Sean A y B dos conjuntos de un mismo conjunto universal. La diferencia o complemento


relativo de B con respecto a A, es el conjunto de los elementos que pertenecen a A, pero
no pertenecen a B.

A - B = {x | x ‫ א‬A, x ‫ ב‬B} A B

Nota: A - B  B - A

La parte del grafico correspondiente


al conjunto A , pero sacándole
la intersección (parte central común a ambos)

4) Complemento de un conjunto:

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 113


Sea A un subconjunto cualesquiera del conjunto universal. El complemento de A es el
conjunto de elementos que perteneciendo al universo y no pertenecen al conjunto A,
denotado por A’ Ac

Nota: A’ = U - A

PROBABILIDAD: 

Los conceptos de probabilidad, azar o aleatorio son tan viejos
como la civilización. Y es que todos usamos intuitivamente

este concepto cuando decimos :
“quizás llueva mañana” , “probablemente lleguemos tarde”…
Pero es importante que nos preguntemos ¿Qué es la
probabilidad?

Como vimos anteriormente la probabilidad mide la mayor o menor posibilidad de que se dé un


determinado resultado (que denominamos suceso o evento) cuando se estudia un experimento
aleatorio.

Conceptos preliminares

x Experimento estadístico: es el proceso mediante el cual se genera un conjunto de datos y


puede ser determinístico o aleatorio.

x Evento: es un conjunto bien definido de los posibles resultados de un experimento

x Evento simple: son aquellos constituidos por un solo elemento

x Evento compuesto: es aquel que está compuesto por la combinación de dos o más eventos
simples, los cuales se relacionan con alguna de las operaciones de: unión, intersección,
complemento o diferencia. (aquí comenzamos a observar cómo se relacionan directamente
con los conceptos vistos en el repaso de teoría de conjuntos)

x Espacio muestral o probabilístico: es el conjunto de todos los resultados posibles de un


experimento se denota con Ÿ. (en la teoría de conjuntos sería el conjunto universal)

La probabilidad toma valores entre 0 y 1 (o expresados en tanto por ciento, entre 0% y 100%):

El valor cero corresponde al evento imposible: lanzamos un dado y la probabilidad de que salga el
número 7 es cero (dado que tiene solo 6 caras)

P(‫=)׎‬0

El valor uno corresponde al espacio probabilístico: lanzamos un dado al aire y la probabilidad de


que salga cualquier número del 1 al 6 es igual a uno ( o 100%).

P(Ÿ) = 1

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.114


Elrestodeeventossiempretendráprobabilidadesentreceroyuno:queserátantomayorcuanto
másprobableseaquedichosucesotengalugar.

Para calcular la probabilidad , hay diferentes teorías para definir este concepto :

1) Teoria clásica:
La probabilidad es número que se define como el cociente entre la cantidad de eventos
favorables sobre la cantidad de eventos posibles , en cierto experomento aleatorio.

Ejemplo. Si existen n posibles resultados, todos ellos con la misma posibilidad de que
ocurran, entonces la probabilidad de cada evento es 1/n

Veamos un ejemplo: si nuestro experimento es tirar un dado una vez , cual sería la
Probabilidad de que salga un número 5?

P(salga un 5) = 1/6
(Porque hay un solo 5 en las 6 caras que tiene un dado )

2) Teoría frecuencial:
En ésta teoria la probabilidad de un evento o suceso se obtiene a través de la frecuencia
relativa , si el evento se repite muchas veces bajo las mismas condiciones.

Veamos el siguiente ejemplo: si sabemos que en un colegio hay 435 alumnos de los
cuales 267 son mujeres . Podemos representar esta situación en una tabla como sigue:

ni fr =ni/n
mujeres 267 0,61
varones 168 0,39
total 435 1,00

Entonces por ejemplo si seleccionamos un alumno al azar del colegio analizado, la

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 115


probabilidad de que se trate de un varon será: 168/435=0.39 o 39%

Veamos antes de seguir, algunos ejemplos para terminar de comprender el concepto:

a) Probabilidad de que al lanzar un dado salga el número 2: el caso favorable es tan sólo uno (que

salga el dos), mientras que los casos posibles son seis (puede salir cualquier número del uno al
seis). Por lo tanto:

P(A) = 1 / 6 = 0,166 (o lo que es lo mismo, 16,6%)

b) Probabilidad de que al lanzar un dado salga un número par: en este caso los casos favorables
son tres (que salga el dos, el cuatro o el seis), mientras que los casos posibles siguen siendo seis.
Por lo tanto:

P(A) = 3 / 6 = 0,50 (o lo que es lo mismo, 50%)

c) Probabilidad de que al lanzar un dado salga un número menor que 5: en este caso tenemos
cuatro casos favorables (que salga el uno, el dos, el tres o el cuatro), frente a los seis casos
posibles. Por lo tanto:

P(A) = 4 / 6 = 0,666 (o lo que es lo mismo, 66,6%)

d) Probabilidad de que nos toque el "Gordo" de Navidad: tan sólo un caso favorable, el número que
jugamos (¡qué triste...¡), frente a 100.000 casos posibles. Por lo tanto:

P(A) = 1 / 100.000 = 0,00001 (o lo que es lo mismo, 0,001%)

Para poder aplicar la Regla de Laplace el experimento aleatorio tiene que cumplir dos requisitos:

a) El número de resultados posibles (sucesos) tiene que ser finito. Si hubiera infinitos resultados, al
aplicar la regla "casos favorables / casos posibles" el cociente siempre sería cero.

b) Todos los sucesos tienen que tener la misma probabilidad. Si al lanzar un dado, algunas caras
tuvieran mayor probabilidad de salir que otras, no podríamos aplicar esta regla.

A la regla de Laplace también se le denomina "probabilidad a priori", ya que para aplicarla hay que
conocer antes de realizar el experimento cuales son los posibles resultados y saber que todos
tienen las mismas probabilidades.

Ley de Laplace:

P(A) = (número de casos favorables a A)/ (número de casos posibles)

¿Y si el experimento aleatorio no cumple los dos requisitos indicados, qué hacemos?

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.116


En este caso podemos acudir a otro modelo de cálculo de probabilidades que se basa en la
experiencia (modelo frecuentista):

Cuando se realiza un experimento aleatorio un número muy elevado de veces, las probabilidades
de los diversos posibles sucesos empiezan a converger hacia valores determinados, que son sus
respectivas probabilidades.

Veamos como calcular probabilidades de eventos compuestos :



1) Probabilidad de la unión de dos eventos: (en un enunciado se lo reconoce por el nexo “o” , por
ejemplo : ¿Cuál es la probabilidad de que ocurra A o B?)

La probabilidad de la unión de dos eventos es igual a la suma de las probabilidades de cada


uno de éstos eventos menos la probabilidad de la intersección de éstos

P(AUB) = P(A)+P(B) - P(AŀB)

2) Probabilidad de la intersección de dos eventos: (en un enunciado se lo reconoce por el nexo


“y” , por ejemplo : ¿Cuál es la probabilidad de que ocurra A y B en forma conjunta?)

La probabilidad de la intersección de dos eventos es la probabilidad de que ocurran los


elementos comunes a ambos eventos (también se denomina probabilidad conjunta)

P(AŀB)

3) Probabilidad condicional o condicionada: (en un enunciado se lo reconoce como: ppr ejemplo


P(A/B) ¿Cuál es la probabilidad de que ocurra A , dado que se conoce la probabilidad de que
ocurra B?)

La probabilidad de P(A/B) se calcula como el cociente de : la intersección entre A y B , dividida


por la probabilidad de que ocurra B.

P(A/B) = P(AŀB) / P(B) “probabilidad de A , dado B”

Si se plantea al revés el cálculo será:

P(B/A) = P(AŀB) / P(A) “probabilidad de B , dado A”

4) Probabilidad de la diferencia entre dos eventos: (en un enunciado se lo reconoce como A


menos B)

La probabilidad de la diferencia de un evento A menos un evento B , es igual a la diferencia de


las probabilidades de que ocurra A menos la probabilidad de que ocurra B.

P(A-B) = P(A) – P(B)

Si se plantea al revés el cálculo será:

P(B-A) = P(B) – P(A)

5) Eventos independientes:

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 117


Dos eventos A y B son independientes si
se verifica que
P(AŀB) = P(A).P(B)

CASO ESPECIAL :
** Si dos eventos son indpendientes se verifica que
P(A/B) = P ( AŀB)/ P(B) = P(A).P(B) /P(B) = P(A)
Como A y B son independientes la probabilidad de A dado B es igual a la probabilidad de que
ocurra A

Por el contrario :

P(B/A) = P ( AŀB)/ P(A) = P(A).P(B) /P(A) = P(B)


Como A y B son independientes la probabilidad de B dado A es igual a la probabilidad de que
ocurraB

6) Eventos muyuamente excluyentes:


Dados dos eventos A y B se dice que son mutuamente excluyentes si NO tienen elementos en
común, es decir si su intersección es el evento imposible.

Por lo tanto si dos eventos son mutuamente excluyentes la probabilidad de su intersección es


igula a cero (porque recordemos que al ser la interseccion de éstos igual al evento imposible ,
y como la probabilidad del evento imposible siempres es igual a 0)

Sii A y B son mutuamente excluyentes entonces P(AŀB)= P(‫׎‬ሻൌͲ




7) Probabilidad de el complemento de un evento A
Dado un evento A la probabailidad del complemento de éste evento ( Ac) es igual a 1 menos la
probabilidad de que ocurra A . Porque la probabilidad de el complemento es la probabilidad de
todo el espacio probabilístico menos la probabilidad de que ocurra A.

P(Ac) = P(Ÿ - A) = P(Ÿ) – P(A) = 1- P(A)

9HDPRVDKRUDDOJXQRVHMHPSORV

I. En un colegio los alumnos pueden elegir por cursar inglés o francés. En cierto grupo de 100
alumnos 90 estudia inglés y el resto francés. De los alumnos que estudian inglés 30 son
varones y de los que estudian francés 6 son mujeres.
Se pide:
a) Armar una tabla de doble entrada que muestre las diferentes alternativas
b) Realizar un diagrama de probabilidad o árbol de probabilidad
c) Si se selecciona un alumno al azar calcular las probabilidades de que:
i. Sea un varón
ii. Hable inglés
iii. Sea una mujer que hable frances

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.118


iv. Sea un varón de habla inglesa
v. Sea un varon o hable francés
vi. Sea una mujer o hable inglés
vii. Si se conoce que es un varón , que hable inglés
viii. Dado que se conoce que es un alumno que habla francés, que se trate de
una mujer
ix. Sea un varón o una mujer
x. Sea un varón y una mujer
xi. Compruebe si “el idioma que hablan” y “el sexo de los alumnos” son o no
independientes.

Solución:
a) Con los datos podemos armar la siguiente tabla

 Hablainglés Hablafrancés Total


Varón 30
Mujer 6
Total 90 100

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 119


Ahora completamos la tabla haciendo las diferencias:

b) Árbol de probabilidad

Habla inglés P(VŀI) =30/100=0,30

 Hablainglés Hablafrancés Total


Varón 30 4 34 Varón (son 34)
P(V)= 34/100=0,34
Mujer 60 6 66
Total 90 10 100
Habla

Francés P(VŀF)=4/100=0,04

Habla inglés P(MŀI) =60/100=0,60

Mujer (son 66) P(M)=66/100=0,66

Habla

Francés P(MŀF)=6/100=0,06

Calculemos cada una de las probabilidades:

i. P(varón) =P(V) = 34/100=0,34

ii. P(hable inglés)=P(I)= 90/100= 0,90

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.120


iii. P(mujer que hable francés)
=P(MŀF)=6/100= 0,06

iv. P(varón de habla


inglesa)=P(VŀI)=30/100=0.30

v. P(varón o hable francés)=P(V U F) =


P(V) + P(F) – P( V ŀ F)

P(V U F) = 34/100+10/100- 4/100=

P(V U F) = (34+10-4)/100= 40/100=0,40

vi. P(mujer o hable inglés)= P(M U I) =


P(M) + P(I) – P( M ŀ I)

= (66+90-60)/100= 96/100=0,96

vii. P(Si se conoce que es un varón , que hable inglés)=P(I/V)=P(I ŀV)/P(V)=


=(30/100)/(34/100)=30/34=0,88235

viii. P(Dado que se conoce que es un


alumno que habla francés, que se trate de una mujer)=

P(M/F)=P(M ŀF)/P(F) =( 6/100) / (10/100) = 6/10= 0,6

‹šǤ P(varón o una mujer) = P(V) +P(M) – P(V ŀ M)


= (34/100)+(66/100) – (0/100)
=0,34+0,66
= 1 o 100% (que es la probabilidad de todo el espacio
probabilístico)

šǤ P(Sea un varón y una mujer) = P(V ŀ M) = P(P(‫׎‬ሻൌͲ(que es la probabilidad del 
evento imposible)
xi. Compruebe si “el idioma que hablan” y “el sexo de los alumnos” son o no
independientes.

Para ello tomamos un evento del “idioma” por ejemplo “que hable inglés” y otro
evento de “sexo” peo ejemplo “varón”

Y debemos ver que sii P(I ŀ V) = P(I) . P(V) las características son
independientes

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 121


No es posible calcular la probabilidad de un intervalo simplemente usando la primitiva de la función
de densidad, ya que no tiene primitiva expresable en términos de funciones ‘comunes’.

Todas las distribuciones normales N( μ, ı), pueden ponerse mediante una traslación μ, y un
cambio de variable ı, como N(0,1) . Esta distribución especial se llama normal estandarizada o
tipificada, en ella se define una nueva variable:

X P
Z
V

La distribución Normal estandarizada o normal estándar es aquella que se determina a partir de la


fórmula de estandarización vista más arriba. Y que tiene media igual a 0 y desviación estándar
igual a 1.
La gran ventaja de ésta es que está tabulada y que una sola tabla nos permitirá calcular cualquier
probabilidad, sea cuales fueran los valores originales de media y desviación estándar. Es decir que
cualquier distribución normal puede convertirse en una estándar.

La variable aleatoria normal estándar: ~ .

La transformación de una distribución X ~ N(ȝ, ı) en una N(0, 1) se llama normalización,


estandarización o tipificación de la variable X.

La distribución normal estándar está tabulada (habitualmente en la forma de el valor de la función


de distribución ĭ) y las otras distribuciones normales pueden obtenerse como transformaciones
simples, como se describe más arriba, de la distribución estándar. De este modo se pueden usar
los valores tabulados de la función de distribución normal estándar para encontrar valores de la
función de distribución de cualquier otra distribución normal.

A continuación se muestra la tabla Normal estandarizada con la que trabajaremos en la práctica:

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.124


7DEOD1RUPDO(VWDQGDUL]DGD

/RVYDORUHVGHODWDEODQRUPDOUHSUHVHQWDQHOiUHD
EDMRODFXUYDQRUPDOKDVWDXQYDORUSRVLWLYRGH]

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 125


Ejemplos de uso de la tabla normal. Cuando la variable z es mayor o igual que un número positivo,
menor o igual que un número negativo, entre dos valores positivos, cálculo de la probabilidad en
cada caso. Estudio de los casos más frecuentes.

1. Cuando la probabilidad pedida se encuentra directamente en las tablas

Hallar la probabilidad p ( z ” 0,45 )

En la 1ª columna buscamos el valor de las unidades y las décimas.

En la 1ª fila el valor de las centésimas.

Basta buscar 0,4 en la columna y 0,05 en la fila. Su intersección nos da la probabilidad.

Leemos y nos da 0,6736. La probabilidad P(z ” 0,45 ) = 0,6736

2. Probabilidad de un valor positivo P (z > 1,24)

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.126


En este caso la probabilidad pedida no está en las tablas.

Sin embargo, si tenemos en cuenta que el área total bajo la gráfica ha de ser 1, deducimos de la
figura que:

P (z > 1,24) = 1 – P (z ” 1,24) = 1 – 0,8925 = 0,1075

3. Probabilidad de un valor negativo P ( z ” - 0,72 )

Como la gráfica es simétrica respecto al eje de ordenadas, P ( z ” - 0,72 ) = P ( z • + 0,72 )

Calculamos P ( z • + 0,72 ) igual que en el caso 2.

P( z • + 0,72 ) = 1 - P ( z < + 0,72 ) = 1 - 0,7642 = 0,2358

P ( z ” - 0,72 ) = P ( z • + 0,72 )= 1 - P ( z < + 0,72 ) = 1 - 0,7642 = 0,2358

4. Probabilidad entre dos valores positivos P ( 0,5 ” z ” 1,76 )

Leemos directamente en la tabla la P (z ” 1,76) y la P ( z ” 0,5 ).

La diferencia entre ellas es la probabilidad que nos piden.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 127


P ( 0,5 ” z ” 1,76 ) = P ( z ” 1,76 ) - P ( z ” 0,5 ) = 0,9608 - 0,6915 = 0,2693

5. Probabilidad entre dos valores negativos P( - 1,76 ” z ” - 0,5 )

Por simetría cambiamos los dos valores negativos a positivos y calculamos sus probabilidades.

P ( - 1,76 ” z ” - 0,5 ) = P ( 0,5 ” z ” 1,76 ) = 0,9608 - 0,6915 = 0,2693

Observa que el área sombreada es la misma que en el caso 4.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.128


6. Probabilidad entre un valor positivo y uno negativo P (- 0,53 ” z ” 2,46)

P (- 0,53 ” z ” 2,46) = P ( z ” 2,46) - P ( z ” - 0,53 )

P ( z ” - 0,53 ) = P ( z • 0,53 ) = 1 - P ( z < 0, 53)= 1 - 0,7019 = 0,2981

P (- 0,53 ” z ” 2,46) = P ( z ” 2,46) - P ( z ” - 0,53 ) = 0,9931 - 0,2981 = 0,695

7. Manejo de la tabla en forma inversa

En éste caso nos darán la probabilidad y debemos calcular el valor de la variable z que acumula
dicha probabilidad

Hallar el valor de z de la normal N(0;1) en cada caso:

a) P(z ” k)= 0,7019

Se busca en el cuerpo de la tabla el valor de probabilidad 0,7019 observando que valores


corresponden con el valor de la 1° columna 0,5 y de la primera fila 0,03

Por lo tanto el valor de k es 0,53

b) P(z ” k)= 0,8997

Se busca en el cuerpo de la tabla el valor de probabilidad 0,8997 observando que valores


corresponden con el valor de la 1° columna 1,2 y de la primera fila 0,08

Por lo tanto el valor de k es 1,28

Concluimos aquí el desarrollo teórico correspondiente al módulo Probabilidad.

Lo invitamos a poner en práctica los conceptos estudiados, realizando para ello las actividades
planteadas. Las preguntas que surjan canalícelas a través del espacio tutorial.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 129


m5 material

Material Básico
x Desarrollo teórico del módulo, disponible en el apartado contenidos.
x Bologna E. (2011) (Comp). Estadística aplicada a la Psicología y a la
Educación. Córdoba: Editorial Brujas.

Material Complementario
GOVINDEN, Lincoyán, (1985), Introducción a la Estadística, Ed. McGraw Hill.
Interamericana Editores. S.A., Bogotá, Colombia.

JOHNSON, Robert, (2003), Estadística Elemental, Ed. Math Learning, Ed. Ter-
cera, México DF. KUBY, Patricia.

Ed. McGrawHill, Ed. Segunda, Bogotá, Colombia.

SHAO, Stephen, (1980), Estadística para Economistas y Administradores de


Empresas, Ed. Herrero Hnos, México DF.
SPIEGEL, Murray, (2000), Estadística, Serie de Compendios Schaum, Ed.
McGraw-Hill, México

Artículos Consultados por Internet


x www.estadística.mat.uson.mx/material/elmuestreo.pdf
x http://www.monografias.com/trabajos12/recoldat/recoldat.
shtml#ixzz36cNauhI7
x Matemáticas 1º Bachillerato Sociales. Ramas matemáticas de
Álgebra, Análisis de funciones, Estadística y probabilidad..http://www.
google.com.ar/url?sa=t&rct=j&q=&esrc=s&frm=1&source=web&
cd=2&ved=0CB8QFjAB&url=http%3A%2F%2Fwww.vadenumeros.
es%2Fsociales%2Fmanejo-tabla-normal.htm&ei=qjC9U4aDJNXLsATIyo
KQBg&usg=AFQjCNHKR4KmoYT5O2jCYkJ9N0kPVhJU_Q&bvm=bv.70
138588,d.cWc
x http://www.monografias.com/trabajos12/recoldat/recoldat.
shtml#ixzz36cMvQgzu

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.130


m5 actividades

m5 | actividad 1

Probabilidad

A continuación lo invito a realizar ejercicios sobre probabilidad:

Ejercicio 1:
En una población, donde el 45% son hombres y el resto mujeres, se sabe que
el 10% de los hombres y el 8% de las mujeres son inmigrantes.

a) ¿Qué porcentaje de inmigrantes hay en esta población?


b) Si se elige, al azar, un inmigrante de esta población, ¿cuál es la
probabilidad de que sea hombre?
Sugerencia : a los efectos de responder es conveniente confeccionar una tabla.

Ejercicio 2:

En una clase de 30 alumnos hay 18 que han aprobado matemáticas, 16 que


han aprobado inglés y 6 que no han aprobado ninguna de las dos. Elegimos al
azar un alumno de esa clase:
a) ¿Cuál es la probabilidad de que haya aprobado inglés y
matemáticas?
b) Sabiendo que ha aprobado matemáticas, ¿cuál es la probabilidad
de que haya aprobado inglés?
c) ¿Son independientes los sucesos “Aprobar matemáticas” y “Aprobar
inglés”?

Sugerencia : a los efectos de responder es conveniente confeccionar una tabla.

Ejercicio 3:

El 1% de la población de un determinado lugar padece una enfermedad. Para


detectar esta enfermedad, se realiza una prueba de diagnóstico. Esta prueba
da positiva en el 97% de los pacientes que padecen la enfermedad; en el
98% de los individuos que no la padecen da negativa. Si elegimos al azar un
individuo de esa población:
a) ¿Cuál es la probabilidad de que el individuo dé positivo y padezca la
enfermedad?
b) Si sabemos que ha dado positiva, ¿cuál es la probabilidad de que
padezca la enfermedad?

Sugerencia : a los efectos de responder es conveniente confeccionar una tabla.

Ejercicio 4:
En una clase de 30 alumnos, las 3/5 partes son mujeres
y la tercera parte aprueban todo en Junio.
Se sabe además que la mitad de los varones no aprueba en Junio.
Halla la probabilidad de que un alumno elegido al azar:

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 131


a) Sea mujer y apruebe todo
b) Sea varón y no apruebe todo
c) Sea mujer sabiendo que aprueba todo
d) Apruebe todo sabiendo que es varón
e) No apruebe

Sugerencia : a los efectos de responder es conveniente confeccionar una tabla.

Ejercicio 5:
En un colegio secundario el 25% de los estudiantes fue aplazado en
Matemática, el 10% en Química y el 5% fue aplazado en ambas materias.
Calcular:

a) De los aplazados en Química, ¿qué porcentaje aplazó Matemática?


b) De los aplazados en Matemática, ¿qué porcentaje aplazó Química?
c) ¿Qué porcentaje aplazó Matemática o Química?

Sugerencia : a los efectos de responder es conveniente confeccionar una tabla.

Ejercicio 6:
De acuerdo a una encuesta realizada en Córdoba, la ubicación probable de las
computadoras personales (PC) en una casa son:
Dormitorio de adultos 0.03
Dormitorio de niños 0.15
Otro dormitorio 0.14
Oficina o estudio 0.40
Otras habitaciones 0.28

Calcular la probabilidad de que:

a) Una PC esté en un dormitorio


b) No esté en un dormitorio
c) Supongamos que se selecciona una familia al azar entre las familias
con una PC
¿en qué lugar esperarías encontrar una PC?

Ejercicio 7:
8QDPXHVWUDDOHDWRULDGHDGXOWRVVHFODVLÀFDDEDMRSRUJpQHUR\VXQLYHO
educacional
Educación Hombre Mujer Básica 3845 Media 2850 Universitaria 2217

Si se selecciona una perona al azar de este grupo, calcular la probabilidad de


que:
a) La persona sea hombre, dado que la persona tiene educación media
b) La persona no tiene educación superior, dado que la persona es mujer

Ejercicio 8:
La siguiente tabla representa información respecto a género y tipo de salario de
los empleados de una empresa:

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.132


Si seleccionamos aleatoriamente una persona de esta empresa, para un
estudio económico. Cuál es la probabilidad de que la persona seleccionada:

a) Sea mujer
b) Tenga ingresos medios
c) Sea hombre o tenga salario bajo
d) Sea hombre si tiene salario bajo
e) Tenga salario alto si es mujer
f) Sea hombre y tiene salario medio
g) Tenga salario medio o bajo
h) Tenga salario medio y alto
i) Verificar si “el tipo de salario” es independiente de “el género”

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 133


m5 | actividad 2

5HYLVLyQGHFRQFHSWRVEiVLFRVGHSUREDELOLGDG

$FRQWLQXDFLyQOHSUHVHQWRHMHUFLFLRVTXHOHSHUPLWLUiQSRQHUHQSUiFWLFD
ORVFRQFHSWRVGHSUREDELOLGDG

Ejercicio 1:
6HDQ$\%ORVVXFHVRVWDOHVTXH3>$@ \3>$ŀ%@ 
&DOFXOH3 $‫׫‬% \3 % 

Ejercicio 2:
6HDQ$\%GRVVXFHVRVDOHDWRULRVVLVHFRFQRFHTXH3 $F 
3 $8% 3 $ŀ% 
Hallar las siguientes probabilidades:

3 $
3 %
3 $ŀ%F
3 %ŀ$F

**Recordar que: Ac es el complemento de A- BC es el complemento de B

m5 | actividad 3

Distribución NORMAL

A continuación lo invito a realizar dos ejercicios que le permitirán poner en


práctica los conceptos respecto de la distribución normal.

Ejercicio 1: Calculo de Normal ya estandarizado (N(0,1))

A- Hallar el área bajo la curva normal tipificada ( o estandarizada):


a) Entre Z = 0 y Z = 1,2
b) Entre Z = -0, 68 y Z = 0

c) Entre Z = -0, 46 y Z = 2, 21

d) Entre Z = 0, 81 y Z = 1, 94

e) A la derecha de Z = -1,28

B- Si “área” se refiere al área bajo la curva normal tipificada, hallar el valor o los
valores de Z tales que:
a) El área entre 0 y Z sea 0,3770
b) El área a la izquierda de Z sea 0,8621

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.134


c) El área entre -1,5 y Z sea 0,0217

C-Determine el área situada debajo de la curva normal estándar que está:


a) A la izquierda de z = 0,94
b) A la derecha de z = - 0,65
c) A la derecha de z = 1,76
d) A la izquierda de z = - 0,85
e) Entre z = - 0,87 y z = - 1,28
f) Entre z = - 0,34 y z = 0,62

D- Obtenga Z si:
a) El área de la curva normal entre 0 y Z es 0,2019

b) El área de la curva normal a la derecha de Z es 0,8810


c) El área de la curva normal a la derecha de Z es 0,0336
d) El área de la curva normal entre -Z y Z es 0,2662

Le sugerimos que realice los graficos en cada caso.

Ejercicio 2: Estandarización

A- Un profesor de matemáticas ha observado que las notas obtenidas por sus


alumnos en los exámenes de estadística siguen una distribución N (6; 2,5).
Se han presentado al último examen 32 ¿cuántos sacaron al menos un 7?

B- Una empresa lleva a cabo una prueba para seleccionar nuevos empleados.
Por la experiencia de pruebas anteriores, se sabe que las puntuaciones
siguen una distribución normal de media 80 y desviación típica 25.¿Qué
porcentaje de candidatos obtendrá entre 75 y 100 puntos ?.

C- El peso medio de 500 estudiantes varones de una universidad es de 68,5


Kg. y la desviación típica es de 10 Kg. Suponiendo que los pesos están
distribuidos normalmente, hallar el número de estudiantes que pesan:
a) Entre 48 y 71 kg.
b) Más de 91 kg.

D- Se tiene un programador de entrenamiento diseñado para mejorar la


calidad de las habilidades de los supervisores de la línea de producción.
Debido a que el programa es auto administrativo, los supervisores
requieren un número diferente de horas para terminarlo. Un estudio de los
participantes anteriores indica que el tiempo medio que se lleva completar
el programa es de 500 h. y que esta variable aleatoria normalmente
distribuida tiene una desviación estándar de 100 h.
a) ¿Cuál es la probabilidad de que un participante elegido al azar
requiera más de 500 h. para completar el programa?.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 135


b) ¿Cuál es la probabilidad de que un candidato elegido al azar
se tome entre 500 h. y 650 h. para completar el programa de
entrenamiento?.
c) ¿Cuál es la probabilidad de que un candidato elegido al azar
se tome más de 700 h. en completar el programa?.

d) Suponga que el director del programa de entrenamiento desea


saber la probabilidad de que un participante escogido al azar
requiera entre 550 y 650 h. para completar el trabajo requerido
en el programa. ¿Cuánto ha de ser ese valor?

e) ¿Cuál es la probabilidad de que un candidato elegido al azar


se tomará menos de 580 h. para completar el programa?

f) ¿Cuál es la probabilidad de que un candidato escogido


al azar se tome entre 420h.y 570 h. para completar el
programa?

E- En un proceso industrial el diámetro de una arandela es muy importante.


El comprador establece en sus especificaciones que el diámetro debe ser
de 3,0 ± 0,01 mm. La condición es que no acepta ninguna arandela que
se salga de estas especificaciones. Se sabe que en el proceso el diámetro
de las arandelas tienen distribución normal con media de 3,0 mm y una
desviación estándar de 0,005 mm. ¿Qué porcentaje de arandelas será
rechazado?.

F- Un estudio reciente reveló que el 64% de las mujeres mayores de 18 años,


consideran a la nutrición la prioridad en su vida. Se seleccionó una muestra
de 60 mujeres. Determinar la probabilidad de que:
a) 32 o más consideren importante la dieta diaria.

b) 44 o más estimen que la alimentación es esencial.

c) Más de 32 pero menos de 43 consideren importante el


aspecto dietético.
d) Exactamente 44 consideren fundamental la alimentación.

G- Los gastos mensuales en alimentación para familias de cuatro miembros en


una ciudad grande son en promedio de $420 con una desviación estándar
de $80. Si los gastos mensuales en alimentación siguen una distribución
normal:
a) ¿Qué porcentaje de estos gastos es menor de $350?
b) ¿Qué porcentaje de estos gastos está entre $250 y $300?

c) ¿Qué porcentaje de estos gastos es menor de $250 o mayor de


$450?
d) ¿Cuál es el gasto mayor en dólares que hace una familia que
está entre el 25% de las familias que menos gastos realizan en
alimentación?

H- Se encontró que en un conjunto de calificaciones de exámenes finales


en un curso tenía distribución normal con media 73 puntos y desviación
estándar de 8 puntos.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.136


a) ¿Cuál es la probabilidad de obtener una calificación no mayor de 91
puntos en este examen?
b) ¿Qué porcentaje de estudiantes obtuvo una calificación entre 65 y 89
puntos?
c) ¿Cuál fue la calificación superada sólo por 5% de los estudiantes que
hicieron el examen?
d) El profesor sigue el siguiente criterio: Le otorga A a los estudiantes
que están ubicados en el 10% de las mejores notas del grupo y usted
saca 81 puntos. Suponga que se realiza otro examen en el que la
media es 62 y la desviación es 3 y usted saca 68 puntos. ¿En cuál de
los 2 exámenes usted queda mejor calificado?. ¿Por qué?

I- El tiempo necesario para terminar un examen final en determinado curso se


distribuye normalmente con una media de 80 minutos y una desviación de
10 minutos.
a) ¿Cuál es la probabilidad de terminar el examen en una hora o
menos?
b) ¿Cuál es la probabilidad de que un estudiante termine el
examen entre 60 y 85 minutos?
c) Suponga que en el curso hay 60 alumnos y que el tiempo del
examen es de 90 minutos. ¿Cuántos alumnos se espera que no
puedan terminar el examen en el tiempo indicado?

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 137


m5 glosario

&RPSOHPHQWRGHXQFRQMXQWR:sea A un subconjunto cualesquiera del conjunto


universal. El complemento de A es el conjunto de elementos que perteneciendo
al universo y no pertenecen al conjunto A.

&RQMXQWR¿QLWR: son aquellos que tienen una cantidad determinada de


elementos , de forma tal que podemos nombrar su último elemento.

&RQMXQWRLQ¿QLWR: son conjunto en los que no podemos nombrar su último


elemento.
&RQMXQWRXQLYHUVDO: se denomina así al conjunto formado por todos los
elementos del tema de referencia.

&RQMXQWRYDFtR: se denomina así al conjunto que no tiene ningún elemento.


&RQMXQWR: agrupación de objetos o elementos.
&RQMXQWRVGLVMXQWRV: son aquellos que no tienen elementos en común.

&RQMXQWRVLJXDOHV: si tienen los mismos elementos.

'H¿QLUXQFRQMXQWRSRUHQXPHUDFLyQ: si se detallan cada uno de los elemen-


WRVGHXQFRQMXQWR VLQUHSHWLU HQFHUUDGRVHQWUHOODYHV\VHSDUDGRVSRUFRPDV
'H¿QLUXQFRQMXQWRSRUSURSLHGDGRSRUFRPSUHVLyQ: si se describe la
característica común a todos los elementos del conjunto.

'LDJUDPDGH9HQQJUi¿FDFHUUDGDHQIRUPDGHRYDORGHQWURGHOFXDOVH
enumeran los elementos del conjunto indicados por un punto.

'LIHUHQFLDGHFRQMXQWRV: sean A y B dos conjuntos de un mismo conjunto


universal. La diferencia o complemento relativo de B con respecto a A, es el
conjunto de los elementos que pertenecen a A, pero no pertenecen a B.
(VSDFLRPXHVWUDORSUREDELOtVWLFR: es el conjunto de todos los resultados
SRVLEOHVGHXQH[SHULPHQWRVHGHQRWDFRQŸ HQODWHRUtDGHFRQMXQWRVVHUtDHO
FRQMXQWRXQLYHUVDO /DSUREDELOLGDGHVQ~PHURTXHVHGH¿QHFRPRHOFRFLHQWH
entre la cantidad de eventos favorables sobre la cantidad de eventos posibles,
en cierto experimento aleatorio.
(YHQWRFRPSXHVWR: es aquel que está compuesto por la combinación de dos
o más eventos simples, los cuales se relacionan con alguna de las operaciones
GHXQLyQLQWHUVHFFLyQFRPSOHPHQWRRGLIHUHQFLD DTXtFRPHQ]DPRVDREVHU-
var cómo se relacionan directamente con los conceptos vistos en el repaso de
teoría de conjuntos)
(YHQWRVLPSOH: son aquellos constituidos por un solo elemento.
(YHQWRHVXQFRQMXQWRELHQGH¿QLGRGHORVSRVLEOHVUHVXOWDGRVGHXQH[SHUL-
mento.
(YHQWRVLQGHSHQGLHQWHV'RVHYHQWRV$\%VRQLQGHSHQGLHQWHVVLVHYHUL¿FD
que
3 $ŀ%  3 $ 3 %

(YHQWRVPXWXDPHQWHH[FOX\HQWHV:dados dos eventos A y B se dice que son


mutuamente excluyentes si NO tienen elementos en común, es decir si su
intersección es el evento imposible.

([SHULPHQWRHVWDGtVWLFR: es el proceso mediante el cual se genera un conjunto

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.138


de datos y puede ser determinístico o aleatorio.
,QWHUVHFFLyQGHFRQMXQWRV: sean A y B dos conjuntos de un mismo conjunto
XQLYHUVDOODLQWHUVHFFLyQGH$\%H[SUHVDGDSRU$ŀ%HVHOFRQMXQWRGHWRGRV
los elementos que pertenecen a A y a B simultáneamente.

3UREDELOLGDGFRQGLFLRQDORFRQGLFLRQDGDODSUREDELOLGDGGH3 $% 
se calcula como el cociente de: la intersección entre A y B, dividida por la
probabilidad de que ocurra B.

3UREDELOLGDGGHODGLIHUHQFLDHQWUHGRVHYHQWRV: la probabilidad de la
diferencia de un evento A menos un evento B , es igual a la diferencia de las
probabilidades de que ocurra A menos la probabilidad de que ocurra B.

3UREDELOLGDGGHODLQWHUVHFFLyQGHGRVHYHQWRV:la probabilidad de la
intersección de dos eventos es la probabilidad de que ocurran los elementos
FRPXQHVDDPERVHYHQWRV WDPELpQVHGHQRPLQDSUREDELOLGDGFRQMXQWD 

3UREDELOLGDGGHODXQLyQGHGRVHYHQWRV: la probabilidad de la unión de dos


HYHQWRVHVLJXDODODVXPDGHODVSUREDELOLGDGHVGHFDGDXQRGHpVWRVHYHQWRV
PHQRVODSUREDELOLGDGGHODLQWHUVHFFLyQGHpVWRV

5HODFLyQGHLQFOXVLyQ: se da entre dos o más conjuntos si cada elemento


GHXQFRQMXQWR$HVWDPELpQXQHOHPHQWRGHOFRQMXQWR%VHGLFHTXH$HVXQ
subconjunto de B.

5HODFLyQGHSHUWHQHFLD:la relación de pertenencia se establece entre un


elemento y uno o más conjuntos.

8QLyQGHFRQMXQWRV: sean A y B dos conjuntos de un mismo conjunto universal,


ODXQLyQGH$\%H[SUHVDGDSRU$ŀ%HVHOFRQMXQWRGHWRGRVORVHOHPHQWRV
que pertenecen a A o pertenecen a B.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 139


m6

m6 microobjetivos

x Conocer las características de los métodos de investigación habituales


en Educación, tanto con un enfoque cualitativo, como cuantitativo.
x Desarrollar la habilidad para realizar búsquedas documentales
especializadas dentro del ámbito de la investigación aplicada a la
Educación.
x Permitir una reflexión teórica y metodológica sobre los fenómenos
que se operan en el proceso educativo puesto que viabiliza la
coparticipación de los sujetos interactuantes en los intercambios
culturales desde el aula de clase, la escuela, la comunidad, y la
sociedad en general.
x Capacitarse para utilizar los conocimientos metodológicos, como
herramienta crítica en la valoración de los trabajos de investigación
producidos en las diferentes áreas de la Educación.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.140


m6 contenidos

Muestreo y Estimación

En Estadística se llama muestreo al conjunto de


WpFQLFDV SDUD  VHOHFFLRQDU PXHVWUDV SDUWLHQGR GH
una población bajo estudio. Se puden extraer más
de una muestra de una misma población, al conjunto
de todas las muestras posibles que se pueden
obtener de una misma pobalción,se lo denomina
“espacio muestral” . Cada una de las muestras
WHQGUi XQD SUREDELOLGDG GH VHU VHOHFFLRQDGD 8QD
vez seleccionada la muestra con la cual se va a
trabajar, se inferirán carácterísticas del todo
SREODFLyQ  D SDUWLU GH ODV FDUDFWHUtVWLFDV GH XQD
SDUWH PXHVWUD  7RGD GHVFULSFLyQ GH XQD SREODFLyQ
a partir de los elementos de una muestra es
aproximada , al no haber tendio en cuenta todos los
elementos. La precisión con la cual se va a trabajar es inversamente proporcional al tamaño de la
PXHVWUDHVGHFLUFXDQWRPiVJUDQGHVHDHOWDPDxRDGHODPXHVWUD HVWDPiVFHUFDDOWDPDxRGH
OD SREODFLyQ  \ SRSU HQGH ODV FRQFOXVLRQHV VHUiQ PDV SUHFLVDV  SHUR HV WDPELpQ FLHUWR TXH HO
FRVWR VHUi WDPELpQ PiV HOHYDGR  (VWRV GRV DVSHFWRV GHEHUiQ VHU DQDOL]DGRV HQ WRGD
investigacion para decidir cuál es el “tamaño óptimo de muestra con el cual se trabajará”.Vimos ya
en la primer unidad que toda muestra debe tener dos características deseables: ser alaeatoria y
ser representativa.
3DUD UHDOL]DU XQD LQYHVWLJDFLyQ VRFLDO  QR QHFHVDULDPHQWH KD\ TXH HVWXGLDU OD WRWDOLGDG GH OD
población, bastará con seleccionar al azar una muestra representativa de la población bajo
estudio.
$ILQGHVHOHFFLyQDUpVWDVPXHVWUDV\TXHSRVHDQODVFDUDFWHUtVLFDVGHVHDEOHVTXHPHQFLRQDPRV
DUULEDHVTXHVHXWLOL]DQGLIHUHQWHV³WHFQLFDVGHVHOHFFLyQGHPXHVWUDV´RWpFQLFDVGHPXHVWUHR
.Cuando dentro de un proceso de investigación se decide trabajar con una muestra esta tarea
GHEH SODQWHDUVH \ UHDOL]DUVH GH IRUPD PX\ FXLGDGRVD  SRUTXH OD YDOLGp] GH ODV FRQFOXVLRQHV
dependen en gran medida de esto.
3DUD FRPHQ]DU D HVWXGLDU ODV WpFQLFDV GH PXHVWUHR  YDPRV D UHSDVDU DQWHV XQD VHULH GH
conceptos y nociones básicas:

3REODFLyQFRQMXQWRGHWRGRVORVHOHPHQWRVEDMRHVWXGLR

Muestra: subconjunto de la población bajo estudio, posee dos características: ser aleatoria y
representativa .

0XHVWUHR FRQMXQWR GH WpFQLFDV \ SURFHGLPLHQWRV


que se realizan para obtener una muestra

8QLGDG HVWDGtVWLFD R XQLGDG HOHPHQWDO R XQLGDG


de observación o unidad de muestra)

Cada uno de los elementos que se está


DQDOL]DQGR 3XHGH VHU VLPSOH FRQVWLWXLGD SRU XQ

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 141


LQGLYLGXR SRU HMHPSOR  XQ  DOXPQR XQ GRFHQWH  R ELHQ FROHFWLYD FRQVWLWXLGD SRU XQ JUXSR GH
individuos, por ejemplo: una familia,un pueblo).
Base de la muestra: es el conjunto de unidades individualizadas que forman el universo o
SREODFLyQ3XHGHVHUSRUHMHPSORXQFHQVRXQSDGUyQHOHFWRUDOXQFDWiORJRXQPDSDHWF
6LQHPEDUJRQRWRGRVODVSREDOFLRQHVHVWiQFHQVDGDVRFDWDORJDGRV\HQpVWHFDVRVODEDVHGH
la muestra no existe y hay que seleccionarla por algún procedimiento empírico por ejemplo:
encuestar a un grupo de personas que se encuentran en determinado lugar en un momento dado.

Fracción de muestreo: es el porcentaje que representa la muestra respecto de la población, se


REWLHQGH GLYLGLHQGR HO WDPDxR GH OD PXHVWUD SRU HO WDPDxR GH OD SREDFLyQ  3RU HMHPSOR VL OD
SREDOFLyQ HVWi IRUPDGD SRU  LQGLYLGXRV  \ OD PXHVWUD FRQ OD TXH VH HVWi WUDEDMDQGR HVWi
IRUPDGDSRUXQLGDGHVHVWDGtVWLFDVODIUDFFLyQGHPXHVWUHRVHUiRELHQGHO

Coeficiente de elevación: indica las veces que la muestra esta contenida en la población. Es la
inversa de la fracción de muestreo. En el ejemplo planteado en el punto anterior , si la fracción de
PXHVWUHRHUDGHHQWRQFHVHOFRHILFLHQWHGHHOHYDFLyQVHUi 

9HDPRVDKRUDXQDVHULHGHOH\HVHQTXHVHEDVDQORVPpWRGRVGHPXHVWUHRDOHDWRULRpVWDVOH\HV
le otrogan un fundamento científico :

 ³/D OH\ GH ORV JUDQGHV Q~PHURV  formulada por Jacques Bernoulli) expresa
TXHVLHQXQDSUXHEDODSUREDELOOLGDGGHXQVXFHVRGHGHQRPLQD3\VLpVWHVXFHVRVH
repite una gran cantidad de veces. La relación entre las veces que se repite el suceso y
OD FDQWLGDG WRWDO GH SUXHEDV WLHQGH D DFHUFDUHV FDGD YH] PDV D OD SUREDELOLGDG 3 0DV
exáctamente si el número de pruebas es lo suficientemente grande, hay una probabilidad
PX\FHUFDQDDGHTXHODIUHFXHQFLDGHOVXFHVRVHDSUDFWLFDPHQWHLJXDOD3´

 /D SUREDELOLGDG GH XQ VXFHVR 3  HV OD UHODFLyQ HQWUH HO Q~PHUR GH FDVRV
favorables y el número total de casos posibles. Si todos los casos son igualmente
posibles, esta cociente es lo que se denomina cálculo de probabilidad.

 8QFRQMXQWRGHGHQXQLGDGHVWRPDGDVDOD]DUGHXQDSREDOFLRQGHWDPDxR1
HV FDVL VHJXUR TXH WLHQH ODV FDUiFWHUtVWLFDV GHO JUXSR PiV JUDQGH pVWD OH\ VH FRQRFH
como “Ley de la regularidad estadística”).

 (Q ODPD\RUtDGHORV IHQyPHQRVFXDQGR XQDSDUWHYDUtDHQXQDGLUHFFLyQHV


SUREDEOHTXHXQDSDUWHGHOPLVPRJUXSRYDUtHHQGLUHFFLyQRSXHVWD pVWDOH\VHFRQRFH
como “Ley de la inercia de los grandes números”).

 6LXQDPXHVWUDVXILFLHQWHPHQWHJUDQGHHVUHSUHVHQWDWLYDGHODSREDODFLyQDOD
cual pertenece, una segunda muestra de igual magnitud deberá ser semejante a la
primera. Y si en la primer muestra se encuentran pocos individuos con características
UDUDV  HV GH HVSHUDU HQFRQWUDU LJXDO SURSRUFLyQ HQ OD VHJXQGD PXHVWUD  pVWD OH\ VH
conoce como “Ley de permanencia de los números pequeños”).

7LSRVGHPXHVWUHR

Existen diferentes formas de seleccionar las muestras , en genaral pueden dividirse en dos
grandes grupos:
a) Muestreo probabilístico
b) Muestreo no probabilístico

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.142


Veamos cada uno de ellos:

D  0XHVWUHR SUREDELOtVWLFR pVWRV PpWRGRV VRQ DTXHOORV TXH VH EDVDQ HQ HO
principio de equiprobabilidad , es decir aquellos en los que todos los individuos tienen la
PLVPDSUREDELOLGDGGHVHUVHOHFFLRQDGRVSDUDIRUPDUSDUWHGHXQDPXHVWUD3RUHQGHWRGDV
las posibles muestras de tamaño n tienen la misma probabilidad de ser seleccionadas . solo
pVWRVPpWRGRVGHPXHVWUHRQRVDVHJXUDQUHSUHVHQWDWLYLGDG\DOHDWRULHGDG<SRUHOORVRQORV
mas recomendables.

'HQWURGHpVWRVPpWRGRVSUREDELOtVWLFRVHVWXGLDUHPRVORVVLJXLHQWHV

D 0XHVWUHRDOHDWRULRVLPSOH 0$6 HOSURFHGLPLHQWRHPSOHDGR


es el siguiente:

I. Se asigna un número a cada individuo de la población


,,$WUDYpVGHWDEODVGHQ~PHURVDOHDWRULRVRJHQHUDQGR
OLVWDGR GH Q~PHURV DOHDWRULRV SRU XQD 3& VH HOLJHQ
tantos individuos como sea necesario según el
tamaño de muestra pre determinado.
Este tipo de muestreo es muy utilizado por su simpleza, pero es casi
imposible de aplicar cuando la población es muy grande debido a que
es imposible numerar todos sus elementos.

a.2) Muestreo aleatorio sistemático: el procedimiento a seguir es:


I. Se asigna un número a cada individuo de la población
,, 6HGHWHUPLQDXQQ~PHURDOHDWRULR TXHGHQRPLQDUHPRVSXQWRGHDUUDQTXH³N´ 
,,, 6HSDUWHGHHVHQ~PHUR³N´ TXHHVXQQ~PHURHOHJLGRDOD]DU \ORVHOHPHQWRV
TXH LQWHJUDQ OD PXHVWUD VRQ ORV TXH RFXSDQ ORV OXJDUHV N NNM
NM«N Q M 6LHQGR M 1Q  HV GHFLU HO FRFLHQWH HQWUH HO WDPDxR GH OD
SREODFLyQ\HOWDPDxRGHODPXHVWUD\HVXQQ~PHURFRPSUHQGLGRHQWUH\
j.

El riesgo en este tipo de muestreo es


aquellas poblaciones en las cuales
hay periodicidad porque al elegir la
muestra podemos introducir una
homogeneidad con una periodicidad
FRQVWDQWH M \TXHQRVHGDHQODSREODFLyQ

D 0XHVWUHRHVWUDWLILFDGR(VWHSURFHGLPLHQWRFRQFLVWHHQFRQVLGHUDUFDWHJRUtDVWtSLFDV
GLIHUHQWHVHQWUHVt HVWUDWRV TXHVRQKRPRJpQHRVUHVSHFWRGHDOJXQDFDUDFWHUtVWLFD
 VH SXHGH HVWUDWLILFDU SRU HMHPSOR VHJ~Q HO
nivel de estudios alcanzado). Lo que se trata es
TXH WRGRV ORV HVWUDWRV GH LQWHUpV HVWpQ
representados en la muestra. Dentro de cada
HVWUDWRVHVHOHFFLRQDQHOHPHQWRV SXHGHXVDUVHHO
MAS o el sistematico) que formarán parte de la
muestra analizada.

La mayor dificultad que presenta es cuando se


desconocen en forma detallada los estratos por
ser demasiado grandes.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 143


3DUDVHOHFFLRQDUODPXHVWUDODSURSRUFLyQGHHOHPHQWRVTXHVHHOLMHQGHQWURGHFDGDHVWUDWRKD\
tres tipos diferentes de criterios que se denominan afijaciones:
I. Afijación simple: a cada estrato le corresponde igual número de elementos
muestrales
II. Afijación proporcional: la distribución se hace de acuerdo con el peso
WDPDxR GHODSREODFLyQHQFDGDHVWUDWR
III. Afijación óptima: se tiene en cuenta la dispersión dentro de cada estrato de
modo que para seleccionar la cantidad de elementos dentro de cada
estrato se tiene presente la desviación estándar y la proporción dentro del
PLVPR 3HUR HV SRFR DSOLFDGR SRUTXH HQ JHQHUDO QR VH FRQRFH OD
desviación de cada estrato.

D 0XHVWUHRDOHDWRULRSRUFRQJORPHUDGRV(QORVDQWHULRUHVPpWRGRVODVXQLGDGHV
muestrales son los elementos de la población.
En el muestreo por conglomerados
la unidad elemental es un conjunto de
elementos de la población a la que se
GHQRPLQD³FRQJORPHUDGR´ FRPRSRUHMHPSOR
los departamentos o áreas dentro
de un colegio). Éste muestreo consiste en
seleccionar aleatoriamente un cierto
número de conglomerados hasta alcanzar el
tamaño de muestra elegido.

E  0XHVWUHRVQRSUREDELOtVWLFRVPXFKDVYHFHVDSOLFDUODVWpFQLFDVGHPXHVWUHR
probabilístico
HV FRVWRVR \ VH HOLJHQ PXHVWUHRV QR SUREDELOtVWLFRV $XQTXH VH FRQRFH TXH pVWRV QR
VLUYHQSDUDUHDOL]DUJHQHUDOL]DFLRQHV HVWLPDFLRQHVLQIHUHQFLDOHVVREUHODSREODFLyQEDMR
estudio) porque no se tiene certeza de que la muestra extraída sea representativa ya que
no todos los elementos de la población tienen la misma probabilidad de ser elegidos para
formar parte de la muestra. En general se seleccionan a los sujetos siguiendo
determinados criterios tratando de que la muestra sea representativa.
(QWUHORVPpWRGRVGHPXHVWUHRQRSUREDEilísticos mas utilizados vamos a estudiar:

E 0XHVWUHRSRUFXRWDVWDPELpQGHQRPLQDGR³DFFLGHQWDO´6HEDVDHQXQEXHQ
FRQRFLPLHQWRGHORVHVWUDWRVGHODSREODFLyQ\RGHORVLQGLYLGXRVPiV
representativos o adecuados para los fines de la investigación.
7LHQHFLHUWDVVLPLOLWXGHVFRQ
el muestreo estratificado,
pero no tiene el
carácter de aleatoriedad de
pVWH
(QpVWHWLSRGHPXHVWUHRVH
fijan “cuotas” que son
números de individuos
que reúnen determinadas
condiciones , por ejemplo: 20
LQGLYLGXRVGHD
años de sexo femenino , de
Córdoba capiWDO8QDYH]GHWHUPLQDGDODFXRWD
se seleccionan los primeros individuos que cumplan esas características

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.144


eVWHPpWRGRVHXVDPXFKRHQODVHQFXHVWDVGHRSLQLyQ

E 0XHVWUHRLQWHQFLRQDO RGHFRQYHQLHQFLD 6HVHOHFFLRQDQPXHVWUDV


“representativas” incluyendo en la misma grupos considerados supuestamente
típicos. Es muy frecuente que se
use en sondeos preelectorales de
zonas que en anteriores
votaciones han marcado
tendencias de voto.
7DPELpQDYHFHVSXHGHGDUVHTXH
el investigador seleccione directa o
intencionalmente los individuos de la
SREODFLyQ3RUHMHPSORWRPDUFRPR
muestra los individuos a los que se
tiene fácil acceso, es el caso de los
maestros que utilizan a sus propios
alumnos como muestra.

E %RODGHQLHYHVHORFDOL]DDDOJXQRVLQGLYLGXRVORVFXDOHVFRQGXFHQDRWURV\
pVWRVDRWURV\DVtKDVWDFRQVHJXLUXQDPXHVWUDGHOWDPDxRGHVHDGReVWHWLSR
de muestreo se usa cuando se hacen estudios
es poblaciones marginales
 SRUHMHPSORGHOLQFXHQWHVVHFWDV
determinados tipos de enfermos, etc)

E 0XHVWUHRGLVFUHFLRQDODFULWHULRGHOLQYHVWLJDGRUORVHOHPHQWRVVRQHOHJLGRV
VREUHORTXHpOFUHHSXHGHQDSRUWDUDOHVWXGLR

3ODQGHPXHVWUHR

Se llama plan o programa de muestreo al procedimiento para selección de la muestra con la cual
se va a trabajar.En todo plan de muestreo debe tenerse en cuenta que procedimiento de selección
de muestra se va a utilizar, y los criterios de decisión que se van a aplicar.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 145


(UURUPXHVWUDO
$XQTXHVHXWLOLFHQORVPHMRUHVPpWRGRVGHVHOHFFLyQGHPXHVWUDGHDFXHUGRDODVFDUDFWHUtVWLFDV
de la población que se está estudiando. Nunca puede darse garantía absoluta de que la muestra
VHDXQDUpSOLFDH[iFWDGHODSREDOFLyQDQDOL]DGD/RVHUURUHVVRQLQHYLWDEOHVHQWRGRSURFHVRGH
selección de muestra.Esta diferencia entre población y muestra se denomina error de muestreo o
error muestral.
Lo importante es que se pueda determinar el orden o margen de los errores y su frecuencia dentro
de un conjunto de datos , debido a que esto nos permitira establecer el intervalo de confianza
adentro del cual vamos a trabajar.
3RGHPRVGLVWLQJXLUGRVWLSRVGHHUURUHV
I. Sistemáticos
,, 3RUD]DURDFFLGHQWDOHV

Los errores sistemáticos provienen de causas ajenas a la muestra misma, producen distorsiones o
sesgos en la muestra que hace que los resultados obtenidos varíen en una dirección
SDUWLFXODU$OJXQRV HMHPSORV GH pVWRV WLSRV GH HUURUHV SXHGHQ VHU HUURUHV SRU VXVWLWXLU
inadecuadamente un elemento por otro que es el primero que tiene a su alcance. Otro ejemplo
VHUtD HUURUHV SRU RPLVLyQ SRU WHQHU LQVXILFLHQWHV GDWRV REWHQLGRV  VREUH WRGR VH GD pVWH FDVR
cuando hay muchas “no respuestas” dentro de la información muestreada; se da por ejemplo en
las encuestas que se mandan por internet o por correo y que las personas no responden .
3RU ~OLWPR VHUtD HO FDVR GH HUURUHV GH VHVJRV GH VHOHFWLYLGDG  HV GHFLU HUURUHV SRU QR KDEHU
incluíso elementos dentro de la muestra y que son significativos para la investigación.

Los errores accidentales o por el azar cualquiera sea el tipo de muestreo utilizado , son los
DVRFLDGRV DO LQVWUXPHQWR GH PHGLFLyQ 'HSHQGH GH GRV IDFWRUHV GHO WDPDxR GH OD PXHVWUD D
mayor muestra menor será el error de la muestra) y de la dispersión o desviación típica de la
PXHVWUD DPD\RUGLVSHUVLyQPD\RUVHUiHOHUURU 

,QVWUXPHQWRVGHUHFROHFFLyQGHGDWRV

8Q LQVWUXPHQWR GH UHFROHFFLyQ GH GDWRV HV XQ UHFXUVR TXH
utiliza el investigador para estar más cerca del fenómeno que
es objeto de estudio y extraer de estos infromación.
([LVWHQ  GLIHUHQWHV PDQHUDV GH REWHQHU pVWD LQIRUPDFLyQ  GH
DTXt VH GHULYDQ ODV GLVWLQWDV WpFQLFDV GH UHFROHFFLyQ GH GDWRV
que son mecanismos , medios y sitemas para recolectar,
conservar, reelaborar y trasmitir los datos con los que se va a
WUDEDMDU(VGHFLUTXHODVWpFQLFas están referidas a la manera
cómo se van a obtener los datos y los instrumentos que se van a utilizar para extraer la
información.

(V LPSRUWDQWH SODQWHDUVH TXH pVWDV WpFQLFDV VHDQ YiOLGDV \ FRQILDEHV YiOLGDV SRUTXH PLGHQ
H[DFWDPHQWH OR TXH VH GHVHD PHGLU HILFDFLD  \ FRQILDEOHV FXDQGR VL VH YROYLHVHQ D DSOLFDU VH
obtendrían resultados muy parecidos o similares.
Otro aspecto fundamental es definir el marco teórico y metodológico, para lo cual debe consultarse
la bibliografía y elegir la mejor metodología de forma de que se defina en forma lo más exacta
posible los instrumentos de análisis acorde a los objetivos planteados en la investigación.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.146


Otro aspecto importante es plantearse cómo aplicar estos instrumentos:
 &RQRFHUTXHVHYDDSUHJXQWDUGHODVXQLGDGHVHVWDGtVWLFDV
2. Determinar cuáles son el o los instrumentos más idóneos para encontrar las
respuestas que se buscan.
 &RQRFHUORVLQVWUXPHQWRVFyPRVHDSOLFDQVXVOLPLWDFLRQHVHWF
 5HDOL]DUHQIRUPDSUHYLDXQDHQFXHVWDSLORWRSDUDSRGHUFRUUHJLUFXDOTXLHUIDOOD
 &RQIHFFLRQDU XQD WDEOD R LQVWUXPHQWR TXH QRV SHUPLWD FXDQWLILFDU HQ IRUPD
sencilla la información .

Estudiaremos los siguientes instrumentos de recoleccion de datos: entrevistas, encuestas,


observación.

(QWUHYLVWDV

(VWDVWpFQLFDVVHXVDQSDUDUHFDEDUGDWRVHQIRUPDYHUEDODWUDYpVGHSUHJXQWDVTXHUHDOL]DHO
investigador, es una forma de interacción social, en la cual el investigador se sitúa frente al
entrevistado y le realiza preguntas y a partir de las respuestas
del mismo se obtendrá la información que se necesita. Se
HVWDEOHFH XQ GLiORJR DVLPpWULFR GRQGH XQD GH ODV SDUWHV EXVFD
recoger información y la otra parte es la fuente de esa
información. Éste puede entrevistar en forma individual o bien en
grupos. De todas formas siempre es un intercambio de
información que se realiza cara a cara, es decir es un canal de
comunicación directo entre el investigador y la unidad
HVWDGtVWLFD 3HUR MXVWDPHQWH HV pVWD LQWHUDFFLyQ GLUHFWD OD TXH
PXFKDVYHFHVKDFHTXHQRVHDpVWDODIRUPDGHUHFROHFWDUGDWRV
más objetiva.
El entrevistado debe ser siempre una persona que tiene conocimiento sobre el tema que se está
investigando.
El entrevistador es quien dirige la entrevista, domina el diálogo, hace las preguntas adecuadas y
cierra la entrevista.
3DUDFRPHQ]DUHOSURFHVRGHHQWUHYLVWDOHSHUVRQDTXHYDDUHDOL]DUODPLVPDGHEHUiSUHSDUDUOD
entrevista teniendo en cuenta los siguientes aspectos:
I. Definir en forma detallada características del entrevistado
,, 3UHSDUDUODVSUHJXQWDVTXHYDDSODQWHDU
III. Determinar un límite de tiempo y preparar la agenda para la entrevista
IV. Seleccionar y preparar un lugar donde realizar la entrevista en forma cómoda ,
evitando interferencias del exterior
V. Hacer la cita con cada unidad de relevamiento, con la debida anticipación.

En el momento de realizar la entrevista, para llevar adelante la misma deberán tenerse en cuenta
los siguientes puntos:
I. Explicar al entrevistado el propósito y alcance de la misma.
II. Hacer preguntas específicas de forma tal que las respuestas obtenidas puedan
ser fácilmente cuantificadas. Evitando dentro de lo posible las subjetividades, el cuchicheo
y no emitir juicios de valor.
III. Conservar siempre el control de la entrevista, evitando comentarios al margen
del tema principal.
IV. Escuchar atentamente lo que se responde, sin anticiparse a las respuestas.

En forma simultánea y aunque filme o grave la encuesta deberá:


I. Escribir las respuestas de la entrevista

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 147


,, (QWUHJDU XQD FRSLD HO HQWUHYLVWDGR  VROLFLWDQGR VL IXHVH SRVLEOH  VX
confirmación, corrección a agregado de datos que pusieron haberse omitido
III. Archivar los resultados de la entrevista para un posterior procesamiento y
análisis.

(QHOPRPHQWRGHUHDOL]DUODLQIRUPDFLyQHOHQWUHYLVWDGRUGHEHUiWHQHUSUHVHQWHTXHpVWDHVXQD
IRUPDGHFRQYHUVDFLyQQRGHLQWHUURJDFLyQVLHQGRpVWDODPDQHUDPiVDGHFXDGDSDUDUHFROHFWDU
datos cualitativos.
La estructura de la entrevista varía, si por ejemplo el objetivo de a entrevista es adquirir
información general la entrevista será una serie de preguntas sin estructura y con respuestas
libres. En cambio si es necesario indagar sobre diferentes aspectos es conveniente realizar
preguntas más estandarizadas, donde haya preguntas abiertas y cerradas .Las preguntas para
respuestas abierta permiten a los entrevistados dar cualquier respuesta que parezca apropiado.
3XHGHQ FRQWHVWDU SRU FRPSOHWR FRQ VXV SURSLDV SDODEUDV &RQ ODV SUHJXQWDV SDUD UHVSXHVWD
cerradas se proporcionan al usuario un conjunto de respuesta que se pueda seleccionar.
La entrevista no estructurada no requiere menos tiempos de preparación, porque no necesita tener
SRU DQWLFLSDGR ODV SDODEUDV SUHFLVDV GH ODV SUHJXQWDV $QDOL]DU ODV UHVSXHVWDV GHVSXpV GH OD
entrevista lleva más tiempo que con la entrevista estructuradas. El mayor costo radica en la
preparación, administración y análisis de las entrevistas estructuradas para preguntas cerradas.
La habilidad del entrevistador es IXQGDPHQWDO SDUD HO p[LWR GH OD HQWUHYLVWD /D EXHQD HQWUHYLVWD
depende del conocimiento del analista tanto de la preparación del objetivo de una entrevista
específica como de las preguntas por realizar a una persona determinada.
El tacto, la imparcialidad e incluso la vestimenta apropiada ayudan a asegurar una entrevista
H[LWRVD/DIDOWDGHHVWRVIDFWRUHVSXHGHUHGXFLUFXDOTXLHURSRUWXQLGDGGHp[LWR

$OJXQDVYHQWDMDV\GHVYHQWDMDVGHpVWDWpFQLFDGHUHFROHFFLyQGHGDWRVVRQ

9(17$-$6 '(69(17$-$6
x Asegura elaborar en forma uniforme de x 7LHQHXQDOWRFRVWRGHSUHSDUDFLyQ
las preguntas para todos los que van a x Lo que responde no puede tener un alto
responder. nivel de estructura y carácter mecánico de
x Es fácil de administrar y evaluar las preguntas.
x 7LHQHXQDHYDOXDFLyQPiVREMHWLYDWDQWR x Si las preguntas tienen un alto nivel de
del entrevistador como del entrevistado estructura se reducen las respuestas
x Se necesita un limitado entrenamiento espontáneas.
del entrevistador. x Los entrevistadores pueden introducir
x Hay mayor flexibilidad al realizar las sus sesgos en la pregunta o en el
preguntas adecuadas a quien responde momento de informar los resultados de las
x El entrevistador puede explotar áreas respuestas
que surjan en forma espontánea durante la x El análisis y la interpretación pueden
entrevista. ser muy largos y difícilmente cuantificables
x 3XHGHSURGXFLULQIRUPDFLyQGHiUHDV x El proceso lleva más tiempo que otros
que minimizó en el momento de planificar PpWRGRVGHUHFROHFFLyQGHGDWRV
la entrevista.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.148


(QFXHVWDV

Son conjuntos de preguntas normalizadas que se dirigen a un


FRQMXQWRV GH LQGLYLGXRV PXHVWUD UHSUHVHQWDWLYD  GH XQD SREODFLyQ
bajo estudio, a fin de conocer una serie de características
específicas.Es tal vez el instrumemento más utilizado por los
investigadores sociales cuando se quiere lograr representatividad y
mayor exactitud en la información; partiendo directamente de
consideraciones individuales y no estructurales, para acceder a la
conclusión sobre la existencia de regularidades de estructuras
sociales y sobre los sujetos insertos en ellas. La información se
recoge en forma estructurada y se realizan las mismas preguntas y
en el mismo orden a cada uno de los entrevistados .

Etapas básicas en el desarrollo de una encuesta:


x 7HQHU ORV REMHWLYRV TXH VH GHVHD DOFDQ]DU PX\ FODURV  SDUD HOOR HV
IXQGDPHQWDOUHYLVDUELEOLRJUDItDTXHWUDWHpVWRVWHPDV
x Decidir el tipo de encuesta que se va a utilizar, para ello debemos definir y
describir cual es la población bajo estudio, la unidad estadística , el tamaño de la muestra
\ GHWHUPLQDU D WUDYHV GH DOJXQ PpWRGR GH PXHVWUHR ORV HOHPHQWRV TXH YDPRV D
encuestar.
x Diseñar el cuestionario de forma que las preguntas se adecuen al objetivo
propuesto, siendo para ello muy útil hacer un estudio previo sobre las características de la
pobalción que se está estudiando.

7LSRVGHHQFXHVWDVVHJ~QHOWLSRGHPHGLRTXHVHXVDSDUDUHDOL]DUODHQFXHVWD
, (QFXHVWD FDUD D FDUD FRQVLWH HQ HQWUHYLVWDV GLUHFWDV \ SHUVRQDOHV DO
encuestado).
,, (QFXHVWDVWHOHIyQLFDV VRQHQWUHYLVWDVYtDWHOHIyQLFDFRQFDGDHQFXHVWDGR 
,,, (QFXHVWDVSRUFRUUHR VHHQYtDQFXHVWLRQDULRVDORVSRWHQFLDOHVHQFXHVWDGRV
se les pide que lo rellenen y lo devuelvan completados).
,9 (QFXHVWDVSRU,QWHUQHW RHQFXHVWDVRQOLQH  FRQVLVWHHQXQFXHVWLRQDULRHQXQD
página web o bien crear una encuesta online y enviarla a los correos electrónicos).

7LSRVGHHQFXHVWDVVHJ~QVXVREMHWLYRV
I. Encuestas descriptivas: buscan reflejar actitudes o condiciones presentes , es
decir describir en que situación se encuentra determinada pobalción en el momento en
que se realiza la encuesta.
II. Encuesta analítica: su objetivo es describir, explicar los porque de determinada
situación. En general se toman como base de análisis mas de dos variables, de las que se
REVHUYDWDPELpQVLHVWDQLQWHUUHODFLRQDGDV\TXHLQIHUHQFLDVSXHGHQKDFHUVH

7LSRVGHHQFXHVWDVVHJ~QODFODVHGHSUHJXQWDV
I. De respuesta abierta: en ellas se les pide al interrogado que responda el mismo
a las preguntas formuladas, Esto da mas libertad al entrevistado y al mismo tiempo
permite que de respuestas mas profundas.
,, 'H UHVSXHVWD FHUUDGD HQ pVWD ORV HQFXHVWDGRV GHEHQ HOHJLU SDUD UHVSRQGHU
alguna de las opciones que se presentan en un listado dado de antemano. Esta forma
de encuestar da como resultado respuestas más fáciles de cuantificar y de carácter
PiVXQLIRUPH(OSUREOHPDTXHSXHGHQSUHVHQWDUHVTXHHQODVRSFLRQHVQRHVWpHO
listado de respuestas que el encuestado desea , esto puede salvarse agragando como
última opcion :”otros”.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 149


7LSRVGHHQFXHVWDVVHJ~QORVPHGLRVGHFDSWXUD
I. Encuestas realizadas en papel: por lo general se usa en encuestas que van a
ser realizadas en sitios muy alejados donde no existe señal de Internet, o dodne la misma
no es estable o bien cuando por las características de la investigación se requiere un
registro físico de las respuestas obtenidas.El papel sigue siendo el medio más utilizado a
pesar de los avances tecnológicos por su bajo costo , versatilidad y seguridad . La taza de
recahzos de una encuesta en papel es muy baja .

II. Encuestas telefónicas: se emplean cuando el cuestionario a aplicar no es muy


ODUJR SRU OR JHQHUDO QR PDV GH  SUHJXQWDV < VL VH GHVHDQUHVXOWDGRV LQPHGLDWRV /D
tasa de rechazo es realtivamente baja pero depende en gran medida de que el
encuestador logra persuadir al encuestado y mantenga su atención.

III. Encuestas por la Web: se usan en encuestas autoadministradas,es decir donde


QR VH QHFHVLWD DO HQFXHVWDGRU 7LHQHQ XQD PX\ EDMD WD]D GH UHVSXHVWDV SRUTXH QR VH
PRWLYD D UHVSRQGHU DO HQFXHVWDGRU  8QD YDULDQWH HV OD (QFXHVWD HQYLDGD SRU FRUUHR
electrónico.

IV. Encuesta por dispositivos móviles: permiten su aplicación con encuestador ,


JUDEDQGRORVGDWRVGLUHFWDPHQWHHQDOJ~QGLVSRVLWLYRWLSRWLSRWHOpIRQRFHOXODURWDEOHWFRQ
conexión o sin conexión a Internet. El principal problema es el costo del dispositivo y la
taza de rechazo que en general es alta.


Tiposdepreguntasdelcuestionariodeunaencuesta
Existen diversos tipos de preguntas para elaborar el cuestionario, las principales son las
siguientes:
, 3UHJXQWDV LQWURGXFWRULDV VRQ DTXHOODV TXH WLHQHQ OD ILQDOLGDG GH DWUDHU OD DWHQFLyQ GHO
interrogado, disponiendo favorablemente hacia la entrevista. Son preguntas agradables y
VXJHVWLYDV (MHPSOR¢/H JXVWDUtD WHQHU HO FXHUSR GH 6KDNLUD" ,QWHQWH FRQWHVWDU HO
cuestionario y le diremos como lograrlo.

,, 3UHJXQWDV DELHUWDV (V FXDQGR HO HQWUHYLVWDGR SXHGH UHVSRQGHU GH PDQHUD HVSRQWiQHD
VHJ~QFUHDFRQYHQLHQWH(MHPSOR¢4XpDFWLYLGDGHVWLHQHVHOGtDGHPDxDQD"

,,, 3UHJXQWDVFHUUDGDV6RQDTXHOODVFX\DVUHVSXHVWDVVHOLPLWDQDODVTXHHVWiQFRQWHQLGDV
en el texto de la misma pregunta.
Ejemplo: ¿Dormiste bien? Subraya: Sí No Regular

,9 3UHJXQWDVGHUHVSXHVWDP~OWLSOH6RQDTXHOODVFX\DVSRVLEOHVUHVSXHVWDVVHHQFXHQWUDQ
contenidas casi totalmente las opciones que se dan pero dejan la posibilidad abierta por
si ninguna de ellas le satisface agregar una nueva opción.
(MHPSOR¢4XpJXVWDVFRPHUHQODVPDxDQDV"
Escoge: fruta____ yogurth____ leche_________ otros. ¿Cuáles?__________________

9 3UHJXQWD ILOWUR VRQ ODV TXH VH FDUDFWHUL]DQ SRUTXH ODV UHVSXHVWDV REWHQLGDV SHUPLWHQ
establecer una selección cualitativa o una clasificación de las personas interrogadas.
(MHPSOR¢4XpDFRVWXPEUDVFRPHUORVILQHVGHVHPDQD"6HxDOD
Arroz ____ fiambre_____ chocolate_____ Helado_________
IUXWDBBBBBBYHUGXUDBBBBBB$VDGRBBBBBBBBBB3L]]DBBBBBBBBBB

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.150


Otras. ¿Cuáles?_____________________________

VI. Preguntas de batería. Constituyen una serie de preguntas encadenadas que se


complementan entre sí.
Ejemplo: ¿Usted fuma?______, en caso afirmativo ¿Qué cigarros fuma?____________

VII. Preguntas de evaluación. Se pide al entrevistado que exprese un juicio de valor respecto a
un determinado tema que se somete a su consideración.
Ejemplo: ¿Cómo considera que estuvo la película?
___Buena ___ Regular ___Deplorable

VIII. Preguntas de control. Tienen la finalidad de evaluar la exactitud y coherencia de las


respuestas obtenidas. Como por ejemplo hacer dos preguntas en diferente orden del
cuestionario, dichas de distinta manera pero que signifiquen lo mismo para ver si la
persona no se contradice
Ejemplo: ¿Se alimenta de comida chatarra?_____________________________
Más adelante: ¿Consume alimentos nutritivos?___________________

IX. Preguntas ponderativas son aquellas que dan a escoger las posibles respuestas en orden
progresivo de calificación.
Ejemplo: Del uno al cinco, anota tu canción favorita:
____Amor eterno ___Nunca te olvidaré _____Hoy tengo ganas de ti
______Gavilán o paloma ______La nave del olvido

Dentro de las encuestas pueden distinguirse los censos en los que se analiza a todos los
individuos de la pobalción bajo estudio, por supuesto, de mayor alcance y extensión.
Si por cuestiones de costo (de tiempo o presupuesto) se opta por encuestar a una muestra
representativa de la población se debe elegir de antemano utilizando alguna de las técnicas de
selección de muestras. Una forma reducida de una encuesta por muestreo es un "sondeo de
opinión", esta forma de encuesta es muy parecida a un muestreo, pero se caracteriza porque la
muestra de la población elegida no es suficiente para que los resultados puedan aportar un
informe confiable. Se utiliza solo para recolectar algunos datos sobre lo que piensa un número de
individuos de un determinado grupo sobre un determinado tema.
Un tipo particular de encuesta, que tiene por objetivo preparar la verdadera encuesta es la
“encuesta piloto”. Se busca tener unos pocos criterios para diseñar o rediseñar las herramientas
de trabajo, teniendo una idea previa de la población. Esta exploración es útil porque esta libre de
conclusiones sobre el tema de estudio y sirve solo para mejorar la investigación; incluso
restablecer un diagrama de flujo u otro tipo de planificación.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 151


Algunas ventajas y desventajas de ésta técnica de recolección de datos son:

VENTAJAS DESVENTAJAS
x Bajo costo x El planteamiento y ejecución de la
x Información más exacta y de mejor investigación suele ser más complejo
calidad x Requiere diseño de profesionales que
x Es posible introducir métodos científicos tengan buenos conocimientos de teoría y
objetivos de medición para corregir errores sean hábiles en su aplicación.
x Tiene resultados con mayor rapidez x Tiene mayor riesgo de sesgo muestral.
x Los datos son más fáciles de procesar
x Es una de las técnicas más utilizadas y
que permite obtener información de
cualquier tipo de información
x Permite obtener información sobre
hechos pasados de los encuestados
x Permite estandarizar los datos
x Es relativamente más barata

Las observaciones:

Esta técnica consite en observar a las personas cuando efectúan


determinada actividad que interesa analizar. La tarea de observar no es
solo una percepción pasiva de los hechos o situaciones . Sino que se trata
de una percepción “activa”lo que implica seleccionar, organizar y
realcionar los datos obtenidos en referencia a los objetivos planteados en
la investigación. No todo lo que aparece ante el campo del observador
tiene importancia y, si la tiene, no siempre en el mismo grado; no todos los
datos se refieren a las mismas variables o indicadores, y es precio estar
alerta para discriminar adecuadamente frente a todo este conjunto posible
de informaciones.
Esta técnica es muy utilizada por sociologos con el fin de estudiar a las
personas en actividades sobre todo de tipo grupal. Y le permitirá observar: que está haciendo,
como lo hace, quein , de que forma , en cuanto tiempo, donde y porque , entre otros interrogantes.
El investigador puede observar de tres maneras básicas:
x Observar a una persona o actitud sin que el observado se dé cuenta y su
interacción por aparte del propio analista.
x Observar una actividad sin intervenir para nada, pero estando la persona
observada enteramente consciente de la observación.
x Por último, puede observar y a la vez estar en contacto con las personas
observas. La interacción puede consistir simplemente en preguntar respecto a una
tarea específica, pedir una explicación, etc

Sea cual se a la forma en que lleva adelante la observación deberá prepararse para esto ,
tenidendo en cuenta los siguientes aspectos:
1. Determinar y definir aquello que va a observar. .
2. Definir el tiempo necesario de observación
3. Obtener la autorización necesarias para llevar a cabo la observación.
4. Explicar a las personas que van a ser observadas lo que se va a hacer y las
razon para ello.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.152


Durante el desarrollo de la observación es fundamental que el observador tenga presente que
deberá:
1. Familiarizarse con los componentes físicos del área inmediata de observación.
2. Mientras se observa, medir el tiempo en forma periódica.
3. Anotar lo que se observa lo más específicamente posible, evitando las
generalidades y las descripciones vagas.
4. Si se está en contacto con las personas observadas, es necesario abstenerse de
hacer comentarios cualitativos o que impliquen un juicio de valores.
5. Observar las reglas de cortesía y seguridad.

Como se hace una investigación:

El objetivo de ésta última parte de material es


brindarle una guía de los diferentes pasos a seguir
en este desafío de plantearse una investigación,
acorde al método científico.
Para comenzar y con el abjetivo de que vayan
internalizando en la cotidianeidad el proceso de
investigación les propongo el siguiente ejercicio:

Ejercicio 1: Examinen algún incidente de su propia


vida: una actividad, una conversación,un
hecho,etc y resuma en una oración a este hecho.
Suponga desde ya que para ello usted es “un
investigador”.
Para elegir un hecho concreto debió ser muy
selectivo debido a ante la propuesta de ejercicio seguramente se le habrán pasado por su mente
infinidad de cosas y usted debió elegir una de éstas. En otras palabras, seleccionó una muestra a
partir de una población muy grande.
Luego analizó en forma consciente o no un exámen exaustivo del hecho o experiencia elegida, ya
sea desde su perspectiva o la de otros. Es decir que usted recolectó y analizó un conjunto de
datos.
Más tarde resumió el hecho y lo presentó en forma concreta, escrita y breva, es decir redactó su
análisis del mismo.

Completando así este sencillo ejercicio usted demostró las siguientes habilidades: leer, escuchar,
observar, elegir, preguntar, resumir, organizar, escribir y presentar . Se trata de habilidades
desarrolladas por la mayoría de los estudiantes y aplicadas a la vida cotidiana. Pero también son
habilidades que deben estar presentes en toda investigación y que emplean permanentemente los
académicos y otros investigadores.
Los investigadores emplean habilidades cotidianas para la recolección, selección, análisis y
presentación de datos, pero lo hacen de una manera consciente, mesurada y sistemática a fin de
ser rigurosos, críticos y analíticos. La investigación requiere de la profesionalización de las
habilidades cotidianas. Ello exige, asimismo, que el investigador atienda sobre todo a los diversos
valores, opiniones, significados y explicaciones para estar alerta a las parcialidades y distorsiones.
Pero en esencia, las habilidades aplicadas a la investigación siguen siendo habilidades cotidianas,
de modo que su experiencia y conocimiento de estas últimas le proporcionarán una vía rápida
para pensar en el diseño y los métodos de investigación.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 153


¿Investigación cualitativa o cuantitativa?
La investigación cuantitativa consiste en
aquellos estudios cuyos datos pueden
analizarse en términos de números. La
investigación puede ser también cualitativa,
o sea describir científicamente a las
personas, acontecimientos, etc., sin usar o
datos numéricos.O bien como la mayoría de
las investigaciones una combinacion de
éstas dos.
La investigación cuantitativa se basa en los
planes originales y sus datos se analizan e
interpretan con más prontitud. La
investigación cualitativa es más abierta y
sensible al sujeto. Las dos son útiles y
válidas y no se excluyen mutuamente. Es
posible usar ambos métodos en una misma
investigación. (Best y Kahn, 1989, pp. 89-
90) .
La investigación cuantitativa, como la expresión lo sugiere, incumbe a la recolección y al análisis
de datos en forma numérica. Tiende a poner el énfasis en los conjuntos de datos relativamente
representativos y en gran escala, y a menudo -a nuestro juicio, erróneamente- se la presenta o
percibe como la simple reunión de los "hechos". La investigación cualitativa, por otro lado, se
ocupa de recolectar y analizar la información en todas las formas posibles, exceptuando la
numérica. Tiende a centrarse en la exploración de un limitado pero detallado número de casos o
ejemplos que se consideran interesantes o esclarecedores, y su meta es lograr "profundidad" y no
"amplitud".
En los últimos años, los méritos relativos de las estrategias cualitativa y cuantitativa fueron el
origen de una vasta polémica en las ciencias sociales. Las posturas asumidas por los
investigadores varían considerablemente. Hay quienes piensan que ambas estrategias son
diametralmente opuestas y se basan en dos visiones del mundo alternativas, y hay quienes gustan
mezclar ambas estrategias en sus proyectos. Dado que las estrategias cuantitativas se consideran
más científicas y "objetivas", los investigadores cualitativos se han visto en la necesidad de
defender denodadamente su postura . La investigación cualitativa se ha vuelto cada vez más
popular en las últimas dos décadas. El permanente debate acerca de sus méritos relativos no es,
en el fondo y desde una perspectiva más general, sino el debate sobre el estatuto y las relaciones
de poder de los distintos tipos de investigación.

¿Hasta qué punto difieren las formas cuantitativa y cualitativa de investigación? A primera vista, la
técnica de investigación basada en el uso de cuestionarios puede considerarse una estrategia
cuantitativa, en tanto cabría decir que las entrevistas y las observaciones son técnicas cualitativas.
En la práctica, sin embargo, las cosas no son tan sencillas. Las entrevistas pueden estructurarse y
analizarse de forma cuantitativa: por ejemplo, cuando se recolectan datos numéricos o cuando las
respuestas no numéricas se clasifican en categorías y se codifican de forma numérica.
Análogamente, las encuestas permiten a menudo respuestas de final abierto e inducen a estudiar
investigación-acción implique, generalmente, algún trabajo de campo. Asimismo, cabe usar los
documentos, entrevistas, observaciones y cuestionarios como parte de todas las estrategias y
enfoques de investigación identificados, aunque el modo de aplicarlos y analizarlos varíe. En otras
palabras, las familias, enfoques y técnicas representan las dimensiones del proceso de
investigación. El investigador puede combinar estas dimensiones de distinta forma con el propósito
de estudiar más adecuadamente un conjunto específico de cuestiones. Es posible escoger
enfoques o técnicas concretos y concentrarse en el trabajo de gabinete o de campo, o bien en una
estrategia cualitativa o cuantitativa; o también combinar o variar el tratamiento. Todo depende de

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.154


las preferencias, los recursos disponibles, las restricciones que pesan sobre el investigador y los
problemas concretos que desea investigar.

La investigación-acción
La investigación-acción constituye una forma de
indagación autorreflexiva desarrollada por investigadores
que participan en situaciones sociales incluídos temas
referidos a la educación, que tiene por objeto mejorar la
racionalidad en sus propias prácticas pedagógicas ,
comprender mejor éstas prácticas y las situaciones en
las que las mismas se llevan a cabo.
La investigación-acción es un estudio de a situación
social con el objetivo de mejorar la calidad de las
acciones que se llevan a adelante dentro de éste
contexto. En ésta práctica las teorías no se validan en
forma independiente y luego se aplican a las situaciones
prácticas sino que son validadas por la práctica misma.
La investigación-acción se ha convertido en un enfoque cada vez más popular entre los
investigadores en pequeña escala pertenecientes a las ciencias sociales, particularmente para
aquellos que trabajan en áreas como la educación, la salud y la asistencia social. Se adapta muy
bien a las necesidades de los que conducen la investigación en sus lugares de trabajo y que se
interesan además por mejorar aspectos de su propia práctica y la de sus colegas.

Los caracteres más importantes de la investigación-acción son:


x Es educativa
x Se ocupa de los individuos como miembros de un grupo social
x Se centra en el problema
x Implica una intervención con objetivo fundamental de cambiar algo
x Es orientada a mejorar la participación
x Los que investigan partician activamente en el proceso de cambio

Pasos a seguir para el planteo de una investigación:

1) Planteo del problema: Toda investigación parte de una situación problemática


,es por ello fundamental plantear el problema de investigación . Entendemos por “problema” a
cualquier situación actual en nuestro caso de indole social (educativa), que difiera en cierta
medida de la situación ideal, es decir que a nuestro entender haya elementos factibles de ser
mejorados.
Para los investigadores de las ciencias sociales una situación puede ser llamada problema cuando
es posible determinar las características relevantes de una dificultad para la que no existe medios
conocidos de solución, ésto puede darse por ejemlo en los siguientes casos:
x Cuando no hay ninguna información sobre aspectos particulares de la dificultad
que se plantea en el problema.
x Cuando existe información y aparentemente es completa pero no está
verificada, y por lo tanto es necesario realizar una investigación conceptual o empírica.
Algunas características deseables de un problema de investigación para ques ea “investigable” y
no incurrir en gastos, tiempo y esfuerzo innecesarios, son:
x Factibilidad: es decir que debe ser susceptible de estudiarse teniendo en
cuenta los recursos con los cuales contamos como por ejemplo; tiempo, acceso a la
información, grado de dificultad,financiación.
x Resoluble: es decir que su naturaleza deba permitr llegar a una solución

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 155


x Real,novedad y originalidad: es decir que debe existir independecia de
concimiento, buscando en forma permanente nuevos conocimientos y evitar que se
repitan los temas objeto de investigación.
x Importancia: es decir que el problema planteado debe ser actual y aplicable a
una situación concreta, y que aporte algo a un área de concimiento.
x Interés: es decir que el problema debe presentar un reto para el investigador.
x Precisión: ser lo más concreto y específico que sea posible.
x Relevante: ser importante es decir tener un valor significativo en el planteo de
la situación que se está investigando.
x Delimitado: es decir se deberá saber hasta donde se extenderán sus
conclusiones y los factores de análisis que se tomarán en cuenta y cuales no.
Algunas fuentes de problemas podrán ser (solo a título enumerativo): la experiencia derivada de
la realidad educativa, los espacios vacíos del conocimiento, los resultados contradictorios de otras
investigaciones anteriores, la incoherencia entre la teoría y la práctica, etc.

2) Elaborar un guión: Armar una guía buscando material bibliográfico que sirvan de orientación
para no perderse en el “mundo de la información” alejándose del problema que se está
analizando.
Para ésto deben analizarse los antecendente en el tema , y en cada material analizado observar:
¿quién o quiénes han escrito sobre él en particular?, ¿cómo lo han hecho? y ¿hasta dónde han
llegado?. Este concimento nos permitirá estructurar más formalmente la investigación, y si hay
más de una persepectiva o enforque del tema podremos seleccionar cuál es el enfoque con el que
vamos a trabajar y el por qué de ésta elección.

3) Buscar información documental , identificando fuentes documentales que se pueden encontrar 


bibliotecas, Internet, hemerotecas, centros de información, u otros eventos como coloquios,
congresos, talleres, seminarios, etc.

4) Seleccionar el material :una vez que buscamos el material deberemos analizarlo para lo 
cual es importante: ver si es acorde al tema , cual es su lenguaje , si tiene referencias
bibliográficas y clasificarlo adecuadamente . Para ésta clasificación es importante tener en cuanta:
nombre del autor, título del documento, editorial, número de edición, año y/o número de revista
(ordenándola alfabéticamente y dándole una numera- ción secuencial para su clasificación), una
para libros y otra para revistas

5) Lectura y análisis de documentos: se deberá realizar una lectura analítica del material
documental que se a reunido. Teniendo siempre presente los objetivos planteados en la
investigación. Pudiéndose elaborar fichas bibliográficas da cada libro analizado, pequeñas
síntesis o bien de referencias bibliográ¿cas con notas al pie de página.

6) Elaboración del “Estado del Arte” :una vez realizada la búsqueda, selección y revisión de la
bibliografía al igual que la lectura y análisis de documentos seleccionados podemos describir:
¿quiénes han escrito sobre el tema?;¿cómo lo hicieron?;¿ hasta dónde llegaron?;¿ cuáles serían
las posibles teorías que sustentarán la investigación (en caso de ser necesario)?, y sobre todo
qué falta por investigar, a esto se le llama, Estado del Arte. Esto es indispensable hacerlo en
cualquier investigación, porque de aquí se deriva, también,el marco de referencia, el teórico o
conceptual,.

7) Formulación de hipótesis: éste paso consiste en establecer la respuesta tentativa al problema


y las relaciones causales entre el fenómeno y sus partes con la consecuente operatividad de las
variables. La hipótesis puede ser desarrollada desde distintos puntos de vista, puede estar
basada en un supuesto ; en el resultado de otros estudios, en la posibilidad de una relación
semejante entre dos o más variables representadas en un estudio, o puede estar basada en una
teoría mediante la cual una suposición de proceso deductivo, nos lleva a la pretensión de que si se

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.156


dan ciertas condiciones se puedan obtener ciertos resultados, es decir, la relación causa-efecto.
La hipótesis nos sirve de guía para la obtención de datos en función del interrogante presentado
en el problema, o también para indicar la forma de cómo deben ser organizados según el tipo de
estudio. Asimismo, se podría decir que la hipótesis es una proposición que nos permite establecer
relaciones entre hechos. Su valor reside en la capacidad para establecer unas relaciones entre
los hechos y explicar por qué se producen.

8) Diseño de comprobación de hipótesis: para el diseño de comprobación de hipótesis debemos


de tomar en cuenta las siguientes características:
x Deben plantearse conceptual y operativamente de una manera clara y precisa, con el ¿n
de que cualquier investigador que desee comprobarla esté en posibilidades de hacerlo. El
planteamiento conceptual se re¿ere a que los términos sean aceptables y comunicables,
mientras que la operacionalidad se re¿ere a que sean susceptibles de medirse.
x Deben ser específicas, incluir todas las operaciones y predicciones indicadas en ellas, de
tal manera que no sólo se especifiquen con claridad los conceptos sino que también se
describan todos los índices que puedan utilizarse para medir las variables.
x Deben también referirse a situaciones empíricas u objetivas. Es decir, el estudio científico
implica la investigación de fenómenos en el mundo real sin hacer referencia a juicios de
valor. En otras palabras, la hipótesis debe referirse a variables objetivas en las que no
aparezcan juicios de valor, tales como “malo”, “mejor”, etc. una hipótesis como, “la
educación es mala” difícilmente se puede comprobar.
x Las hipótesis deben fundamentarse en un cuerpo teórico. Para que la hipótesis tenga un
carácter cientí¿co, debe construirse sobre un grupo de teorías que pueden respaldarla. Es
decir, para fundamentarla es necesario examinar toda la literatura e información que se
tenga rela- cionada con ésta, obteniendo de las fuentes de información todas las
proposiciones que estén relacionadas entre sí, con¿rmando que de este cuerpo teórico se
pueda deducir y comprobar la hipótesis, comparándola con la de autores más reconocidos
en la materia.Deben estar de acuerdo con las técnicas y recursos disponibles. El
investigador debe saber de qué técnicas dispone para someter su hipótesis a prueba. Por
esto es necesario recopilar información acerca de las distintas técnicas que se han utilizado
para medir las variables del estudio que se intente realizar. El no encontrar técnicas para
veri¿car la investigación puede ser in- dicio de que la hipótesis sea demasiado ambigua o
general. Por otra parte, al plantear una hipótesis siempre es necesario tener en mente los
recursos (¿nancieros y humanos) con que se cuenta para su comprobación debiendo
reunir las características de operatividad, ¿dedignidad y validez.

9) Elaboración del proyecto de el protocolo. En este paso, es posible que el guión


original haya cambiado, es decir, aquella idea que se tenía vaga en un principio, conforme se van
realizando los pasos a seguir, permite tener un panorama más exacto de lo que se desea
investigar y es cuando ya se está listo para hacer el proyecto de investigación y/o protocolo, que
consta de lo siguiente:
x Tema a investigar o título de la investigación.
x Objetivos.
x Planteamiento del problema: incluye la selección; la delimitación; la justi¿cación y
el impacto social.
x Marco teórico o de referencia.
x Formulación de hipótesis.
x Estrategia metodológica a seguir.
x Metas y calendario de actividades (que incluye recursos).
x Resultados esperados.
x Bibliografía.
x Anexos

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 157


10) Redacción del trabajo: en ésta etapa se mani¿esta el resultado del esfuerzo anterior. En
efecto, una idea o una conclusión podría parecer su¿cientemente clara cuando se tiene en la
mente, pero en el momento que se intenta una redacción apropiada, se pone en evidencia
cualquier oscuridad o falta de precisión con respecto a dicha idea o conclusión. Por lo tanto, hacer
el esfuerzo de la redacción implica volver a revisar lo ya investigado y al mismo
tiempo lograr la etapa final por la que se puede llegar a presentar el fruto cosechado. Desde
luego, tomar la pluma y escribir las primeras palabras de una investi- gación cuesta mucho
trabajo, por ello se debe tratar de hacerlo en un ambiente agradable en donde el ruido y las
interrupciones queden reducidas al mínimo. También el ánimo interno es otro factor en el trabajo
de redacción, las preocupaciones externas, el temor, la prisa, el cansancio, no son los mejores
acompañantes de la redacción. Asimismo el deseo de tener un párrafo completamente
satisfactorio puede indicarnos el bloqueo de las ideas o por lo menos, a una labor de corrección
tras corrección, que impide continuar la redacción de un segundo pá- rrafo, por lo tanto, vale más
tener un texto por corregir que una página en blanco. Con esto no se quiere decir que se haga la
redacción al “hay se va”, sino que se trate de redactar lo mejor po- sible, esto es con claridad;
orden; exactitud, con propiedad gramatical y sobre todo sin faltas de ortografía.

11) Revisión del escrito. Cuando ya se ha concluido la redacción del trabajo, o una sección
importante de él, es bueno volver a leerlo todo desde el principio, y tratar de descubrir alguna falta,
desde el punto de vista del contenido y de la forma gramatical. Es decir, releer el escrito en voz
alta, de esta manera se detectan con mayor facilidad las repeticiones de la misma palabra, la
ausencia de alguna coma, las faltas de concordancia, etc., pero también detectar alguna falta en el
orden y en la claridad de la exposición. Otra opción muy buena, es que alguien más lo lea
nuevamente y detecte algo no visto. Hay que tener especial cuidado en las citas y notas a pie de
página, el número de la llamada debe corresponder al número de la nota, que las referencias
correspondan a las fuentes indicadas y, además estén redactadas todas con el mismo sistema.
Por último, hay que revisar los títulos y subtítulos. No solamente han de ser congruentes con el
tema tratado, sino que, además deben tener exactamente la misma redacción en el índice. El
cuerpo del trabajo, la bibliografía y los anexos.

12) Diseño de comunicación de resultado. La fase ¿nal del proceso de investigación es la


preparación del informe, en donde se presentan por escrito los resultados de la investigación
indicando la metodología utilizada, los fundamentos teóricos y empíricos de la investigación, así
como las conclusiones y sugerencias. El informe de resultados se redacta con base en el
esquema de investigación y en el material del ¿chero de trabajo rigurosamente ordenado. La
redacción del infor- me implica no sólo la trascripción del material recopilado sino la creación y
acrecentamiento a través de la capacidad intelectual del que investiga, de la información de un
escrito claro y sencillo un buen informe no es resultado de la im- provisación y de la
espontaneidad, sino de un procedimiento arduo y laborioso que implica las siguientes actividades:
revisión y clasi¿cación de la información; revisión del esquema; preparación de cuadros y grá¿cas;
organización del material de trabajo; redaccióny revisión del borrador, entre otros.
La entrega de resultados incluye lo siguiente:
x El título de la investigación, que debe ser lo más claro posible.
x La introducción, prólogo o prefacio, debe explicar el contenido y alcance de la
investigación, de modo que el lector sepa con claridad de qué se trata y encuentre una
motivación para leer el trabajo, descubriendo de entrada lo esencial de lo que se va a decir
después.
x El índice, conviene que sea su¿cientemente analítico para que el lector pueda tener una
visión de conjunto de las cues- tiones tratadas y una ayuda para encontrar los temas que
busca.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.158


x El cuerpo del trabajo, que incluye los capítulos de la investigación, de preferencia hay que
tratar de poner al inicio de cada uno de ellos una pequeña introducción que apoye al lector
a identi¿car rápidamente cuál es su contenido.
x Conclusiones, hay que tratar que éstas sean expresadas en forma clara y convincente.
x Anexos, apéndices y bibliografía, no deben olvidarse. Todo lo anteriormente planteado es
lo que conformó la estrategia de investigación que se siguió en una de mis primeras
investigaciones, y es la estrategia que he continuado utilizando, por lo tanto, es una
experiencia que se desea compartir con los que amablemente lean el trabajo, esperando
sobre todo que sea de utilidad para los que apenas se inician en el campo de la
investigación educativa

Finalizamos aquí el desarrollo tórico de la asignatura. Lo invitamos una vez más, a que realice las
actividades, de modo de poder practicar en profundidad los conceptos que han sido presentados
desde el programa de la asignatura.
Seguramente surgirán preguntas, las que podrá canalizar a través del espacio tutorial.

m6 material

Material Básico
x Desarrollo teórico del módulo, disponible en el apartado contenidos.
x Bologna E. (2011) (Comp). Estadística aplicada a la Psicología y a la
Educación. Córdoba: Editorial Brujas.

Material Complementario
GOVINDEN, Lincoyán, (1985), Introducción a la Estadística, Ed. McGraw Hill.
Interamericana Editores. S.A., Bogotá, Colombia.

JOHNSON, Robert, (2003), Estadística Elemental, Ed. Math Learning, Ed.


Tercera, México DF. KUBY, Patricia.

Ed. McGrawHill, Ed. Segunda, Bogotá, Colombia.

SHAO, Stephen, (1980), Estadística para Economistas y Administradores de


Empresas, Ed. Herrero Hnos, México DF.
SPIEGEL, Murray, (2000), Estadística, Serie de Compendios Schaum, Ed.
McGraw-Hill, México

Artículos Consultados por Internet


x www.estadística.mat.uson.mx/material/elmuestreo.pdf
x http://www.monografias.com/trabajos12/recoldat/recoldat.
shtml#ixzz36cNauhI7
x Matemáticas 1º Bachillerato Sociales. Ramas matemáticas de Álge-
bra, Análisis de funciones, Estadística y probabilidad..http://www.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 159


google.com.ar/url?sa=t&rct=j&q=&esrc=s&frm=1&source=web&
cd=2&ved=0CB8QFjAB&url=http%3A%2F%2Fwww.vadenumeros.
es%2Fsociales%2Fmanejo-tabla-normal.htm&ei=qjC9U4aDJNXLsATIyo
KQBg&usg=AFQjCNHKR4KmoYT5O2jCYkJ9N0kPVhJU_Q&bvm=bv.70
138588,d.cWc
x http://www.monografias.com/trabajos12/recoldat/recoldat.
shtml#ixzz36cMvQgzu

m6 actividades

m6 | actividad 1

Revisión de conceptos de muestreo

Complete en los espacios en blanco: “de que tipo de muestreo se trata”.


Justique brevemente su respuesta:

a) Métodos de muestreo basados en el principio de


probabilidad que nos aseguran que la muestra será
representativa:____________________________
b) Aquél cuya muestra se toma al azar: _______________________________
___
c) Separa a la población por estratos o nive
les:____________________________
d) Tipo de muestreo que no es aconsejable cuando existe
periodicidad en la pobalción de la cual de extraerá la
muestra:_____________________________________
e) En éste tipo de muestreo la unidad elemental es un conjunto de
elementos de la población que tienen características diferentes dentro
de cada uno de éstos grupos:_____________________________
f) En éste tipo de muestreo la unidad elemental es un conjunto de
elementos de la población que tienen características similares dentro de
cada uno de éstos grupos:_____________________________

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.160


m6 | actividad 2

Tipo de preguntas de una encuesta

De los siguientes ejemplos de preguntas evalúe y mencion de que tipo de


pregunta se trata en cada caso. Anótelo en el renglón de puntos disponible.

Abierta - cerrada - ponderativa - evaluativa - de batería -


de respuesta múltiple - filtro - de control - introductoria

a) Cuando toma alcohol se siente:


o pésimo

o mal

o regular

o bien

o muy bien

------------------------------------

b) ¿acostumbra tomar licor en ayunas?


sí ____________ no ____________
-----------------------------------------

c) En caso de ser afirmativo ¿cuántas copas se


toma?____________________

---------------------------------------------

d) ¿Le gustaría estar en forma? Conteste el presente


cuestionario y con el resultado podremos darle los tips más
adecuados:_____________________

e) ¿Qué bebida toma por la manaña?__________________________

--------------------------------

f) ¿Cuál de las siguientes opciones corresponde a lo que usted


generalmente hace por las mañanas al levantarse? (subrraye)

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 161


o Me baño

o Almuerzo

o Veo televisión

o Hago ejercicio

o Otra:_______________

--------------------------------------

m6 | actividad 3

Técnicas de recolección de datos

Marcar la alternativa correcta. Justifique su elección.

El conjunto de técnicas para seleccionar muestras partiendo de una


I.
población bajo estudio se denomina:
a) Población
b) Encuesta
c) Muestro
d) Probabilidad
e) Ninguna es correcta
…………………………………………………………………………………………
……………

Elemento bajo análisis , que puede ser individual o colectivo:


II.
a) Unidad poblacional
b) Unidad estadística
c) Unidad básica
d) Unidad derivada
e) Ninguna es correcta
…………………………………………………………………………………………
……………

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.162


III. La proporción de la muestra en el total de la población que se obtiene
dividiendo el tamaño de la muestra por el tamaño de la pobación , se
denomina:

Fracción de elevación
a)
Coeficiente de elevación
b)
Fracción de muestreo
c)
Coeficiente de muestreo
d)
Ninguna es correcta
e)
…………………………………………………………………………………………
…………….

Número que indica las veces que la muestra está contenida en la


IV.
población. Es la inversa
de la fracción de muestreo, se llama:
a) Fracción de elevación
b) Coeficiente de elevación
c) Fracción de muestreo
d) Coeficiente de muestreo
e) Ninguna es correcta
…………………………………………………………………………………………
…………….

V. Tipo de muestreo en el cual no se tiene certeza de que la muestra


extraída sea representativa ya que no todos los elementos de la
población tienen la misma probabilidad de ser elegidos para formar
parte de la muestra. Se llama:

MAS a)
Sistemático
b)
Estratificado
c)
Conglomerado
d)
Ninguna es correcta
e)
…………………………………………………………………………………………
…………….

Los errores que provienen de causas ajenas a la muestra misma,


VI.
producen distorsiones o sesgos en la muestra que hace que los
resultados obtenidos varíen en una dirección particular:
a) Sistemáticos
b) Accidentales
c) Despreciable
d) Determinístico
e) Ninguna es correcta
…………………………………………………………………………………………
…………….

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 163


VII. Técnica de recolección de datos por lo general verbal, en la que se
aborda al individuo en frente al mismo y se lo interroga para obtener la
información que se está buscando:
a) Cuestionario
b) Entrevista
c) Encuesta
d) Observación directa
e) Ninguna es correcta

…………………………………………………………………………………………
…………….

La técnica de recolección de datos que consite en conjuntos de


VIII.
preguntas normalizadas que se dirigen a un conjuntos de individuos
(muestra representativa) de una población bajo estudio, a fin de
conocer una serie de características específicas, se denomina:
a) Cuestionario
b) Entrevista
c) Encuesta
d) Observación directa
e) Ninguna es correcta
…………………………………………………………………………………………
…………….

IX. Técnica que es muy utilizada por sociólogos con el fin de estudiar
a las personas en actividades sobre todo de tipo grupal que le
permitien ver: que está haciendo, como lo hace, quién , de qué forma
, en cuánto tiempo, dónde y por qué ,etc. Se llama:

Cuestionario
a)
Entrevista
b)
Encuesta
c)
Observación directa
d)
Ninguna es correcta
e)
…………………………………………………………………………………………
…………….

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag.164


m3 glosario

Coeficiente de elevación: indica las veces que la muestra esta contenida en la


población.

Encuestas: técnica de recolección de datos que consiste en un conjunto de


preguntas normalizadas, dirigida a un conjunto de individuos, para indagar a
cerca de características específicas.

Entrevistas: técnica de recolección de datos en forma verbal, a través de


preguntas del investigador, frente al entrevistado.

Error muestral: cuantificación de la diferencia entre población y muestra.


Fracción de muestreo: es el porcentaje que representa la muestra respecto de
la población

Investigación-acción: forma de indagación autorreflexiva que tiene por objeto


mejorar la racionalidad en sus propias prácticas pedagógicas , comprender
mejor éstas prácticas y las situaciones en las que las mismas se llevan a cabo.

Muestra: subconjunto de la población bajo estudio, posee dos características:


ser aleatoria y representativa.

Muestreo: conjunto de técnicas y procedimientos que se realizan para obtener


una muestra.

Muestreo probabilístico: todos los individuos tienen la misma probabilidad de


ser seleccionados para formar parte de una muestra.

Muestreos no probabilísticos: la muestra extraída sea no es representativa


porque todos los elementos de la población no tienen la misma probabilidad de
ser elegidos para formar parte de la muestra.

Observación directa: técnica de recolección de datos que consiste en


observar a las unidades estadísticas cuando efectúan determinada actividad
que se está analizando.

Plan de muestreo: procedimiento para selección de la muestra con la cual se


va a trabajar.
Población: conjunto de todos los elementos bajo estudio.

Unidad estadística: cada uno de los elementos que se está analizando

e valuación

La versión impresa no incluye las actividades obligatorias. Las mismas se


encuentran disponibles directamente en plataforma.

EDUBP | GESTIÓN DE INSTITUCIONES EDUCATIVAS | estadística aplicada a la educación - pag. 165

También podría gustarte