Documentos de Académico
Documentos de Profesional
Documentos de Cultura
«ESTADÍSTICA
APLICADA A LA
EDUCACIÓN »
consecuencia del concepto popular que existe sobre el término y que cada vez está
más extendido debido a la influencia de nuestro entorno, ya que hoy día es casi
imposible que cualquier medio de difusión, periódico, radio, televisión, etc., no nos
empezamos a percibir que la Estadística no solo es algo mas, sino que se convierte
en la única herramienta que, hoy por hoy, permite dar luz y obtener resultados, y
estadística como la ciencia que estudia cómo debe emplearse la información y como
1
CAPÍTULO I
Estado, es decir, "la ciencia del Estado" . Sin embargo, recién a partir del siglo
estadística inferencial.
Por ejemplo, si sobre 60 veces que se mira un dado, sale un dos 10 veces, no se
requiere la estadística para rechazar la hipótesis “el dado está cargado”. Si sale un
Pero, ¿qué ocurre si el número dos sale 20, 25 o 30 veces? En estos casos de
dado cargado.
Otro ejemplo. Si una persona adivina el color (rojo o negro) de las cartas en un
50% de los casos, se puede rechazar la hipótesis “la persona es adivina”. Si, en
cambio, acierta en el 99% de los casos el color de las cartas, se puede aceptar la
científica radica en que la gran mayoría de las investigaciones son ‘casos de duda’.
1. Definición de Estadística :
Kendall y Buckland (citados por Gini V. Glas/ Jullian C. Stanley,1980) Definen
de muestra.
2. Clasificación de la Estadística:
Existen varias formas de clasificar los estudios estadísticos. La más tradicional es
la siguiente:
3
numéricos. Se puede definir la estadística descriptiva como los métodos que
conjunto
conocida.
Puede considerarse la inferencia estadística como los métodos que hacen posible la
conclusiones generales sobre todos aquellos objetos del tipo de los que han sido
básico que refleja su relación con la faceta del mundo exterior que pretende
población sobre la base de una muestra extraída de ella. Muchos de los análisis
aleatorias.”
4
3. TÉRMINOS Y CONCEPTOS BÁSICOS
En primer lugar, muchas veces se confunden los términos “Estadística” con “estadísticas” o
científica.
Los estadísticos, en cambio, son medidas de resumen calculadas sobre los datos
provenientes de una muestra, que en estadística inferencial se utilizan para estimar los
espacio y tiempo.
alumnos de una escuela, empresas, organizaciones, partidos políticos, ciudades, países, etc.
Lo fundamental al definir una población es que sea acorde a los objetivos que nos planteamos
3.2. MUESTRA:
Al recoger datos relativos a las características de una población muchas veces es difícil,
costoso o poco práctico observar todo el grupo, sobre todo cuando se trata de conjuntos
grandes. En ese caso, se relevan los datos sólo para una parte de la población, a la cual se
le llama MUESTRA.
Una muestra tomada con determinados criterios de aleatoriedad (para ello nos servimos de
que construyamos a partir de ella permiten realizar estimaciones sobre lo que sucede con
Existe un margen de incertidumbre sobre las conclusiones que se sacan para la población y
5
partir de la información obtenida en al muestra. En estos casos, la estadística descriptiva
3.3. CENSO:
a todos los habitantes del país sino que se toma una muestra de hogares e integrantes de
En cambio, cuando se realiza un Censo de Población, se entrevista a todas las personas que
se encuentran en el país ese día. Dentro de los temas que releva el Censo de Población se
el cual sirve para estimar la desocupación a nivel de toda la población (por lo cual hay un
margen de error, una incertidumbre sobre en qué medida ese valor es el que corresponde a
la población). En el caso del Censo, el número de desocupados nos indica (salvo errores de
3.4. Parámetro
Es la característica numérica que resume todos los datos de una población completa. Entre
3.5. Estimadores
Es la característica numérica que resume todos los datos de una muestra. Entre ellos
6
Extraído de Bueno, Concepción y Escudero, Tomás: Apuntes de Estadística para
profesores. Curso 2006/2007.Instituto de Ciencias de la Educación. Universidad de
Zaragoza
denominadas variables. Por ejemplo: los estudiantes universitarios son unidades de análisis
nos interesará relevar las características de las unidades de análisis y sacar conclusiones
Para obtener los datos de las unidades de análisis debemos relevar la información. Las
herramientas para relevar la información pueden ser entrevistas (encuestas) pero también
Puede ser una persona, una familia, un animal, una sustancia química, o un objeto como una
3.7. Variable
Hemos visto que nos interesa caracterizar a nuestras unidades de análisis. De ahora en
adelante hablaremos de VARIABLES, como los instrumentos que nos permiten hacer esa
7
Los valores o categorías que adopta una variable constituyen un SISTEMA DE
CATEGORIAS. Este sistema tiene dos propiedades fundamentales: sus categorías deben
en estudio.
Sigamos con el ejemplo del estudio de los hogares de acuerdo a su nivel de ingresos y al
número de miembros del hogar que trabajan. Tenemos dos variables, la primera podemos
llamarla INGRESOS DEL HOGAR, y vamos a construir un sistema de categorías para ella.
Supongamos que relevamos los ingresos de todos los miembros de un hogar. Con esta
información podemos obtener el dato que corresponde a ese hogar. Deberemos hacer lo
mismo con cada uno de los hogares que constituyen nuestra población en estudio.
Obtenidos nuestros datos para todos los hogares, queremos expresar el sistema de
categorías de esta variable. Un sistema de categorías posible podría ser cada uno de los
Para explicitar un sistema de categorías así (que tiene muchos valores posibles), lo mejor
es buscar el valor más bajo y el más alto y expresarlo como: $ 2000,….., $ 70000. Otro
podría ser identificar a los hogares en esta variable en tramos de ingreso. Por ejemplo: $
2000 a $10000, $10001 a $40000, $40001 a 70000. En este caso tendríamos tres
categorías en nuestro sistema y los hogares tendrían como valor o categoría en esta
variable su pertenencia a uno de los tres tramos (nos “olvidamos” de sus valores originales.
Pero nos interesa entender las propiedades del sistema de categorías. Supongamos que
tenemos este segundo sistema. Si hubiéramos armado los tramos de esta manera: $2000-
categoría corresponde un hogar que tiene $10000 como ingreso. ¿En qué categoría lo
coloco? ¿En la primera (2000 a 10000) o en la segunda (10000 a 40000)? A esto nos
referimos con la idea que las categorías deben ser mutuamente excluyentes. Frente al
sistema, no tengo que tener duda de cuál es la categoría que le corresponde a cada unidad.
70000. ¿Cuál es la categoría que le corresponde al hogar que gana $2000? No tengo
ninguna categoría que lo incluya. La idea de exhaustividad implica que mi sistema debe
sistema de categorías está relacionado con la población en estudio: si por ejemplo estamos
estudiando el nivel educativo de un país, nuestro sistema de categorías para esa variable
8
tendría que tener por ejemplo, las siguientes categorías: sin instrucción, Primaria,
Secundaria, Superior.
Sin embargo si estoy estudiando el nivel educativo de una población de menores de 16 años,
alcanza con tener el siguiente sistema: Sin instrucción, Primaria, Secundaria, ya que la
análisis. Por ejemplo puede ser la edad para una persona, el grado de cohesión para una
familia, el nivel de aprendizaje alcanzado para un animal, el peso específico para una
sustancia química, el nivel de ‘salud’ para una dentadura, y el tamaño para una mesa.
Sobre una misma población demográfica pueden definirse varias poblaciones de datos, una
demográfica), puede definirse una población referida a la variable edad (el conjunto de
3.8. Dato
Un DATO, en el contexto de nuestra disciplina es el valor que toma una variable en una
unidad de análisis. Por esta razón se dice que su estructura es “tripartita”: refiere
Los datos son la materia prima con que trabaja la estadística, del mismo modo que la
madera es la materia prima con que trabaja el carpintero. Así como este procesa o
transforma la madera para obtener un producto útil, así también el estadístico procesa o
transforma los datos para obtener información útil. Tanto los datos como la madera no se
inventan: se extraen de la realidad; en todo caso el secreto está en recoger la madera o los
De una manera general, puede definirse técnicamente dato como una categoría asignada a
una variable de una unidad de análisis. Por ejemplo, “Luis tiene 1.70 metros de estatura” es
categoría asignada.
9
Como puede apreciarse, todo dato tienen al menos tres componentes: una unidad de
En la matriz de datos esta estructura tripartita se hace visible, al presentar las unidades
en las filas, las variables en las columnas y el DATO como “cruce” de esos dos “vectores”.
Siguiendo nuestro ejemplo de los hogares, una matriz de datos podría ser:
Que indica que el hogar uno tiene $ 2000 de ingreso y trabajan 2 de sus miembros, en el
hogar 2, el ingreso es $ 70000 y trabajan 4 miembros, etc. La matriz de datos tiene tantas
¿Qué se mide?
«Medir es asignar numerales a las propiedades de los sistemas materiales según las leyes
que presiden esos atributos» (Campbell, 1938);
«Es la atribución de numerales a los objetos o sucesos conforme con leyes o reglas»
(Stevens, 1951).
sobre los elementos u objetos (unidades de estudio) son las variables las que posibilitan la
división en clases. Esto nos abre a la necesidad de conocer la naturaleza de las variables
Comenzaremos con un ejemplo que nos introducirá en la idea de naturaleza distinta de las
variables. Dada una población puede decirse cuáles de los individuos son solteros, casados,
divorciados o cualquiera otra categoría de la variable "estado civil". Pero sobre estos
10
mismos individuos se puede decir cuáles no tienen hijos y cuales sí. Sobre este segundo
atributo de las unidades de registro se puede, además medir cuales no tienen hijos, cuales
tienen un hijo, cuales dos, etc…. Ahora bien, si relevamos la característica “tener o no
tener hijos” es diferente de si relevamos cuantos hijos tiene, a pesar que las
características de interés es la misma. Lo que difiere son las mediciones en los modos en
Los datos se obtienen a través un proceso llamado medición. Desde este punto de vista,
puede definirse medición como el proceso por el cual asignamos una categoría (o un valor) a
una variable, para determinada unidad de análisis. Ejemplo: cuando decimos que Martín es
varón, estamos haciendo una medición, porque estamos asignando una categoría (varón) a
Se pueden hacer mediciones con mayor o menor grado de precisión. Cuanto más precisa sea
la medición, más información nos suministra sobre la variable y, por tanto, sobre la unidad
de análisis. No es lo mismo decir que una persona es alta, a decir que mide 1,83 metros.
y en cada uno de ellos la obtención del dato o resultado de la medición será diferente:
nombres, dándoles una denominación o símbolo, sin que implique ninguna relación de orden,
En la escala nominal los números sólo sirven para distinguir categorías, estos no poseen
propiedades cuantitativas y sirven solamente para identificar las clases. Por lo tanto, los
implicada es la de equivalencia. Esto es, los miembros de cualquier clase deben ser
11
equivalentes en la propiedad medida. La relación de equivalencia es reflexiva (x = x para
Los símbolos que designan a los diferentes grupos en una escala nominal pueden
estadísticas de tipo descriptivo admisibles son aquellas que no se alteran por este proceso:
analíticos acerca de la distribución de las categorías, así como la posible relación entre dos
o más características clasificadas mediante este tipo de escala que llamaremos “variables
cualitativas”.
Otros ejemplos:
Para las mismas personas también se pueden medir propiedades donde la clasificación debe
seguir un orden jerárquico. Se trata de la escala ordinal. Con ella se establecen posiciones
Suponga que a los clientes en un negocio se les hace unas preguntas para
valorar la calidad del servicio. Los clientes valoran la calidad de acuerdo a las
siguientes respuestas: 1 (Muy satisfecho), 2 (satisfecho), 3 (Insatisfecho), 4
(Muy insatisfecho). Estos datos son ordinales. Note que una valoración de 1 no
indica que el servicio es dos veces mejor que cuando se da una valoración de
2. Sin embargo podemos decir que la valoración de 1 es preferiblemente
mejor que 2, y así en los demás casos.
12
Puede suceder que los objetos de una categoría de las escala no sean precisamente
diferentes a los objetos de otra categoría de la escala, sino que están relacionados entre
sí, guardan una relación de jerarquía. Los numerales empleados en las escalas ordinales no
Las relaciones entre los elementos en clasificación, pueden formularse con el signo >, mayor
que, o sea que axiomáticamente la diferencia fundamental entre una escala nominal y una
ordinal es que esta última incorpora no solamente la relación de equivalencia (=) sino
también la relación ''mas grande que'' (>). Esta relación es irreflexiva (no es verdad para
ninguna x tal que x > x), asimétrica (x > y luego x < y) y transitiva (x > y et y > z luego x > z).
1º Muy Satisfecho
2º Satisfecho
3º Insatisfecho
4º Muy insatisfecho
individuos, sino que se mide también la distancia entre los intervalos o las diferentes
intervalo; esto es, si la asignación de números a varias clases de objetos es tan precisa que
se sabe la magnitud de los intervalos (distancias) entre todos los objetos de la escala, se ha
obtenido una medida de intervalo. Una escala de intervalo está caracterizada por una
unidad de medida común y constante que asigna un número real a todos los pares de objetos
Axiomáticamente se puede ver que las operaciones y las relaciones en que se origina la
estructura de una escala de intervalo son tales que las diferencias en la escala son
13
isomórficas a la estructura de la aritmética. Los números pueden asociarse con las
posiciones de los objetos de tal manera que las operaciones de la aritmética puedan
La consecuencia de cualquier cambio de los números asociados con los objetos medidos en
una escala de intervalo debe preservar no solamente el orden de los objetos sino también
las diferencias relativas entre ellos. Esto es, la escala de intervalo es "única hasta una
cuantitativa. Las estadísticas paramétricas, son las aplicables a estudios en estas escalas.
2050
2000
1950
1900
Suponga que se está interesado en algún período histórico específico y se están haciendo
Obviamente los datos pueden ser ordenados (semejante a los datos ordinales) en orden
los valores ordenados pueden ser comparadas. Aquí el intervalo entre los valores de los
demás intervalos. Hay que tener en cuenta que en esta escala no hay un cero absoluto o
real, el cero es arbitrario; depende del tipo de calendario que estemos usando.
14
corresponde a las estimaciones y proyecciones vigentes, sustituyendo así las
publicadas en el Boletín Demográfico No. 60 de julio de 1997.
2000 507.932.043
2050 800.592.305
Cuando una escala tiene todas las características de una escala de intervalo y además un
punto cero real en su origen, se llama escala de razón. Además de distinción, orden y
distancia, ésta es una escala que permite establecer en que proporción es mayor una
categoría de una escala que otra. El cero absoluto o natural representa la nulidad de lo que
se estudia. Las operaciones y relaciones hechas con los valores numéricos en una escala de
asignados a los objetos mismos, así como también en los intervalos entre los números como
sucede en las escalas de intervalo. Implican que las relaciones de equivalencia, relación de
mayor a menor, proporción conocida de dos intervalos y proporción conocida de dos valores
de la escala, sean posibles de obtener operacionalmente. Los números asociados con los
valores de la escala de razón son "verdaderos" números con un verdadero cero; solo la
unidad de medida es arbitraria. Así la escala de razón es "única hasta la multiplicación por
una constante positiva". Además de los procesos paramétricos básicos de las escalas de
coeficiente de variación, las que requieren el conocimiento del verdadero valor cero
15
En este nivel al igual que en el nivel intervalar, las categorías son del mismo tamaño. La
diferencia es que este nivel tiene un punto cero significativo y el valor de las categorías es
2000 12
1000 25
0 32
-1000 17
-2000 10
Variables
16
EJERCICIOS
1)
Determina si las siguientes variables son cualitativas o cuantitativas.
C) El color de un edificio
D) La cantidad de lluvia caída en una estación del año en el Colca.
2) Clasifica lo que representa cada proposición según los conceptos básicos de estadística, dado un
estudio referido a los hábitos de comida en Arequipa.
3)
Señala en qué caso es más conveniente estudiar la población o una muestra.
4)
Clasifica las siguientes variables estadísticas en cualitativas o cuantitativas. Si son
cuantitativas indica si son discretas o continuas.
A) Provincia de residencia.
B) Número de vecinos de un edificio.
C) Profesión de la madre.
D) Número de llamadas telefónicas hechas en un día.
E) Consumo de gasolina cada 100 km.
F) Registro de temperatura en un día.
5)
Indica las variables cuantitativas que son discretas y las que son continuas.
E) Número de primos.
F) Talla de pantalón.
G) Perímetro craneal.
H) Número de puertas de tu casa.
I) Kilogramos de pan consumidos en una semana por un colegio.
J) Número de hijos.
17
K) Ingreso diario en una cafetería.
L) Edades de los vecinos de tu cuadra.
M) Número de calzado de tus compañeros de sexo femenino de tu clase.
N) Estatura de recién nacidos en un hospital en un día.
O) Suma de los números obtenidos al lanzar dos dados.
P) Kilogramos de ropa que se pueden poner en una lavadora cuya capacidad es de 5
kg.
Q) Número de personas que integran el grupo familiar en un cierto sector de la
ciudad.
R) Longitud media de los tornillos producidos por una máquina en un día.
Cantidad de profesores por colegio de una ciudad determinada
6) Identifica las unidades estadísticas y las observaciones en cada uno de los siguientes
casos:
a) Un abogado investiga las condiciones de vida de cada uno de sus clientes.
b) Un jefe de personal investiga los tipos de dietas en las raciones que entregan en
el comedor de los obreros de la empresa.
7) En el siguiente enunciado identifica a la población, la muestra, la unidad elemental, la
variable y el tipo de variable.
En cierto Establecimiento Penal el Dr. Gómez desea precisar el tipo de delito por el que
han sido sentenciados los detenidos.
8) Se realizó una encuesta para determinar las preferencias estudiantiles con respecto a
los diarios de la localidad. Con este fin se entrevistó a un mil quinientos estudiantes y
seiscientos de ellos prefieren El Espectador. Responde lo siguiente:
a) ¿Cómo está formada la muestra?
b) ¿Cómo está formada la población?
c) ¿La población es finita o infinita?
d) ¿Cuál es el parámetro?
e) ¿Cuál es el valor estadístico?
9) Se realizó un muestreo de opinión para determinar si los profesores de Arequipa
prefieren textos de un autor X con respecto a otro. Con este fin se entrevistaron a 2
000 profesores y entre ellos 1 500 prefieren al autor X. Responde lo siguiente:
a) ¿Cómo está formada la muestra?
b) ¿Cómo está formada la población?
c) ¿La población es finita o infinita?
d) ¿Cuál es el parámetro?
e) ¿Cuál es el valor estadístico?
10) La universidad desea precisar la cantidad de ingresantes que tienen problemas auditivos.
Se seleccionó a 80 jóvenes y 20 de ellos presentaron problemas auditivos. Identifica:
a) La variable.
b) La muestra.
c) El valor estadístico.
11) Se estableció que el costo promedio de los textos escolares de matemática en un
colegio de 1 500 alumnos fue de S/ 80. Un grupo de estudiantes de estadística encuestó
a treinta estudiantes para determinar el promedio del costo de un texto escolar de
matemática y concluyó que dicho gasto es de S/ 120.
Identifica:
a. la variable.
b. El tipo de variable.
c. La población.
d. La muestra.
18
e. El parámetro.
f. El estadígrafo.
g. ¿Qué podría concluir el grupo de estudiantes de Estadística si el costo promedio
de un libro para la muestra de los 30 estudiantes fuera de S/ 150?si el costo
promedio de los pasajes de los 30 estudiantes fuera de S/ 150?
12) Se entrevistó a 200 ciudadanos votantes arequipeños sobre su opinión (respuesta sí o
no) sobre la construcción de un tren eléctrico sobre los cauces de algunas torrenteras
que cruzan la ciudad. Define la población que se está muestreando, describe el
parámetro y el valor estadístico.
13) Un examen de inteligencia normal es aplicado a un grupo de niños que reciben educación
especial. Todos los niños cursan el segundo grado y han sido escogidos para recibir un
nuevo programa de instrucción impartido en la escuela Polivalente de Tingo. El examen
debe ser aplicado antes y después de que reciban la instrucción.
Identifica:
a) la población.
b) La muestra.
c) La variable.
d) El tipo de variable.
e) La unidad estadística.
14) El profesor de Matemática Básica desea aplicar la técnica del ABP (Aprendizaje en base
a problemas) en el estudio de la estadística, motivo por el cual se realizó una encuesta,
obteniéndose los siguientes resultados: el 20% estaba de acuerdo; el 60% indicó que no
era necesario y al resto le resultaba indiferente.
Según el enunciado coloca (V) o (F) si es verdadero o falso respectivamente según
corresponda.
( ) La variable en estudio es el porcentaje de preferencia de una nueva técnica de
aprendizaje.
( ) La variable en estudio es del tipo cuantitativo discreto.
( ) La población es finita.
( ) La muestra está formada por 100 alumnos.
15) Un periodista desea determinar la proporción de votos que deben ser emitidos a favor
de cierto candidato en las próximas elecciones municipales para el distrito de Santa
María.
Identifica la población, la muestra, la variable y el tipo de variable.
16) Durante una auditoría, 16 cuentas de la firma comercial que asesoras jurídicamente
fueron seleccionadas aleatoriamente y examinadas en busca de la cantidad de errores.
Identifica:
a) La población.
b) La muestra.
c) La unidad estadística.
d) La variable.
e) El tipo de variable.
17) Define las poblaciones apropiadas y a partir de ellas selecciona las muestras siguientes:
a) Se llamó por teléfono a personas de 100 hogares de cierto distrito y se les pidió
el nombre de su candidato para alcalde.
b) En diez ocasiones diferentes un alumno tardó 35; 28; 37; 30; 28; 40; 28; 30; 40
minutos en llegar desde su casa a la universidad donde estudia.
18) Un censo completo del plantel de estudiantes de un colegio de educación inicial se reveló
que el número de estudiantes de 4 años a más era de 210. ¿Este número 210 es un
estadígrafo o un parámetro? ¿Por qué?
19
19) La figura siguiente muestra una de las páginas del formulario de la Encuesta
Nacional de Hogares Ampliada, con preguntas que se relevan de cada integrante del
hogar. Identifica las variables que aparecen, así como sus sistemas de categorías y
niveles de medición.
20
20) Clasifica las variables que se consideran en el siguiente ejemplo:
Recolección de la información
Etapa de mayor importancia para el investigador. Tiene que ser vigilada por
el investigador, de manera que la información recogida sea correcta.
Organización de la información.
21