Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADÍSTICA DESCRIPTIVA
PARA LA ENSEÑANZA
PREUNIVERSITARIA
–2005 –
Este material está dirigido a los estudiantes y profesores de la Enseñanza
media Superior como apoyo a la Unidad 3 "Estadística Descriptiva" del
programa de Matemática para el 10mo grado. En el mismo se presentan
los conceptos básicos que se trabajan en este nivel los cuales se ilustran
mediante ejemplos y ejercicios resueltos. Contiene además un grupo de
ejercicios propuestos para la práctica y el repaso.
En cada uno de los epígrafes se indica las video-clases donde se trata este
contenido. Para ello se utiliza el símbolo ( c-A) donde el lugar de A
está ocupado por los números de las clases correspondientes.
1
ÍNDICE
Contenido página
Bibliografía……………………………………………………………. 50
2
BREVE RESEÑA HISTÓRICA
Por otra parte, los egipcios del siglo XXXI (a.n.e) – anterior a la construcción de las
pirámides– representaban datos sobre la población y los índices de renta en el país.
Antes del año 2000 (a.n.e), los chinos realizaban estudios sobre la población y las
posibilidades materiales de sus habitantes. En tanto, los griegos –con el propósito de
cobrar los impuestos– llevaron a cabo un censo de población cuyos resultados fueron
utilizados hasta los alrededores del año 594 (a.n.e).
Fue en el siglo XVII, en Inglaterra cuando John Graunt (1620-1674) comenzó a estudiar
los registros de fallecimientos; este pequeño comerciante estuvo probablemente
motivado por la curiosidad. Y así fue que descubrió que el porcentaje de muertes por
accidentes, suicidios y enfermedades era aproximadamente el mismo en las localidades
estudiadas, variando muy poco de un año para otro. Graunt realizó numerosos estudios
sobre los nacimientos y otros aspectos de carácter social. En el año 1962 publicó el
libro Natural and Political Observations…upon the Bills of Mortality el cual puede ser
3
considerado como el inicio de la utilización del método científico en las ciencias
sociales.
Muchos fueron los continuadores de Graunt y es en la segundad mitad del siglo XIX en
que se produjo el desarrollo matemático de la Estadística. Francis Galton (1822-1911) y
Kart Pearson (1857-1936) fueron dos matemáticos que contribuyeron mucho a su
evolución. Las técnicas estadísticas comenzaron a tener marcada importancia en la
Astronomía y en la teoría de los Gases. Es por eso que las Ciencias Sociales y la
Físicas aceleraron la creación y aplicación de los métodos estadísticos.
4
1. Tipos de Estadísticas. Importancia que tiene para la sociedad el trabajo con
datos. C-128)
Los que habitamos la sociedad de hoy no podemos actuar como en los tiempos de los
babilonios hace más de 5000 años. En la actualidad es necesario realizar estudios
profundos sobre todos los procesos que garantizan la vida en el planeta, los que dan
continuidad al desarrollo y preservación de las diferentes especies de animales y
plantas que lo habitan y al mismo tiempo salvar y enriquecer el patrimonio que el propio
hombre ha construido.
Muchos ejemplos pueden ilustrar con absoluta claridad la importancia que tiene el
conocimiento, la recopilación, el procesamiento y el análisis de los datos que describen
determinados eventos; por el momento queremos referirnos a los siguientes:
Hacer un pronóstico y tomar decisiones sobre las temperaturas, las lluvias, los
períodos de sequías, la erosión y la degradación de los suelos o cualquier
fenómeno atmosférico o climatológico, implica – sin lugar a dudas– el estudio
profundo y continuado de los resultados históricos, físicos, químicos, biológicos
que han influido y que resultan de interés para los especialistas.
5
la moda predominante, la época del año en que saldrá al mercado; no solo para
obtener mayores resultados económicos, sino también, para lograr un impacto
social positivo.
Por otro lado, la parte de la Estadística que estudia una población a partir de
considerar todos los elementos que la integran, sin derivar conclusiones sobre un
grupo mayor, se denomina ESTADÍSTICA DESCRIPTIVA O DEDUCTIVA.
Ejemplo 1
De una escuela de 970 alumnos se han elegido, de manera aleatoria, 200 de estos
para realizar un estudio relacionado con el número de hermanos.
Muestra: Los 200 estudiantes que fueron elegidos. Tamaño de la muestra: 200
6
Unidad estadística o individuos: Cada uno de los estudiantes.
(C-129 y 130)
Las variables estadísticas son cada una de las características que se estudian en los
elementos (individuos) de una población. Estas son de diferentes tipos y toman, tanto
valores numéricos como no numéricos. En los ejemplos que se proponen a
continuación se presenta la variable y los valores que esta toma dentro de paréntesis.
TIPOS DE VARIABLES
Cualitativas
discretas
Cuantitativas
continuas
Cualitativas: Se refieren a características que no se pueden cuantificar.
7
Nota: Un conjunto es numerable cuando todos sus elementos se pueden poner en
correspondencia uno a uno con un subconjunto de los números naturales.
Cantidad de lluvia caída en una región en una época, dada en función del tiempo
(cualquier valor real no negativo).
Volumen de agua en una presa en metros cúbicos (todos los valores reales no
negativos del intervalo [0; a], donde a es el volumen máximo de la presa).
8
Existen cuatro escalas de medición y la aplicación de cualquiera de ella depende del
tipo de atributo que se está midiendo, es decir: depende de los valores que toma la
variable que se quiere medir. Estas escalas son las siguientes:
Nominal De intervalos
Ordinal De razones
No existe una relación de orden entre los elementos ni entre las clases.
SEXO
NÚMERO DE (Tabla 1)
ALUMNOS
En este ejemplo dos elementos de la misma clase
MASCULINO 11
son iguales en virtud de la variable que se mide y
FEMENINO 19 diferentes a uno cualquiera de la otra clase.
TOTAL 30
Existe una relación de orden entre los elementos de dos clases diferentes.
9
RENDIMIENTO ACADÉMICO
NÚMERO DE (Tabla 2)
ALUMNOS
Ahora es importante notar que un elemento
ALTO 15
de la clase alto – por ejemplo – es superior
MEDIANO 12 a cualquier elemento de las otras dos
clases, en virtud de la variable que se mide.
BAJO 3
El valor cero no es absoluto (no significa ausencia del atributo que se mide)
Notas 0 1 2 3 4 5 6 7 8 9 10
Cantidad de alumnos 1 1 0 1 0 2 5 6 4 4 6
(Tabla 3)
El valor cero es absoluto, indica la ausencia total del atributo que se mide.
10
Ejemplo 9: Cantidad de líquido que contienen dos recipientes A y B.
a) Tipo de enfermedad
d) Peso en kilogramos
11
d) Calidad de equipos ensamblados en una jornada de trabajo.
e) Clasificación de los trabajadores por turnos de trabajo.
Identifica la variable estadística, describe los valores que puede tomar y determina cuál
es la escala de medición en cada caso.
Respuesta:
Escala de medición
Variable Tipo de variable Valores de la variable
de la variable
a) Nivel cultural de cada Primario, Medio básico, Medio Ordinal
Cualitativa
trabajador superior y Universitario
b) Cantidad de equipos Cuantitativa
0; 1; 2; 3; 4; 5;… De razones
ensamblados discreta
c) Tiempo que invierte cada Cuantitativa De razones
1; 0,5; 2; 0; 3; 4,23;… horas.
trabajador continua
d) Calidad de los equipos Ordinal
Cualitativa Buena, regular y mala
ensamblados.
(Tabla 4)
Ejemplo 10:
Al analizar los índices de la emulación por la cede del acto en conmemoración del
asalto al Cuartel Moncada el 26 de julio de 1953, una zona de los CDR evaluó el
cumplimiento de los compromisos de donaciones de sangre, a través de la
siguiente información, donde se muestra la cantidad de donaciones de cada uno
de los 22 CDR de la zona:
4 7 12 18 12 7 17 17 12 2 4
4 2 12 9 4 12 12 7 2 4 12
12
Individuos: cada uno de los 22 CDR.
Los datos anteriores, los cuales no han sido organizados reciben el nombre de datos
primarios. Estos valores pueden ponerse en orden (ascendente o descendente) para
facilitar su análisis y conteo. Un arreglo ordenado de estos datos primarios (que pudiera
contener un número mucho mayor de datos) sería el siguiente:
2 2 2 4 4 4 4 4 7 7 7
9 12 12 12 12 12 12 12 17 17 18
Xi CONTEO O Fi (Tabla 5)
TARJADO
2 ///=3 3 Fi se llama frecuencia absoluta
4 ////=5 5
La frecuencia absoluta (Fi) de un dato cuantitativo es el número
7 /// =3 3
de veces que aparece este en la población que se estudia.
9 /=1 1
12 //// //=7 7 En este ejemplo Xi es el número de donaciones (valores de la
variable X) y Fi es la cantidad de CDR (número de veces que
17 //=2 2
aparece el dato Xi).
18 /=1 1
Con el objetivo de mejorar la descripción de los datos las tablas de frecuencias
contienen otras columnas, así en la que presentaremos a continuación (Tabla 6) vamos
a incorporar las siguientes:
13
La cuarta y la quinta columna: corresponden a la frecuencia absoluta acumulada Fai
obtener acumulando de arriba hacia abajo o viceversa, según sea el interés del estudio.
Ejercicio 3:
4) ¿Qué porcentaje de los CDR estuvo por debajo de las 12 donaciones de sangre?
Es muy difícil percibir a simple vista – y a veces con mayor detenimiento– toda la
información que hay en una tabla, y si esta ocupa más de media hoja será casi
14
imposible; para conseguirlo una manera es representar los datos en diferentes tipos de
gráficos, de los cuales mostraremos algunos a continuación.
Ejemplo 11
Para construir una gráfica de barra, los valores de las variables se sitúan en el eje de
las abscisas y se trazan barras perpendiculares, todas de igual ancho, cuya altura sea
igual al valor de la frecuencia absoluta. La disposición de los ejes puede variar de
acuerdo con la posición que se elija para las barras (vertical u horizontal).
15
El gráfico de barras anterior corresponde a la preferencia de las mujeres por los
géneros cinematográficos estudiados en este centro universitario. Para su construcción
se utilizó el Generador de Gráficos de la Enciclopedia Encarta.
Cuando usamos este sencillo asistente para graficar los datos de una tabla de
frecuencias se realizan los siguientes pasos:
b) Elegir el tipo de gráfico que se quiere construir de acuerdo con las tres opciones que brinda:
gráfico de sectores, gráfico de barras y gráfico de líneas.
c) Describir con una etiqueta el contenido del gráfico (por ejemplo Géneros cinematográficos).
d) Elige el tipo de color a utilizar (Estándar, pastel, brillante o grises) y completar la tabla con el
nombre de los ítems (variables) y la frecuencia correspondiente.
e) Finalmente escribir el título del gráfico y los comentarios que se consideren. Al oprimir el
botón SIGUIENTE se obtiene el gráfico, el cual permite las opciones: copiar, imprimir,
guardar, entre otras.
Nota: para ir de un paso a otro se usan las opciones Atrás y Siguiente de cada página.
Otro tipo de gráfico muy utilizado es el pictograma que como su nombre lo indica
requiere de cierta creatividad y de arte. En el se sustituyen las barras por dibujos que
representan la frecuencia correspondiente a cada valor de la variable que se estudia.
Así utilizando los datos del ejemplo 11, tenemos:
16
Donde:
Ejercicio 3:
Utilizando los datos, las tablas y los gráficos relacionados con el ejemplo 11, responde
las siguientes preguntas:
d) ¿Es cierto que las películas de C. Ficción son preferidas por los hombres más que por
las mujeres?
17
frecuencia. De esta manera, como el 1% de 360O es 3,6O entonces el cálculo de O se
reduce a una simple fórmula: αO 3,6O f i % donde f i % es la frecuencia relativa
Los gráficos circulares son de mucha utilidad para comparar distintas distribuciones.
Para ilustrar la construcción de un gráfico circular vamos a retomar el ejemplo 10 de las
donaciones de sangre. Esta vez mediante una tabla de frecuencias (absoluta y relativa
porcentual) con una columna para representar la amplitud del ángulo correspondiente
en cada caso.
(Tabla 7)
Xi Fi fi(%) α O
7 3 13,6 49O
………………..
………………..
9 1 4,6 17O
………………..
12 7 31,8 114O
3,6O 31,8 114 O .
…………………
18 1 4,6 17O
18
5. Datos agrupados. (C-139 y 140)
Para describir una cantidad grande de datos o para estudiar una variable a partir de
determinadas categorías, es conveniente organizarlos en clases y definir el número de
individuos (u observaciones de la variable) que pertenecen a cada una de ellas.
Ejemplo 12
Los participantes del evento están dispuestos en un arreglo de 10 filas (1, 2, 3, 4,…, 10)
y 10 columnas(A, B, C, …, J), como se muestra en la siguiente tabla (tabla 8).
19
(Tabla 8)
5 4 3 8 6 6 7 5 1 8
8 8 3 2 1 8 8 9 7 6
4 5 4 5 3 8 4 2 6 6
3 5 8 8 7 6 5 9 4 8
2 4 3 2 8 4 10 5 5 5
8 3 6 6 5 4 4 3 5 4
12 3 11 5 11 4 3 4 5 5
6 2 7 6 8 5 4 3 2 2
7 9 8 9 7 4 3 5 5 4
8 9 7 8 8 4 5 3 4 2
1–3 Regular ( R) 22
4–6 Buena ( B ) 45
7–9 Muy Buena (M B ) 29
10 – 12 Excelente (E ) 4
Para resolver el problema planteado los datos han sido agrupados mediante cuatro
clases: 1 – 3, 4 – 6, 7 – 9 y 10 – 12 donde (Fi) la frecuencia absoluta (frecuencia de
clases) de la clase "i".
20
La marca de clase es el punto medio de cada intervalo de clase la cual es un valor
representativo en esta de la variable que se mide. En la tabla 9, las marcas de clases
son 2, 5, 8 y 11 las cuales se obtienen mediante la semisuma de los extremos de los
intervalos de clases.
Ejemplo 13
En este caso la variable puede tomar valores para los cuales existe cierta ambigüedad
con relación a qué clase pertenecen. Por ejemplo un valor entre 28 y 29 se discute si
pertenece a la segunda o a la tercera clase. Existen varios criterios para resolver este
problema, pero en clases de igual amplitud– en este ejemplo l = 14 – es muy práctico
sustraer 0,5 al límite inferior y adicionar esta misma cantidad al límite superior de cada
clase. Así obtenemos – por ejemplo – para la tercera clase:
1 – 14 8 7,5
15 – 28 12 21,5
29 – 42 6 35,5
43 – 56 5 49,5
57 – 70 3 63,5
71 – 84 2 77,5
21
Por otro lado, aprovechando los conocimientos sobre la notación de intervalos reales
(usando corchetes y paréntesis), las clases se pueden expresar como en la tabla 11
que presentaremos a continuación. En este caso es importante notar que no existe
ambigüedad para decidir la ubicación de un elemento. Así las clases se pueden
representar de forma continua sobre la recta real, entonces los límites reales coinciden
con los de cada clase.
0 ;14 ) 8 7,5
22
5.1 Representación gráfica de datos agrupados. (C-141 a C-145)
Ejemplo 14
23
Ejemplo 15
Ejemplo 16
24
Análogamente se procede cuando la frecuencia es acumulada en forma descenderte
(de abajo hacia arriba en la tabla de frecuencia). Entonces la pregunta anterior pudiera
ser ¿Durante cuántas semanas las lluvias caídas fueron iguales o superiores a los 56
mm?
En este proceso el objetivo es resumir el volumen de los datos primarios, o los de una
distribución de frecuencias por determinados valores descriptivos, a los cuales se les
llama Estadígrafos o Estadísticos.
Estadígrafos de posición
La Mediana
La moda
Los cuartiles, deciles, percentiles y fractiles (las cuales son medidas de posición
relativas que no se estudiarán en este material)
Estadígrafos de dispersión:
Recorrido o rango
Desviación media
Varianza
Coeficiente de variación
25
6. Medidas de tendencia central
Muchos son los problemas en los cuales es importante representar un grupo de datos
por un solo valor que es, por decirlo así, descriptivo del grupo entero. Las medidas de
tendencia central, que como su nombre lo indica tienden a ser un valor medio, permiten
la descripción de la variable (o variables) que es objeto de estudio.
Antes de definir las medidas de tendencia central es importante tratar, de forma breve,
el uso del signo de sumatoria el cual permitirá simplificar en algunos casos la escritura
de las fórmulas que serán utilizadas.
n
n 1
2
se lee: suma de los valores de n2 desde n = 1 hasta 10.
Ejemplo 17
n
a) S 1 2 3 4 5 ... n Respuesta: S i
i 1
21
b) S 2 4 6 8 ... 42 Respuesta: S 2k
k 1
n
1 1 1 1 1
c) S ... Respuesta: S
2 3 4 n k 1 k
26
n
d) S X1 X 2 X 3 ... X n Respuesta S X k
k 1
n
e) S X1F1 X 2 F2 ... X n Fn Respuesta S X i Fi
i 1
Definición: Sean X1, X2, X3,…, Xn, n valores medidos. La Media Aritmética X se
X1 X 2 X 3 ... X n
calcula mediante la fórmula: X y de manera abreviada,
n
n
X i
1 n
usando el símbolo de sumatoria, la fórmula es: X i 1
n
Xi
n i 1
Ejemplo 18
27
Es una función algebraica de los datos individuales. Esto significa que la
modificación de cualquiera de los datos hace variar el valor de la media.
6.1.1.1) Media aritmética ponderada
Hay algunos problemas en los cuales es imposible promediar cantidades sin tomar en
cuenta, de alguna manera, su importancia relativa dentro de la situación global que se
está tratando de describir. Por ejemplo, si en un agromercado se venden tres tipos de
granos a $3,50, $4,60 y $5,75 es imposible determinar el precio global que se recibe
por libras si no se considera el número de libras vendidas de cada tipo de granos. Si la
mayoría de las libras vendidas son del tipo más barato la media estará más cerca de
$3,50.
Supongamos que el mercado vendió durante una semana 300 libras del tipo de granos
más barato, 220 de las del precio medio y 96 del más caro. Por un simple cálculo
aritmético el mercado recibió 300($3,50) + 220($4,60) + 96($5,75) = $ 2614 al vender
300 + 220 + 96 = 616 libras de estos granos. Luego el precio promedio por libras es
$ 2614
$ 4,24 .
616
F X F2 X 2 ... Fn X n F X i i
X i i i 1
(Análogamente
F1 F2 ... Fn n
Fi
i 1
28
6.1.2) Mediana
Ejemplo 19 A
22 23 25 28 30
Ejemplo 20 40 43 45 46 48 51
En este ejemplo n = 6 (par) luego, la mediana del conjunto de datos B es
45 46
Me 45,5
2
6.1.3) Moda
29
820 940 940 952 964 970 972 MO= 940 horas
Ejemplo 22
Calificaciones 2 3 4 5 MO = 3 puntos
# de alumnos 5 10 8 7
Ejemplo 23
0 2 3 3 3 4 4 4 5 6 7 34
MO 3,5
2
Ejemplo 24
0 2 3 3 3 4 4 5 5 5 6 7 M O(1) 3 y M O ( 2) 5 en
30
En una HEC podemos realizar entre otros, cálculos matemáticos generales,
estadísticos, cotidianos; unido a grandes posibilidades de diseño y manipulación de la
información. Las HEC son sistemas (Tabuladores electrónicos) que tienen como
propósito fundamental el tratamiento de datos, la elaboración de gráficos y la gestión de
archivos organizados en forma de tablas. En principio una HEC es la representación
informática sobre una inmensa hoja cuadriculada (16777216 celdas) en blanco
dispuesta a recibir la información que deseamos escribir, un lápiz, una goma de borrar y
una potente calculadora.
La comunicación del usuario con una HEC no resulta algo muy complejo y constituye
uno de los contenidos que los estudiantes del preuniversitario deben aprender a través
del programa de informática básica incluido en plan de estudio. Por el momento solo
presentaremos algunos ejemplos del empleo del EXEL en la Estadística Descriptiva en
este nivel de enseñanza.
Ejemplo 25
1) Para realizar este trabajo se confeccionará una tabla con los siguientes datos:
3) Hallar la nota promedio del grupo (NPG) en cada uno de los exámenes
aplicados.
31
4) Representar en un gráfico circular la distribución de los estudiantes por los
siguientes rangos de notas obtenidas en el primer trabajo de control: 85 – 89;
90 –94 y 95 – 100.
32
que no puede proporcionar los datos primarios o porque la masa de datos hace que el
proceso sea complejo.
F1 X F 2 X 2 F 3 X 3 ... F n X Fi X i
X 1 n
i 1
F 1 F 2 F 3 ... F n n
i 1
Fi
Donde:
La tabla muestra la distribución de las notas obtenidas por 103 estudiantes en la tercera
pregunta de un examen de Matemática, calificada con una escala de de 0 a 10 puntos.
Fi
[0 ; 2,5) 5 5 1.25
[2,5 ; 5) 9 14 3.75
[5 ; 7,5) 33 47 6,25
33
La media aritmética para un grupo de datos agrupados en clases, como el ejemplo
anterior, no difiere una cantidad significativa de la media aritmética calculada a partir de
los datos simples.
Las 103 calificaciones pueden ser consideradas en una HEC y calcular la nota promedio
utilizando la función estadística PROMEDIO del EXEL la cual devuelve el promedio (media
aritmética) de los argumentos de una referencia de celdas.
n
Fa m 1
M e L i 2 l Donde:
Fm
Ahora es necesario determinar el valor de cada una de las variables que aparecen en el
miembro izquierdo de la fórmula.
34
103 1 104
ejemplo tenemos que PM e 52 . Así la mediana buscada ocupa el
2 2
lugar 52 en la lista, entonces la clase mediana es la cuarta, es decir: 7,5 ; 10
F1 7,5 Pues en este ejemplo las clases pueden ser colocadas sobre una escala
continua desde 0 hasta 10, entonces los límites reales coinciden con los extremos de
los intervalos de clases.
calcular la mediana.
103
47
M e 7,5 2 2,5 7,5 51,5 47 2,5 7,5 4,5 2,5 7,5 0,08 2,5
56 56 56
Análogamente a lo explicado para la media aritmética, las 103 calificaciones pueden ser
consideradas en una HEC y calcular la mediana utilizando la función estadística MEDIANA del
EXEL la cual devuelve la mediana (o valor central) de los argumentos de una referencia de
celdas.
35
6.2.3) Moda (C-153)
n1
MO L i l Donde:
n1 n2
n1: Exceso de la frecuencia modal sobre la frecuencia de la clase anterior más próxima.
Ejemplo27
36
Significado geométrico de la moda en un conjunto de datos agrupados.
n1LS n2 LS
proporciones y transformaciones algebraicas equivalente se obtiene M O
n1 n2
n1( L i l ) n2 Li
pero LS Li l (l es la amplitud de la clase modal) entonces, M O ,
n1 n2
(n1 n2 )Li n1 l
MO , ahora aplicando la propiedad distributiva de la división respecto
n1 n2
n1
a la suma se obtiene M O Li l que es la fórmula empírica que hemos
n1 n2
utilizado para el cálculo algebraico de la mediana.
37
la variabilidad de la información de acuerdo con estos valores de descripción, es decir,
la dispersión o concentración de los datos alrededor de determinados valores.
Ejemplo 1
GRUPO A GRUPO B
x1 3 y1 5
x2 4 y2 5
x3 5 y3 6
x4 9 y4 8
x5 10 y5 8
x6 10 y6 9
X I 41 Y I 41
En este caso los dos grupos de datos tienen igual media aritmética e igual mediana, sin
embargo, a simple vista se puede comprobar que el grupo A es más heterogéneo que
el B. Las puntuaciones en el primer grupo varían mucho con una marcada diferencia
entre las notas bajas y altas, en tanto, en el segundo grupo hay menor variación entre
las puntuaciones contiguas y entre las altas y las bajas, luego, el grupo B es más
homogéneo que el A.
Es una medida simple de dispersión que se puede utilizar para una comparación
primaria de un grupo de distribuciones. Es poco confiable, pues considera sólo las dos
observaciones extremas, con independencia de la forma de la distribución y de las
frecuencias de las variables individualmente.
38
Así en el grupo “A”se tiene que el rango es R(A) = 10 – 3 = 7 y por otro lado en el
grupo “B” R(B) = 9 – 5 = 4, es decir, existe mayor diferencia entre las puntuaciones
altas y bajas en el grupo “A”. Esto indica mayor dispersión de los datos en el grupo
“A” en relación con el “B”.
Se define como la media aritmética de los valores absolutos de las diferencias entre los
datos y su media aritmética. Esto se expresa mediante la siguiente fórmula:
n
X1 X X 2 X ... X n X X i X
DX i 1
Donde X es la media aritmética
n n
X i con relación a X .
GRUPO A GRUPO B
Xi Yi
Xi X Yi Y
39
1,83 1,83 0,83 1,17 1,17 2,17 9
DY 1,5 Así, la desviación media del grupo A
6 6
es superior que la del grupo B, lo cual verifica los resultados obtenidos anteriormente
con relación a la dispersión de los datos y a la fiabilidad de la media aritmética y la
mediana en determinado tipos de distribuciones.
La desviación media puede tener sus atractivos como medida de variación, pero no es
la más utilizada, es por eso que estudiaremos otras medidas de variación de mayor
alcance.
7.3) Varianza
La varianza de un conjunto de datos x1, x2, x3,…, xn, se define como la media del
cuadrado de las desviaciones de la variable respecto a la media.
V(X)
X X X
1
2
2
2
X ... Xn X 1n 2
Xi X
2
n n i1
Retomando el ejemplo 1, tenemos:
Los estudios estadísticos han demostrado que para el cálculo de la varianza muestral
de una muestra de tamaño N, es más conveniente modificar la fórmula anterior
dividiendo por N – 1 en lugar de dividir por N. En lo adelante, para el trabajo con la
40
Estadística Descriptiva que es a la cual está dirigido este material, utilizaremos la
fórmula como la hemos presentado en la definición de Varianza.
Propiedades de la Varianza
La desviación típica o estándar varía menos que otros estadígrafos cuando se calcula
para varias muestras extraídas de una misma población. Esto hace que sea la medida
de dispersión más usada y de mayor confianza para los estadísticos.
X
n 2
i X
S V i 1
41
Con la desviación típica o estándar se tiene una idea del grado de desviación promedio
en la distribución, en nuestro caso se puede afirmar que con respecto a la variable
calificaciones existe homogeneidad en el grupo B, mientras que con respecto a esa
misma variable, el grupo A es más heterogéneo.
42
8. Ejercicios y problemas para la práctica y el repaso.
Sexo
Nivel cultural.
Calificación técnica.
Tiempo en horas que invierte un trabajador para confeccionar un pantalón.
Cantidad de pantalones que confecciona un trabajador en una jornada de
trabajo.
Calidad de la costura determinada por el número de piezas que no son
rechazadas.
a) Identifica la variable que se evalúa, clasifícala y presenta ejemplos de los
valores que puede tomar en caca caso.
b) Determina la escala de medición de cada una de estas variables.
43
3) Los siguientes datos corresponden a la superficie aproximada, dadas en millones de
kilómetros cuadrados, de 6 grandes regiones de muestro planeta.
REGIONES SUPERFICIE
La Habana 28 Camaguey 20
Matanzas 23 Holguín 23
a) Construye una tabla de frecuencia haciendo una distribución de los datos por
regiones (occidental, central y oriental).
44
c) Representa estos datos, distribuidos por regiones, en un gráfico de pastel.
d) Construye una tabla como la anterior donde muestres la cantidad actual de estos
clubes en cada uno de los municipios de tu provincia.
Surgen el 8 de septiembre de 1987 por iniciativa del Comandante en Jefe Fidel Castro, después de
evaluarse como positiva la experiencia del Joven Club radicado en el Pabellón Cuba durante el
período vacacional del verano de 1987, de forma experimental, con carácter promocional y
recreativo.
5) A partir de los resultados del ejemplo 11 construye una tabla de frecuencia relativa,
expresada en porcentajes, sobre la preferencia de los hombres y las mujeres por
los géneros cinematográficos estudiados en un centro universitario. Representa la
frecuencia hallada para los hombres y las mujeres en una misma gráfica de barras.
a) ___ El valor de F5 es 6.
Fi 4 3 4 5 F5
b) ___ No se puede conocer el valor de F5.
2 3 4 3 5 3 2 4 3 5 3 2 5 3 4 2 5 5 4 3 5 4 3 2 2
45
a) ¿De cuántos ejemplares consta la población estudiada?
6 7 6 8 5 5 7 6 5 4 6 8 6 6 5 4 7 5 5 6
7 5 7 5 6 5 6 5 6 5 7 7 7 6 5 5 6 7 5 6
5 6 6 7 7 6 7 4 7 7 4 5 4 4 5 8 8 3 4 6
5 4 3 5 6 3 7 5 7 8 8 8 5 6 5 3 4 6 4 5
5 2 7 6 4 4 6 7 5 5 5 8 8 5 6 6 7 4 6 7
8.1) Representa estos datos en una tabla de frecuencia y realiza las siguientes
actividades:
a) Determina el porcentaje de las plantaciones que tienen una producción de 5
toneladas por hectáreas.
b) Halla la cantidad de plantaciones cuya producción está por encima (debajo)
de la producción media por hectáreas.
8.2) Representa la distribución de frecuencia relativa porcentual en un gráfico de
barras.
46
9) Los alumnos de un centro deportivo han hecho estadísticas acerca de los
resultados históricos de dos equipos de baseball A y B. En relación con la cantidad
de juegos ganados durante cinco temporadas se registraron los siguientes datos:
PROMEDIO DE JUEGOS
GANADOS POR DESVIACIÓN ESTANDAR
TEMPORADAS
Equipo A 45 2,5
Equipo B 45 0,8
c) __ Los alumnos deciden matricular en cualquiera de los dos equipos porque los
consideran igualmente estables en relación con la cantidad de juegos ganados
por temporadas.
d) __Son insuficiente los datos aportados para seleccionar el equipo más estable.
11) Halla la desviación típica o estándar en relación con la producción media de café
(en toneladas por hectáreas) de las 100 plantaciones estudiadas en el ejercicio 8.
12) Los gráficos corresponden a dos distribuciones relativas a las distancias de las
casas al empleo de los trabajadores de dos empresas (A y B). Sin efectuar cálculos
determina en cuál de los dos casos la desviación típica es mayor. Justifica
47
13) Un profesor de Educación Física midió las pulsaciones de los 30 alumnos de un
grupo "A" de 10mo grado al terminar una carrera de velocidad. Los resultados
fueron los siguientes:
14) Realiza un estudio de tu grupo, procesando los datos en una HEC, basado en los
siguientes aspectos:
14.1) Puntuaciones alcanzadas por los estudiantes en cada una de las evaluaciones
realizadas.
48
14.2) Cantidad de ausencias mensuales a clases de cada estudiante en las diferentes
asignaturas que se imparten.
14.3) Nota promedio alcanzada por cada estudiante en las evaluaciones aplicadas (en
cada evaluación aplicada y en cada asignatura en general).
49
BIBLIOGRAFIA
ÁLVAREZ HERRERO, FERNANDO. et al. Matemática. BUP 1o. CIDEAD. Madrid. 1995
50