Explora Libros electrónicos
Categorías
Explora Audiolibros
Categorías
Explora Revistas
Categorías
Explora Documentos
Categorías
ESPACIO CURRICULAR:
Matemática Aplicada
MÓDULO: Estadística
2. TERMINOLOGÍA ESTADÍSTICA
Es obvio que todo estudio estadístico ha de estar referido a un conjunto o colección de personas o
cosas. Este conjunto de personas o cosas es lo que denominaremos población.
Las personas o cosas que forman parte de la población se denominan elementos o entidad. En
sentido estadístico un elemento puede ser algo con existencia real, como un automóvil o una casa,
o algo más abstracto como la temperatura, un voto, o un intervalo de tiempo.
En estadística se aplica la palabra entidad como termino general para referirnos a un miembro
individual de un grupo de personas, lugares o cosas. Por ejemplo un educador puede mostrar
interés por aquellos estudiantes que ha aprendido a leer empleando determinado método.
A su vez, cada elemento de la población tiene una serie de características que pueden ser objeto
del estudio estadístico. Así por ejemplo si consideramos como elemento a una persona, podemos
distinguir en ella los siguientes caracteres:
- Sexo - Edad - Nivel de estudios - Profesión
- Peso - Altura - Color de pelo - Etc.
Luego o tanto de cada elemento de la población podremos estudiar uno o más aspectos cualidades
o caracteres.
La población puede ser según su tamaño de dos tipos:
Población finita: cuando el número de elementos que la forman es finito, por ejemplo el número
de alumnos de un centro de enseñanza, o grupo clase.
3. Método Estadístico
El conjunto de los métodos que se utilizan para medir las características de la información, para
resumir los valores individuales, y para analizar los datos a fin de extraerles el máximo de
información, es lo que se llama métodos estadísticos. Los métodos de análisis para la información
cuantitativa se pueden dividir en los siguientes seis pasos:
A partir de este momento nos vamos a ocupar de las estadísticas de una sola variable,
“Estadísticas Unidimensionales”.
Las tablas estadísticas se confeccionan según el número de observaciones y según el recorrido de
la variable estadística, así tenemos los siguientes tipos de tablas estadísticas:
Tablas tipo I o Serie simple de datos:
Cuando el tamaño de la muestra y el recorrido de la variable son pequeños, por ejemplo si
tenemos una muestra de las edades de 5 personas, por lo que no hay que hacer nada especial
simplemente anotarlas de manera ordenada en filas o columnas.
Edad de los 5 miembros de una familia: 5, 8, 16, 38, 45
Tablas tipo II o Serie de frecuencias:
Cuando el tamaño de la muestra es grande y el recorrido de la variable es pequeño, por lo que hay
valores de la variable que se repiten. Por ejemplo, si preguntamos el número de personas activas
que hay en 50 familias obtenemos la siguiente tabla:
2 1 2 2 1 2 4 2 1 1
2 3 2 1 1 1 3 4 2 2
2 2 1 2 1 1 1 3 2 2
3 2 3 1 2 4 2 1 4 1
1 3 4 3 2 2 2 1 3 3
Podemos observar que la variable toma valores comprendidos entre 1 y 4, por lo que precisaremos
una tabla en la que resumamos estos datos quedando la siguiente tabla:
Uno de los primeros pasos que se realizan en cualquier estudio estadístico es la tabulación de
resultados, es decir, recoger la información de la muestra resumida en una tabla. En ella a cada
valor de la variable se le asocian determinados números que representan el número de veces que
ha aparecido, su proporción con respecto a otros valores de la variable, etc. Estos números se
denominan frecuencias.
Así tenemos los siguientes tipos de frecuencia:
Frecuencia absoluta:
La frecuencia absoluta de una variable estadística es el número de veces que aparece en la
muestra dicho valor de la variable, la representaremos por fa.
Porcentaje:
La frecuencia relativa es un tanto por uno, sin embargo, hoy día es bastante frecuente hablar
siempre en términos de tantos por ciento o porcentajes, por lo que esta medida resulta de
multiplicar la frecuencia relativa por 100. La denotaremos por pi.
pi = fr x 100%
Personas
Número Familias
Activas
x fa fr pi Fa Fi Pac
1 16 16/50=0,32 32% 16 16/50=0,32 32%
2 20 20/50 =0,40 40% 36 36/50=0,72 72%
3 9 9/50=0,18 18% 45 45/50=0,90 90%
4 5 5/50=0,10 10% 50 50/50 =1 100%
Total 50
Cuando la cantidad de datos es mucha, se los suele ordenar de modo tal que la variable se coloca
una sola vez junto con un valor que indica la cantidad de veces que ésta aparece, llamada
frecuencia. Como se mostró en la tabla de tipo II.
Serie de Intervalos de clase. Es una tabla en la cual se agrupa en clases los valores posibles para
una variable y se registra el número de valores observados que corresponde a cada clase.
Los datos organizados así se denominan datos agrupados; por el contrario, para los datos no
agrupados, se enumeran todos los valores observados de la variable aleatoria.
Solución.
Primeramente se localizan los números mayor y menor.
Valor máximo=82 Valor mínimo=62
Calcula el número de intervalos: no = 1 + 3,32 log n n = número de datos
Sustituyendo: no = 1 + 3,32 log 60 = 6,9035
Vmax Vmin 82 62
La Amplitud de clase: A 2,9
n0 6,9035
Por regla general no se utilizan menos de 5 ni más de 15 intervalos. Hay que recordar que por
definición el valor de la amplitud de clase debe representarse en números enteros, por lo tanto:
A=3
Tabla de Registro de Datos: Distribución de Frecuencias Relativas y Acumuladas.
Frecuencia
Marca de Frecuencia Frecuencia Frecuencia
Intervalos Relativa
clase de la clase Acumulada Relativa
de clase Acumulada
x fa Fa fr Fr
62 – 65 63,50 10 10 0,167 0,167
66 – 69 67,50 14 24 0,233 0,400
70 – 73 71,50 14 38 0,233 0,633
74 – 77 75,50 13 51 0,217 0,850
78 – 81 79,50 7 58 0,117 0,967
82 - 85 83,50 2 60 0,033 1,000
Las curvas de frecuencia que aparecen, en la práctica adoptan ciertas formas características, como
se ilustra en las siguientes figuras.
6) BIMODAL 7) MULTIMODAL
a) Las curvas de frecuencias simétricas o en forma de campana (1), se caracterizan porque las
observaciones equidistantes del máximo central tienen la misma frecuencia. Un ejemplo
importante es la curva normal.
b) En las curvas de frecuencias poco asimétricas o sesgadas (2 y 3), la cola de la curva a un lado
del máximo central es más larga que al otro lado. El sesgo de la cola puede ser a la derecha o
hacia la izquierda.
c) En una curva en forma de “J” o de “J invertida” (4 y 5), hay un máximo en un extremo.
d) Una curva de frecuencia en forma de “U” tiene máximos en ambos extremos.
e) Una curva de frecuencia bimodal (6) tiene dos máximos.
f) Una curva de frecuencia multimodal (7) tiene más de dos máximos.
9. GRÁFICOS
CONTINENTE ÁREA
Un gráfico es una representación de la relación entre (millones km²)
variables. Muchos tipos de gráficos aparecen en
África 30,3
Estadística; según la naturaleza de los datos
involucrados y el propósito del gráfico. Entre ellos Asia 47,4
citemos por ejemplo los gráficos de barras, los gráficos Europa 4,9
de pastel, conocidos como “pie charts” y los gráficos a
base de pictogramas. América del norte 24,3
50
45
40
35
Millones de km cuadrados
30
25
20
15
10
5
0
Continente África Asia Europa América del norte Oceanía
Continentes
Con los datos e información del problema anterior se puede construir un gráfico de torta o pie
chart.
Gráfico de Torta
Para representa porcentajes, podemos usar el gráfico circular o torta.
CÁLCULO DE ÁNGULOS
Para calcular los ángulos que representaran los porcentajes de la información en el gráfico de
torta, se realiza una regla de tres para relacionar los porcentajes con los ángulos que en su
totalidad forman el diagrama circular. Se recomienda “redondear” solo a números enteros.
Histogramas
Es una serie de rectángulos cuyo ancho es proporcional al rango de valores que se encuentran
dentro de la clase, y cuya altura es proporcional al número de elementos dentro de cada clase. Si
las clases son todas del mismo ancho, también lo será el ancho de cada rectángulo. La altura
representa las observaciones de cada clase. Como consecuencia, el área de cada rectángulo ocupa
un porcentaje del área total de todos los rectángulos, la cual es igual a la frecuencia absoluta de
esa clase respecto a todas las observaciones hechas. Se usa para variables continuas.
Polígonos de frecuencias
Aunque menos utilizados, también se usan parar representar distribuciones de frecuencias como
de frecuencias relativas.
Los histogramas y los polígonos de frecuencias son similares. ¿Por qué necesitamos ambos?.
Veamos las ventajas de cada uno.
f
Histograma
14
12
Polígono de
frecuencias
10
0
0 62 – 65 66 – 69 70 – 73 74 – 77 78 – 81 82 - 85 x
n donde:
xi x media aritmética.
x i 1
Ʃxi = suma total de datos que componen la población o muestra.
n
n = número de datos de la población o tamaño de la muestra.
Para el caso que los datos estén agrupados por serie de frecuencias o por intervalos de clase,
matemáticamente la media aritmética se expresa:
donde:
n
x media aritmética.
xi . f i
fi = frecuencia
x i 1
wi .xi
w 1 . x 1 w 2 . x 2 w 3 . x 3 ..... w n . x n
xp i 1
n
w 1 w 2 w 3 ..... w n
i 1
wi
Ejemplo 3. Si el examen final cuenta tres veces más que una evaluación parcial y un estudiante
tiene calificación de 85 en el examen final y, 70 y 90 en los dos parciales, la calificación media es:
1 .7 0 1 .9 0 3 .8 5
xp 83
11 3
Mediana (Me)
La mediana de un grupo, es el valor del dato que ocupa un lugar central cuando se los agrupa a
todos en ascendente o descendente. La mediana puede presentarse de dos formas:
a) Cuando el total de datos son un número impar. En este caso, la mediana será el dato que
queda exactamente en el centro, una vez ordenados los datos de menor a mayor.
Ejemplo 4: Hallar la mediana de: 6, 4, 8, 8, 3, 4, 8 ordenando se tiene: 3, 4, 4, 6, 8, 8, 8
Entonces se tiene Me = 6
b) Cuando el total de datos son un número par. Aquí debemos aplicar la siguiente fórmula:
x ( n / 2 ) x ( n / 2 1)
Me
2
Ejemplo 5. Hallar la mediana del conjunto de números: 3, 6, 10, 11, 10, 12, 3, 13, 19, 11, 12, 8,
donde n = 12, luego se acomodan de forma que se encuentren ordenados de menor a
mayor 3, 3, 6, 8, 10, 10, 11, 11, 12, 12, 13, 19
Moda:
La moda de un conjunto de números es el valor que tiene mayor frecuencia, es decir, el valor más
frecuente. La moda puede no existir, o incluso no ser única en caso de existir; si existe dos veces,
se llama bimodal.
En el caso de datos agrupados donde se haya construido una 1
curva de frecuencias para ajustar los datos, la moda será el valor
Mo = L1 + .i
o valores de “ x ” correspondiente al máximo o “máximos” de la 1 2
curva. La moda puede deducirse de una distribución de
frecuencias o de un histograma a partir de la fórmula:
Las diferencias entre los valores de la media, la mediana y la moda permiten saber la forma de la
curva de frecuencias en términos de asimetría.
a) Para una distribución unimodal simétrica, el valor de la media, la mediana y la moda es igual.
b) Para una distribución asimétrica positiva, la media es el mayor valor de los tres y la mediana es
mayor que la moda, pero menor que la media.
c) Para una distribución asimétrica negativa, la media es el menor valor de los tres y la mediana es
inferior a la moda, pero mayor que la media.
d) El coeficiente de asimetría de Pearson, es una medida conocida de asimetría que utiliza la
diferencia observada entre la media y la mediana de un grupo de valores.
Generalmente las medidas de posición central, por sí solas, no proporcionan suficiente información
para dar una adecuada descripción de los datos. Quien base sus juicios sólo en la media, podría
compararse a una persona que teniendo su cabeza en una heladera y sus pies en el horno,
declarase: “en promedio, me siento muy bien”. Sin duda se requiere una medida que indique el
grado de variabilidad de los datos.
Consideremos las propiedades que debe tener una buena medida. Un buen índice de dispersión
debe ser independiente de la posición central de las observaciones, esto es, no depender de la
media. Esto implica que si se sumara (o restara) una constante a cada uno de los valores de un
conjunto de datos, tal transformación no debería influir en la dispersión. Además, para ser útil, una
medida de dispersión debe tomar en cuenta todas las observaciones, y no sólo algunos como el
mayor o el menor. Finalmente, una buena medida debería reflejar la dispersión típica de los datos
y ser convenientemente manejable matemáticamente.
La dispersión o variación de los datos intenta dar una idea de lo esparcido que se encuentra estos.
Hay varias medidas de tal dispersión, siendo las más comunes la desviación media, la
desviación típica o estándar y la varianza.
a) Rango (R)
El rango o recorrido de un conjunto de números es la diferencia entre el mayor y el menor de
todos ellos; es una medida de dispersión que no se utiliza mucho.
R=x max− x min
n
b) Desviación Media (Dm)
La desviación media o desviación promedio, de un conjunto de
xi x i
Dm i 1
n números, x1, x2, x3...xn es abreviada por Dm y se define como: n
c) Varianza (σ2 o S 2)
La varianza es similar a la desviación media porque de basa en la diferencia entre cada uno de los
valores del conjunto de datos y la media del grupo. La diferencia consiste en que antes de
sumarlas, se eleva al cuadrado cada una de las diferencias. Matemáticamente se expresa:
n 2 n 2
xi x xi x
2
i 1
S 2
i 1
n n 1
30 , 2 5 6 ,2 5 6 ,2 5 0 , 2 5 0 , 2 5 0 , 2 5 1 2 ,2 5 30 , 2 5
2
10, 75
8
d) Desviación estándar (σ o S)
En Estadística frecuentemente se aplica más la raíz cuadrada de la varianza a la cual se le llama
Desviación Estándar, representándose por σ para la población y S para una muestra. Las f órmulas
son:
x
n n 2
2
xi x i x
2
i 1
S S2 i 1
n n 1
donde:
σ = Desviación Estándar Poblacional S = Desviación Estándar muestral
n 2
x
n 2
i x . fi xi x . fi
2
i1
S 2 i 1
n n 1
Intervalos Marca Fr. clase Fr. Ac. Fr. Rel. Fr. Rel. Ac.
x . fa
de clase xm fa Fa fr Fr [ x - x ]. fa (x - x) 2.fa
62 – 65 63,5 10 10 0,167 0,167 635,00 79,333 629,378
66 – 69 67,5 14 24 0,233 0,400 945,00 55,067 371,307
70 – 73 71,5 14 38 0,233 0,633 1001,00 0,933 0,169
74 – 77 75,5 13 51 0,217 0,850 981,50 52,867 843,427
78 – 81 79,5 7 58 0,117 0,967 556,50 56,467 3774,124
82 - 85 83,5 2 60 0,033 1 167,00 24,133 8736,267
Ʃ= 4286,00 268,80 14354,67
n = 60 x = 4286 / 60 = 71,433
Ejemplos Resueltos
Ejemplo 8. En el restaurante “Nueva Asia” se obtuvieron los siguientes pagos por el consumo de
15 personas de diversos platillos a la carta.
Determine la media, mediana y moda, para el total de precios por cada uno de los platillos.
Ejemplo 9. De acuerdo a los datos del ejemplo anterior, hallar los valores de:
Ejemplo 10. Las calificaciones parciales del grupo 2° NAT en cuatro materias fueron 83, 88, 92 y
96. Si los respectivos créditos otorgados a estos cursos son 3, 6, 4, 2. Determinar una calificación
media apropiada.
Rta: Aplicando la media aritmética ponderada se tiene: 89,13.
Ejemplo 11. Los siguientes datos representan el número total de pasajeros que utiliza la ruta
Burzaco - Obelisco de la empresa “Date un Punch”. El total de recorridos en un día de servicio es
de 38 viajes.
52 23 29 32 54 50 48 40 34 32 23 39 33
36 28 22 26 27 35 38 40 46 44 22 24 27
50 43 36 30 26 23 25 28 24 31 22 29
Hallar:
(a) El viaje con mayor número de pasajeros
(b) El viaje con menor número de pasajeros
(c) Los 5 viajes con más pasajeros
(d) Los 5 viajes con menos pasajeros
(e) Construir una tabla de registro de datos
(f) Construir un histograma y un polígono de frecuencias
(g) Hallar la media, mediana, moda, varianza y desviación típica
Solución:
(a) 54 más alta (b) 22 más baja
(c) 54, 52, 50, 50, 48 (d) 22, 22, 22, 23, 23
(e) Primeramente, calcularemos el número de clases:
Ejemplo 12. El “gigante” de las computadoras Hewlett Packard, dio a conocer el reporte de sus
ventas durante el periodo de 1992 a Abril de 1993. Las ventas están en dólares. Construir un
gráfico de torta con dicha información.
Cálculo de ángulos:
Computadoras -Impresoras: x = (76.3%)(360°) / 100% = 274.68 ≈ 275°
Equipos de Prueba: x = (11.7%)(360°) / 100% = 42.12 = 42°
Equipo Médico: x = (5.7%)(360°) / 100% = 20.52 ≈ 21°
Instrumental Analítico: x = (3.6%)(360°) / 100% = 12.96 ≈ 13°
Componentes Electrónicos: x = (2.7%)(360°) / 100% = 9.72 ≈ 10°
(a) Anotar las cinco calificaciones menores. (b) Anotar las cinco calificaciones mayores.
(c) Construir un histograma y polígono de frecuencia. (d) Calcular la media, mediana, y moda
(e) Calcular la varianza y la desviación estándar.
Ejercicio 5:
La siguiente tabla representa las temperaturas de 106 habitantes de “El Jodido”, llevadas a cabo
por una brigada de estudiantes de la ISFD. Las temperaturas Están medidas en grados Celsius.
35.8 36.3 36.4 36.6 36.7 36.8 36.9 37.0 37.0 37.1 37.3 36.0
36.3 36.4 36.6 36.7 36.8 36.9 37.0 37.0 37.1 37.3 36.1 36.3
36.4 36.7 36.7 36.9 36.9 37.0 37.0 37.1 37.4 36.1 36.3 36.5
36.7 36.7 36.9 36.9 37.0 37.0 37.1 37.4 36.1 36.3 36.6 36.7
36.7 36.9 36.9 37.0 37.0 37.1 37.5 36.2 36.4 36.6 36.7 36.8
36.9 36.9 37.0 37.0 37.1 37.5 36.2 36.4 36.6 36.7 36.8 36.9
36.9 37.0 37.0 37.2 36.2 36.4 36.6 36.7 36.8 36.9 36.9 37.0
37.0 37.2 36.2 36.4 36.6 36.7 36.8 36.9 37.0 37.0 37.0 37.2
36.3 36.4 36.6 36.7 36.8 36.9 37.0 37.0 37.1 37.2
(a) Anotar las siete temperaturas menores. (b) Anotar las siete temperaturas mayores.
(c) Construir una tabla de registro de datos. (d) Calcular la media, mediana, y moda.
(e) Construir un histograma y un polígono de frecuencia.
(f) Calcular la varianza y desviación estándar.
Ejercicio 6:
El servicio postal determinó que los pesos de una muestra de cartas procesadas en una oficina
postal, pesada hasta el gramo más próximo son: 21, 18, 30, 12, 14, 17, 18, 27, 31, y 35;
determinar:
(a) la media mediana y moda de los pesos de las cartas en gramos
(b) El tercer cuartil (c) El tercer decil (d) El punto porcentil 70