Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESCUELA DE ESTADÍSTICA
GUÍA DIDÁCTICA
ESTADÍSTICA BÁSICA
_______________________________________________________________________________________
Autor:
Leonido Rosario Peña, MA
PRÓLOGO
Este material didáctico se ha escrito para satisfacer la necesidad de tener una guía que sirva no
solo para tener las ideas principales de la estadística, sino además que facilite el trabajo al
estudiante en el sentido que pueda trabajar directamente, sin tener que perder tiempo copiando
ejercicios. Ésta guía no pretende sustituir ningún libro de texto formal, sino más bien es la
compilación de ejercicios y ejemplos de diferentes libros.
En éste material se puede trabajar los ejemplos y ejercicios directamente, además las gráficas
tienen los espacios correspondientes para realizarlas en el mismo. Ésta guía tiene seis capítulos
desarrolladas conforme a las unidades del programa de la asignatura Estadística Básica
(EST2110). Después de cada unidad se encuentra una práctica que ayudará al estudiante a
afianzar los conocimientos adquiridos, conceptuales, procedimentales y actitudinales.
Los contenidos desarrollados en esta guía pueden ser trabajados con el programa Excel, además
se usarán calculadoras científicas y aplicaciones informáticas como herramientas para el
manejo de cálculo numérico, pero se hará énfasis en el análisis estadístico.
iii
ÍNDICE GENERAL
PRÓLOGO ii
5.8 Uso de la calculadora científica para calcular x / ó s / para datos sueltos 129
5.11 Uso de la calculadora científica para calcular x / ó s / para datos agrupados 132
Establece diferencia y
similitud entre conceptos
básicos estadísticos.
Identifica el nivel de
medición de una variable.
Cuando se habla de planificación ésta puede ser considerada a nivel micro o a nivel macro, todo depende de
si se refiere a una parte pequeña o una parte grande, si es una unidad de un conglomerado o es el conglomerado
completo. No importa si se habla de una cosa o de la otra, en cualquier caso, se está hablando de planificación
e ineludiblemente al hablar de ésta, se está hablando de Estadística.
La estadística es la base de la planificación. Para planificar y obtener resultados acertados hay que disponer
de estadísticas confíales y oportunas. Confiable significa que respondan a la realidad y que sean de cobertura
total y lo de la oportunidad guarda referencia con el momento; un dato estadístico deja de ser bueno cuando
pierde oportunidad, es decir si no se tiene en el momento que se necesita.
El profesor/a, el director del centro y de los estamentos de dirección, no sólo deben desempeñarse con
estadísticas educativas, es decir las que se producen al interior del centro educativo, por ejemplo la cantidad
de estudiantes de la escuela, de una tanda o de grado; o en qué rango de edad se encuentran, sus calificaciones;
número de aulas, cuántos maestros/as hay en la escuela, por género, años en servicio, etc.
Pero además deben manejar otras estadísticas, como las que se refieran a la salud de los estudiantes, cuáles
son las enfermedades más frecuentes que padecen, las vacunas que les han sido administradas. Estadísticas
sociales, como lugar donde viven, con quien viven y estadísticas demográficas referidas a la población de la
comunidad y su estructura por sexo y edad, número de hermanos/as, niños/as en edad escolar, etc.
Artículo escrito por el Maestro Ezequiel Valdez, para el Minerd
Capítulo 1. Conceptos Fundamentales de la Estadística 3
1.2 Estadística
Ciencia que recoge, organiza, presenta e interpreta datos con el fin de tomar la decisión más eficaz.
Tipos de estadística
1.2.1 Estadística Descriptiva 1.2.2 Estadística Inferencial
Método para organizar, resumir y Método que emplean para determinar una
presentar datos de manera informativa. propiedad de una población con base en la
información de una muestra.
Ejemplo 1.1
La empresa de publicidad PUBLICART, con sede en Santiago, solicitó a una muestra de 1,960
consumidores que probaran un platillo con pollo recién elaborado por GOODCHICKEN. De
las 1,960 personas de la muestra, 1,176 dijeron que comprarían el alimento si se
comercializaba.
❖ Muestra
Porción o parte de la población de interés.
¿Por qué los investigadores estudian la muestra si el interés es la población?
Ejemplo 1.2
El CURSA ha entrevistado 100 estudiantes de informática para averiguar el tiempo semanal
medio que dedican a navegar por internet.
a) ¿Cuál es la población?
b) ¿Cuál es la muestra?
4 Estadística Básica
❖ Parámetro
Es una característica específica de una población.
Ejemplo 1.3
La media de las notas obtenidas por 50 estudiantes de estadística básica fue 83 puntos.
a) ¿Cuál es el parámetro?
❖ Estadístico
Es una característica específica de una muestra.
Ejemplo 1.4
La media de una muestra compuesta por las notas obtenidas de 14 estudiantes de estadística
básica fue 79 puntos. ¿Cuál es el estadístico?
❖ Datos
Son el conjunto de información recolectada.
Ejemplo 1.5
-Mediciones, respuestas de encuestas, otros.
Ejemplo 1.6
-La estatura -El peso -Estado civil
❖ Variable independiente
Es aquella que es controlada en forma sistemática por el investigador.
Ejemplo 1.7
Se estudia “el efecto de la privación del sueño con respecto al comportamiento agresivo”.
a) ¿Cuál es la variable independiente?
Capítulo 1. Conceptos Fundamentales de la Estadística 5
❖ Variable dependiente
La variable dependiente en un experimento es la que el investigador mide para determinar el
efecto de la variable independiente.
Ejemplo 1.8
En el estudio del “efecto de la privación del sueño con respecto al comportamiento agresivo”.
¿Cuál es la variable dependiente?
Ejercicio 1.1
Analice el siguiente experimento, y luego responda las 5 preguntas.
Un psicólogo de la salud está interesado en saber si la motivación del temor es eficaz para
reducir la incidencia del hábito de fumar. Cuarenta adultos fumadores son seleccionados de
entre los individuos residentes en la ciudad en donde trabaja el psicólogo. A 20 de ellos se les
pide fumar un cigarrillo, después ven una atemorizante película acerca de cómo el hábito de
fumar provoca cáncer; vívidas imágenes de los pulmones y otros órganos internos enfermos
de fumadores fallecidos se muestran en un esfuerzo de generar temor a fumar en estos sujetos.
El otro grupo recibe el mismo tratamiento, excepto que ellos ven una película neutra que no
está relacionada con el tabaquismo. Durante dos meses posteriores a la proyección de la
película, el experimentador mantiene registros de número de cigarrillos que los participantes
fuman a diario. Después calcula el promedio de cigarrillos fumados a diario de cada grupo
después de la exhibición de la película, y compara una media con la otra para determinar si la
película atemorizante surtió efectos sobre el hábito de fumar.
Preguntas
1. ¿Cuál es la variable independiente? 2. ¿Cuál es la variable dependiente?
5. ¿Cuál es el estadístico?
6 Estadística Básica
❖ Variables categóricas o cualitativas
Son aquellas que consisten en nombres o etiquetas que no representan conteos o mediciones.
Ejemplo 1.9
La afiliación a partidos políticos (PLD, PRM, PRD, PRSC, otros)
Ejercicio 1.2
Clasifica las siguientes variables en cualitativas, cuantitativas discretas o cuantitativas
continuas.
Variable Tipo de variable
1. La nacionalidad de una persona.
-Precios
8 Estadística Básica
Resumen de los niveles de medición de las variables
Nominal Ordinal Intervalo Razón
Los datos sólo se Los datos se Diferencias Punto 0 y razón entre
clasifican ordenan significativas entre valores significativas
valores
Ejemplo Ejemplo Ejemplo Ejemplo
• Números de • El número de • Temperatura • Número de pacientes
camisetas de los lista en las clases atendidos.
jugadores. de bachillerato.
Ejercicio 1.3
¿Cuál es el nivel de medición de cada una de las siguientes variables?
Variable Nivel de medición
a) Los números en las camisetas de los corredores de maratones.
❖ Fuentes primarias
Son aquellas que la persona o institución investigadora obtienen directamente de la realidad,
recogiendo los datos con sus propios instrumentos.
❖ Fuentes secundarias
Son informaciones que ya han sido producidas por otras personas o instituciones.
10 Estadística Básica
1.7 Pasos Del Método Estadístico De La Investigación Científica
❖ Método Estadístico
La investigación científica se basa en dos tipos de razonamientos: el deductivo y el inductivo,
mientras que la investigación estadística se desarrolla utilizando el ciclo deductivo-inductivo
en cuatro etapas:
1. Planteamiento del problema.
2. Recolección de la información.
3. Organización de la información.
4. Análisis e interpretación de los resultados.
1. Planteamiento Del Problema
El primer paso de la investigación es definir claramente los objetivos del estudio y relacionar este objetivo
con los valore numéricos de las variables observables. La investigación científica es una actividad con
propósito (finalidad, meta) y como tal para quedar enteramente caracterizado debe dar respuesta a las
siguientes interrogantes fundamentales:
a) ¿En qué consiste el problema objeto de investigación?
b) ¿Qué se quiere conocer?
c) ¿Por qué o para que se plantea su investigación?
d) ¿Sobre quién recae la investigación?
e) ¿Dónde se va realizar?
f) ¿Cuándo se va a realizar?
2. Recolección de la Información
La recolección correcta de los datos es de extrema importancia para el investigador, que tiene que ser
realizada o vigilada por este. Para remarcarlo los investigadores han establecido la ecuación entrada de
“datos basura” es igual salida de análisis “basura”.
Esta etapa consiste en determinar los métodos de recolección adecuado, preparar los instrumentos de
recolección, prueba del método y de los instrumentos de recolección seleccionados y realizar la
recolección de los datos.
1.4 Indique cuáles de las siguientes afirmaciones representan una variable y cuáles una
constante.
a) El número de letras del alfabeto.____________________
b) El número de horas que tiene 1 día._________________
c) La hora en que usted come_____________________
d) El número de centímetros en un metro__________________
e) Su peso____________________
1.5 Analice si las siguientes variables son discretas o continuas.
a) Número de materias que usted ha cursado en su carrera.________________
b) Peso del contenido de las cajas de cereal. __________________
c) Número de libros que usted leyó el año pasado (ojalá que hayan sido
muchos)._______________
d) Número de jonrones conectados por Samy Sosa en 1999.____________________
e) Velocidad de un automóvil en km h .________________________
12 Estadística Básica
1.6 Indique cuáles de las siguientes situaciones corresponden a la estadística descriptiva y
cuáles a la estadística inferencial.
a) Un informe anual para accionistas que detalla los bienes de la corporación._________________
b) Un profesor de historia que anuncia a su grupo el número de estudiantes que obtuvieron la máxima
calificación en un examen reciente._________________
d) El uso de los datos de una muestra en una encuesta para estimar la opinión de la
población._____________________
e) Realizar un estudio de correlación sobre una muestra para determinar si el nivel educativo y el ingreso de
la población están relacionados.____________________
1.7 Roger Amster enseña un curso de inglés para 40 estudiantes. En la clase de ayer, preguntó a los
cinco jóvenes que siempre se sientan en la parte posterior del aula si les gustaría que “A Tale of
Two Cities” fuera la tarea de lectura para la clase siguiente. Tres de los cincos dijeron que “si”.
a) Identifique la población y la muestra en este caso.
b) ¿Es probable que sea una muestra representativa? De no ser así, ¿Por qué no?
1.8 Utilice el sentido común para determinar si el acontecimiento descrito es: imposible;
posible, pero muy improbable; posible y probable.
a) Multa por exceso de velocidad. Mientras conducía a su casa en Connecticut, David fue multado
por conducir a 250 millas por hora en una ruta con un límite de velocidad de 55 millas por
hora._____________________
b) Semáforos. Mientras conducía por la ciudad, Mario se encontró con tres semáforos consecutivos
y todos estaban en verde.__________________
c) Día de Acción de Gracias. El año próximo, el Día de Acción de Gracias caerá
lunes._____________________
d) Suprema Corte. Todos los magistrados de la Suprema Corte de Estados Unidos tienen la misma
fecha de cumpleaños. ______________________
e) Calculadoras. Cuando los 25 estudiantes de estadística encienden su calculadora TI-84 plus, todas
funcionan adecuadamente. _________________
f) Dados de la suerte. Steve Wynn lanzó un par de dados y obtuvo un total de 14
puntos._________________________
g) Máquina tragamonedas. Wayne Newton obtuvo el premio mayor en la máquina tragamonedas en
10 intentos.____________________
Práctica 1. Conceptos Fundamentales de la Estadística 13
1.9 La directora de producción para la planta de Ford Motor Company, debe informar a su
superior sobre el número de días promedio que los empleados de la planta se ausentan del
trabajo. Sin embargo, la planta emplea más de dos mil trabajadores, y la directora de
producción no tiene tiempo de revisar los registros personales de cada empleado. Como
asistente usted debe decidir cómo puede ella obtener la información necesaria.
a) ¿Qué consejo podría darle?
1.10 ¿Qué nivel de medición utilizaría usted en cada uno de los siguientes casos:
a) Un sistema para evaluar a los empleados con base en el número de días que faltan al
trabajo.
c) Un sistema para registrar la población de las ciudades en las cuales viven los clientes.
1.11 ¿En cuál escala de medida puede expresarse cada una de estas variables?
a) Los estudiantes clasifican a su profesor de estadística sobre una escala de “Terrible”, “No
tan malo”, “Bueno”, “Maravillosos”, y “dios griego”
b) Los estudiantes en una universidad están clasificados por profesión, tales como marketing,
administración y contaduría.
e) Una clasificación de estudiantes que cursan primero, segundo, tercero o último grados.
1.13 ¿Cuál es el nivel de medición de los siguientes artículos relacionados con el negocio de los periódicos?
a) El número de periódicos vendidos todos los domingos durante 2011.
1.14 La empresa Gallup realizó una encuesta telefónica empleando una muestra aleatoria nacional
compuesta de 1005 adultos de 18 años o más. En la encuesta se les preguntó a los participantes “Cómo
considera que es su salud física en este momento” (www.gallup.com, 7 de febrero de 2002)”. Las
respuestas podían ser Excelente, Buena, Regular o Ninguna opinión.
a) ¿Cuál es el tamaño de la muestra de esta investigación?
b) ¿Cuál es la población?
d) ¿Sería conveniente usar promedios o porcentajes para resumir los datos de estas preguntas?
e) De las personas que respondieron, 29% dijo que su salud era excelente. ¿Cuántos fueron los individuos
que dieron esta respuesta?
Práctica 1. Conceptos Fundamentales de la Estadística 15
1.15 El Departamento de Comercio informa haber recibido las siguientes solicitudes para
concursar por el Malcolm Baldrige Nacional Quality Award: 23 de empresas fabricantes
grandes, 18 de empresas grandes de servicios y 30 de negocios pequeños.
a) ¿Es el tipo de empresa una variable cualitativa o cuantitativa?
1.16 En un estudio sobre los suscriptores de Business Week de Estados Unidos se recogen
datos de una muestra de 2861 suscriptores. Cincuenta y nueve por ciento de los
encuestados señalaron tener un ingreso de $75 000 o más y 50% indicaron poseer una
tarjeta de crédito de American Express.
a) ¿Cuál es la población de interés en este estudio?
c) ¿Es la posesión de una tarjeta de crédito de American Express una variable cualitativa
o cuantitativa?
d) Describa cualquier inferencia estadística posible para Business Week con base en esta
encuesta.
16 Estadística Básica
1.17 En otoño de 2003, Arnold Schwarzeneger disputó al gobernador Gray Davis la
gobernación de California. En una encuesta realizada entre los votantes registrados se
encontró que Arnold Schwarzeneger iba a la cabeza con un porcentaje estimado de 54%
(Newsweek, 8 de septiembre de 2003).
a) ¿Cuál fue la población en este estudio?
1.18 La UASD ha encuestado a sus estudiantes para averiguar el tiempo semanal medio que
dedican a navegar por internet.
a) ¿Cuál es la población?
b) ¿Cuál es la muestra?
c) ¿Cuál es el estadístico?
b) ¿Cuál es la muestra?
c) ¿Cuál es el estadístico?
b) ¿Cuál es el 5% de 5020?
a) ¿Cuál es el número real de usuarios de Internet que afirmaron que compran en línea de
manera frecuente u ocasional?
b) De los 734 usuarios de internet encuestados por Gallup, 323 dijeron que de manera
frecuente u ocasional realizan planes de viaje consultando información en línea. ¿Cuál
es el porcentaje de personas que afirmaron que de manera frecuente u ocasional realizan
planes de viaje consultando información en línea?
1.23 En una encuesta que realizó Gallup con 976 adultos, 68 dijeron que consumen una
bebida alcohólica al día.
b) De los 976 adultos encuestados, el 32% dijo que nunca bebe. ¿Cuál es el número real
de adultos encuestados que dijeron que nunca beben?
CAPÍTULO 2
Organización de los Datos
Distribuciones de Frecuencias y su Representación Gráfica
Competencias
Específicas
➢ Razona y argumenta.
Construye e interpreta
distribuciones de frecuencias
cualitativas y cuantitativas.
Organiza e interpreta datos
cualitativos o cuantitativos en una
gráfica apropiada.
➢ Comunica
Presenta cada paso para la
construcción de una distribución de
frecuencias cualitativa o
Fuente: Ministerio de Educación
cuantitativa.
Una vez que definimos con cuidado un problema, necesitamos
Presenta cada paso para la
recoger datos. A menudo el número de observaciones construcción de una gráfica de
recogidas es tan grande que los resultados efectivos del estudio acuerdo a la naturaleza de los datos
no están claros. Queremos reducir lo más posible una masa de y al tipo de representación que se
desee.
datos, evitando al mismo tiempo la posibilidad de ocultar
características importantes por reducirlos excesivamente. ➢ Modela y Representa
Para lograr el punto de equilibrio desafortunadamente no Modela e interpreta situaciones de
la vida diaria a través de las
existe un método único, sin embargo, la línea de ataque distribuciones de frecuencias y sus
adecuada normalmente es específica de cada problema y gráficas.
depende de dos factores: el tipo de datos y el fin del estudio.
➢ Conecta
Se ha dicho que una imagen vale más que mil palabras. Utiliza las distribuciones y las
gráficas para resumir un conjunto
Asimismo, un gráfico vale más que mil cifras.
de datos y explicarlo de una manera
sencilla.
Una vez los datos han sido recolectados, siempre debemos
preguntarnos: ¿cómo se pueden organizar? ¿Cómo se pueden ➢ Resuelve problemas
graficar? ¿Qué nos sugiere la gráfica? Resuelve problemas del contexto
educativo que impliquen
En esta unidad, se introducen tablas y gráficas adecuadas, construcciones de distribuciones y
como distribuciones de frecuencia, gráficos de barras, gráficos de gráficas.
de tarta, diagramas de pareto, gráficos de series temporales, ➢ Utiliza herramientas
histogramas, diagramas de tallo y hoja, ojivas y otras. Nuestro tecnológicas
objetivo es resumir los datos de manera que tengamos una Usa Excel, con el complemento
imagen clara y precisa. MegaStat y otras herramientas
tecnológicas para construir
Paul Newbold distribuciones de frecuencias y
gráficas.
Estadística Básica 20
2.1 Introducción
Cuando la cantidad de información recolectada es relativamente grande, para responder a cuestionantes que
impliquen generalizaciones de los datos originales, es necesario tomar en cuenta las distribuciones de
frecuencias y las gráficas, que son dos formas de resumir de manera genérica los datos originales.
2.2 Organización de los datos.
Una distribución de frecuencias es una tabla en la que organizamos los datos en clases, es decir, en grupos
de valores que describen una característica de los datos.
Ejemplo 2.2
Tabla de frecuencias relativas de los vehículos que vendió Grupo Motors por locación.
Locación Números de autos Frecuencia Relativa
Toyota 52 52
f r1 = 100% = 0.28 29%
180
Ford 40
Honda 45
Peugeot 43
Total 180
Capítulo 2. Organización de los datos 21
➢ Distribución de frecuencia cuantitativa acumulada
Otro enfoque útil para expresar los datos es la tabla de distribución de frecuencias acumuladas,
que presenta la cantidad de observaciones que están dentro o por debajo de cada una de las
clases. Cuando las frecuencias acumuladas se dividen entre el número total de observaciones,
el resultado es una tabla de distribución de frecuencias relativas acumuladas.
Ejemplo 2.3
Tabla de frecuencias relativas de los vehículos que vendió Grupo Motors por locación.
Locación Números de autos Frecuencia Acumulada
Toyota 52 F1 = 52
Ford 40 F2 = 52 + 40 = 92
Honda 45
Peugeot 43
Total 180
Ejercicio 2.1
Complete la siguiente tabla de frecuencia.
Especie en peligro de f fr F Fr
extinción en USA
Mamíferos 69
Aves 77
Reptiles 14
Anfibios 9
Peces 71
Total 240
Estadística Básica 22
➢ Distribuciones de frecuencias cuantitativas.
Es una agrupación de datos cuantitativos en clases mutuamente excluyentes que muestra el número
de observaciones en cada clase.
Considere las medidas del pulso (en latidos por minuto) obtenidas de una muestra aleatoria simple
de 20 mujeres y de otra muestra aleatoria simple de 30 hombres, con los resultados que se presentan
a continuación:
Pulsos (latidos por minutos) de hombres y mujeres
Mujeres
60 72 68 64 80 64 68 68 80 76
76 76 80 104 88 60 76 72 72 88
Hombres
68 64 8 72 64 72 60 86 76 60 84 72 56 64 60
72 56 68 64 60 68 60 60 56 84 72 84 72 84 86
El pulso es sumamente importante, ¡ya que es muy difícil sobrevivir sin él! Los médicos utilizan el
pulso para evaluar la salud de los pacientes. Cuando el pulso tiene una frecuencia demasiado elevada
o demasiado baja, esto podría indicar que existe algún problema médico; por ejemplo, un pulso muy
alto podría indicar que el paciente tiene una infección o que está deshidratado.
Un problema surge cuando trabajamos con grandes conjuntos de datos, para poder interpretar los
datos necesitamos a menudo organizarlos y resumirlos elaborando una tabla llamada distribución
de frecuencias.
Antes de seguir trabajando con la distribución de frecuencias cuantitativas es necesario dominar algunos
conceptos:
Clase. Cada categoría de la distribución de frecuencias. (La tabla #1 tiene 5 clases)
Frecuencia. La cantidad de datos que caen en cada clase. (En la tabla #1 los números 7, 7,…, son las
frecuencias)
Límites de clase. Son los valores extremos de cada clase. (Los números 60 y 69 son los límites de la primera
clase)
Rango. Es la diferencia entre el dato máximo y el mínimo. ( R = xmax − xmin ) Rv = 104 − 60 = 44
Anchura de clase. Es la diferencia entre el límite inferior de una clase y el límite inferior de la siguiente
clase. ( A = li 2 − li1 ) (10 es la amplitud, ya que 70-60 =10). Para calcular la amplitud también usaremos la
fórmula R
A=
C
Tabla #1
Latidos por minutos de las mujeres
Pulso Frecuencia
60 y menos de 70 7
70 y menos de 80 7
80 y menos de 90 5
90 y menos de 100 0
100 y menos de 110 1
Total 20
Capítulo 2. Organización de los datos 23
➢ Características de una tabla de distribución de frecuencias
Al construir una tabla de distribución de frecuencias para un conjunto de datos específicos, se
deben observar las características siguientes:
1. Las clases deben ser mutuamente excluyentes, es decir, cada dato sólo puede caer en una
clase. No debe haber traslape entre las clases: (15 y menos de 20, y 19 y menos de 25), en
estas dos clases hay traslape, ¿por qué?
2. El conjunto de clases debe ser exhaustivo, es decir, debe incluir todos los datos
considerados.
3. Si es posible las clases deben tener la misma amplitud.
4. La elección de la cantidad de clases a utilizar es un proceso subjetivo, esta debe ser
proporcional a la cantidad de datos. En general es conveniente elegir entre 5 y 20 clases.
En muchos de los casos usaremos la fórmula: C = 1 + 3.33log n , para aproximar la cantidad
de clases a utilizar.
5. Cuando sea posible las amplitudes de clases deben ser números redondos, es decir, 5,
10,15,…, 100.
Ahora veamos cómo se construye una distribución de frecuencia utilizando los pulsos de los
latidos por minutos de las 40 mujeres.
1. Rango. ( R = xmax − xmin )
R = 104 − 60 = 44
5. Calcule los límites inferiores y superiores de cada clase. Sume el ancho de la clase ( A = 10 ) al límite
inferior de la primera clase para obtener el primer límite superior, como el límite superior no está
contenido en la primera clase, ese será el límite inferior de la segunda clase. Con este algoritmo se
completa los límites en las demás clases.
Latidos por minutos
Pulso Frecuencia
60 y menos de 70
70 y menos de 80
80 y menos de 90
90 y menos de 100
100 y menos de 110
Total 20
Formato anterior
Pulso Frecuencia
60 y menos de 70 7
70 y menos de 80 7
80 y menos de 90 5
90 y menos de 100 0
100 y menos de 110 1
Total 20
Forma similar
Pulso Frecuencia
60 – 69 7
70 – 79 7
80 – 89 5
90 – 99 0
100 – 109 1
Total 20
Estadística Básica 26
Ejercicio 2.2
Construye una distribución de frecuencias para los datos dados a continuación:
Pulsos (latidos por minutos) de hombres
Hombres
68 64 8 72 64 72 60 86 76 60 84 72 56 64 60
72 56 68 64 60 68 60 60 56 84 72 84 72 84 86
Ordene los datos de menor a mayor
PASOS:
1. Busco el rango.
R = xmax − xmin
PASOS:
1. Busco el rango.
R = xmax − xmin
100 129 52 F = 52
130 159 40 F = 52 + 40 = 92
160 189 45
190 219 43
Total 180
Ejercicio 2.4
Para la siguiente tabla de frecuencia, agregue una columna de frecuencia acumulada,
frecuencia relativa, y otra de frecuencia relativa acumulada.
Edad de un grupo de personas f fr F Fr
05 - 09 6
10 - 14 2
15 - 19 10
20 - 24 4
25 - 29 1
Total 23
Capítulo 2. Organización de los datos 29
Ejemplo 2.6
Una enfermera registró el peso de 30 hombres cuya edad estaba comprendida entre 20 y 25
años. Construya una distribución de frecuencias completa.
Peso de las 30 personas
160 120 134 130 112 154 170 200 200 175
150 136 145 154 180 148 159 154 119 115
155 133 154 130 170 155 161 153 154 126
Organizamos los datos
112 115 119 120 126 130 130 133 134 136
145 148 150 153 154 154 154 154 154 155
155 159 160 161 170 170 175 180 200 200
PASOS:
1. Busco el rango.
R = xmax − xmin
30
Estadística Básica 30
Interpretación de una distribución de frecuencias.
Si tomamos la distribución del peso de los 30 hombres, se pueden extraer informaciones
interesantes.
Pesos f f r (%) F Fr (%)
110 y menos de 125 4 13.3 4 13.3
125 y menos de 140 6 20 10 33.3
140 y menos de 155 9 30 19 63.3
155 y menos de 170 5 16.7 24 80
170 y menos de 185 4 13.3 28 93.3
185 y menos de 200 0 0 28 93.3
200 y menos de 215 2 6.7 30 100
30
a) ¿Cuántos hombres tienen un peso entre 155 y menos de 170 libras?
Existen tres formas diferentes de presentar los datos estadísticos, que son: Presentación
escrita, presentación tabular y presentación gráfica.
Los elementos básicos de todo cuadro son: Título, encabezados, cuerpo del cuadro, columna
matriz y Fuente.
1. Título: 2. Encabezados:
Sirve para describir el contenido del cuadro. Son los distintos subtítulos que se colocan en
Se debe indicar que el título debe responder las la parte superior de cada columna.
inquietudes: ¿qué son los datos?, ¿dónde?,
¿cuándo? y ¿cómo se recogieron?
(Gómez, 2008)
5. Fuente:
Indica la procedencia de los datos. Cuando se usa una tabla con informaciones que ya han sido
elaboradas por otros, es un deber señalar la institución que las recopiló y presentó, Sin
embargo, si las informaciones fueron recopiladas y presentadas por la misma persona no es
necesario señalar la fuente.
De acuerdo al tipo de variable que vamos a representar, las principales gráficas son las
siguientes:
a. Gráfica de barras
b. Gráfica de pastel
c. Histograma
d. Polígono de frecuencias
e. Ojivas
f. Gráfica lineal
g. Tallo y hojas
Capítulo 2. Organización de los datos 33
a. La gráfica de barras.
Representa las frecuencias de acuerdo con las alturas relativas de un conjunto de rectángulos.
Los rectángulos adyacentes tienen una separación entre ellos. Este tipo de gráfico se usa para
representar datos cualitativos.
Ejemplo 2.8
Represente por medio de un gráfico de barras las ventas de Grupo Motors por locación
manualmente y luego utilizando Excel.
Locación Números de autos
Toyota 52
Ford 40
Honda 45
Peugeot 43
Total 180
1. Copie estos datos a
Excel.
2. Seleccionamos las
celdas que
queremos graficar.
Estadística Básica 34
3. Insertamos el gráfico
Ejemplo 2.9
Construye una gráfica de pastel con Excel usando la información de la tabla siguiente.
Gastos de la lotería del estado de Ohio en 2009
Uso del dinero de las ventas Cantidad ( en millones de dólares)
Premios 1460.0
Educación 702.3
Bonos 150
Gastos 124.3
Total 2436.6
Siguiendo los pasos para
graficar en vez de las barras Gastos de la lotería de Ohio en 2009
usamos el circular y
tendríamos.
6% 5%
Análisis gráfico
Dado que cada rebanada del
pastel representa la porción
relativa de cada componente, es
posible compararlas con
facilidad: Premios Educación Bonos Gastos
✓ El gasto más cuantioso de la
lotería se canaliza hacia los
premios (60%) Nota:
✓ Cerca de la tercera parte En la mayoría de los casos, las gráficas de pastel son las más
(29%) de los fondos informativas cuando se trata de comparar la diferencia relativa
recaudados se transfieren a en el porcentaje de observaciones de cada una de las variables
educación. de la escala nominal.
✓ Los gastos de operación
apenas significan 5% de los
fondos recaudados.
Estadística Básica 36
Ejercicio 2.6
DeCenzo Specialty Food and Beverage Company sirve una bebida de cola con un sabor
adicional, Cola-Plus, muy popular entre sus clientes. La compañía se encuentra interesada en
la preferencia de los consumidores por Cola-Plus en comparación con Coca-Cola, Pepsi y una
bebida de Lima-limón. Se pidió a 270 consumidores seleccionados de forma aleatoria que
degustaran una prueba y eligieran la bebida que más les gustaba. Los resultados aparecen en
la siguiente tabla:
Bebida Número
Cola-Plus 60
Coca-Cola 90
Pepsi 90
Lima-limón 30
Total 270
a) ¿Son los datos de naturaleza cuantitativa o cualitativa?
Gráfica de pastel
➢ Análisis gráfico
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Capítulo 2. Organización de los datos 37
c. Histograma
Describe una distribución de frecuencias mediante una serie de rectángulos adyacentes, cuya
base es proporcional a la anchura de cada clase (Valor del intervalo) y cuya altura es
proporcional a la frecuencia. En este tipo de gráfico se representan datos cuantitativos.
Ejemplo 2.10
Representa por medio de un histograma la siguiente distribución de frecuencias, usando Excel.
Cantidad de conductores en cada categoría de velocidad en un tramo de una carretera
Velocidad(MPH) Cantidad de conductores
30- menos de 40 2
40- menos de 50 9
50- menos de 60 15
60- menos de 70 28
70- menos de 80 12
80- menos de 90 6
90-menos de 100 3
Después de buscar las marcas de clases se grafican estas en el eje x y las frecuencias en el
eje y. El gráfico debe quedar así:
➢ Análisis gráfico
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Estadística Básica 38
Ejercicio 2.7
Representa por medio de un histograma la distribución de los pesos de 100 estudiantes del
CURSA que se muestra a continuación (usando Excel).
Peso (en libras) Cantidad de estudiantes
120 – menos de 130 6
130 – menos de 140 20
140 – menos de 150 30
150 – menos de 160 27
160 – menos de 170 10
170 – menos de 180 5
180 – menos de 190 2
➢ Análisis gráfico
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Capítulo 2. Organización de los datos 39
d. Polígono de frecuencias
Estrechamente relacionado con el histograma, este consiste en segmentos de líneas que
conectan los puntos formados por las intersecciones de las marcas de clases y las frecuencias
de clase.
Luego de graficar los puntos, se agregan dos clases, una en cada extremo de la escala de
valores observados. Éstas contienen cero observaciones, pero permiten que el polígono llegue
al eje horizontal en ambos extremos de la distribución.
Ejemplo 2.11
Representa por medio de un polígono de frecuencias la siguiente distribución de frecuencias,
manualmente y usando Excel.
Cantidad de conductores en cada categoría de velocidad en un tramo de una carretera
Velocidad(MPH) Cantidad de conductores Marcas de clases (x)
30- menos de 40 2 30 + 40 70
x= = = 35
2 2
40- menos de 50 9 45
50- menos de 60 15 55
60- menos de 70 28 65
70- menos de 80 12 75
80- menos de 90 6 85
90-menos de 100 3 95
Usando Excel
➢ Análisis gráfico
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
Velocidad (MPH) -------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
Estadística Básica 40
Ejercicio 2.8
Representa por medio de un polígono de frecuencia la distribución de los pesos de 100
estudiantes del CURSA que se muestra a continuación (manualmente y usando Excel).
Peso (en libras) Cantidad de estudiantes x
120 – menos de 130 6
130 – menos de 140 20
140 – menos de 150 30
150 – menos de 160 27
160 – menos de 170 10
170 – menos de 180 5
180 – menos de 190 2
➢ Análisis gráfico
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Capítulo 2. Organización de los datos 41
e. Ojiva
Recordemos que una distribución de frecuencias acumuladas nos permite ver cuántas observaciones
están por encima de ciertos valores. La gráfica de una distribución de frecuencias acumuladas se
conoce como ojiva. Una ojiva es una gráfica lineal que describe frecuencias acumuladas y utiliza
fronteras de clase a lo largo de la escala horizontal, y frecuencias acumuladas a lo largo del eje
vertical.
Ejemplo 2.12
Represente en una ojiva “menor que” la siguiente distribución, manualmente y usando Excel.
Salarios por hora (Dólares) Número de empleados
8 – 10 3
10 – 12 7
12 – 14 4
14 – 16 1
Solución:
Para lograr esto, es necesario transformar la distribución tomando en cuenta los límites
inferiores de cada clase y al final añadiremos una clase para que no queden observaciones
fuera.
Clases Frecuencias acumuladas
Menor que 8 0 ¿Por qué?
Menor que 10 3
Menor que 12 10
Menor que 14 14
Menor que 16 15
Usando Excel: Responda las siguientes
preguntas de acuerdo al
gráfico.
a) ¿Cuántos empleados
ganan menos de 10
dólares por hora?
b) ¿Cuántos empleados
ganan menos de 12
dólares por hora?
c) ¿Cuántos empleados
ganan menos de 14
dólares por hora?
d) ¿A cuántos empleados
Salario por hora
se les investigó el
salario?
Estadística Básica 42
Ejercicio 2.9
Representa en una ojiva menor la siguiente distribución, manualmente y usando Excel.
Cantidad de conductores en cada categoría de velocidad en un tramo de una carretera
Velocidad (MPH) Cantidad de conductores
30- menos de 40 2
40- menos de 50 9
50- menos de 60 15
60- menos de 70 28
70- menos de 80 12
80- menos de 90 6
90-menos de 100 3
Clases (menor que) Frecuencias acumuladas
Ventas de bikinis
350
300
250
200
150
100
50
0
Marzo Abril Mayo Junio Julio Agosto Septiembre
➢ Análisis gráfico
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Estadística Básica 44
Ejercicio 2.10
La siguiente distribución muestra los quintales de arroz vendidos por una factoría los primeros
6 meses del año 2000. Represente la información en una gráfica de línea:
Año Produción Gráfica de líneas
Enero 40
Febrero 46
Marzo 56
Abril 63
Mayo 73
Junio 78
Julio 60
Agosto 67
➢ Análisis gráfico:
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Capítulo 2. Organización de los datos 45
g. Gráfica de tallo y hojas
Una gráfica de tallo y hojas representa datos cuantitativos separando cada valor en dos partes:
el tallo (el dígito ubicado en el extremo izquierdo y la hoja (el dígito del extremo derecho).
Ejemplo 2.14
Representa el pulso de las mujeres en un diagrama de tallo y hoja
76 72 88 60 72 68 64 80 64 68 120 80 76 68 72 96 52 68 72 80
Tallo (Decenas) Hoja (Unidades)
Ejercicio 2.11
Representa el pulso de los hombres en un diagrama de tallo y hoja
68 64 88 72 64 72 60 88 76 60 96 72 56 64 60 64 84 76 84 88
72 56 68 64 60 68 60 60 56 84 72 84 72 84 88 56 64 56 56 64
Tallo (Decenas) Hoja (Unidades)
Estadística Básica 46
2.4 Tablas y gráficos para describir relaciones entre variables
En los ejemplos anteriores hemos desarrollado gráficos para describir una única variable. Estas
“imágenes” nos han ayudado a analizar mejor la información que contenía un gran conjunto de
datos. Ahora, ampliamos las medidas gráficas para describir las relaciones entre dos o más variables.
En primer lugar, presentamos un diagrama de puntos dispersos para estudiar las posibles relaciones
entre dos variables cuantitativas. A continuación, analizamos tablas cruzadas de dos variables para
examinar posibles relaciones entre variables cualitativas.
➢ Diagramas de puntos dispersos
Un diagrama de dispersión es una gráfica de datos apareados (𝑥, 𝑦). El diagrama de puntos dispersos
es una representación de los datos, que se usa para verificar la relación entre dos variables
cuantitativas.
Muchos docentes quieren hacer creer que son excelentes maestros por las “notas que sacan sus
alumnos”, pero esas calificaciones, en múltiples ocasiones suelen ser un mal indicador. Es por esta
razón que el Minerd estudia la relación existente entre “la nota de presentación de cada asignatura
y la nota obtenida en cada prueba nacional”. Veamos los siguientes ejemplos.
Ejemplo 2.15
Las siguientes calificaciones corresponden a la nota de presentación de 17 estudiantes con su
respectiva nota de la prueba nacional de matemática, en un politécnico de la ciudad de
Santiago. Represente esos datos en un diagrama de dispersión:
Datos hipotéticos de la nota de presentación de un politécnico y el resultado de la prueba de matemática
N P 55 56 60 62 63 63 64 64 65 67 67 68 68 69 69 69 69
NPN 23 24 25 26 26 27 15 26 27 28 28 29 29 28 17 30 30
Para hacer el gráfico manualmente solo marcamos un punto en cada par ordenado. Si
deseamos hacerlo en Excel seleccionamos los datos e insertamos un gráfico de dispersión,
resultando una imagen como la siguiente:
Análisis gráfico:
Relación entre la nota de presentación y la
Una interesante pauta es la tendencia
nota de prueba nacional de matemática
ascendente positiva: la nota de la
32 prueba nacional tiende a aumentar
30
directamente con la nota de
30% (Prueba nacional Mat)
28
26 presentación. Obsérvese también que la
24 relación no suministra una predicción
22 exacta. Algunos estudiantes que
20 obtienen una alta nota de presentación
18
de matemática tienen una calificación
16
14
baja en la prueba nacional. Vemos que
12 la pauta básica indica que las notas más
10 altas obtenidas en la nota de
54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 presentación predicen mayores
70% (Nota de presentación Mat) calificaciones en las pruebas, pero los
resultados no son perfectos.
Capítulo 2. Organización de los datos 47
Ejemplo 2.16
Las siguientes calificaciones corresponden a la nota de presentación de 17 estudiantes con su
respectiva nota de la prueba nacional de matemática, en un politécnico de la ciudad de
Santiago. Representa los datos en un diagrama de dispersión:
Minerd, nota de presentación y la de prueba nacional de matemática de los estudiantes del
aérea de mecatrónica de un politécnico de la regional 08, 1ra convocatoria, 2015.
NP 53 57 50 56 53 53 56 53 55 60 50 51 68 57 60 51 62
NPN 18 15 18 17 18 21 17 21 21 20 19 16 17 20 16 16 17
Representa los datos en un diagrama de dispersión:
Análisis gráfico:
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Estadística Básica 48
2.4.1 Tablas cruzadas
Una tabla cruzada, llamada a veces tabla de contingencia, enumera el número de observaciones
correspondiente a cada combinación de valores de dos variables categóricas u ordinales. La combinación de
todos los intervalos posibles de las dos variables define las casillas en una tabla. Una tabla cruzada de r filas
y c columnas se denomina tabla cruzada de dimensión r×c.
En cada zona residencial, se contactó con 250 hogares por teléfono y se les pidió que indicaran cuál de tres
categorías de productos habían comprado la última vez que habían ido a una tienda de materiales de
construcción.
La encuesta se realizó para determinar la demanda de herramientas, madera y pintura. Las tres zonas
residenciales contienen el mismo número de hogares y, por lo tanto, la muestra aleatoria de 750 representa
la población de hogares de toda la ciudad.
Ejemplo 2.17
Tabla cruzada de la demanda de productos por parte de los hogares por zonas residenciales
Zona Herramientas Madera Pintura Ninguna Total
Este 100 50 50 50 250
Norte 50 95 45 60 250
Oeste 65 70 75 40 250
Total 215 215 170 150 750
Gráfica Análisis gráfico:
-----------------------------------------------------------
Demanda de productos por parte de los
-----------------------------------------------------------
hogares por zona de residencia -----------------------------------------------------------
-----------------------------------------------------------
100
Número de hogares
-----------------------------------------------------------
80
-----------------------------------------------------------
60 -----------------------------------------------------------
40 -----------------------------------------------------------
-----------------------------------------------------------
20
-----------------------------------------------------------
0
Este Norte Oeste -----------------------------------------------------------
-----------------------------------------------------------
Herramientas Madera Pintura Ninguna
-----------------------------------------------------------
-----------------------------------------------------------
Capítulo 2. Organización de los datos 49
2.4.2 Gráfica de barras múltiples o compuestas
Ésta contiene dos o más conjuntos de barras, y se utiliza para comparar dos o más conjuntos
de datos.
Ejemplo 2.18
Construya una gráfica de barras múltiples de los datos, y luego describa cualquier tendencia
de la siguiente tabla que incluye el número (en miles) de hombres y mujeres estudiantes de
educación superior en diferentes años en Estados Unidos.
Año 2004 2005 2006 2007 2008 2009 2010
Hombres 7268 7356 7568 7568 7695 7802 7872
Mujeres 9826 9995 10,203 10,407 10,665 10,838 10,944
Fuente: National Center for Education Statistics
Gráfica de barras múltiples
Anáilisis gráfico:
-------------------------------------------------------------------------------
-------------------------------------------------------------------------------
-------------------------------------------------------------------------------
-------------------------------------------------------------------------------
-------------------------------------------------------------------------------
-------------------------------------------------------------------------------
-------------------------------------------------------------------------------
Ejercicio 2.12
Un estudiante universitario en su primer ciclo tomó las siguientes asignaturas, sacando las
calificaciones que se muestran a continuación, en tres parciales de 20 puntos.
Asignaturas 1er parcial 2do parcial 3er parcial
Matemática 16 18 20
Español 12 20 20
Biología 14 14 18
Geografía 16 15 14
Inglés 15 14 18
Gráfica de barras múltiples
➢ Análisis gráfico
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
Estadística Básica 50
2.4.3 Gráfica de barras por componentes o superpuestas.
En esta gráfica se representan todas las variables en una barra.
Ejemplo 2.19
La siguiente distribución muestra los volúmenes de ventas de los productos A, B y C en los
primeros 4 meses del año 2012 de una compañía. Construye una gráfica de barras
componentes o superpuestas.
Meses A B C Total
Enero 25 35 40
Febrero 35 45 20
Marzo 40 20 10
Abril 50 15 5
Gráfica de componentes o superpuestas
➢ Análisis gráfico
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
Ejercicio 2.13
Representa la siguiente distribución de las ventas de vehículos en una gráfica de barras
componentes o superpuestas.
Meses Toyota Ford Honda Peugeot Total
Enero 52 40 45 43
Febrero 60 43 53 30
Marzo 59 41 56 31
Abril 65 45 64 25
Gráfica de barras componentes
➢ Análisis gráfico
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
Capítulo 2. Organización de los datos 51
2.4.4 Gráfica de líneas múltiples.
Ésta contiene dos o más conjuntos de líneas, y se utiliza para comparar dos o más conjuntos
de datos.
Ejemplo 2.20
Construya una gráfica de líneas múltiples de los datos, y luego describa cualquier tendencia
de la siguiente tabla que incluye el número (en miles) de hombres y mujeres estudiantes de
educación superior en diferentes años en Estados Unidos.
Año 2004 2005 2006 2007 2008 2009 2010
Hombres 7268 7356 7568 7568 7695 7802 7872
Mujeres 9826 9995 10,203 10,407 10,665 10,838 10,944
Fuente: National Center for Education Statistics
➢ Análisis gráfico:
-------------------------------------------------------------
-------------------------------------------------------------
-------------------------------------------------------------
-------------------------------------------------------------
-------------------------------------------------------------
-------------------------------------------------------------
-------------------------------------------------------------
-------------------------------------------------------------
-------------------------------------------------------------
Ejercicio 2.14
Construya una gráfica de líneas múltiples para la distribución de los autos vendidos de una
agencia de vehículos al inicio del año 2010.
Condición Toyota Honda Peugeot Kia
Nuevos 30 20 5 25
Usados 60 55 10 70
Chocados y reparados 45 30 2 50
Gráfica de líneas múltiples
➢ Análisis gráfico:
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
52 Estadística Básica
UNIVERSIDAD AUTÓNOMA DE SANTO DOMINGO
ESTADÍSTICA BÁSICA
PRÁCTICA 2
ORGANIZACIÓN DE LOS DATOS.
2.1 Responde:
a) ¿Cuál es la diferencia entre los datos originales (sueltos) y una distribución de frecuencia?
b) ¿Por qué es útil convertir los datos originales (sueltos) en una distribución de frecuencia?
2.2 Grupos sanguíneos. A continuación se presenta una lista de los grupos sanguíneos O, A, B, y AB de
donadores de sangre elegidos al azar. Construya una tabla donde resuma la distribución de frecuencias
de esos grupo sanguíneos.
2.5 Un conjunto de datos consta de 230 observaciones entre $235 y $567. ¿Qué intervalo de
clase recomendaría?
2.6 Un conjunto de datos contiene 53 observaciones. El valor más bajo es 42 y el más alto
129. Los datos se van a organizar en una distribución de frecuencias.
PASOS:
a) Busco el rango. R = xmax − xmin
d) Construye la tabla.
Práctica 2. Organización de los datos 55
2.8 Quick Change Oíl Company cuenta con varios talleres en el área metropolitana de Seattle.
Las cantidades diarias de cambios de aceite que se realizaron en el taller de Oak Street
los pasados veinte días son las siguientes:
65 98 55 62 79 59 51 90 72 56
70 62 66 80 94 79 63 73 71 85
b) ¿Se comportan los conductores del distrito nacional en ese tramo de acuerdo al informe
de la AMET?
c) La AMET asegura que la velocidad más segura para este tramo es 30 a 59 mph. ¿Qué
proporción de conductores maneja dentro de este intervalo?
Práctica 2. Organización de los datos 61
2.15 La siguiente tabla muestra los idiomas más hablado del mundo y el número aproximado
de hablantes expresado en millones. Represente estos datos en una gráfica de barras.
Gráfica de barras
Análisis gráfico
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
62 Estadística Básica
2.16 La compañía Northwind Traders Tea recibe un informe acerca de las ventas de las cajas
de los productos que 6 empleados han podido poner en el mercado en el primer trimestre
del año 2000. Construye una gráfica de barras múltiples.
Informe de ventas
Empleados Enero Febrero Marzo
Tomás Navarro 55 85 66
María Gonzáles 68 78 94
Antonio Bermejo 77 75 80
Fabricio Noriega 71 65 78
Arturo López 75 78 85
Enrique Gil 68 85 86
Análisis gráfico
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Práctica 2. Organización de los datos 63
2.17 Representa la distribución de las ventas anterior en una gráfica de barras superpuestas
o por componentes.
Informe de ventas
Empleados Enero Febrero Marzo
Tomás Navarro 55 85 66
María Gonzáles 68 78 94
Antonio Bermejo 77 75 80
Fabricio Noriega 71 65 78
Arturo López 75 78 85
Enrique Gil 68 85 86
Gráfica de barras superpuestas
Análisis gráfico
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
64 Estadística Básica
2.18 Construye una gráfica circular a partir del número de medallas obtenidas por cada país
en las Olimpiadas de Invierno del 1998.
Análisis gráfico
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Práctica 2. Organización de los datos 65
2.19 Las notas obtenidas de 50 estudiantes del CURSA en estadística básica se muestran en
la siguiente distribución. Construye un histograma.
Notas Frecuencia
55 y menos de 60 5
60 y menos de 65 6
65 y menos de 70 8
70 y menos de 75 20
75 y menos de 80 7
80 y menos de 85 4
85 y menos de 90 2
90 y menos de 95 1
Gráfica histograma
Análisis gráfico
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
66 Estadística Básica
2.20 Construye un polígono de frecuencia con la distribución de frecuencia de las notas de
los estudiantes del punto anterior.
Notas Frecuencia
55 y menos de 60 5
60 y menos de 65 6
65 y menos de 70 8
70 y menos de 75 20
75 y menos de 80 7
80 y menos de 85 4
85 y menos de 90 2
90 y menos de 95 1
Análisis gráfico
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Práctica 2. Organización de los datos 67
2.21 Representa en una ojiva menor la distribución de los pesos de 35 estudiantes del CURSA
que se muestra a continuación.
Análisis gráfico
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
68 Estadística Básica
2.22 Representa con un gráfico de líneas la cantidad anual de niños vacunados en una
población.
Años Niños vacunados
1980 805
1985 1250
1990 3500
1995 6550
2000 7200
Gráfica de líneas
Análisis gráfico
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Práctica 2. Organización de los datos 69
2.23 La tabla que se presenta a continuación refleja los indicadores de promoción y
aplazamiento de los estudiantes que asistieron a la primera convocatoria de pruebas
nacionales, de la modalidad general, del nivel secundario, del distrito 04,
de la regional 08, año 2015-2016
TANDA PROMOVIDO (%) APLAZADO (%)
JEE 67 33
JER 68 32
JEN 47 53
TOTAL 100 100
Análisis gráfico
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
70 Estadística Básica
2.24 Una compañía estudia el uso de cajeros automáticos en una ciudad. Una muestra de 30
cajeros mostró que éstos se utilizaron la siguiente cantidad de veces el día de ayer.
Elabore un diagrama de tallo y hojas.
83 64 84 76 84 54 75 59 70 61
63 80 84 73 68 52 65 90 52 77
95 36 78 61 59 84 95 47 87 60
Diagrama de tallo y hojas
Tallo Hojas
2.25 Molly’s Candle Shop tiene diversas tiendas de venta de menudeo en las áreas costeras
de Carolina del Norte y Carolina del Sur. Muchos de los clientes de Molly´s han
solicitado que les envíe sus compras. La siguiente gráfica muestra el número de paquetes
enviados por día durante los pasados 100 días.
2.27 La siguiente gráfica muestra los salarios por hora que percibe una muestra de soldadores
en la zona de Atlanta, Georgia. (Ojiva menor que)
c) ¿Alrededor de 75% de los soldadores ganan menos de cierta cantidad? ¿Qué cantidad
es ésta?
Color de pelo
Rubio
Pelirrojo
Moreno
b) ¿La mayoría de los días, la temperatura fue bajo cero o sobre cero?_________________
2.32 ¿Cuántos mensajes se enviaron en los últimos tres meses del año?
a)10 b) 17 c) 9 d) 20 e) 35
Imagine que el maestro de estadística dio un examen con un valor de 20 puntos a un grupo de
20 participantes y los resultados fueron los siguientes:
20 13 7 12 18 16 17 9 11 10
12 18 14 17 3 5 6 3 1 15
Un participante le pregunta al facilitador, ¿cómo nos fue profe?, si usted fuera el facilitador,
¿qué le responde?
Una pregunta cómo esta podríamos responderla con un número que represente el equilibrio
de los datos. A las medidas que se sitúan en el centro de un conjunto de datos se le conoce
como medidas de tendencia central.
Antes de continuar con el estudio de las medidas de tendencia central, necesitamos revisar el
concepto de sumatoria por su aplicación en este tema.
En lugar de escribir todos esos términos, introducimos una manera más concisa de expresar
dicha suma, llamada notación de sumatoria. Utilizando dicha notación, podemos escribir la
suma como:
n
X
i =1
i = X 1 + X 2 + X 3 + ... + X n ; donde i, n N
SÍMBOLO SIGNIFICADO
Letra griega mayúscula sigma, que indica sumatoria.
Estos naturales indican dónde inicia y dónde termina la suma,
respectivamente.
Variable
NOTA:
Cuando la sumatoria se realiza con todos los datos (de 1 a n) se abreviará de la siguiente manera:
Capítulo 3. Medidas de Tendencias Céntricas 77
Ejemplos 3.1
Para los siguientes datos, determine la sumatoria correspondiente.
1. X: 6, 8, 9, 10
4. Z: 2, -12, 14, 16
5. Z: 2, -12, 14, 16
6. X: 6, 8, 9, 10
7. X: 6, 8, 9, 10
PROPIEDADES DE LA SUMATORIA
No PROPIEDAD SIGNIFICADO
1 La sumatoria de una constante es igual a n veces la constante.
Fórmula para la media de una muestra Fórmula para la media de una población
x x
x= =
n N
Ejemplo 3.2
Las notas de dos estudiantes del Liceo Nocturno “Aguas de Amor” en el primer cuatrimestre
fueron las siguientes.
Alumnos Nota 1 Nota 2 Nota 3 Nota 4 Promedio
A 85 90 98 95
B 94 85 80 75
a) ¿Qué se observa en el comportamiento de las notas del alumno A?
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
b) ¿Qué se observa en el comportamiento de las notas del alumno B?
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
c) Si usted es el/la director/a del liceo, ¿qué harías en el segundo mes para evitar el declive
de las notas de este estudiante?
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Capítulo 3. Medidas de Tendencias Céntricas 79
➢ Ventajas y desventajas de la media aritmética
Ejercicio 3.1
Complete la tabla y deduzca qué sucede.
Datos Media
1, 2, 5, 9, 10
1, 2, 5, 9, 100
1, 2, 5, 9, 1000
1, 2, 5, 9, 10000
➢ ¿Qué ventajas posee la media? ➢ ¿Qué desventajas tiene la media?
Ejercicio 3.3
Complete la tabla y deduzca qué sucede.
Datos Promedio x−x
2 2 + 5 +1+ 4
x=
5 4
1 12
4 x= x=3
4
n=4
( x − x) =
o ¿Cuál fue el resultado de la sumatoria de las desviaciones con respecto a la media?
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
o Ventaja
Una ventaja de la media es que resulta relativamente confiable, de manera que cuando se seleccionan
muestras de la misma población, las medias muéstrales tienden a ser más consistentes que otras
medidas de tendencia central.
3.3 Características de la media aritmética
1. Todo conjunto de datos cuantitativos posee una media y esta es única.
2. Todos los valores se encuentran incluidos en el cálculo de la media.
3. La media es muy sensible a los datos extremos. Un valor extremo perturba
considerablemente el equilibrio de los datos.
4. La suma de las desviaciones de cada valor con respecto a la media es cero. ( X − ) = 0
80 Estadística Básica
o Desventaja de la media
Una desventaja de la media es su sensibilidad a los valores extremos, la mediana resuelve en
gran medida, esa desventaja. La mediana es el valor intermedio, ya que la mitad de los datos
están por debajo de la mediana y la otra mitad por encima de ella.
Ejemplo 3.3
Calcule la mediana de los siguientes datos:
Datos Ordene los datos Mediana
a) 8, 10, 4, 3, 1, 15
b) 2.5, 1.8, 1.2, 2.48, 2.0
c) 2, 3, 5, 7, 10
d) 2, 3, 5, 7, 100
e) 2, 3, 5, 7, 1000
➢ ¿Qué observa en los ejemplos c, d, y e? ¿A qué conclusión llegas?
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
3.5Características de la mediana
1. En su cálculo no se incluyen todos los valores de la variable.
2. La mediana no es afectada por los valores extremos.
Capítulo 3. Medidas de Tendencias Céntricas 81
3.6 Moda para datos sueltos
La moda es otra medida de tendencia central de importancia en la descripción y resumen de
una distribución de frecuencias.
Es utilizado en el lenguaje común, por ejemplo, ¿cuándo las damas dicen que una cartera está
de moda? En estadística se tiene una idea similar de la moda de un conjunto de datos.
Moda
Se define como el dato con mayor frecuencia.
Ejemplo 3.4
Complete la tabla.
Datos Moda
a) 1, 2, 4, 2, 3
b) 1, 2, 5, 9, 4, 999
c) 1, 2, 1, 2
d) 1, 2, 1, 2, 5
e) 1, 2, 5, 9, 5, 555
3.7Características de la moda
1. En su cálculo no se incluyen todos los valores de la variable.
2. No es afectada por los valores extremos.
3. El valor de la moda puede afectarse de acuerdo con el método de designación de los intervalos.
82 Estadística Básica
o Comparación entre la media, mediana y moda.
Al decidir si vamos a utilizar la media aritmética, mediana o moda en una distribución
unimodal, se debe tomar en cuenta la forma la distribución de los datos, que puede ser de tres
maneras: simétrica, con sesgo positivo o con sesgo negativo.
1. Una distribución es simétrica cuando la curva que la representa es exactamente igual a ambos
lados de un punto de referencia. Si una distribución es simétrica decimos que es insesgada. En
este tipo de distribución la media, mediana y la moda son iguales. Por tanto, cuando la
distribución es simétrica no importa la medida que se use, pues son iguales. Observa la figura 1.
2. Una distribución de datos tiene asimetría positiva o está sesgada a la derecha si la cola se
extiende más a la derecha del pico que a la izquierda. En este tipo de distribución la
𝑀𝑜𝑑𝑎 < 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 < 𝑀𝑒𝑑𝑖𝑎. En distribuciones sesgadas la mediana suele la mejor opción.
Observa la figura 2.
Esta misma fórmula se usará cuando los datos aparezcan ordenados en una distribución de
li + ls
frecuencia con la salvedad de que x = es el punto medio de cada clase.
2
Es preciso indicar que cuando tenemos una tabla de frecuencia no es posible buscar la media
real, ya que no tenemos los datos puntuales, lo que buscamos es una aproximación de la media
aritmética.
Ejemplo 3.5
La siguiente tabla presenta la estatura de una muestra de 100 estudiantes elegidos
aleatoriamente de 4to grado del liceo “El Señor es mi Pastor”. Calcule la estatura media.
Estatura (pulg.) f x=
li + ls f x
2
60 – 62 5
63 – 65 18
66 – 68 42
69 – 71 27
72 – 74 8
n = f = 100 ( f x) =
Sustituya:
x=
( f x) x=
n
a) ¿Cuál es la estatura media?
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
111 - 121 5
122 - 132 12
133 - 143 15
144 - 154 20
155 - 165 45
166 - 176 8
177 - 187 5
( )
________________ f x =
c) Imagine que usted tiene una tienda de ropa para hombres cerca del CURNO, ¿Qué usted
haría con este dato?
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Capítulo 3. Medidas de Tendencias Céntricas 85
3.9 Mediana para una muestra de datos agrupados
Si los datos aparecen agrupados para determinar la mediana se usará la fórmula:
n − Fi−1
x = li + 2 c
fi
Símbolo Significado
li Es el límite inferior de la clase que tiene la mediana.
n Es la mitad del número de datos (recuerde que la mediana se sitúa en la mitad de los datos)
2
Fi−1 Es la sumatoria de las frecuencias que están por debajo de la clase que contiene a la mediana.
155 - 165 13 92 n − Fi −1
x = li + 2 c
166 - 176 5 97 fi
50 − 25
x = 133 + 11
35
177 - 187 2 99
25
x = 133 + 11
35
x = 133 + 7.86
188 - 198 1 100 6. Sustituyo en la fórmula
x = 140.86
Respuestas:
El peso promedio mediano de los 110 estudiantes es de 140.86 libras aproximadamente.
86 Estadística Básica
Ejercicio 3.3
Encuentre la mediana de la distribución de la estatura de 100 basquetbolistas.
Estatura (pulg.) f F Solución
60 - 62 5 1. Busco dónde está la clase mediana. n 2 =
63 - 65 18
c = li2 − li1
2. Tamaño de la clase.
66 - 68 42 c =
69 - 71 27 3. Determino a Fi−1 =
72 - 74 8
4. Busco a li =
n = 100
5. Determino a fi =
n − Fi −1
6. Sustituya en la fórmula x = li + 2 c
fi
Respuesta:
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Capítulo 3. Medidas de Tendencias Céntricas 87
3.10 Moda de una muestra de datos agrupados
Si los datos aparecen agrupados para determinar la moda se usará la fórmula:
d c
mod = li + 1
d1 + d 2
Nota:
d1 = f m − f m −1
d 2 = f m − f m +1
Ejemplo 3.7
Calcule la moda de la distribución del peso (libras) de 110 estudiantes de la escuela de
estadística.
Peso (libras) f Solución
100 - 110 7 4 d1 = fm − fm−1 d1 = 35 − 20 = 15
133 - 143 35 d1 c
mod = li +
d1 + d 2
15 11
144 - 154 19 mod = 133 +
15 + 16
4. 165
155 - 165 13 mod = 133 + 31
mod = 133 + 5.32
166 - 176 5
mod = 138.32
88 Estadística Básica
Respuesta:
El peso más frecuente de las personas es 138.32 libras.
Ejercicio 3.4
Encuentre la moda de la distribución de la estatura de 92 personas de un sector de Santiago.
60 - 62 5
1. d1 = fm − fm−1 d1 =
63 - 65 18 2. d2 = f m − f m+1 d2 =
66 - 68 42 3. c = li2 − li1 c =
69 - 71 27 d1 c
4. mod = li +
d1 + d 2
Respuesta:
-----------------------------------------------------
-----------------------------------------------------
-----------------------------------------------------
-----------------------------------------------------
-----------------------------------------------------
-----------------------------------------------------
-----------------------------------------------------
-----------------------------------------------------
Capítulo 3. Medidas de Tendencias Céntricas 89
Ejemplo 3.8
Una estudiante obtuvo calificaciones de 90 puntos en el examen parcial, 70 puntos en el
examen final y 83 puntos en un proyecto semestral. Si estas tres notas se importantizan en
20%, 70% y 10% respectivamente, ¿Cuál es la media de las calificaciones?
Solución:
90 + 70 + 83
x= = 81
3
➢ ¿Será 81 realmente la media que representa estos datos? ¿Qué debilidad tiene esta
media?
Respuesta
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Ejercicio 3.5
Considere la siguiente muestra de cinco valores y las ponderaciones correspondientes y
calcule su media:
x w 𝑥∗𝑤
4.6 8
3.2 3
5.4 6
2.6 2
5.2 5
Solución y Respuesta:
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Capítulo 3. Medidas de Tendencias Céntricas 91
3.11 Media geométrica
Imagina que tenemos tres elementos consecutivos a, m y b de una
progresión geométrica como se muestra en la figura que está a la derecha.
m b
Esto significa, que r = = , lo que implica que m2 = ab m = ab , a esta
a m
expresión se le conoce como la media geométrica para dos valores, pero si
son varios valores, entonces, la media geométrica es:
xg = n x1 x2 x3 xn
Ejemplos 3.10
Calcula la media geométrica de:
Datos Media geométrica
a) 2, 18
b) 9, 3, 3
c)1, 3, 9, 2
d)2, 3, 5, 6, 1
Nota:
La media geométrica suele utilizarse para promediar por ciento (tasa de interés). Cuando
trabajamos con cantidades que cambian cada cierto tiempo y se requiere conocer una tasa
promedio de cambio utilizamos la media geométrica.
Respuestas:
La fábrica aumentó 8.98% en promedio la producción anual de tableros de circuitos eléctricos.
Ejercicio 3.6
La siguiente distribución presenta el gasto (millones de pesos dominicanos) del gobierno
central durante el periodo 1992-1996. Calcule el aumento porcentual promedio del
crecimiento en cada año.
Año Gasto Factor de crecimiento
1992 16,056
1993 20,727.5
1994 23,135.3
1995 24,107.4
1996 27,691.1
Solución:
Respuesta:
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Capítulo 3. Medidas de Tendencias Céntricas 93
Otro modelo de aplicación de la media geométrica se relaciona con la determinación de un
cambio porcentual promedio durante cierto periodo. Por ejemplo, si usted ganó $30 000 en el
año 2000 y $50 000 en el 2010, ¿cuál es la tasa anual de incremento durante el periodo? Ésta
es de 5.24%. La tasa de incremento porcentual promedio se deduce a partir de la fórmula del
interés compuesto:
s = c (1 + i ) c (1 + i ) = s
n n
s s
(1 + i ) (1 + i )
n
=
n
n
= n
c c
s s
1+ i = n i= n −1
c c
Ejemplo 3.13
Una persona toma prestado de 827,000 pesos en el año 2015 y debe de pagar un total de
1, 665,000 en 2020. Durante este periodo:
a) ¿Cuánto pagó de intereses?
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
94 Estadística Básica
3.13 Características y aplicaciones de la media geométrica.
1. Toma en cuenta todos los valores de la variable. Si uno de los valores es cero, la media
geométrica dará cero.
2. La media geométrica es afectada por datos extremos, aunque en menor medida que la
media aritmética.
3. Es mayormente usada para promediar tasas de cambio, razones y valores que muestren una
progresión geométrica.
xa = 4.25
Respuestas:
La media armónica de la muestra de datos es 4.25
3.15 Características y aplicación de la media armónica:
1. Se toman en cuenta todos los valores de la variable para su cálculo.
2. Es menos afectada por los datos extremos.
3. El uso de la media armónica no es común, sin embargo, es de gran utilidad cuando se trata
de algunas magnitudes físicas y otros campos relacionados.
Capítulo 3. Medidas de Tendencias Céntricas 95
3.16 Media cuadrática
La media cuadrática se define como la raíz cuadrada de la media aritmética de los cuadrados
de los valores de la variable. La fórmula es:
xc =
x 2
N
Esta medida es útil en muchos cálculos de ciencias.
Ejemplo 3.15
Calcule la media cuadrática de los datos: 1, 3, 4, 5, 7
Solución
12 + 32 + 42 + 52 + 72
xc =
5
1 + 9 + 16 + 25 + 49
xc =
5
100
xc = = 20 = 4.47
5
xc = 4.47
Respuestas:
La media cuadrática de la muestra de datos es 4.47
Ejercicio 3.9
Encuentre la media cuadrática para los siguientes datos muestrales: 10, 12, 24, 13,15, 22
Solución:
Respuesta:
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
3.17 Características y aplicación de la media cuadrática:
1. En el cálculo de media cuadrática se emplean todos los datos de la variable.
c) ¿Cuál es el por ciento de estudiante que obtuvo una nota igual o superior a 88 puntos?
PRÁCTICA 3
MEDIDAS DE TENDENCIAS CENTRÍCAS
a) 2, 4, 5, 7
b) 2.1, 3.2, 3.6, 5.0, 7.2
c) 11, 14, 18, 22, 25, 28, 30
d) 110, 112, 115, 120, 133
3.2 Represente cada una de las siguientes expresiones por medio de la notación de sumatoria:
a ) x1 + x2 + + x10 =
b) x1 + x2 + x3 =
n
b) ( xi − 3) =
i =1
n
c ) ( 2 xi ) =
i =1
n
x
d ) i =
i =1 4
98 Estadística Básica
3.4 Calcule la media, la mediana y la moda de los siguientes datos:
Datos Media Mediana Moda
5, 2, 8, 2, 3, 2, 4, 0, 6
3.5 Para el siguiente conjunto de datos, indique si utilizaría la media o la mediana para
representar la tendencia central de la distribución y explique las razones de su decisión.
Datos:
1.2, 0.8, 1.1, 0.6, 25
Explicación:
3.6 Estudio de casos. En un estudio que se realizó en un asilo de ancianos, se tomó las edades
de los envejecientes que pueden caminar sin dificultades. Busque la media, mediana y
moda de los siguientes datos: 69 73 65 70 71 74 65 69 60 62
Práctica 3. Medidas de Tendencia Céntricas 99
3.7 Ciencias. Un científico social para una organización defensora de la niñez seleccionó de
manera aleatoria 10 programas de caricaturas por televisión del sábado en la mañana y
efectuó un análisis del contenido, donde cuenta la cantidad de incidentes de violencia física
o verbal en cada uno. Para las 10 caricaturas examinadas, estas fueron las cuentas: 27, 12,
16, 22, 15, 30, 14, 30, 11 y 21. Determine la media, la moda y la mediana para estos datos.
20 73 75 80 82
3.6El director de unos grandes almacenes tiene interés en saber cuántas reclamaciones recibe
el departamento de atención al cliente sobre la calidad de los aparatos eléctricos que
venden los almacenes. Los registros de un periodo de 5 semanas muestran el siguiente
número de reclamaciones semanales:
13 15 8 16 8
c) Halle la moda.
c) ¿Cuál es la moda?
Práctica 3. Medidas de Tendencia Céntricas 101
3.8Una cadena de grandes almacenes eligió aleatoriamente 10 establecimientos situados en
una región. Tras examinar los datos de ventas, observó que ese año se habían conseguido
en las Navidades los siguientes aumentos porcentuales de las ventas en dólares con
respecto al año anterior:
b) Calcule la mediana.
a) Describa la media.
b) Determina la mediana.
c) Determina la moda.
Número de defectos 0 1 2 3
Número de radios 12 15 17 6
1, 2, 5, 9, 4, 999
3.12 Durante un período de una hora en una tarde calurosa de un sábado, el cantinero Julio
sirvió cuatro bebidas. Calcule la media ponderada de los precios de las bebidas
(Precio ($), cantidad vendida).
Bebidas Precio Cantidad PC Proceso
B1 50 5
B2 75 15
B3 90 15
B4 110 15
Total
3.13 Suponga que el Hospital Regional Universitario José María Cabral y Báez tiene 200
empleados en su personal de enfermería. 50 son auxiliares de enfermería; 50 enfermeras
practicantes, y 100 son enfermeras tituladas. Las auxiliares de enfermería ganan 200 pesos
la hora; las enfermeras practicantes 300 pesos y los titulados 400 pesos la hora. ¿Cuál es
el salario promedio ponderado por hora?
Práctica 3. Medidas de Tendencia Céntricas 103
3.14 A continuación, se mencionan las materias que Luís Pérez llevó en el primer semestre
de Ingeniería Química, el número de créditos y la calificación obtenida, determine la
calificación promedio que obtuvo Luís Pérez en su primer semestre. Utilice la media
ponderada.
Materia Número de Calificación Producto Proceso
créditos (1) (2)
Metodología de la Inv. 3 90
Matemática 1 4 100
Programación 8 81
Química 10 78
Dibujo 6 100
Economía 4 84
Total
3.15 Calcular la media geométrica de los siguientes datos:
Datos Proceso
1, 2, 4, 2, 3
1, 2, 5, 9, 4, 9
3.16 El crecimiento en el gasto por deudores morosos de una compañía financiera durante
los últimos años es el que se muestra a continuación. Calcule el incremento promedio
porcentual del gasto por deudores morosos durante ese periodo.
Año Tasa de Factor de Proceso
interés crecimiento
2008 0.110
2009 0.090
2010 0.075
2011 0.080
2012 0.095
2013 0.108
2014 0.120
3.17 En 1985 había 340,213 suscriptores a la telefonía celular en Estados Unidos. En 2008,
el número de suscriptores aumentó a 262, 700,000.
a) En número de suscriptores, ¿de cuánto fue el incremento para este periodo?
c) ¿Cuál es el por ciento de estudiante que obtuvo una nota igual o superior a 85 puntos?
✓ Comunica
Explica cómo se obtiene la
los cuartiles, deciles y
percentiles para datos
sueltos y agrupados.
Fuente: Ministerio de Educación
✓ Modela y Representa
La nutrición es la ingesta de alimentos en relación con las necesidades Modela situaciones, donde
dietéticas del organismo. Una buena nutrición (una dieta suficiente y
se pueda calcular las
equilibrada combinada con el ejercicio físico regular) es un elemento
fundamental de la buena salud.
medidas de posiciones.
Los percentiles se representan con la letra P y la localización del percentil estará dada por la
fórmula:
k ( n + 1)
Lk =
100
Ejemplo 4.1
En la siguiente tabla aparecen las comisiones (en dólares) que ganó el último mes una muestra de 19
corredores de bolsa de la oficina de Salomón Smith, California. Esta compañía de inversiones tiene oficinas
a lo largo de Estados Unidos.
2038 1721 1721 1637 2097 2047 2205 2287 1741 1932
1940 2311 2054 2046 1471 1460 1787 1900 1800 ------
𝑎)𝑃20 =
Solución Resultado Respuesta
𝑏)𝑃24 =
Solución Resultado Respuesta
𝑐)𝑃80 =
Solución Resultado Respuesta
110 Estadística Básica
4.3 Deciles
Los deciles dividen un conjunto ordenado de datos en 10 partes iguales. Los deciles dan los
valores correspondientes al 10%, al 20%, al 30%,… y al 90% de los datos.
Ejemplo 4.2
Para los datos del ejemplo 1, calcule los siguientes deciles: 𝐷1 𝑦 𝐷6
Recordemos que los datos ordenados de menor a mayor son:
1460 1471 1637 1721 1721 1741 1787 1800 1900 1932
1940 2038 2046 2047 2054 2097 2205 2287 2311 ------
a) Dado que D1 = P10, tenemos:
Solución Resultado Respuesta
10 (19 + 1) Así que el D1 se encuentra en la El 10% de los corredores
L10 =
100 posición 2, es decir, que ganó 1,471 dólares o
D1 = P10 = 1471 menos por comisión el
L10 = 2
último mes de trabajo.
Ejemplo 4.3
Para los datos del ejemplo 1, calcule los siguientes cuartiles: 𝐶1 𝑦 𝐶3
Recordemos que los datos ordenados de menor a mayor son:
1460 1471 1637 1721 1721 1741 1787 1800 1900 1932
1940 2038 2046 2047 2054 2097 2205 2287 2311 ------
a) Dado que C1 = P25, tenemos:
Solución Resultado Respuesta
25 (19 + 1) Así que el C1 se encuentra en El 25% de los corredores
L25 = la posición 5, es decir, que ganó 1,721 dólares o menos
100
C1 = P25 = 1721 por comisión el último mes de
L10 = 5
trabajo.
Ejercicio 4.4
A continuación, se presentan la edad de un grupo de 12 estudiantes de un colegio de Santiago.
Determine lo siguiente (Use Excel): a)P40 , b) P81 y c) P26
13 35 82 41 41 13 20 10 25 45 34 34
a)P40 =
b)P40 =
c) P26 =
Capítulo 4. Medidas de posición 115
4.5 Percentiles, deciles y cuartiles para datos agrupados
El procedimiento para calcular estas medidas para datos agrupados en una distribución de
frecuencias es similar al usado en el cálculo de la mediana.
Como se puede reescribir los deciles y los cuartiles en función de los percentiles, entonces
solamente usaremos la fórmula para calcular los percentiles de una distribución, que será:
P = Li +
( kn
100
− F )ci −1
k
fi
Ejemplo 4.4
A continuación, se muestran los salarios mensuales de 50 personas. Calcule el D6
Salarios f F
14000 y menos de 15000 2 2
15000 y menos de 16000 5 7
16000 y menos de 17000 7 14
17000 y menos de 18000 9 23
18000 y menos de 19000 12 35
19000 y menos de 20000 8 43
20000 y menos de 21000 4 47
21000 y menos de 22000 3 50
Total 50
Solución
Pasos Sustitución
1. Recordemos que D6 = P60
P = Li + (kn
100 )
− Fi −1 c
k fi
2. Busco donde está la clase que
contiene el P60 kn = 60 ( 50 ) = 30 , por ( 30 − 23) 1000
100 100 P60 = 18000 + 12
tanto, el P60 está en la 5ta clase. 7000
P60 = 18000 + 12
3. Busco el tamaño de la clase. P60 = 18000 + 583.33
c = 18000 − 17000 = 1000
P60 = 18, 583.33
4. Determino a Fi−1 = 23
Respuesta:
5. Busco a li = 18000
El 60% de los empleados tienen un salario igual o
menor de 18,583 pesos con 33 centavos.
6. Determino a fi = 12
116 Estadística Básica
Ejercicio 4.4
A continuación, se muestran los salarios mensuales de 50 personas. Calcule el P82.
Salarios f F
13000 y menos de 15000 2 2
15000 y menos de 17000 5 7
17000 y menos de 19000 7 14
19000 y menos de 21000 9 23
21000 y menos de 23000 12 35
Total 35
Percentil 82
Pasos Sustitución
Respuesta:
Estadística Aplicada a la Educación 117
UNIVERSIDAD AUTÓNOMA DE SANTO DOMINGO
ESTADÍSTICA BÁSICA
PRÁCTICA 4
MEDIDAS DE POSICIÓN
𝑎)𝑃20 =
Solución Resultado Respuesta
𝑏)𝑃60 =
Solución Resultado Respuesta
118 Práctica 4
4.2 Rafael es gerente de una compañía que se dedica a vender libros de texto. Ha contratado
40 personas, las cuales hacen visitas a profesores universitarios para recopilar información
que le servirá como insumo para la toma de decisiones. Cada sábado en la mañana solicita
a su personal que le envié un informe, que debe incluir entre otras cosas, la cantidad de
profesores que visitaron la semana anterior. En la lista de abajo, aparece la cantidad de
visitas de la semana pasada. Recuerde interpretar cada resultado.
38 40 41 45 48 50 50 51 51 52 52 53 54 55 55 55 56 56 57 48
59 59 59 62 62 62 63 64 65 66 66 67 67 69 69 71 77 78 79 79
a) Determine el primer cuartil.
b) Calcule el 6to decil.
Organice los datos de menor a mayor
𝑎)𝐶1 =
Solución Resultado Respuesta
𝑏)𝐷6 =
Solución Resultado Respuesta
CAPÍTULO 5
Medidas de Dispersión
Competencias
Específicas
✓ Razona y argumenta.
Reconoce, calcula e interpreta
la varianza y la desviación
estándar de una muestra y/o
una población de datos
sueltos y agrupados.
✓ Comunica
Explica cómo se obtiene la
varianza y la desviación
estándar de una muestra y/o
Fuente: Externa
una población para datos
sueltos y agrupados.
El mundo de la inversión está lleno de todo tipo de alternativas por
las cuales descartamos antes de invertir nuestro dinero ahorrado. ✓ Modela y Representa
Hay que tener en cuenta que no hay inversiones totalmente seguras Modela situaciones, donde se
y cualquier opción que elijamos tendrá algunos riesgos asociados. pueda calcular las medidas
Ya se trate de acciones, bonos, bienes raíces, un negocio e incluso principales de dispersión.
una cuenta ahorro.
✓ Conecta
Toda inversión tiene un riesgo asociado. Se define al riesgo como Utiliza conexiones entre las
la probabilidad de que el rendimiento sea menor al esperado. El medidas principales de
riesgo financiero hace referencia a la incertidumbre producida en el dispersión y las situaciones de
rendimiento de una inversión, debida a los cambios producidos en la comunidad educativa.
el sector en el que se opera, a la imposibilidad de devolución del
✓ Resuelve problemas
capital por una de las partes y a la inestabilidad de los mercados Resuelve problemas del
financieros. contexto educativo que
impliquen calcular la
El rendimiento de una inversión está directamente ligado al riesgo. desviación estándar.
Sin riesgos, el rendimiento siempre es menor.
✓ Utiliza herramientas
En esta unidad, se introducen las medidas de dispersión, tales como: tecnológicas
el rango, el rango intercuartil, el rango semi-intercuartil la Usa Excel (con el
desviación media absoluta, la varianza y la desviación estándar. complemento MegaStat) y
Nuestro objetivo es resumir un conjunto de datos a través de otras herramientas
medidas de tendencias céntricas y las medidas de dispersión, con el tecnológicas para calcular la
varianza y la desviación
fin de comprender e interpretar correctamente el lenguaje de los
estándar de una muestra y/o
datos. una población para datos
Fuente externa sueltos y agrupados.
120 Estadística Básica
5.1 Introducción
“D´Rosario Delicatessen” es una empresa dedicada a comercializar embutidos. La institución
entregará bonos de incentivos por valor de RD$20,000.00, RD$15,000.00, RD$10,000.00
y RD$5,000.00 a los vendedores con el mayor promedio en el volumen de ventas en cuatro semanas.
Al final del mes el supervisor de venta observa que 4 vendedores están empatados con el mismo
promedio (RD$95,000.00). Dado que tienen el mismo promedio debe buscarse alguna manera no
aleatoria para asignar los premios. El supervisor evalúa la consistencia en las ventas, y de esta manera
entregar los premios de tal modo que el primer lugar lo obtenga el empleado con menor variabilidad en
las ventas. ¿Cómo debe el gerente distribuir los premios?
VOLUMEN DE VENTAS
(Expresado en unidad de mil)
Vendedor Semana 1 Semana 2 Semana 3 Semana 4 Promedio
A 100 90 94 96 95
B 95 95 90 100 95
C 100 90 100 90 95
D 94 96 95 95 95
Si representemos los datos en un diagrama de puntos tendremos una visión más clara de la variación
del volumen de ventas de cada empleado.
Diagrama de puntos para el volumen de ventas
Vendedor Gráfica de puntos
A
➢ ¿Cuál de los vendedores parece tener menor variación en el volumen de ventas con relación
a la media?
➢ ¿Cuál de los estudiantes parece tener mayor variación en el volumen de ventas con relación
a la media?
Capítulo 5. Medidas de Dispersión 121
Importancia de las medidas de dispersión.
Las medidas de dispersión nos proporcionan información adicional que nos permite juzgar la
confiabilidad de nuestra medida de tendencia central. Si los datos se encuentran muy dispersos,
la posición central es menos representativa de los datos, como un todo, que cuando éstos se
agrupan más cerca alrededor de la media.
= x−x
N s=
n −1
5.3 Varianza
Es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución
estadística. También se puede definir como el cuadrado de la desviación estándar.
Varianza de una población Varianza de una muestra
(x − ) ( )
2 2
=
2 x−x
N s2 =
n −1
122 Estadística Básica
Los datos del primer ejemplo componen una población. Busque la desviación estándar de cada uno y responda
la inquietud inicial, es decir ¿cómo se deben distribuir los premios?
Volumen de ventas para el empleado A
100 90 94 96
1. Buscamos la media
= x
N
100 + 90 + 94 + 96 380
= = = 95
4 4
= 95
2. Buscamos la desviación estándar
( x − )
2
=
N
(100 − 95) + ( 90 − 95) + ( 94 − 95) + ( 96 − 95)
2 2 2 2
25 + 25 + 1 + 1 52
= = =
4 4 4
= 3.6
=
N
Capítulo 5. Medidas de Dispersión 123
Volumen de ventas para el empleado C
100 90 100 90
1. Buscamos la media
= x
N
=
N
=
N
124 Estadística Básica
Distribución de los premios en forma descendente
Vendedor Media Desviación estándar Premio
1er
2do
3er
4to
Ejercicio 5.1
Para el siguiente conjunto de datos muestrales, calcule la desviación estándar.
Datos muestrales: 6, 2, 8, 5, 5, 4
1. Busque la media
x=
x
n
( x − x)
2
s=
n −1
Capítulo 5. Medidas de Dispersión 125
5.4 Uso de la calculadora científica (CASIO fx-82ms) para calcular la media y la
desviación estándar de una población o una muestra de datos.
Ejemplo 5.4
El siguiente conjunto de datos corresponde a una población, calcule la media y la desviación
estándar usando la calculadora. Datos poblacionales: 8, 3, 7, 3 y 4.
1. Programe la calculadora en el modo estadístico. Para hacer esto, presione la tecla MODE
luego el número 2 (SD).
2. Introduzca los datos: 8, 3, 7, 3, 4. Para hacer esto, presiona 8 y luego la tecla de data (M+)
en la pantalla debe aparecer n = 1, indicando que el primer dato ya se introdujo. Con ese
mismo proceso introduzca los demás datos.
𝑥̅ 𝜎𝑥 𝑠𝑥
3. Presionamos segunda función (shift) y luego el 2, en la pantalla debe aparecer
1 2 3
Presionamos el 1 para buscar la media y nos da: 𝜇 = 5, hacemos el mismo proceso y
presionamos el 2 para calcular la desviación estándar, la cual da 𝜎𝑥 ≈ 2.10 (si el caso fuera
una muestra se trabaja con el 3)
Resultados
Media Desviación estándar
𝜇=5 𝜎𝑥 ≈ 2.10
➢ VIDEO TUTORIAL
Si tiene alguna duda les invito a ver el video titulado “Desviación estándar para datos sueltos
usando calculadora” a través del canal de YouTube llamado “Rosario Institud”.
Ejercicio 5.4
Para el siguiente conjunto de datos muestrales, calcule la media y la desviación estándar,
usando la calculadora. Datos muestrales: 6, 2, 8, 5
Resultados
Media Desviación estándar
126 Estadística Básica
➢ VIDEO TUTORIAL
Compruebe usando Excel que la media y la desviación estándar del volumen de ventas de los 4 empleados son
las que se muestran a continuación. Para hacer esto les invito a ver el video titulado “Desviación estándar usando
Excel” en mi canal de YouTube llamado “Rosario Institud”
10 Leopoldo Cruz 68 65 64 60
11 Luisa Jaquez 80 100 99 99
12 Marcos Ferreira 80 89 87 95
13 Mercedes Martínez 91 79 75 88
14 Pedro Hernández 99 73 96 81
15 Randy Vegas 85 92 82 86
16 Rudy Morel 71 93 76 77
17 Sabrina García 94 72 78 83
18 Santiago Sánchez 90 74 100 83
19 Solange Cruz 90 96 95 97
20 Sonia Amarante 83 76 99 75
Respuesta
128 Estadística Básica
Si los datos aparecen en una distribución de frecuencias, entonces las fórmulas para la
varianza y la desviación estándar serán:
5.9 Varianza para datos agrupados
Para una población Para una muestra
f (x − ) f ( x − x)
2 2
2
= s2 =
N n −1
5.10 Desviación estándar para datos agrupados
Para una población Para una muestra
f (x − ) f ( x − x)
2 2
= s=
N n −1
Ejemplo 5.5
El Instituto Politécnico Dios es Amor, describió una disputa entre la gerencia y el comité de base de ADP
respecto a la eficiencia y productividad de los/as maestros/as. La gerencia argumenta que los/as docentes
tomaban más de 25 minutos al día usando el celular (Redes sociales). Cuando se midió el tiempo de uso del
celular para chatear de los 50 maestros que laboran en la institución, arrojó los resultados tabulados. Responda
las siguientes preguntas: a) ¿la gerencia está en lo correcto? b) ¿Qué medida usted tomaría como director/a
para evitar el uso desmedido del celular por parte de los/as maestros/as? c) Calcule la media, varianza y la
desviación estándar.
x−
Clase (min) f x f x (x − ) f (x − )
2 2
f (x − )
2
1300
= = 26 2 = =
2056
= 41.12
50 N 50
2056
= = 6.41
50
Respuesta:
a) Si, la gerencia está en lo cierto, puesto que los maestros del politécnico duran chateando
un tiempo promedio de 26 minutos, con una desviación estándar de 6.41 minutos.
b) Personal
Capítulo 5. Medidas de Dispersión 129
Ejercicio 5.5
SCCoast, un proveedor de internet del sureste de Estados Unidos elaboró una distribución de
frecuencias sobre la edad de los usuarios de internet. Determine la media, la varianza y la desviación
estándar.
x−x ( ) ( )
Clase (Edad) f x f x 2 2
x−x f x−x
10 y menos de 20 3
20 y menos de 30 7
30 y menos de 40 18
40 y menos de 50 20
50 y menos de 60 12
Total
x= f ( x − x)
2
2 = =
n −1
=
Respuesta
130 Estadística Básica
5.11 Uso de la calculadora científica para calcular la media y la desviación estándar de
una distribución de frecuencias.
Ejemplo 5.6
Tratemos de buscar la media y la desviación estándar con la calculadora para el ejemplo.
Clase (min) f x
10 y menos de 14 1 12
14 y menos de 18 4 16
18 y menos de 22 7 20
22 y menos de 26 17 24
26 y menos de 30 8 28
30 y menos de 34 6 32
34 y menos de 38 5 36
38 y menos de 42 2 40
N = 50
Recordemos que los parámetros son:
Media Desviación estándar
𝜇 = 26 𝜎 = 6.41
Pasos
1. Programe la calculadora en el modo estadístico. Para hacer esto, presione la tecla MODE
luego el número 2 (SD).
2. Introduzca las marcas de clases con su respectiva frecuencia. Para hacer esto, presiona 12
y luego shift y la coma, después 1 (En su pantalla debe aparecer 12; 1) y presionamos M+.
Con ese mismo proceso introduzca las demás clases.
𝑥̅ 𝜎𝑥 𝑠𝑥
3. Presionamos segunda función (shift) y luego el 2, en la pantalla debe aparecer
1 2 3
Presionamos el 1 para buscar la media y nos da: 𝜇 = 26, hacemos el mismo proceso y
presionamos el 2 para calcular la desviación estándar, la cual da 𝜎𝑥 ≈ 6.41 (si el caso fuera
una muestra se trabaja con el 3)
➢ VIDEO TUTORIAL
Si tiene alguna duda les invito a ver el video titulado “Desviación estándar para datos
agrupados usando calculadora” a través del canal de YouTube llamado “Rosario Institud”.
Capítulo 5. Medidas de Dispersión 131
Importancia de la desviación estándar
Hemos visto como dos o más conjuntos pueden tener la misma media, pero uno con mayor
dispersión que el otro. Esto sucede también con las tres distribuciones que se presentan en la
figura siguiente. La media de las tres curvas es la misma, pero la curva A tiene menor
separación (o variabilidad) que la curva B, y ésta tiene menor variabilidad que la C. Si
medimos sólo la media de estas tres distribuciones, estaremos pasando por alto una diferencia
importante que existe entre las tres curvas. Al igual que sucede con cualquier conjunto de
datos, la media, la mediana y la moda sólo nos revelan una parte de la información que
debemos conocer acerca de las características de los datos. Para aumentar nuestro
entendimiento del patrón de los datos, debemos medir también su dispersión, separación o
variabilidad.
Los analistas financieros están preocupados por la dispersión de las ganancias de una
empresa. Las ganancias ampliamente dispersas —que van desde extremadamente altas a
extremadamente bajas e incluso a niveles negativos— son indicativas de un riesgo mayor
para los accionistas y para los acreedores que las ganancias que permanecen relativamente
estables. De manera similar, los expertos en el control de la calidad analizan la dispersión de
los niveles de calidad de un producto. Una medicina cuya pureza promedio es buena, pero
que oscila desde muy pura hasta muy impura puede ser peligrosa para la vida humana.
132 Estadística Básica
5.12 Coeficientes de variación (CV):
Cuando se compara la variación de dos conjuntos diferentes de datos, se debe tomar en cuenta
que las desviaciones estándares han de ser aproximadamente iguales o iguales, además los
datos deben tener la misma escala y las mismas unidades. Si las medias son muy diferentes o
si los conjuntos utilizan diferentes escalas o unidades de medición, podemos utilizar el
coeficiente de variación.
El coeficiente de variación es un coeficiente expresado como porcentaje que describe la
desviación estándar en relación con la media. El coeficiente de variación está dado de la
siguiente forma:
Muestra Población
s
CV = 100% CV = 100%
x
Ejemplo 5.6
Un director de escuela tiene dos maestras de primero del nivel inicial. La maestra Juana usa
el método 1 para alfabetizar a sus alumnos de primero A y la maestra Xiomara usa
el método 2 para el mismo fin, con los estudiantes de primero B, al término del curso se miden
las palabras por minutos de ambos grupos, resultando los siguientes datos:
Primero A Primero B
= 40 = 55
=9 = 10
➢ Podemos observar que las medias son distintas, por tanto, no podemos comparar las
desviaciones estándares absolutas, necesitamos calcular el coeficiente de variación para
ambos grupos.
Solución
Coeficiente de variación de primero A Coeficiente de variación de primero B
CV = 100% CV = 100%
9 10
CV = 100% = 22.5% CV = 100% = 18.18%
40 55
CV = 22.5% CV = 18.18%
Conclusión
El método A tubo mayor variación relativa en la lectura de palabras por minutos por parte de
los estudiantes.
Capítulo 5. Medidas de Dispersión 133
Ejemplo 5.7
Compare la variación de las estaturas de hombres con la variación de sus pesos utilizando los
siguientes resultados: Para los hombres, las estaturas producen x = 68.34 pu lg y s = 3.02 pu lg ;
los pesos producen x = 172.55lb y s = 26.33lb .
Solución
Coeficiente de variación de la estatura Coeficiente de variación del peso
CV = 100% CV = 100%
Conclusión
134 Estadística Básica
5.13Medidas de Asimetría y de apuntamiento o Curtosis.
Hasta ahora, en secciones anteriores se han tratado las medidas de tendencia central (media, mediana
y moda) y las medidas de dispersión como las medidas más importantes que resumen y describen un
conjunto de datos. Sin embargo, otra característica importante de un conjunto de datos es la forma de
su distribución. La forma de una distribución de datos puede ser de cuatro maneras: simétrica, con
sesgo positivo, con sesgo negativo y bimodal.
Vamos a considerar las medidas de asimetría para las distribuciones con variables continuas, ya que
las distribuciones de variables discretas tienen una forma similar usando el histograma.
1. Distribución simétrica
Figura 1
Una distribución es simétrica (As = 0) cuando la curva que la representa es exactamente igual a ambos
lados de un punto de referencia. Si una distribución es simétrica decimos que es insesgada. En este
tipo de distribución la media, mediana y la moda son iguales.
Nota:
Existen otros tipos de distribuciones simétricas con otras formas, pero que no son de nuestro
interés en este momento.
2. Distribución con sesgo positivo
Figura 2
Una distribución de datos tiene asimetría positiva o está sesgada a la derecha si existe un solo pico y
los valores de las frecuencias se extienden más a la derecha del pico que a la izquierda. En este tipo
de distribución la 𝑀𝑜𝑑𝑎 < 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 < 𝑀𝑒𝑑𝑖𝑎.
Capítulo 5. Medidas de Dispersión 135
3. Distribución con sesgo negativo
Figura 3
Una distribución de datos tiene asimetría negativa o está sesgada a la izquierda si existe un
solo pico y los valores de las frecuencias se extienden más a la izquierda del pico que a la
derecha. En este tipo de distribución la 𝑀𝑒𝑑𝑖𝑎 < 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 < 𝑀𝑜𝑑𝑎.
4. Distribución bimodal
Figura 4
Coeficientes de asimetría
Existen diversas fórmulas para medir el grado en que una distribucion es asimétrica. Dos de
las más simples son: el coeficiente de sesgo de Karl Pearson y de Arthur Bowley.
5.14 Coeficiente de sesgo de Pearson
Se basa en la diferencia entre la media y la mediana, su fórmula es:
sk =
(
3 x − Med )
s
De acuerdo con esta expresión, el sesgo puede variar de -3 a 3. Si 𝑠𝑘 < 0, entonces, la
distribución tiene un sesgo negativo. Si 𝑠𝑘 > 0, entonces, la distribución tiene un sesgo
positivo. Si 𝑠𝑘 = 0, entonces, la distribución es simétrica (Para mayor claridad, obsérvese
las figuras 1, 2 y 3)
136 Estadística Básica
Ejemplo 5.7
Una muestra de 7 capturistas de datos que laboran en la oficina de impuestos de Horry County
revisó el siguiente número de expedientes ficales durante la última hora: 60, 73, 84, 92, 93,
95, 98
a) Calcule el coeficiente de sesgo con el método de Pearson.
Solución
Si usamos la calculadora obtenemos los siguientes estadísticos:
Media Mediana Desviación estándar
85 92 13.86
Sustituimos estos valores en la Nota:
fórmula: Cada vez que la 𝑥̅ < 𝑀𝑒𝑑, tendremos un
sk =
( =
)
3 x − Med 3 (85 − 92 )
= −1.52
coeficiente negativo, pero debemos hacer el
proceso para ver el grado de asimetría negativa
s 13.86 que tiene la distribución.
Respuesta
La distribución de datos tiene un sesgo negativo considerable.
Ejercicios 5.6
Los siguientes valores son los sueldos iniciales, en miles de dólares, de una muestra de cinco
graduados de contabilidad, quienes aceptaron puestos de contaduría pública el año pasado:
36, 26, 33, 28, 31
a) Calcule el coeficiente de sesgo con el método de Pearson.
Solución
Si usamos la calculadora obtenemos los siguientes estadísticos:
Media Mediana Desviación estándar
Respuesta
Capítulo 5. Medidas de Dispersión 137
Coeficiente de Pearson para datos agrupados
Ejemplo 5.8
Las ausencias de los maestros de una escuela durante un año escolar se presentan en la
siguiente tabla. Calcule el coeficiente el coeficiente de asimetría de Pearson.
Cantidad de Número de F x fx ( 𝑥 − μ )2 𝑓(𝑥 − μ)2
ausencias empleados
0 4 1 1 2 2 324 324
5 9 1 2 7 7 169 169
10 14 3 5 12 36 64 192
15 19 5 10 17 85 9 45
20 24 7 17 22 154 4 28
25 29 8 25 27 216 49 392
Total 25 500 1150
Media 500 Desviación estándar
= = 20 1150
25 𝜎=√ = 6.78
25
Ahora tenemos que buscar la mediana, es decir, 𝑃50 .
Solución
Pasos Sustitución
1. Busco donde está la clase que contiene
kn 50 ( 25 )
P = Li +
kn
100 (
− Fi −1 c )
el P50 = = 12.5 , por tanto, k
100 100 fi
el P50 está en la 5ta clase.
= 20 +
(12.5 − 10 ) 5
P50 7
2. Busco el tamaño de la clase.
12.5
c = 20 − 15 = 5 P50 = 20 +
7
P50 = 20 + 1.79
3. Determino a Fi−1 = 10
4. Busco a li = 20 P50 = 21.79
5. Determino a fi = 7
Resumen de datos
Media Mediana Desviación estándar
20 21.79 6.78
Ahora buscamos el coeficiente de Pearson Respuestas
3 ( x − Med ) 3 ( 20 − 21.79 ) La distribución está sesgada negativamente
sk = = = −0.79
s 6.78
138 Estadística Básica
Ejercicio 5.7
El tiempo de espera (minutos) de los clientes que visitan un día un banco de Santo Domingo,
se dan a continuación. Calcule el coeficiente de asimetría de Pearson.
Minutos Número de clientes F x fx (𝑥 − μ)2 𝑓(𝑥 − μ)2
0 6 8
6 12 12
12 18 25
18 24 20
24 30 10
30 36 5
Total 80
Media Desviación estándar
Resumen de datos
Media Mediana Desviación estándar
sk =
(
3 x − Med )=
s
Respuestas
Capítulo 5. Medidas de Dispersión 139
5.15 Coeficiente de Asimetría de Bowley
Otra forma de medir la asimetría es la que estableció Arthur Bowley utilizando los cuartiles, bajo el supuesto
de que si el grupo de datos o distribución de frecuencias es simétrica, C3 y C1 serían equidistantes de C2 (la
mediana). Sin embargo, si hay asimetría la distancia de C3 a C2 no es igual a la distancia de C2 a C1. Esta
diferencia puede ser usada para medir la asimetría, quedando la fórmula así:
C3 + C1 − 2C2
As =
C3 − C1
De acuerdo con esta expresión, el sesgo puede variar de -1 a 1. Si 𝐴𝑠 < 0, entonces, la distribución tiene un
sesgo negativo. Si 𝐴𝑠 > 0, entonces, la distribución tiene un sesgo positivo. Si 𝐴𝑠 = 0, entonces, la
distribución es simétrica.
Este coeficiente se puede usar en el diagrama de cajas, para determinar la asimetría de una distribución.
Ejemplo 5.9
Una muestra de 7 capturistas de datos que laboran en la oficina de impuestos de Horry County revisó el
siguiente número de expedientes ficales durante la última hora: 60, 73, 84, 92, 93, 95, 98.
a) Calcule el coeficiente de sesgo con el método de Bowley.
b) ¿Qué conclusión obtiene del sesgo de los datos?
Solución:
Cuartil 1: C1 = P25 Cuartil 2: C2 = P50 Cuartil 3: C3 = P75
25 ( 7 + 1) 50 ( 7 + 1) 75 ( 7 + 1)
L =25 L =
50 L =75
100 100 100
L25 = 2 L50 = 4 L75 = 6
C1 = P25 = 73 C2 = P50 = 92 C3 = P75 = 95
Sustituimos estos valores en la fórmula:
95 + 73 − 2 ( 92 )
As = = −0.73
95 − 73
Respuesta
La distribución de datos está fuertemente sesgada negativamente.
Ejercicio 5.8
Una muestra de 5 estudiantes de la asignatura de matemática financiera del CURSA
obtuvieron las siguientes calificaciones: 73, 98, 60, 92 y 84.
a) Calcule el coeficiente de sesgo con el método de Bowley.
b) ¿Qué conclusión obtiene del sesgo de los datos?
Solución:
Cuartil 1: C1 = P25 Cuartil 2: C2 = P50 Cuartil 3: C3 = P75
L25 = L50 = L75 =
Un caso opuesto a la curva leptocúrtica es el que corresponde a una distribución donde existe
un intervalo amplio de puntuaciones con escasa agrupación en el centro. A esta se le llama
aplanada o platocúrtica. Véase la figura 7.
La mejor forma de medir la Curtosis es a través del coeficiente de Curtosis. Antes de calcular
el coeficiente de Curtosis de una distribución, vamos a estudiar los momentos de una variable
aleatoria.
mr = =
N N
Capítulo 5. Medidas de Dispersión 141
Ejemplo 5.10
Determine los momentos: 1 y 2 de la distribución de datos: 5, 6, 7, 8, 9, 10, 11, 12, 13
respecto al origen.
Solución
Momento 𝑟 = 1 con relación al origen Momento 𝑟 = 2 con relación al origen
m1 =
x 1
i
=
x m2 =
x 2
i
N N N
5 + 6 + 7 + 8 + 9 + 10 + 11 + 12 + 13 52 + 62 + 7 2 + 82 + 92 + 102 + 112 + 12 2 + 132
m1 = m2 =
9 9
81 620
m1 = =9 m2 = = 68.89
9 9
Ejercicio 5.9
Determine los momentos: 3 y 4 de la distribución de datos: 5, 6, 7, 8, 9, 10, 11, 12, 13 respecto
al origen.
Solución
Momento 𝑟 = 3 con relación al origen Momento 𝑟 = 4 con relación al origen
142 Estadística Básica
5.18 Momento con respecto a la media aritmética de los datos
Dada una distribución de datos: x1, x2, x3, …, xn y 𝑟𝜖ℕ, el momento r con respecto a la media
aritmética de los datos de la distribución se define como:
( x − )
r
=
i
mr
N
Ejemplo 5.11
Determine los momentos 1 y 2 de la distribución de datos: 5, 6, 7, 8, 9, 10, 11, 12, 13 respecto
a la media aritmética.
Solución
Sabemos por el ejemplo 7 que el momento 1 con relación al origen de los datos es la media
aritmética, por tanto, 𝑚1 = 𝜇 = 9
m1 = i
N
( 5 − 9 ) + ( 6 − 9 ) + ( 7 − 9 ) + (8 − 9 ) + ( 9 − 9 ) + (10 − 9 ) + (11 − 9 ) + (12 − 9 ) + (13 − 9 )
1 1 1 1 1 1 1 1 1
m1 =
9
0 Recordemos que esa es una propiedad de la media, por esa razón el primer
m1 = =0
9 momento será siempre 0.
m2 = i
N
( 5 − 9 ) + ( 6 − 9 ) + ( 7 − 9 ) + (8 − 9 ) + ( 9 − 9 ) + (10 − 9 ) + (11 − 9 ) + (12 − 9 ) + (13 − 9 )
2 2 2 2 2 2 2 2 2
m2 =
9
60
m2 = = 6.67
9
Capítulo 5. Medidas de Dispersión 143
Ejercicio 5.10
Determine los momentos 3 y 4 de la distribución de datos: 5, 6, 7, 8, 9, 10, 11, 12, 13 respecto
a la media aritmética.
Solución
Sabemos por el primer ejemplo que el momento 1 es la media aritmética, por tanto, 𝑚1 =
𝜇=9
Momento 𝑟 = 3 con relación a la media
g2 = 0 Mesocúrtica o normal
g2 0 Platicúrtica
144 Estadística Básica
Ejemplo 5.12
Calcule el coeficiente de Curtosis y luego calcule el coeficiente de asimetría por el método de
momento para la siguiente distribución.
Clase f x f x x− f (x − )
2
f (x − )
3
f (x − )
4
Respuesta
a) Ya que el coeficiente g > 0, la distribución es leptocúrtica con tendencia a ser normal, es
decir, que los datos se concentran alrededor de la media.
Clase f x f x x− f (x − )
2
f (x − )
3
f (x − )
4
0 6 8
6 12 12
12 18 25
18 24 20
24 30 10
30 36 5
Total 80
Solución
1. Media 2. Momento r = 4
Respuesta
146 Práctica 5. Medidas de Dispersión
UNIVERSIDAD AUTÓNOMA DE SANTO DOMINGO
ESTADÍSTICA BÁSICA
PRÁCTICA 5
MEDIDAS DE DISPERSIÓN
5.1 ¿Cuáles datos cree usted que tengan mayor variación: ¿los ingresos de una muestra aleatoria
simple de 1000 adultos elegidos de la población en general, o los ingresos de una muestra aleatoria
simple de 1000 profesores de estadística? ¿Por qué?
5.2 ¿Para cuál de las siguientes distribuciones la media es más representativa de los datos como un
todo? ¿Por qué?
5.3 Para medir el éxito escolar, los educadores necesitan probar los niveles de conocimientos y habilidades
de los estudiantes. Tomar en cuenta las diferencias individuales de cada uno de ellos, permite a los
profesores planear mejor el programa académico. Las curvas que se muestran a continuación representan
las distribuciones basadas en resultados anteriores de dos pruebas distintas. ¿Cuál de ellas seleccionaría
usted como mejor opción para los propósitos de los profesores?
Práctica 5. Medidas de Dispersión 147
5.4 Una empresa que usa dos métodos diferentes para enviar pedidos a sus clientes encontró
las siguientes distribuciones del tiempo de entrega para los dos métodos, según los
registros históricos. Con la evidencia disponible, ¿qué método de envío recomendaría?
¿por qué?
5.6.1 Sume a cada dato una constante igual a 2. Calcule la desviación estándar para los nuevos
valores. ¿Qué efecto produce sobre la desviación estándar el hecho de sumar una
constante a cada dato?
Desviación estándar de: ____, ____, ____, ____, ____
5.6.2 Multiplique cada dato una constante igual a 2. Calcule la desviación estándar para los
nuevos valores. ¿Qué efecto produce sobre la desviación estándar el hecho de
multiplicar una constante a cada dato?
Desviación estándar de: ____, ____, ____, ____, ____
Práctica 5. Medidas de Dispersión 149
5.7 Calcule la desviación estándar de los siguientes datos muéstrales.
a) 6, 8, 7, 3, 6, 4
b) 6, 8, 7, 3, 6, 35
c) ¿Por qué la desviación estándar es tan grande en la parte b, en comparación con la parte a?
150 Estadística Básica
NOTA:
➢ Para los ejercicios 5.8 hasta 5.12 encuentre la desviación estándar.
5.8 Años para obtener el título de licenciatura. A continuación, se presenta el tiempo (en
años) que le tomó a una muestra aleatoria de estudiantes universitarios obtener su título de
licenciatura. Con base en los resultados, ¿Es inusual que un estudiante obtenga el título de
licenciatura en 12 años?
4 4 4.5 4.5 6 6 8 9 13 15
5.11 Mediciones de la presión sanguínea. Siete estudiantes del segundo año de medicina de Bellevue
Hospital midieron la presión sanguínea de la misma persona. A continuación, se listan las lecturas
sistólicas (en mmHg). Si la presión sanguínea del sujeto permanece constante y los estudiantes de
medicina aplican correctamente la misma técnica de medición, ¿cuál debería ser el valor de la desviación
estándar? Obtenga la desviación estándar.
138 130 135 140 140 130 150
152 Estadística Básica
5.12 IMC y género. Es bien sabido que los hombres tienden a pesar más y a ser más altos
que las mujeres. El índice de masa corporal (IMC) es una medida que se basa en el peso y
en la estatura. A continuación se muestran los valores de IMC de hombres y mujeres
elegidos de manera aleatoria. ¿Parece existir una diferencia en la variación entre los dos
conjuntos de datos? Calcule la desviación estándar. (Puedes usar Excel)
Hombres: 23.8 23.2 24.6 26.2 23.5 24.5 21.5 31.4 26.4 22.7 27.8 28.1
Mujeres: 19.6 23.8 19.6 29.1 25.2 21.4 22.0 27.5 33.5 20.6 29.9 17.7
Práctica 5. Medidas de Dispersión 153
5.13 Responde las siguientes preguntas.
a) ¿Por qué el rango no es una medida de dispersión tan útil como la desviación estándar?
c) ¿Es posible que el valor del rango, la desviación estándar o la varianza de un conjunto de
datos sea negativo? Explique
154 Estadística Básica
5.14 A raíz de que los jóvenes en su mayoría están activos sexualmente en nuestras escuelas,
y que las enfermedades de transmisión sexual son de alto riesgo, el psicólogo decide
investigar cómo anda la fidelidad de los estudiantes en el noviazgo en el politécnico Dios
es amor. Para esto, estudia una muestra de 20 alumnos (10 hembras y 10 varones) y
encuentra los siguientes datos. (Puedes usar Excel)
Sexo Número de parejas simultaneas de los 20 estudiantes.
Masculino 1, 1, 3, 2, 4,1, 2, 3, 4, 5
Femenino 1, 1, 1, 1, 2, 3, 2, 1, 1, 1
Calcule lo siguiente:
Medidas Sexo
Masculino Femenino
a) La moda
b) La mediana
c) La media
d) El rango
e) Varianza
f) Desviación estándar
g) Coeficiente de variación
1. ¿Cuál de los dos grupos tiene mayor capacidad de mantenerse con una pareja?
2. Según su criterio, ¿cuáles son las razones que explican la respuesta a la primera pregunta?
10 Leopoldo Cruz 68 65 64 60
11 Luisa Jaquez 80 100 99 99
12 Marcos Ferreira 80 89 87 95
13 Mercedes Martínez 90 96 95 97
14 Pedro Hernández 99 73 96 81
15 Randy Vegas 85 92 82 86
16 Rudy Morel 71 93 76 77
17 Sabrina García 94 72 78 83
18 Santiago Sánchez 90 74 100 83
19 Solange Cruz 90 93 82 75
20 Sonia Amarante 83 76 99 75
Respuesta
156 Estadística Básica
5.15 La edad de los hombres que visitaron a un urólogo en la mañana de un día fueron
44, 50, 39, 46 y 54 años. Calcule lo que se le pide y luego escriba su conclusión.
a) Calcula el coeficiente de asimetría por el método de Pearson. Conclusión
---------------------------------------------------
---------------------------------------------------
---------------------------------------------------
---------------------------------------------------
---------------------------------------------------
---------------------------------------------------
---------------------------------------------------
1.12 Para los datos poblacionales: 5, 8, 7, 3 y 10, calcule los momentos: 1, 2 y 3 de la variable
con respecto al origen.
Momento 1 con respecto al origen
=
i
Momento 4 con relación a la media: mr
N
(x − )
2
Desviación estándar: =
N
m4
Sustitución: g2 = −3
4
Conclusión:
CAPÍTULO 6
Números índices
Competencias
Específicas
✓ Razona y argumenta.
Reconoce, calcula e interpreta
los números índice en sus
distintas modalidades.
✓ Comunica
Explica cómo se obtiene los
números índices en sus
diferentes contextos
atendiendo a los métodos para
determinarlos.
Fuente Externa
b) El administrador de una fábrica puede tener la necesidad de comparar el costo por unidad
de producción este mes con el de hace seis meses.
En cada una de estas situaciones, se necesita determinar y definir el grado de cambio. Por lo
común, los números índice son los que nos permiten medir esas diferencias.
pt qt
Iv = 100
p0 q0
162 Estadística Básica
Ejemplo 6.1
Suponga que los precios unitarios y las cantidades producidas del producto A durante los años
2005 y 2010 se presentan en la siguiente tabla. Calcular los índices de precios, cantidad y
valor para el año 2010 tomando como base el año 2005.
Producto Año Precio (RD$) Cantidad de unidades vendida Valor
p q 𝑝∗𝑞
A 2005 35 750 26,250
2010 48 975 46,800
El año base es el 2005, por tanto, los datos conocidos son:
p0 pt q0 qt
35 48 750 975
Solución
Índice de precio Índice de cantidad Índice de valor
pt qt pt qt
Ip = 100 Ic = 100 Iv = 100
p0 q0 p0 q0
48 975 48 975
Ip = 100 Ic = 100 Iv = 100
35 750 35 750
I p = 137.1% I c = 130% I v = 178.3%
Los números índices compuestos son los de mayor uso práctico, ya que si nos interesa
conocer, por ejemplo, los cambios relativos del costo de la vida, no lo haríamos con el precio
de un solo artículo, sino que incluiríamos los precios de un grupo de elementos o artículos que
determinan el costo de la vida, como son: alimentación, vivienda, transporte, vestuario, etc.”
Carlos custodios, pág. 277
Un índice de agregados no ponderados se calcula sumando todos los elementos del compuesto
para el periodo dado y luego dividiendo este resultado entre la suma de los mismos elementos
durante el periodo base.
Ip =
p t
100 q pq
Ic = t
100 Iv = t t
100
p 0 q
0 pq
0 0
Capítulo 6. Números Índices 165
Ejemplo 6.2
A continuación se muestran los precios de cuatro productos de primera necesidad en los años
1990 y 1996. Calcule el índice agregado no ponderados de precios, tomando como año base
el 1990.
Artículos Cantidad Precios
1990 (p0) 1996 (pt)
Huevos 1 docena $6.00 $10.00
Carne (pollo) 1 libra 15.00 20.00
Leche 1 litro 8.00 10.00
Espaguetis 1 libra 5.00 8.50
p 0 = 34.00 p t = 48.50
Solución
Ip =
pt 100 = 48.50 = 143%
p0 34.00
Respuesta
Los precios de estos artículos aumentaron en 43% durante el período 1990 – 1996.
El método de los índices no ponderados tiene poca practicidad, ya que da el mismo peso o
importancia al cambio de precio de un artículo de gran uso que a uno de poca demanda.
Carlos Custodio, pág. 279
6.9 Índices ponderados
Los dos métodos más conocidos para calcular el índice de precios ponderado son el de
Laspeyres y el de Paasche. Difieren sólo en el periodo de la ponderación. Cuando se emplea
el método de Laspeyres se aplican ponderaciones en el periodo base; es decir, los precios y
las cantidades originales de los artículos comprados se utilizan para encontrar el cambio
porcentual durante un periodo, ya sea en el precio o en la cantidad consumida, según el
problema. En el método de Paasche se aplican ponderaciones en el año en curso.
Desventajas
No refleja cambios que el tiempo genera en los patrones de compra. Además, puede ponderar
demasiado los artículos cuyos precios aumentan.
168 Estadística Básica
6.9.2 Índice de Paasche
La desventaja principal del índice de Laspeyres es que se supone que las cantidades en el
periodo base aún son reales en el periodo dado. El índice de Paasche es una alternativa. El
procedimiento es similar, pero en lugar de emplear cantidades del periodo base como
ponderaciones, se utilizan cantidades del periodo actual.
El índice de Paasche es un índice compuesto ponderado en el que la ponderación se hace
utilizando las cantidades del período de tiempo corriente.
El índice de Paasche se utiliza para calcular el índice de Drobisch y el índice de Fischer.
Fórmulas para calcular los índices de precios, de cantidades y de valor, mediante el método
de Paasche
Precios Cantidad De valor
Ip =
pq t t
100 Ic =
pq t t
100 Iv =
pq t t
100
pq 0 t pq t 0 pq 0 0
Ejemplo 6.4
Según PROCONSUMIDOR el precio por libras de los siguientes productos se mantuvieron sin variaciones
importantes en los primeros seis meses del año 2014 y del año 2015. Una familia consume en el primer
semestre del 2014 y del 2015 las cantidades en libras de los productos que se muestran a continuación. Calcule
el índice de precio, el índice de cantidad y el índice de valor; usando el método de Paasche, tomando como
año base el 2014.
Producto 2014 2015 𝑝𝑡 𝑞𝑡 𝑝0 𝑞𝑡 𝑝𝑡 𝑞0 𝑝0 𝑞0
Precio Cantidad Precio Cantidad
(p0) (q0) (pt) (qt)
Bacalao 134.99 50 146.72 30 4,401.6 4,049.7 7,336 6,749.5
Res 78.99 40 90.22 40 3,608.8 3,159.6 3,608.8 3,159.6
Cerdo 79.99 50 81.01 70 5,670.7 5,599.3 4,050.5 3,999.5
Pollo 50 100 48.77 150 7,315.5 7,500 4,877 5,000
Total 20,996.6 20,308.6 19,872.3 18,908.6
Solución
Precios Cantidad De valor
Ip =
pq t t
100 Ic =
pqt t
100 Iv =
pq t t
100
pq 0 t pqt 0 pq 0 0
Ventajas
Como utiliza cantidades del periodo actual, refleja los hábitos actuales de compra.
Desventajas
Requiere datos de cantidades del año actual. Como se utilizan cantidades diferentes cada año,
es imposible atribuir cambios en el índice a cambios sólo en el precio. Tiende a ponderar
demasiado los artículos cuyos precios declinaron. Necesita que los precios se vuelvan a
calcular cada año.
170 Estadística Básica
Los índices mundialmente más usados son: los índices de precios al consumidor, los de
precios al por mayor, el del promedio industrial de Dow- Jones y el de la producción industrial.
Como se puede observar es muy importante que un país controle la inflación y la deflación,
ya que si no se controlan ambas, pueden ser muy perjudicial para la economía de un país, es
por esta razón que los estados deben procurar conseguir estabilidad de precios.
Los valores del índice de precios al consumidor se expresan como promedios anuales,
cuatrimestrales, trimestrales y mensuales. Veamos algunos índices de precios al consumo
calculados en la Republica Dominicana.
Capítulo 6. Números Índices 171
Ejemplo 6.5
Calcule la variación del IPC de enero del 2012, tomando como base el mes de enero 2010.
Año Mes IPC (Base Año Mes Índice Año Mes IPC (Base 2010)
2010) (Base 2010)
Enero 95,36 Enero 101,24 Enero 108,23
Febrero 95,50 Febrero 102,46 Febrero 108,61
Marzo 96,32 Marzo 103,65 Marzo 108,77
Abril 96,66 Abril 104,55 Abril 108,78
Mayo 96,99 Mayo 104,78 Mayo 108,49
Junio 96,83 Junio 105,85 Junio 108,72
Julio 97,16 Julio 106,75 Julio 108,50
Agosto 97,37 Agosto 107,28 Agosto 109,60
Septiembre 98,12 Septiembre 107,51 Septiembre 110,31
Octubre 98,78 Octubre 107,54 Octubre 110,57
Noviembre 99,09 Noviembre 107,64 Noviembre 111,27
Diciembre 100,00 Diciembre 107,76 Diciembre 111,97
Fuente: Banco Central
Solución Respuesta
IPCt 95.36 El índice de precio al consumidor tuvo un
V = 100 = 100
IPCo 108.23 aumento porcentual de un 13.50% de enero 2010
V = 1.1350 hasta enero de 2012.
El índice de precios al consumidor se usa, para medir el poder adquisitivo de la moneda.
Fórmula para calcular el índice del poder adquisitivo de la moneda
1
PA = 100
IPC
Ejemplo 6.6
Para la situación de aprendizaje 2, encuentre el poder adquisitivo mensual del año 2011.
Año Mes IPC (Base 2010) Poder adquisitivo
1
PA = 100 = 0.988
Enero 101.24 101.24
Febrero 102.46 0.976
Marzo 103.65 0.965
Abril 104.55 0.956
Mayo 104.78 0.954
Junio 105.85 0.945
Julio 106.75 0.937
Agosto 107.28 0.932
Septiembre 107.51 0.930
Octubre 107.54 0.930
Noviembre 107.64 0.929
Diciembre 107.76 0.928
De acuerdo a este ejemplo, el poder adquisitivo de un peso dominicano en enero del 2011 es
0.988 centavos con relación a enero del 2010.
172 Estadística Básica
Ejercicio 6.4
Para la situación de aprendizaje 2, encuentre el poder adquisitivo mensual del año 2012.
Año Mes Índice Base 2010 Poder adquisitivo
Enero 108.23
Febrero 108.61
Marzo 108.77
Abril 108.78
Mayo 108.49
Junio 108.72
Julio 108.50
Agosto 109.60
Septiembre 110.31
Octubre 110.57
Noviembre 111.27
Diciembre 111.97
Además el IPC se usa para determinar el ingreso real de los trabajadores, que es el ingreso ajustado para
cambios en los precios.
Fórmula para el cálculo del ingreso real.
Salario neto
IR = 100
IPC
Ejemplo 5
El salario de Juan, y el IPC del mes de julio para los años 2011 y 2016 fueron:
Año Pago neto IPC (Índice Base 2010)
2011 15,000 106.75
2016 19,500 121.36
a) ¿Cuál fue el ingreso real de Juan en 2011?
Solución
Salario neto Salario neto
a ) IR = 100 b) IR = 100
IPC IPC
15000 19500
IR2011 = 100 IR2016 = 100
106.75 121.36
IR2011 = 14, 051.52 IR2016 = 16, 067.89
Interpretación
En términos del año base (2010), el salario de Juan fue de $14, 052 en 2011 y de $16, 068 en
2016. Esto indica que su ingreso neto aumentó con una tasa mayor que el precio de sus
alimentos, transporte, etc. Por lo tanto, el estándar de vida de Juan aumentó desde el periodo
base hasta la actualidad.
Capítulo 6. Números Índices 173
Ejercicio 6.5
El ingreso (dólares) de la señora Sofía se detalla a continuación en el siguiente cuadro.
Año Ingreso monetario anual IPC (Índice Base 1982-1984)
1982-1984 20,000 100
Año en curso 40,000 200
a) ¿Cuál fue el ingreso real de Sofía en el periodo 1982-1984?
Solución
Salario neto Salario neto
a) IR = 100 b) IR = 100
IPC IPC
Interpretación
174 Estadística General
UNIVERSIDAD AUTÓNOMA DE SANTO DOMINGO
ESTADÍSTICA GENERAL
PRÁCTICA 6
NÚMERO ÍNDICE
6.1 Los datos que se presentan en la siguiente tabla muestran la cantidad y el precio de un
artículo vendido durante los años indicados en Santo Domingo.
Año Precio por unidad Cantidad de unidades vendida Valor
p q 𝑝∗𝑞
2000 200 2350
2002 425 1990
2004 523 3122
Determina los tres índices simples vistos para cada año, tomando como base el año 2000.
Solución año 2002
Queso 90 30 lb 110 40 lb
Total
Solución
Precios Cantidad De valor
Ip =
pq t 0
100 Ic =
pq0 t
100 Iv =
pq t t
100
pq0 0 pq0 0 pq 0 0
Queso 90 30 lb 110 40 lb
Total
Solución
Precios Cantidad De valor
Ip =
pq t t
100 Ic =
pqt t
100 Iv =
pqt t
100
pq 0 t pqt 0 pq0 0
ESTADÍSTICA BÁSICA
25
1. Se le va a deducir puntos por ejecicios incompletos
o que tengan falta de organización y/o limpieza. En
el caso de las gráficas deben estar bien construídas,
usando instrumentos geométricos o alguna
aplicación informática (no es cuestión de salir del
paso).
178 Estadística General
Bibliografía consultada
Barrientos, M. G. (2012). Elementos de estadística descriptivas. San José, Costa Rica: EUNED.
Pérez, H. E. (2008). Estadística para las ciencias sociales, del comportamiento y de la salud. México:
CENGAGE Learnig.