Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESCUELA DE ESTADÍSTICA
GUÍA DIDÁCTICA
BIOESTADÍSTICA
_______________________________________________________________________________________
Autor:
Leonido Rosario Peña, MA
ii
PRÓLOGO
Este material didáctico se ha escrito para satisfacer la necesidad de tener una guía que sirva no
solo para tener las ideas principales de la estadística, sino además que facilite el trabajo al
estudiante en el sentido que pueda trabajar directamente, sin tener que perder tiempo copiando
ejercicios. Esta guía no pretende sustituir ningún libro de texto formal, sino más bien es la
compilación de ejercicios y ejemplos de diferentes libros.
En este material se puede trabajar los ejemplos y ejercicios directamente, además las gráficas
tienen los espacios correspondientes para realizarlas en el mismo. Ésta guía tiene seis capítulos
desarrolladas conforme a las unidades del programa de la asignatura Bioestadística
(EST1330 y EST1350). Después de cada unidad se encuentra una práctica que ayudará al
estudiante a afianzar los conocimientos adquiridos, conceptuales, procedimentales y
actitudinales.
Los contenidos desarrollados en esta guía pueden ser trabajados con el programa Excel, además
se usarán calculadoras científicas y aplicaciones informáticas como herramientas para el
manejo de cálculo numérico, pero se hará énfasis en el análisis estadístico.
iii
ÍNDICE GENERAL
PRÓLOGO ii
Establece diferencia y
similitud entre conceptos
básicos estadísticos.
Identifica el nivel de
medición de una variable.
Cuando se habla de planificación ésta puede ser considerada a nivel micro o a nivel macro, todo depende de
si se refiere a una parte pequeña o una parte grande, si es una unidad de un conglomerado o es el conglomerado
completo. No importa si se habla de una cosa o de la otra, en cualquier caso, se está hablando de planificación
e ineludiblemente al hablar de ésta, se está hablando de Estadística.
La estadística es la base de la planificación. Para planificar y obtener resultados acertados hay que disponer
de estadísticas confíales y oportunas. Confiable significa que respondan a la realidad y que sean de cobertura
total y lo de la oportunidad guarda referencia con el momento; un dato estadístico deja de ser bueno cuando
pierde oportunidad, es decir si no se tiene en el momento que se necesita.
El profesor/a, el director del centro y de los estamentos de dirección, no sólo deben desempeñarse con
estadísticas educativas, es decir las que se producen al interior del centro educativo, por ejemplo la cantidad
de estudiantes de la escuela, de una tanda o de grado; o en qué rango de edad se encuentran, sus calificaciones;
número de aulas, cuántos maestros/as hay en la escuela, por género, años en servicio, etc.
Pero además deben manejar otras estadísticas, como las que se refieran a la salud de los estudiantes, cuáles
son las enfermedades más frecuentes que padecen, las vacunas que les han sido administradas. Estadísticas
sociales, como lugar donde viven, con quien viven y estadísticas demográficas referidas a la población de la
comunidad y su estructura por sexo y edad, número de hermanos/as, niños/as en edad escolar, etc.
Artículo escrito por el Maestro Ezequiel Valdez, para el Minerd
Capítulo 1. Conceptos Fundamentales de la Estadística 3
1.2 Estadística
Ciencia que recoge, organiza, presenta e interpreta datos con el fin de tomar la decisión más eficaz.
Tipos de estadística
1.2.1 Estadística Descriptiva 1.2.2 Estadística Inferencial
Método para organizar, resumir y Método que emplean para determinar una
presentar datos de manera informativa. propiedad de una población con base en la
información de una muestra.
Ejemplo 1.1
La empresa de publicidad PUBLICART, con sede en Santiago, solicitó a una muestra de 1,960
consumidores que probaran un platillo con pollo recién elaborado por GOODCHICKEN. De
las 1,960 personas de la muestra, 1,176 dijeron que comprarían el alimento si se
comercializaba.
❖ Muestra
Porción o parte de la población de interés.
¿Por qué los investigadores estudian la muestra si el interés es la población?
Ejemplo 1.2
El CURSA ha entrevistado 100 estudiantes de informática para averiguar el tiempo semanal
medio que dedican a navegar por internet.
a) ¿Cuál es la población?
b) ¿Cuál es la muestra?
4 Estadística Básica
❖ Parámetro
Es una característica específica de una población.
Ejemplo 1.3
La media de las notas obtenidas por 50 estudiantes de estadística básica fue 83 puntos.
a) ¿Cuál es el parámetro?
❖ Estadístico
Es una característica específica de una muestra.
Ejemplo 1.4
La media de una muestra compuesta por las notas obtenidas de 14 estudiantes de estadística
básica fue 79 puntos. ¿Cuál es el estadístico?
❖ Datos
Son el conjunto de información recolectada.
Ejemplo 1.5
-Mediciones, respuestas de encuestas, otros.
Ejemplo 1.6
-La estatura -El peso -Estado civil
❖ Variable independiente
Es aquella que es controlada en forma sistemática por el investigador.
Ejemplo 1.7
Se estudia “el efecto de la privación del sueño con respecto al comportamiento agresivo”.
a) ¿Cuál es la variable independiente?
Capítulo 1. Conceptos Fundamentales de la Estadística 5
❖ Variable dependiente
La variable dependiente en un experimento es la que el investigador mide para determinar el
efecto de la variable independiente.
Ejemplo 1.8
En el estudio del “efecto de la privación del sueño con respecto al comportamiento agresivo”.
¿Cuál es la variable dependiente?
Ejercicio 1.1
Analice el siguiente experimento, y luego responda las 5 preguntas.
Un psicólogo de la salud está interesado en saber si la motivación del temor es eficaz para
reducir la incidencia del hábito de fumar. Cuarenta adultos fumadores son seleccionados de
entre los individuos residentes en la ciudad en donde trabaja el psicólogo. A 20 de ellos se les
pide fumar un cigarrillo, después ven una atemorizante película acerca de cómo el hábito de
fumar provoca cáncer; vívidas imágenes de los pulmones y otros órganos internos enfermos
de fumadores fallecidos se muestran en un esfuerzo de generar temor a fumar en estos sujetos.
El otro grupo recibe el mismo tratamiento, excepto que ellos ven una película neutra que no
está relacionada con el tabaquismo. Durante dos meses posteriores a la proyección de la
película, el experimentador mantiene registros de número de cigarrillos que los participantes
fuman a diario. Después calcula el promedio de cigarrillos fumados a diario de cada grupo
después de la exhibición de la película, y compara una media con la otra para determinar si la
película atemorizante surtió efectos sobre el hábito de fumar.
Preguntas
1. ¿Cuál es la variable independiente? 2. ¿Cuál es la variable dependiente?
5. ¿Cuál es el estadístico?
6 Estadística Básica
❖ Variables categóricas o cualitativas
Son aquellas que consisten en nombres o etiquetas que no representan conteos o mediciones.
Ejemplo 1.9
La afiliación a partidos políticos (PLD, PRM, PRD, PRSC, otros)
Ejercicio 1.2
Clasifica las siguientes variables en cualitativas, cuantitativas discretas o cuantitativas
continuas.
Variable Tipo de variable
1. La nacionalidad de una persona.
-Precios
8 Estadística Básica
Resumen de los niveles de medición de las variables
Nominal Ordinal Intervalo Razón
Los datos sólo se Los datos se Diferencias Punto 0 y razón entre
clasifican ordenan significativas entre valores significativas
valores
Ejemplo Ejemplo Ejemplo Ejemplo
• Números de • El número de • Temperatura • Número de pacientes
camisetas de los lista en las clases atendidos.
jugadores. de bachillerato.
Ejercicio 1.3
¿Cuál es el nivel de medición de cada una de las siguientes variables?
Variable Nivel de medición
a) Los números en las camisetas de los corredores de maratones.
❖ Fuentes primarias
Son aquellas que la persona o institución investigadora obtienen directamente de la realidad,
recogiendo los datos con sus propios instrumentos.
❖ Fuentes secundarias
Son informaciones que ya han sido producidas por otras personas o instituciones.
10 Estadística Básica
1.7 Pasos Del Método Estadístico De La Investigación Científica
❖ Método Estadístico
La investigación científica se basa en dos tipos de razonamientos: el deductivo y el inductivo,
mientras que la investigación estadística se desarrolla utilizando el ciclo deductivo-inductivo
en cuatro etapas:
1. Planteamiento del problema.
2. Recolección de la información.
3. Organización de la información.
4. Análisis e interpretación de los resultados.
1. Planteamiento Del Problema
El primer paso de la investigación es definir claramente los objetivos del estudio y relacionar este objetivo
con los valore numéricos de las variables observables. La investigación científica es una actividad con
propósito (finalidad, meta) y como tal para quedar enteramente caracterizado debe dar respuesta a las
siguientes interrogantes fundamentales:
a) ¿En qué consiste el problema objeto de investigación?
b) ¿Qué se quiere conocer?
c) ¿Por qué o para que se plantea su investigación?
d) ¿Sobre quién recae la investigación?
e) ¿Dónde se va realizar?
f) ¿Cuándo se va a realizar?
2. Recolección de la Información
La recolección correcta de los datos es de extrema importancia para el investigador, que tiene que ser
realizada o vigilada por este. Para remarcarlo los investigadores han establecido la ecuación entrada de
“datos basura” es igual salida de análisis “basura”.
Esta etapa consiste en determinar los métodos de recolección adecuado, preparar los instrumentos de
recolección, prueba del método y de los instrumentos de recolección seleccionados y realizar la
recolección de los datos.
1.4 Indique cuáles de las siguientes afirmaciones representan una variable y cuáles una
constante.
a) El número de letras del alfabeto.____________________
b) El número de horas que tiene 1 día._________________
c) La hora en que usted come_____________________
d) El número de centímetros en un metro__________________
e) Su peso____________________
1.5 Analice si las siguientes variables son discretas o continuas.
a) Número de materias que usted ha cursado en su carrera.________________
b) Peso del contenido de las cajas de cereal. __________________
c) Número de libros que usted leyó el año pasado (ojalá que hayan sido
muchos)._______________
d) Número de jonrones conectados por Samy Sosa en 1999.____________________
e) Velocidad de un automóvil en km h .________________________
12 Estadística Básica
1.6 Indique cuáles de las siguientes situaciones corresponden a la estadística descriptiva y
cuáles a la estadística inferencial.
a) Un informe anual para accionistas que detalla los bienes de la corporación._________________
b) Un profesor de historia que anuncia a su grupo el número de estudiantes que obtuvieron la máxima
calificación en un examen reciente._________________
d) El uso de los datos de una muestra en una encuesta para estimar la opinión de la
población._____________________
e) Realizar un estudio de correlación sobre una muestra para determinar si el nivel educativo y el ingreso de
la población están relacionados.____________________
1.7 Roger Amster enseña un curso de inglés para 40 estudiantes. En la clase de ayer, preguntó a los
cinco jóvenes que siempre se sientan en la parte posterior del aula si les gustaría que “A Tale of
Two Cities” fuera la tarea de lectura para la clase siguiente. Tres de los cincos dijeron que “si”.
a) Identifique la población y la muestra en este caso.
b) ¿Es probable que sea una muestra representativa? De no ser así, ¿Por qué no?
1.8 Utilice el sentido común para determinar si el acontecimiento descrito es: imposible;
posible, pero muy improbable; posible y probable.
a) Multa por exceso de velocidad. Mientras conducía a su casa en Connecticut, David fue multado
por conducir a 250 millas por hora en una ruta con un límite de velocidad de 55 millas por
hora._____________________
b) Semáforos. Mientras conducía por la ciudad, Mario se encontró con tres semáforos consecutivos
y todos estaban en verde.__________________
c) Día de Acción de Gracias. El año próximo, el Día de Acción de Gracias caerá
lunes._____________________
d) Suprema Corte. Todos los magistrados de la Suprema Corte de Estados Unidos tienen la misma
fecha de cumpleaños. ______________________
e) Calculadoras. Cuando los 25 estudiantes de estadística encienden su calculadora TI-84 plus, todas
funcionan adecuadamente. _________________
f) Dados de la suerte. Steve Wynn lanzó un par de dados y obtuvo un total de 14
puntos._________________________
g) Máquina tragamonedas. Wayne Newton obtuvo el premio mayor en la máquina tragamonedas en
10 intentos.____________________
Práctica 1. Conceptos Fundamentales de la Estadística 13
1.9 La directora de producción para la planta de Ford Motor Company, debe informar a su
superior sobre el número de días promedio que los empleados de la planta se ausentan del
trabajo. Sin embargo, la planta emplea más de dos mil trabajadores, y la directora de
producción no tiene tiempo de revisar los registros personales de cada empleado. Como
asistente usted debe decidir cómo puede ella obtener la información necesaria.
a) ¿Qué consejo podría darle?
1.10 ¿Qué nivel de medición utilizaría usted en cada uno de los siguientes casos:
a) Un sistema para evaluar a los empleados con base en el número de días que faltan al
trabajo.
c) Un sistema para registrar la población de las ciudades en las cuales viven los clientes.
1.11 ¿En cuál escala de medida puede expresarse cada una de estas variables?
a) Los estudiantes clasifican a su profesor de estadística sobre una escala de “Terrible”, “No
tan malo”, “Bueno”, “Maravillosos”, y “dios griego”
b) Los estudiantes en una universidad están clasificados por profesión, tales como marketing,
administración y contaduría.
e) Una clasificación de estudiantes que cursan primero, segundo, tercero o último grados.
1.13 ¿Cuál es el nivel de medición de los siguientes artículos relacionados con el negocio de los periódicos?
a) El número de periódicos vendidos todos los domingos durante 2011.
1.14 La empresa Gallup realizó una encuesta telefónica empleando una muestra aleatoria nacional
compuesta de 1005 adultos de 18 años o más. En la encuesta se les preguntó a los participantes “Cómo
considera que es su salud física en este momento” (www.gallup.com, 7 de febrero de 2002)”. Las
respuestas podían ser Excelente, Buena, Regular o Ninguna opinión.
a) ¿Cuál es el tamaño de la muestra de esta investigación?
b) ¿Cuál es la población?
d) ¿Sería conveniente usar promedios o porcentajes para resumir los datos de estas preguntas?
e) De las personas que respondieron, 29% dijo que su salud era excelente. ¿Cuántos fueron los individuos
que dieron esta respuesta?
Práctica 1. Conceptos Fundamentales de la Estadística 15
1.15 El Departamento de Comercio informa haber recibido las siguientes solicitudes para
concursar por el Malcolm Baldrige Nacional Quality Award: 23 de empresas fabricantes
grandes, 18 de empresas grandes de servicios y 30 de negocios pequeños.
a) ¿Es el tipo de empresa una variable cualitativa o cuantitativa?
1.16 En un estudio sobre los suscriptores de Business Week de Estados Unidos se recogen
datos de una muestra de 2861 suscriptores. Cincuenta y nueve por ciento de los
encuestados señalaron tener un ingreso de $75 000 o más y 50% indicaron poseer una
tarjeta de crédito de American Express.
a) ¿Cuál es la población de interés en este estudio?
c) ¿Es la posesión de una tarjeta de crédito de American Express una variable cualitativa
o cuantitativa?
d) Describa cualquier inferencia estadística posible para Business Week con base en esta
encuesta.
16 Estadística Básica
1.17 En otoño de 2003, Arnold Schwarzeneger disputó al gobernador Gray Davis la
gobernación de California. En una encuesta realizada entre los votantes registrados se
encontró que Arnold Schwarzeneger iba a la cabeza con un porcentaje estimado de 54%
(Newsweek, 8 de septiembre de 2003).
a) ¿Cuál fue la población en este estudio?
1.18 La UASD ha encuestado a sus estudiantes para averiguar el tiempo semanal medio que
dedican a navegar por internet.
a) ¿Cuál es la población?
b) ¿Cuál es la muestra?
c) ¿Cuál es el estadístico?
b) ¿Cuál es la muestra?
c) ¿Cuál es el estadístico?
b) ¿Cuál es el 5% de 5020?
a) ¿Cuál es el número real de usuarios de Internet que afirmaron que compran en línea de
manera frecuente u ocasional?
b) De los 734 usuarios de internet encuestados por Gallup, 323 dijeron que de manera
frecuente u ocasional realizan planes de viaje consultando información en línea. ¿Cuál
es el porcentaje de personas que afirmaron que de manera frecuente u ocasional realizan
planes de viaje consultando información en línea?
1.23 En una encuesta que realizó Gallup con 976 adultos, 68 dijeron que consumen una
bebida alcohólica al día.
b) De los 976 adultos encuestados, el 32% dijo que nunca bebe. ¿Cuál es el número real
de adultos encuestados que dijeron que nunca beben?
CAPÍTULO 2
Organización de los Datos
Distribuciones de Frecuencias y su Representación Gráfica
Competencias
Específicas
➢ Razona y argumenta.
Construye e interpreta
distribuciones de frecuencias
cualitativas y cuantitativas.
Organiza e interpreta datos
cualitativos o cuantitativos en una
gráfica apropiada.
➢ Comunica
Presenta cada paso para la
construcción de una distribución de
frecuencias cualitativa o
Fuente: Ministerio de Educación
cuantitativa.
Una vez que definimos con cuidado un problema, necesitamos
Presenta cada paso para la
recoger datos. A menudo el número de observaciones construcción de una gráfica de
recogidas es tan grande que los resultados efectivos del estudio acuerdo a la naturaleza de los datos
no están claros. Queremos reducir lo más posible una masa de y al tipo de representación que se
desee.
datos, evitando al mismo tiempo la posibilidad de ocultar
características importantes por reducirlos excesivamente. ➢ Modela y Representa
Para lograr el punto de equilibrio desafortunadamente no Modela e interpreta situaciones de
la vida diaria a través de las
existe un método único, sin embargo, la línea de ataque distribuciones de frecuencias y sus
adecuada normalmente es específica de cada problema y gráficas.
depende de dos factores: el tipo de datos y el fin del estudio.
➢ Conecta
Se ha dicho que una imagen vale más que mil palabras. Utiliza las distribuciones y las
gráficas para resumir un conjunto
Asimismo, un gráfico vale más que mil cifras.
de datos y explicarlo de una manera
sencilla.
Una vez los datos han sido recolectados, siempre debemos
preguntarnos: ¿cómo se pueden organizar? ¿Cómo se pueden ➢ Resuelve problemas
graficar? ¿Qué nos sugiere la gráfica? Resuelve problemas del contexto
educativo que impliquen
En esta unidad, se introducen tablas y gráficas adecuadas, construcciones de distribuciones y
como distribuciones de frecuencia, gráficos de barras, gráficos de gráficas.
de tarta, diagramas de pareto, gráficos de series temporales, ➢ Utiliza herramientas
histogramas, diagramas de tallo y hoja, ojivas y otras. Nuestro tecnológicas
objetivo es resumir los datos de manera que tengamos una Usa Excel, con el complemento
imagen clara y precisa. MegaStat y otras herramientas
tecnológicas para construir
Paul Newbold distribuciones de frecuencias y
gráficas.
Estadística Básica 20
2.1 Introducción
Cuando la cantidad de información recolectada es relativamente grande, para responder a cuestionantes que
impliquen generalizaciones de los datos originales, es necesario tomar en cuenta las distribuciones de
frecuencias y las gráficas, que son dos formas de resumir de manera genérica los datos originales.
2.2 Organización de los datos.
Una distribución de frecuencias es una tabla en la que organizamos los datos en clases, es decir, en grupos
de valores que describen una característica de los datos.
Ejemplo 2.2
Tabla de frecuencias relativas de los vehículos que vendió Grupo Motors por locación.
Locación Números de autos Frecuencia Relativa
Toyota 52 52
f r1 = 100% = 0.28 29%
180
Ford 40
Honda 45
Peugeot 43
Total 180
Capítulo 2. Organización de los datos 21
➢ Distribución de frecuencia cuantitativa acumulada
Otro enfoque útil para expresar los datos es la tabla de distribución de frecuencias acumuladas,
que presenta la cantidad de observaciones que están dentro o por debajo de cada una de las
clases. Cuando las frecuencias acumuladas se dividen entre el número total de observaciones,
el resultado es una tabla de distribución de frecuencias relativas acumuladas.
Ejemplo 2.3
Tabla de frecuencias relativas de los vehículos que vendió Grupo Motors por locación.
Locación Números de autos Frecuencia Acumulada
Toyota 52 F1 = 52
Ford 40 F2 = 52 + 40 = 92
Honda 45
Peugeot 43
Total 180
Ejercicio 2.1
Complete la siguiente tabla de frecuencia.
Especie en peligro de f fr F Fr
extinción en USA
Mamíferos 69
Aves 77
Reptiles 14
Anfibios 9
Peces 71
Total 240
Estadística Básica 22
➢ Distribuciones de frecuencias cuantitativas.
Es una agrupación de datos cuantitativos en clases mutuamente excluyentes que muestra el número
de observaciones en cada clase.
Considere las medidas del pulso (en latidos por minuto) obtenidas de una muestra aleatoria simple
de 20 mujeres y de otra muestra aleatoria simple de 30 hombres, con los resultados que se presentan
a continuación:
Pulsos (latidos por minutos) de hombres y mujeres
Mujeres
60 72 68 64 80 64 68 68 80 76
76 76 80 104 88 60 76 72 72 88
Hombres
68 64 8 72 64 72 60 86 76 60 84 72 56 64 60
72 56 68 64 60 68 60 60 56 84 72 84 72 84 86
El pulso es sumamente importante, ¡ya que es muy difícil sobrevivir sin él! Los médicos utilizan el
pulso para evaluar la salud de los pacientes. Cuando el pulso tiene una frecuencia demasiado elevada
o baja, esto podría indicar que existe algún problema médico; por ejemplo, un pulso muy alto podría
indicar que el paciente tiene una infección o que está deshidratado.
Un problema surge cuando trabajamos con grandes conjuntos de datos, para poder interpretar los
datos necesitamos a menudo organizarlos y resumirlos elaborando una tabla llamada distribución
de frecuencias.
Antes de seguir trabajando con la distribución de frecuencias cuantitativas es necesario dominar algunos
conceptos:
Clase. Cada categoría de la distribución de frecuencias. (La tabla #1 tiene 5 clases)
Frecuencia. La cantidad de datos que caen en cada clase. (En la tabla #1 los números 7, 7,…, son las
frecuencias)
Límites de clase. Son los valores extremos de cada clase. (Los números 60 y 69 son los límites de la primera
clase)
Rango. Es la diferencia entre el dato máximo y el mínimo. ( R = xmax − xmin ) Rv = 104 − 60 = 44
Anchura de clase. Es la diferencia entre el límite inferior de una clase y el límite inferior de la siguiente
clase. ( A = li 2 − li1 ) (10 es la amplitud, ya que 70-60 =10). Para calcular la amplitud también usaremos la
fórmula R
A=
C
Tabla #1
Latidos por minutos de las mujeres
Pulso Frecuencia
60 y menos de 70 7
70 y menos de 80 7
80 y menos de 90 5
90 y menos de 100 0
100 y menos de 110 1
Total 20
Capítulo 2. Organización de los datos 23
➢ Características de una tabla de distribución de frecuencias
Al construir una tabla de distribución de frecuencias para un conjunto de datos específicos, se
deben observar las características siguientes:
1. Las clases deben ser mutuamente excluyentes, es decir, cada dato sólo puede caer en una
clase. No debe haber traslape entre las clases: (15 y menos de 20, y 19 y menos de 25), en
estas dos clases hay traslape, ¿por qué?
2. El conjunto de clases debe ser exhaustivo, es decir, debe incluir todos los datos
considerados.
3. Si es posible las clases deben tener la misma amplitud.
4. La elección de la cantidad de clases a utilizar es un proceso subjetivo, esta debe ser
proporcional a la cantidad de datos. En general es conveniente elegir entre 5 y 20 clases.
En muchos de los casos usaremos la fórmula: C = 1 + 3.33log n , para aproximar la cantidad
de clases a utilizar.
5. Cuando sea posible las amplitudes de clases deben ser números redondos, es decir, 5,
10,15,…, 100.
Ahora veamos cómo se construye una distribución de frecuencia utilizando los pulsos de los
latidos por minutos de las 40 mujeres.
1. Rango. ( R = xmax − xmin )
R = 104 − 60 = 44
5. Calcule los límites inferiores y superiores de cada clase. Sume el ancho de la clase ( A = 10 ) al límite
inferior de la primera clase para obtener el primer límite superior, como el límite superior no está
contenido en la primera clase, ese será el límite inferior de la segunda clase. Con este algoritmo se
completa los límites en las demás clases.
Latidos por minutos
Pulso Frecuencia
60 y menos de 70
70 y menos de 80
80 y menos de 90
90 y menos de 100
100 y menos de 110
Total 20
Formato anterior
Pulso Frecuencia
60 y menos de 70 7
70 y menos de 80 7
80 y menos de 90 5
90 y menos de 100 0
100 y menos de 110 1
Total 20
Forma similar
Pulso Frecuencia
60 – 69 7
70 – 79 7
80 – 89 5
90 – 99 0
100 – 109 1
Total 20
Estadística Básica 26
Ejercicio 2.2
Construye una distribución de frecuencias para los datos dados a continuación:
Pulsos (latidos por minutos) de hombres
Hombres
68 64 8 72 64 72 60 86 76 60 84 72 56 64 60
72 56 68 64 60 68 60 60 56 84 72 84 72 84 86
Ordene los datos de menor a mayor
PASOS:
1. Busco el rango.
R = xmax − xmin
PASOS:
1. Busco el rango.
R = xmax − xmin
100 129 52 F = 52
130 159 40 F = 52 + 40 = 92
160 189 45
190 219 43
Total 180
Ejercicio 2.4
Para la siguiente tabla de frecuencia, agregue una columna de frecuencia acumulada,
frecuencia relativa, y otra de frecuencia relativa acumulada.
Edad de un grupo de personas f fr F Fr
05 - 09 6
10 - 14 2
15 - 19 10
20 - 24 4
25 - 29 1
Total 23
Capítulo 2. Organización de los datos 29
Ejemplo 2.6
Una enfermera registró el peso de 30 hombres cuya edad estaba comprendida entre 20 y 25
años. Construya una distribución de frecuencias completa.
Peso de las 30 personas
160 120 134 130 112 154 170 200 200 175
150 136 145 154 180 148 159 154 119 115
155 133 154 130 170 155 161 153 154 126
Organizamos los datos
112 115 119 120 126 130 130 133 134 136
145 148 150 153 154 154 154 154 154 155
155 159 160 161 170 170 175 180 200 200
PASOS:
1. Busco el rango.
R = xmax − xmin
30
Estadística Básica 30
Interpretación de una distribución de frecuencias.
Si tomamos la distribución del peso de los 30 hombres, se pueden extraer informaciones
interesantes.
Pesos f f r (%) F Fr (%)
110 y menos de 125 4 13.3 4 13.3
125 y menos de 140 6 20 10 33.3
140 y menos de 155 9 30 19 63.3
155 y menos de 170 5 16.7 24 80
170 y menos de 185 4 13.3 28 93.3
185 y menos de 200 0 0 28 93.3
200 y menos de 215 2 6.7 30 100
30
a) ¿Cuántos hombres tienen un peso entre 155 y menos de 170 libras?
Existen tres formas diferentes de presentar los datos estadísticos, que son: Presentación
escrita, presentación tabular y presentación gráfica.
Los elementos básicos de todo cuadro son: Título, encabezados, cuerpo del cuadro, columna
matriz y Fuente.
1. Título: 2. Encabezados:
Sirve para describir el contenido del cuadro. Son los distintos subtítulos que se colocan en
Se debe indicar que el título debe responder las la parte superior de cada columna.
inquietudes: ¿qué son los datos?, ¿dónde?,
¿cuándo? y ¿cómo se recogieron?
(Gómez, 2008)
5. Fuente:
Indica la procedencia de los datos. Cuando se usa una tabla con informaciones que ya han sido
elaboradas por otros, es un deber señalar la institución que las recopiló y presentó, Sin
embargo, si las informaciones fueron recopiladas y presentadas por la misma persona no es
necesario señalar la fuente.
De acuerdo al tipo de variable que vamos a representar, las principales gráficas son las
siguientes:
a. Gráfica de barras
b. Gráfica de pastel
c. Histograma
d. Polígono de frecuencias
e. Ojivas
f. Gráfica lineal
g. Tallo y hojas
Capítulo 2. Organización de los datos 33
a. La gráfica de barras.
Representa las frecuencias de acuerdo con las alturas relativas de un conjunto de rectángulos.
Los rectángulos adyacentes tienen una separación entre ellos. Este tipo de gráfico se usa para
representar datos cualitativos.
Ejemplo 2.8
Represente por medio de un gráfico de barras las ventas de Grupo Motors por locación
manualmente y luego utilizando Excel.
Locación Números de autos
Toyota 52
Ford 40
Honda 45
Peugeot 43
Total 180
1. Copie estos datos a
Excel.
2. Seleccionamos las
celdas que
queremos graficar.
Estadística Básica 34
3. Insertamos el gráfico
Ejemplo 2.9
Construye una gráfica de pastel con Excel usando la información de la tabla siguiente.
Gastos de la lotería del estado de Ohio en 2009
Uso del dinero de las ventas Cantidad ( en millones de dólares)
Premios 1460.0
Educación 702.3
Bonos 150
Gastos 124.3
Total 2436.6
Siguiendo los pasos para
graficar en vez de las barras Gastos de la lotería de Ohio en 2009
usamos el circular y
tendríamos.
6% 5%
Análisis gráfico
Dado que cada rebanada del
pastel representa la porción
relativa de cada componente, es
posible compararlas con
facilidad: Premios Educación Bonos Gastos
✓ El gasto más cuantioso de la
lotería se canaliza hacia los
premios (60%) Nota:
✓ Cerca de la tercera parte En la mayoría de los casos, las gráficas de pastel son las más
(29%) de los fondos informativas cuando se trata de comparar la diferencia relativa
recaudados se transfieren a en el porcentaje de observaciones de cada una de las variables
educación. de la escala nominal.
✓ Los gastos de operación
apenas significan 5% de los
fondos recaudados.
Estadística Básica 36
Ejercicio 2.6
DeCenzo Specialty Food and Beverage Company sirve una bebida de cola con un sabor
adicional, Cola-Plus, muy popular entre sus clientes. La compañía se encuentra interesada en
la preferencia de los consumidores por Cola-Plus en comparación con Coca-Cola, Pepsi y una
bebida de Lima-limón. Se pidió a 270 consumidores seleccionados de forma aleatoria que
degustaran una prueba y eligieran la bebida que más les gustaba. Los resultados aparecen en
la siguiente tabla:
Bebida Número
Cola-Plus 60
Coca-Cola 90
Pepsi 90
Lima-limón 30
Total 270
a) ¿Son los datos de naturaleza cuantitativa o cualitativa?
Gráfica de pastel
➢ Análisis gráfico
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Capítulo 2. Organización de los datos 37
c. Histograma
Describe una distribución de frecuencias mediante una serie de rectángulos adyacentes, cuya
base es proporcional a la anchura de cada clase (Valor del intervalo) y cuya altura es
proporcional a la frecuencia. En este tipo de gráfico se representan datos cuantitativos.
Ejemplo 2.10
Representa por medio de un histograma la siguiente distribución de frecuencias, usando Excel.
Cantidad de conductores en cada categoría de velocidad en un tramo de una carretera
Velocidad(MPH) Cantidad de conductores
30- menos de 40 2
40- menos de 50 9
50- menos de 60 15
60- menos de 70 28
70- menos de 80 12
80- menos de 90 6
90-menos de 100 3
Después de buscar las marcas de clases se grafican estas en el eje x y las frecuencias en el
eje y. El gráfico debe quedar así:
➢ Análisis gráfico
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Estadística Básica 38
Ejercicio 2.7
Representa por medio de un histograma la distribución de los pesos de 100 estudiantes del
CURSA que se muestra a continuación (usando Excel).
Peso (en libras) Cantidad de estudiantes
120 – menos de 130 6
130 – menos de 140 20
140 – menos de 150 30
150 – menos de 160 27
160 – menos de 170 10
170 – menos de 180 5
180 – menos de 190 2
➢ Análisis gráfico
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Capítulo 2. Organización de los datos 39
d. Polígono de frecuencias
Estrechamente relacionado con el histograma, este consiste en segmentos de líneas que
conectan los puntos formados por las intersecciones de las marcas de clases y las frecuencias
de clase.
Luego de graficar los puntos, se agregan dos clases, una en cada extremo de la escala de
valores observados. Éstas contienen cero observaciones, pero permiten que el polígono llegue
al eje horizontal en ambos extremos de la distribución.
Ejemplo 2.11
Representa por medio de un polígono de frecuencias la siguiente distribución de frecuencias,
manualmente y usando Excel.
Cantidad de conductores en cada categoría de velocidad en un tramo de una carretera
Velocidad(MPH) Cantidad de conductores Marcas de clases (x)
30- menos de 40 2 30 + 40 70
x= = = 35
2 2
40- menos de 50 9 45
50- menos de 60 15 55
60- menos de 70 28 65
70- menos de 80 12 75
80- menos de 90 6 85
90-menos de 100 3 95
Usando Excel
➢ Análisis gráfico
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
Velocidad (MPH) -------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
Estadística Básica 40
Ejercicio 2.8
Representa por medio de un polígono de frecuencia la distribución de los pesos de 100
estudiantes del CURSA que se muestra a continuación (manualmente y usando Excel).
Peso (en libras) Cantidad de estudiantes x
120 – menos de 130 6
130 – menos de 140 20
140 – menos de 150 30
150 – menos de 160 27
160 – menos de 170 10
170 – menos de 180 5
180 – menos de 190 2
➢ Análisis gráfico
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Capítulo 2. Organización de los datos 41
e. Ojiva
Recordemos que una distribución de frecuencias acumuladas nos permite ver cuántas observaciones
están por encima de ciertos valores. La gráfica de una distribución de frecuencias acumuladas se
conoce como ojiva. Una ojiva es una gráfica lineal que describe frecuencias acumuladas y utiliza
fronteras de clase a lo largo de la escala horizontal, y frecuencias acumuladas a lo largo del eje
vertical.
Ejemplo 2.12
Represente en una ojiva “menor que” la siguiente distribución, manualmente y usando Excel.
Salarios por hora (Dólares) Número de empleados
8 – 10 3
10 – 12 7
12 – 14 4
14 – 16 1
Solución:
Para lograr esto, es necesario transformar la distribución tomando en cuenta los límites
inferiores de cada clase y al final añadiremos una clase para que no queden observaciones
fuera.
Clases Frecuencias acumuladas
Menor que 8 0 ¿Por qué?
Menor que 10 3
Menor que 12 10
Menor que 14 14
Menor que 16 15
Usando Excel: Responda las siguientes
preguntas de acuerdo con
el gráfico.
a) ¿Cuántos empleados
ganan menos de 10
dólares por hora?
b) ¿Cuántos empleados
ganan menos de 12
dólares por hora?
c) ¿Cuántos empleados
ganan menos de 14
dólares por hora?
d) ¿A cuántos empleados
Salario por hora
se les investigó el
salario?
Estadística Básica 42
Ejercicio 2.9
Representa en una ojiva menor la siguiente distribución, manualmente y usando Excel.
Cantidad de conductores en cada categoría de velocidad en un tramo de una carretera
Velocidad (MPH) Cantidad de conductores
30- menos de 40 2
40- menos de 50 9
50- menos de 60 15
60- menos de 70 28
70- menos de 80 12
80- menos de 90 6
90-menos de 100 3
Clases (menor que) Frecuencias acumuladas
Ventas de bikinis
350
300
250
200
150
100
50
0
Marzo Abril Mayo Junio Julio Agosto Septiembre
➢ Análisis gráfico
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Estadística Básica 44
Ejercicio 2.10
La siguiente distribución muestra los quintales de arroz vendidos por una factoría los primeros
6 meses del año 2000. Represente la información en una gráfica de línea:
Año Produción Gráfica de líneas
Enero 40
Febrero 46
Marzo 56
Abril 63
Mayo 73
Junio 78
Julio 60
Agosto 67
➢ Análisis gráfico:
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Capítulo 2. Organización de los datos 45
g. Gráfica de tallo y hojas
Una gráfica de tallo y hojas representa datos cuantitativos separando cada valor en dos partes:
el tallo (el dígito ubicado en el extremo izquierdo y la hoja (el dígito del extremo derecho).
Ejemplo 2.14
Representa el pulso de las mujeres en un diagrama de tallo y hoja
76 72 88 60 72 68 64 80 64 68 120 80 76 68 72 96 52 68 72 80
Tallo (Decenas) Hoja (Unidades)
Ejercicio 2.11
Representa el pulso de los hombres en un diagrama de tallo y hoja
68 64 88 72 64 72 60 88 76 60 96 72 56 64 60 64 84 76 84 88
72 56 68 64 60 68 60 60 56 84 72 84 72 84 88 56 64 56 56 64
Tallo (Decenas) Hoja (Unidades)
Estadística Básica 46
2.4 Tablas y gráficos para describir relaciones entre variables
En los ejemplos anteriores hemos desarrollado gráficos para describir una única variable. Estas
“imágenes” nos han ayudado a analizar mejor la información que contenía un gran conjunto de
datos. Ahora, ampliamos las medidas gráficas para describir las relaciones entre dos o más variables.
En primer lugar, presentamos un diagrama de puntos dispersos para estudiar las posibles relaciones
entre dos variables cuantitativas. A continuación, analizamos tablas cruzadas de dos variables para
examinar posibles relaciones entre variables cualitativas.
➢ Diagramas de puntos dispersos
Un diagrama de dispersión es una gráfica de datos apareados (𝑥, 𝑦). El diagrama de puntos dispersos
es una representación de los datos, que se usa para verificar la relación entre dos variables
cuantitativas.
Muchos docentes quieren hacer creer que son excelentes maestros por las “notas que sacan sus
alumnos”, pero esas calificaciones, en múltiples ocasiones suelen ser un mal indicador. Es por esta
razón que el Minerd estudia la relación existente entre “la nota de presentación de cada asignatura
y la nota obtenida en cada prueba nacional”. Veamos los siguientes ejemplos.
Ejemplo 2.15
Las siguientes calificaciones corresponden a la nota de presentación de 17 estudiantes con su
respectiva nota de la prueba nacional de matemática, en un politécnico de la ciudad de
Santiago. Represente esos datos en un diagrama de dispersión:
Datos hipotéticos de la nota de presentación de un politécnico y el resultado de la prueba de matemática
N P 55 56 60 62 63 63 64 64 65 67 67 68 68 69 69 69 69
NPN 23 24 25 26 26 27 15 26 27 28 28 29 29 28 17 30 30
Para hacer el gráfico manualmente solo marcamos un punto en cada par ordenado. Si
deseamos hacerlo en Excel seleccionamos los datos e insertamos un gráfico de dispersión,
resultando una imagen como la siguiente:
Análisis gráfico:
Relación entre la nota de presentación y la
Una interesante pauta es la tendencia
nota de prueba nacional de matemática
ascendente positiva: la nota de la
32 prueba nacional tiende a aumentar
30
directamente con la nota de
30% (Prueba nacional Mat)
28
26 presentación. Obsérvese también que la
24 relación no suministra una predicción
22 exacta. Algunos estudiantes que
20 obtienen una alta nota de presentación
18
de matemática tienen una calificación
16
14
baja en la prueba nacional. Vemos que
12 la pauta básica indica que las notas más
10 altas obtenidas en la nota de
54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 presentación predicen mayores
70% (Nota de presentación Mat) calificaciones en las pruebas, pero los
resultados no son perfectos.
Capítulo 2. Organización de los datos 47
Ejemplo 2.16
Las siguientes calificaciones corresponden a la nota de presentación de 17 estudiantes con su
respectiva nota de la prueba nacional de matemática, en un politécnico de la ciudad de
Santiago. Representa los datos en un diagrama de dispersión:
Minerd, nota de presentación y la de prueba nacional de matemática de los estudiantes del
aérea de mecatrónica de un politécnico de la regional 08, 1ra convocatoria, 2015.
NP 53 57 50 56 53 53 56 53 55 60 50 51 68 57 60 51 62
NPN 18 15 18 17 18 21 17 21 21 20 19 16 17 20 16 16 17
Representa los datos en un diagrama de dispersión:
Análisis gráfico:
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Estadística Básica 48
2.4.1 Tablas cruzadas
Una tabla cruzada, llamada a veces tabla de contingencia, enumera el número de observaciones
correspondiente a cada combinación de valores de dos variables categóricas u ordinales. La combinación de
todos los intervalos posibles de las dos variables define las casillas en una tabla. Una tabla cruzada de r filas
y c columnas se denomina tabla cruzada de dimensión r×c.
En cada zona residencial, se contactó con 250 hogares por teléfono y se les pidió que indicaran cuál de tres
categorías de productos habían comprado la última vez que habían ido a una tienda de materiales de
construcción.
La encuesta se realizó para determinar la demanda de herramientas, madera y pintura. Las tres zonas
residenciales contienen el mismo número de hogares y, por lo tanto, la muestra aleatoria de 750 representa
la población de hogares de toda la ciudad.
Ejemplo 2.17
Tabla cruzada de la demanda de productos por parte de los hogares por zonas residenciales
Zona Herramientas Madera Pintura Ninguna Total
Este 100 50 50 50 250
Norte 50 95 45 60 250
Oeste 65 70 75 40 250
Total 215 215 170 150 750
Gráfica Análisis gráfico:
-----------------------------------------------------------
Demanda de productos por parte de los
-----------------------------------------------------------
hogares por zona de residencia -----------------------------------------------------------
-----------------------------------------------------------
100
Número de hogares
-----------------------------------------------------------
80
-----------------------------------------------------------
60 -----------------------------------------------------------
40 -----------------------------------------------------------
-----------------------------------------------------------
20
-----------------------------------------------------------
0
Este Norte Oeste -----------------------------------------------------------
-----------------------------------------------------------
Herramientas Madera Pintura Ninguna
-----------------------------------------------------------
-----------------------------------------------------------
Capítulo 2. Organización de los datos 49
2.4.2 Gráfica de barras múltiples o compuestas
Ésta contiene dos o más conjuntos de barras, y se utiliza para comparar dos o más conjuntos
de datos.
Ejemplo 2.18
Construya una gráfica de barras múltiples de los datos, y luego describa cualquier tendencia
de la siguiente tabla que incluye el número (en miles) de hombres y mujeres estudiantes de
educación superior en diferentes años en Estados Unidos.
Año 2004 2005 2006 2007 2008 2009 2010
Hombres 7268 7356 7568 7568 7695 7802 7872
Mujeres 9826 9995 10,203 10,407 10,665 10,838 10,944
Fuente: National Center for Education Statistics
Gráfica de barras múltiples
Anáilisis gráfico:
-------------------------------------------------------------------------------
-------------------------------------------------------------------------------
-------------------------------------------------------------------------------
-------------------------------------------------------------------------------
-------------------------------------------------------------------------------
-------------------------------------------------------------------------------
-------------------------------------------------------------------------------
Ejercicio 2.12
Un estudiante universitario en su primer ciclo tomó las siguientes asignaturas, sacando las
calificaciones que se muestran a continuación, en tres parciales de 20 puntos.
Asignaturas 1er parcial 2do parcial 3er parcial
Matemática 16 18 20
Español 12 20 20
Biología 14 14 18
Geografía 16 15 14
Inglés 15 14 18
Gráfica de barras múltiples
➢ Análisis gráfico
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
Estadística Básica 50
2.4.3 Gráfica de barras por componentes o superpuestas.
En esta gráfica se representan todas las variables en una barra.
Ejemplo 2.19
La siguiente distribución muestra los volúmenes de ventas de los productos A, B y C en los
primeros 4 meses del año 2012 de una compañía. Construye una gráfica de barras
componentes o superpuestas.
Meses A B C Total
Enero 25 35 40
Febrero 35 45 20
Marzo 40 20 10
Abril 50 15 5
Gráfica de componentes o superpuestas
➢ Análisis gráfico
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
Ejercicio 2.13
Representa la siguiente distribución de las ventas de vehículos en una gráfica de barras
componentes o superpuestas.
Meses Toyota Ford Honda Peugeot Total
Enero 52 40 45 43
Febrero 60 43 53 30
Marzo 59 41 56 31
Abril 65 45 64 25
Gráfica de barras componentes
➢ Análisis gráfico
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
Capítulo 2. Organización de los datos 51
2.4.4 Gráfica de líneas múltiples.
Ésta contiene dos o más conjuntos de líneas, y se utiliza para comparar dos o más conjuntos
de datos.
Ejemplo 2.20
Construya una gráfica de líneas múltiples de los datos, y luego describa cualquier tendencia
de la siguiente tabla que incluye el número (en miles) de hombres y mujeres estudiantes de
educación superior en diferentes años en Estados Unidos.
Año 2004 2005 2006 2007 2008 2009 2010
Hombres 7268 7356 7568 7568 7695 7802 7872
Mujeres 9826 9995 10,203 10,407 10,665 10,838 10,944
Fuente: National Center for Education Statistics
➢ Análisis gráfico:
-------------------------------------------------------------
-------------------------------------------------------------
-------------------------------------------------------------
-------------------------------------------------------------
-------------------------------------------------------------
-------------------------------------------------------------
-------------------------------------------------------------
-------------------------------------------------------------
-------------------------------------------------------------
Ejercicio 2.14
Construya una gráfica de líneas múltiples para la distribución de los autos vendidos de una
agencia de vehículos al inicio del año 2010.
Condición Toyota Honda Peugeot Kia
Nuevos 30 20 5 25
Usados 60 55 10 70
Chocados y reparados 45 30 2 50
Gráfica de líneas múltiples
➢ Análisis gráfico:
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
52 Estadística Básica
UNIVERSIDAD AUTÓNOMA DE SANTO DOMINGO
ESTADÍSTICA BÁSICA
PRÁCTICA 2
ORGANIZACIÓN DE LOS DATOS.
2.1 Responde:
a) ¿Cuál es la diferencia entre los datos originales (sueltos) y una distribución de frecuencia?
b) ¿Por qué es útil convertir los datos originales (sueltos) en una distribución de frecuencia?
2.2 Grupos sanguíneos. A continuación se presenta una lista de los grupos sanguíneos O, A, B, y AB de
donadores de sangre elegidos al azar. Construya una tabla donde resuma la distribución de frecuencias
de esos grupo sanguíneos.
2.5 Un conjunto de datos consta de 230 observaciones entre $235 y $567. ¿Qué intervalo de
clase recomendaría?
2.6 Un conjunto de datos contiene 53 observaciones. El valor más bajo es 42 y el más alto
129. Los datos se van a organizar en una distribución de frecuencias.
PASOS:
a) Busco el rango. R = xmax − xmin
d) Construye la tabla.
Práctica 2. Organización de los datos 55
2.8 Quick Change Oíl Company cuenta con varios talleres en el área metropolitana de Seattle.
Las cantidades diarias de cambios de aceite que se realizaron en el taller de Oak Street
los pasados veinte días son las siguientes:
65 98 55 62 79 59 51 90 72 56
70 62 66 80 94 79 63 73 71 85
b) ¿Se comportan los conductores del distrito nacional en ese tramo de acuerdo al informe
de la AMET?
c) La AMET asegura que la velocidad más segura para este tramo es 30 a 59 mph. ¿Qué
proporción de conductores maneja dentro de este intervalo?
Práctica 2. Organización de los datos 61
2.15 La siguiente tabla muestra los idiomas más hablado del mundo y el número aproximado
de hablantes expresado en millones. Represente estos datos en una gráfica de barras.
Gráfica de barras
Análisis gráfico
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
62 Estadística Básica
2.16 La compañía Northwind Traders Tea recibe un informe acerca de las ventas de las cajas
de los productos que 6 empleados han podido poner en el mercado en el primer trimestre
del año 2000. Construye una gráfica de barras múltiples.
Informe de ventas
Empleados Enero Febrero Marzo
Tomás Navarro 55 85 66
María Gonzáles 68 78 94
Antonio Bermejo 77 75 80
Fabricio Noriega 71 65 78
Arturo López 75 78 85
Enrique Gil 68 85 86
Análisis gráfico
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Práctica 2. Organización de los datos 63
2.17 Representa la distribución de las ventas anterior en una gráfica de barras superpuestas
o por componentes.
Informe de ventas
Empleados Enero Febrero Marzo
Tomás Navarro 55 85 66
María Gonzáles 68 78 94
Antonio Bermejo 77 75 80
Fabricio Noriega 71 65 78
Arturo López 75 78 85
Enrique Gil 68 85 86
Gráfica de barras superpuestas
Análisis gráfico
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
64 Estadística Básica
2.18 Construye una gráfica circular a partir del número de medallas obtenidas por cada país
en las Olimpiadas de Invierno del 1998.
Análisis gráfico
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Práctica 2. Organización de los datos 65
2.19 Las notas obtenidas de 50 estudiantes del CURSA en estadística básica se muestran en
la siguiente distribución. Construye un histograma.
Notas Frecuencia
55 y menos de 60 5
60 y menos de 65 6
65 y menos de 70 8
70 y menos de 75 20
75 y menos de 80 7
80 y menos de 85 4
85 y menos de 90 2
90 y menos de 95 1
Gráfica histograma
Análisis gráfico
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
66 Estadística Básica
2.20 Construye un polígono de frecuencia con la distribución de frecuencia de las notas de
los estudiantes del punto anterior.
Notas Frecuencia
55 y menos de 60 5
60 y menos de 65 6
65 y menos de 70 8
70 y menos de 75 20
75 y menos de 80 7
80 y menos de 85 4
85 y menos de 90 2
90 y menos de 95 1
Análisis gráfico
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Práctica 2. Organización de los datos 67
2.21 Representa en una ojiva menor la distribución de los pesos de 35 estudiantes del CURSA
que se muestra a continuación.
Cantidad de estudiantes
Peso
120 y menos de 130 3
130 y menos de 140 8
140 y menos de 150 15
150 y menos de 160 12
160 y menos de 170 5
170 y menos de 180 4
180 y menos de 190 2
Análisis gráfico
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
68 Estadística Básica
2.22 Representa con un gráfico de líneas la cantidad anual de niños vacunados en una
población.
Años Niños vacunados
1980 805
1985 1250
1990 3500
1995 6550
2000 7200
Gráfica de líneas
Análisis gráfico
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Práctica 2. Organización de los datos 69
2.23 La tabla que se presenta a continuación refleja los indicadores de promoción y
aplazamiento de los estudiantes que asistieron a la primera convocatoria de pruebas
nacionales, de la modalidad general, del nivel secundario, del distrito 04,
de la regional 08, año 2015-2016
TANDA PROMOVIDO (%) APLAZADO (%) TOTAL
JEE 67 33 100%
JER 68 32 100%
JEN 47 53 100%
Análisis gráfico
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
70 Estadística Básica
2.24 Una compañía estudia el uso de cajeros automáticos en una ciudad. Una muestra de 30
cajeros mostró que éstos se utilizaron la siguiente cantidad de veces el día de ayer.
Elabore un diagrama de tallo y hojas.
83 64 84 76 84 54 75 59 70 61
63 80 84 73 68 52 65 90 52 77
95 36 78 61 59 84 95 47 87 60
Diagrama de tallo y hojas
Tallo Hojas
2.25 Molly’s Candle Shop tiene diversas tiendas de venta de menudeo en las áreas costeras
de Carolina del Norte y Carolina del Sur. Muchos de los clientes de Molly´s han
solicitado que les envíe sus compras. La siguiente gráfica muestra el número de paquetes
enviados por día durante los pasados 100 días.
2.27 La siguiente gráfica muestra los salarios por hora que percibe una muestra de soldadores
en la zona de Atlanta, Georgia. (Ojiva menor que)
c) ¿Alrededor de 75% de los soldadores ganan menos de cierta cantidad? ¿Qué cantidad
es ésta?
Color de pelo
Rubio
Pelirrojo
Moreno
b) ¿La mayoría de los días, la temperatura fue bajo cero o sobre cero?_________________
2.32 ¿Cuántos mensajes se enviaron en los últimos tres meses del año?
a)10 b) 17 c) 9 d) 20 e) 35
Imagine que el maestro de estadística dio un examen con un valor de 20 puntos a un grupo de
20 participantes y los resultados fueron los siguientes:
20 13 7 12 18 16 17 9 11 10
12 18 14 17 3 5 6 3 1 15
Un participante le pregunta al facilitador, ¿cómo nos fue profe?, si usted fuera el facilitador,
¿qué le responde?
Una pregunta cómo esta podríamos responderla con un número que represente el equilibrio
de los datos. A las medidas que se sitúan en el centro de un conjunto de datos se le conoce
como medidas de tendencia central.
Antes de continuar con el estudio de las medidas de tendencia central, necesitamos revisar el
concepto de sumatoria por su aplicación en este tema.
En lugar de escribir todos esos términos, introducimos una manera más concisa de expresar
dicha suma, llamada notación de sumatoria. Utilizando dicha notación, podemos escribir la
suma como:
n
X
i =1
i = X 1 + X 2 + X 3 + ... + X n ; donde i, n N
SÍMBOLO SIGNIFICADO
Letra griega mayúscula sigma, que indica sumatoria.
Estos naturales indican dónde inicia y dónde termina la suma,
respectivamente.
Variable
NOTA:
Cuando la sumatoria se realiza con todos los datos (de 1 a n) se abreviará de la siguiente manera:
Capítulo 3. Medidas de Tendencias Céntricas 77
Ejemplos 3.1
Para los siguientes datos, determine la sumatoria correspondiente.
1. X: 6 8 9 10
Xi =
2. Y 4 -10 20 25 8 5 5
Y =
i =2
i
Y 4 -10 20 25 8 5 6
Y
i =3
i
2
=
4. Z 2 -12 14 16
Z +3 =i
5. Z 2 -12 14 16
(Z i + 3) =
6. X: 6 8 9 10 X i
2
=
X: 6 8 9 10
( Xi ) =
2
7.
PROPIEDADES DE LA SUMATORIA
No PROPIEDAD SIGNIFICADO
1 La sumatoria de una constante es igual a n veces la constante.
Fórmula para la media de una muestra Fórmula para la media de una población
x x
x= =
n N
Ejemplo 3.2
Las notas de dos estudiantes del Liceo Nocturno “Aguas de Amor” en el primer cuatrimestre
fueron las siguientes.
Alumnos Nota 1 Nota 2 Nota 3 Nota 4 Promedio
A 85 90 98 95 92
B 94 85 80 75
a) ¿Qué se observa en el comportamiento de las notas del alumno A?
c) Si usted es el/la director/a del liceo, ¿qué harías en el segundo mes para evitar el declive
de las notas de este estudiante?
Capítulo 3. Medidas de Tendencias Céntricas 79
➢ Ventajas y desventajas de la media aritmética
Ejercicio 3.1
Complete la tabla y deduzca qué sucede.
Datos Media
1, 2, 5, 9, 10
1, 2, 5, 9, 100
1, 2, 5, 9, 1000
1, 2, 5, 9, 10000
➢ ¿Qué ventajas posee la media? ➢ ¿Qué desventajas tiene la media?
Fácil de calcular y es la más usada. La media es sensible a los datos extremos
Ejercicio 3.3
Complete la tabla y deduzca qué sucede.
Datos Promedio x−x
2 2 + 5 +1+ 4
x=
5 4
1 12
x= x=3
4 4
( x − x) =
n=4
Ventaja
Una ventaja de la media es que resulta relativamente confiable, de manera que cuando se seleccionan
muestras de la misma población, las medias muéstrales tienden a ser más consistentes que otras
medidas de tendencia central.
3.3 Características de la media aritmética
1. Todo conjunto de datos cuantitativos posee una media y esta es única.
2. Todos los valores se encuentran incluidos en el cálculo de la media.
3. La media es muy sensible a los datos extremos. Un valor extremo perturba
considerablemente el equilibrio de los datos.
4. La suma de las desviaciones de cada valor con respecto a la media es cero. ( X − ) = 0
80 Estadística Básica
Desventaja de la media
Una desventaja de la media es su sensibilidad a los valores extremos, la mediana resuelve en
gran medida, esa desventaja. La mediana es el valor intermedio, ya que la mitad de los datos
están por debajo de la mediana y la otra mitad por encima de ella.
Ejemplo 3.3
Calcule la mediana de los siguientes datos:
Datos Ordene los datos Mediana
a) 8, 10, 4, 3, 1, 15
b) 2.5, 1.8, 1.2, 2.48, 2.0
c) 2, 3, 5, 7, 10
d) 2, 3, 5, 7, 100
e) 2, 3, 5, 7, 1000
➢ ¿Qué observa en los ejemplos c, d, y e? ¿A qué conclusión llegas?
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
3.5Características de la mediana
1. En su cálculo no se incluyen todos los valores de la variable.
2. La mediana no es afectada por los valores extremos.
Capítulo 3. Medidas de Tendencias Céntricas 81
3.6 Moda para datos sueltos
La moda es otra medida de tendencia central de importancia en la descripción y resumen de
una distribución de frecuencias.
Es utilizado en el lenguaje común, por ejemplo, ¿cuándo las damas dicen que una cartera está
de moda? En estadística se tiene una idea similar de la moda de un conjunto de datos.
Moda
Se define como el dato con mayor frecuencia.
Ejemplo 3.4
Complete la tabla.
Datos Moda
a) 1, 2, 4, 2, 3
b) 1, 2, 5, 9, 4, 999
c) 1, 2, 1, 2
d) 1, 2, 1, 2, 5
e) 1, 2, 5, 9, 5, 555
3.7Características de la moda
1. En su cálculo no se incluyen todos los valores de la variable.
2. No es afectada por los valores extremos.
3. El valor de la moda puede afectarse de acuerdo con el método de designación de los intervalos.
82 Estadística Básica
Comparación entre la media, mediana y moda.
Al decidir si vamos a utilizar la media aritmética, mediana o moda en una distribución
unimodal, se debe tomar en cuenta la forma la distribución de los datos, que puede ser de tres
maneras: simétrica, con sesgo positivo o con sesgo negativo.
1. Una distribución es simétrica cuando la curva que la representa es exactamente igual a ambos
lados de un punto de referencia. Si una distribución es simétrica decimos que es insesgada. En
este tipo de distribución la media, mediana y la moda son iguales. Por tanto, cuando la
distribución es simétrica no importa la medida que se use, pues son iguales. Observa la figura 1.
2. Una distribución de datos tiene asimetría positiva o está sesgada a la derecha si la cola se
extiende más a la derecha del pico que a la izquierda. En este tipo de distribución la
𝑀𝑜𝑑𝑎 < 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 < 𝑀𝑒𝑑𝑖𝑎. En distribuciones sesgadas la mediana suele la mejor opción.
Observa la figura 2.
Hoy en día el uso de las medidas de tendencias céntricas para datos agrupados resulta poco
útil por el avance de las Tics, es por esta razón que sólo nos limitaremos a mencionar las
fórmulas sin ninguna aplicación o resolución de ejercicios.
Para calcular la media, mediana y moda si los datos están en una distribución de frecuencia
se debe usar las fórmulas descritas a continuación.
( f x)
x=
n
Esta misma fórmula se usará cuando los datos aparezcan ordenados en una distribución de
li + ls
frecuencia con la salvedad de que x = es el punto medio de cada clase.
2
n Es la mitad del número de datos (recuerde que la mediana se sitúa en la mitad de los datos)
2
Fi−1 Es la sumatoria de las frecuencias que están por debajo de la clase que contiene a la mediana.
c c = li2 − li1
Es el tamaño de la clase, se determina así:
84 Estadística Básica
3.10 Moda de una muestra de datos agrupados
Si los datos aparecen agrupados para determinar la moda se usará la fórmula:
d c
mod = li + 1
d1 + d 2
Nota:
li Es el límite inferior de la clase que tiene la mayor frecuencia.
d1 = f m − f m −1
d 2 = f m − f m +1
c = li2 − li1
Es el tamaño de la clase.
Capítulo 3. Medidas de Tendencias Céntricas 85
3.11 Media Ponderada
Situación introductoria
Una estudiante obtuvo calificaciones de 90 puntos en el examen parcial, 70 puntos en el examen final y 83
puntos en un proyecto semestral. Si estas tres notas se importantizan en 20%, 70% y 10% respectivamente,
¿Cuál es la media de las calificaciones?
Solución:
90 + 70 + 83
x= = 81
3
➢ ¿Será 81 realmente la media que representa estos datos? ¿Qué debilidad tiene esta media?
Definición
Media ponderada. Esta media nos permite calcular un promedio que tome en cuenta la importancia de cada
valor con respecto al total. La fórmula es:
Ejemplo 3.9
Un estudiante realizó 17 créditos en una universidad durante el primer cuatrimestre. Suponga que se le asigna
un valor de 4 a A, 3 a B, 2 a C, 1 a D y 0 a F.
Asignatura Calificación Valor Créditos V*C
Inglés C 4
Matemáticas B 5
Biología B 3
Español C 5
Total 17
Calcule la calificación cuatrimestral media del estudiante.
Solución:
( w x)
x=
w
Respuesta
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
86 Estadística Básica
Ejercicio 3.5
Considere la siguiente muestra de cinco valores y las ponderaciones correspondientes y
calcule su media:
x w 𝑥∗𝑤
4.6 8
3.2 3
5.4 6
2.6 2
5.2 5
Solución y Respuesta:
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Capítulo 3. Medidas de Tendencias Céntricas 87
3.12 Media geométrica
Imagina que tenemos tres elementos consecutivos a, m y b de una
progresión geométrica como se muestra en la figura que está a la derecha.
m b
Esto significa, que r = = , lo que implica que m = ab m = ab , a esta
2
a m
expresión se le conoce como la media geométrica para dos valores, pero si
son varios valores, entonces, la media geométrica es:
xg = n x1 x2 x3 xn
Ejemplos 3.10
Calcula la media geométrica de:
Datos Media geométrica
a) 2, 18
b) 9, 3, 3
c)1, 3, 9, 2
d)2, 3, 5, 6, 1
Nota:
La media geométrica suele utilizarse para promediar por ciento (tasa de interés). Cuando
trabajamos con cantidades que cambian cada cierto tiempo y se requiere conocer una tasa
promedio de cambio utilizamos la media geométrica.
t g = 1.08977
Respuestas:
La fábrica aumentó 8.98% en promedio la producción anual de tableros de circuitos eléctricos.
Ejercicio 3.6
La siguiente distribución presenta el gasto (millones de pesos dominicanos) del gobierno
central durante el periodo 1992-1996. Calcule el aumento porcentual promedio del
crecimiento en cada año.
Año Gasto Factor de crecimiento
1992 16,056
1993 20,727.5
1994 23,135.3
1995 24,107.4
1996 27,691.1
Solución:
Respuesta:
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Capítulo 3. Medidas de Tendencias Céntricas 89
Otro modelo de aplicación de la media geométrica se relaciona con la determinación de un
cambio porcentual promedio durante cierto periodo. Por ejemplo, si usted ganó $30 000 en el
año 2000 y $50 000 en el 2010, ¿cuál es la tasa anual de incremento durante el periodo? Ésta
es de 5.24%. La tasa de incremento porcentual promedio se deduce a partir de la fórmula del
interés compuesto:
s = c (1 + i ) c (1 + i ) = s
n n
s s
(1 + i ) (1 + i )
n n
= n
= n
c c
s s
1+ i = n i= n −1
c c
Ejemplo 3.13
Una persona toma prestado de 827,000 pesos en el año 2015 y debe de pagar un total de
1, 665,000 en 2020. Durante este periodo:
a) ¿Cuánto pagó de intereses?
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
90 Estadística Básica
3.14 Características y aplicaciones de la media geométrica.
1. Toma en cuenta todos los valores de la variable. Si uno de los valores es cero, la media
geométrica dará cero.
2. La media geométrica es afectada por datos extremos, aunque en menor medida que la
media aritmética.
3. Es mayormente usada para promediar tasas de cambio, razones y valores que muestren una
progresión geométrica.
xa = 4.25
Respuestas:
La media armónica de la muestra de datos es 4.25
3.15 Características y aplicación de la media armónica:
1. Se toman en cuenta todos los valores de la variable para su cálculo.
2. Es menos afectada por los datos extremos.
3. El uso de la media armónica no es común, sin embargo, es de gran utilidad cuando se trata
de algunas magnitudes físicas y otros campos relacionados.
Capítulo 3. Medidas de Tendencias Céntricas 91
3.16 Media cuadrática
La media cuadrática se define como la raíz cuadrada de la media aritmética de los cuadrados
de los valores de la variable. La fórmula es:
xc =
x 2
N
Esta medida es útil en muchos cálculos de ciencias.
Ejemplo 3.15
Calcule la media cuadrática de los datos: 1, 3, 4, 5, 7
Solución
12 + 32 + 42 + 52 + 72
xc =
5
1 + 9 + 16 + 25 + 49
xc =
5
100
xc = = 20 = 4.47
5
xc = 4.47
Respuestas:
La media cuadrática de la muestra de datos es 4.47
Ejercicio 3.9
Encuentre la media cuadrática para los siguientes datos muestrales: 10, 12, 24, 13,15, 22
Solución:
Respuesta:
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
3.17 Características y aplicación de la media cuadrática:
1. En el cálculo de media cuadrática se emplean todos los datos de la variable.
c) ¿Cuál es el por ciento de estudiante que obtuvo una nota igual o superior a 88 puntos?
a) 2, 4, 5, 7
b) 2.1, 3.2, 3.6, 5.0, 7.2
c) 11, 14, 18, 22, 25, 28, 30
d) 110, 112, 115, 120, 133
3.2 Represente cada una de las siguientes expresiones por medio de la notación de sumatoria:
a ) x1 + x2 + + x10 =
b) x1 + x2 + x3 =
n
b) ( xi − 3) =
i =1
n
c ) ( 2 xi ) =
i =1
n
x
d ) i =
i =1 4
94 Estadística Básica
3.4 Calcule la media, la mediana y la moda de los siguientes datos:
Datos Media Mediana Moda
5, 2, 8, 2, 3, 2, 4, 0, 6
3.5 Para el siguiente conjunto de datos, indique si utilizaría la media o la mediana para
representar la tendencia central de la distribución y explique las razones de su decisión.
Datos:
1.2, 0.8, 1.1, 0.6, 25
Explicación:
3.6 Estudio de casos. En un estudio que se realizó en un asilo de ancianos, se tomó las edades
de los envejecientes que pueden caminar sin dificultades. Busque la media, mediana y
moda de los siguientes datos: 69 73 65 70 71 74 65 69 60 62
Práctica 3. Medidas de Tendencia Céntricas 95
3.7 Ciencias. Un científico social para una organización defensora de la niñez seleccionó de
manera aleatoria 10 programas de caricaturas por televisión del sábado en la mañana y
efectuó un análisis del contenido, donde cuenta la cantidad de incidentes de violencia física
o verbal en cada uno. Para las 10 caricaturas examinadas, estas fueron las cuentas: 27, 12,
16, 22, 15, 30, 14, 30, 11 y 21. Determine la media, la moda y la mediana para estos datos.
20 73 75 80 82
3.6El director de unos grandes almacenes tiene interés en saber cuántas reclamaciones recibe
el departamento de atención al cliente sobre la calidad de los aparatos eléctricos que
venden los almacenes. Los registros de un periodo de 5 semanas muestran el siguiente
número de reclamaciones semanales:
13 15 8 16 8
c) Halle la moda.
c) ¿Cuál es la moda?
Práctica 3. Medidas de Tendencia Céntricas 97
3.8Una cadena de grandes almacenes eligió aleatoriamente 10 establecimientos situados en
una región. Tras examinar los datos de ventas, observó que ese año se habían conseguido
en las Navidades los siguientes aumentos porcentuales de las ventas en dólares con
respecto al año anterior:
b) Calcule la mediana.
a) Describa la media.
b) Determina la mediana.
c) Determina la moda.
Número de defectos 0 1 2 3
Número de radios 12 15 17 6
1, 2, 5, 9, 4, 999
3.12 Durante un período de una hora en una tarde calurosa de un sábado, el cantinero Julio
sirvió cuatro bebidas. Calcule la media ponderada de los precios de las bebidas
(Precio ($), cantidad vendida).
Bebidas Precio Cantidad PC Proceso
B1 50 5
B2 75 15
B3 90 15
B4 110 15
Total
3.13 Suponga que el Hospital Regional Universitario José María Cabral y Báez tiene 200
empleados en su personal de enfermería. 50 son auxiliares de enfermería; 50 enfermeras
practicantes, y 100 son enfermeras tituladas. Las auxiliares de enfermería ganan 200 pesos
la hora; las enfermeras practicantes 300 pesos y los titulados 400 pesos la hora. ¿Cuál es
el salario promedio ponderado por hora?
Práctica 3. Medidas de Tendencia Céntricas 99
3.14 A continuación, se mencionan las materias que Luís Pérez llevó en el primer semestre
de Ingeniería Química, el número de créditos y la calificación obtenida, determine la
calificación promedio que obtuvo Luís Pérez en su primer semestre. Utilice la media
ponderada.
Materia Número de Calificación Producto Proceso
créditos (1) (2)
Metodología de la Inv. 3 90
Matemática 1 4 100
Programación 8 81
Química 10 78
Dibujo 6 100
Economía 4 84
Total
3.15 Calcular la media geométrica de los siguientes datos:
Datos Proceso
1, 2, 4, 2, 3
1, 2, 5, 9, 4, 9
3.16 El crecimiento en el gasto por deudores morosos de una compañía financiera durante
los últimos años es el que se muestra a continuación. Calcule el incremento promedio
porcentual del gasto por deudores morosos durante ese periodo.
Año Tasa de Factor de Proceso
interés crecimiento
2008 0.110
2009 0.090
2010 0.075
2011 0.080
2012 0.095
2013 0.108
2014 0.120
3.17 En 1985 había 340,213 suscriptores a la telefonía celular en Estados Unidos. En 2008,
el número de suscriptores aumentó a 262, 700,000.
a) En número de suscriptores, ¿de cuánto fue el incremento para este periodo?
c) ¿Cuál es el por ciento de estudiante que obtuvo una nota igual o superior a 85 puntos?
✓ Comunica
Explica cómo se obtiene los
cuartiles, deciles y
percentiles para datos
sueltos y agrupados.
Fuente: Ministerio de Educación
✓ Modela y Representa
La nutrición es la ingesta de alimentos en relación con las necesidades Modela situaciones, donde
dietéticas del organismo. Una buena nutrición (una dieta suficiente y
se pueda calcular las
equilibrada combinada con el ejercicio físico regular) es un elemento
fundamental de la buena salud.
medidas de posiciones.
4.2 Percentiles
Los percentiles dividen un conjunto ordenado de datos en 100 partes iguales. Los percentiles
dan los valores correspondientes al 1%, al 2%, al 3%,… y al 99% de los datos.
Los percentiles se representan con la letra P y la localización del percentil estará dada por la
fórmula:
k ( n + 1)
Lk =
100
Ejemplo 4.1
En la siguiente tabla aparecen las comisiones (en dólares) que ganó el último mes una muestra de 19
corredores de bolsa de la oficina de Salomón Smith, California. Esta compañía de inversiones tiene oficinas
a lo largo de Estados Unidos.
2038 1721 1721 1637 2097 2047 2205 2287 1741 1932
1940 2311 2054 2046 1471 1460 1787 1900 1800 ------
𝑎)𝑃20 =
Solución Resultado Respuesta
𝑏)𝑃24 =
Solución Resultado Respuesta
𝑐)𝑃80 =
Solución Resultado Respuesta
106 Estadística Básica
4.3 Deciles
Los deciles dividen un conjunto ordenado de datos en 10 partes iguales. Los deciles dan los
valores correspondientes al 10%, al 20%, al 30%,..., y al 90% de los datos.
Ejemplo 4.2
Para los datos del ejemplo 1, calcule los siguientes deciles: 𝐷1 𝑦 𝐷6
Recordemos que los datos ordenados de menor a mayor son:
1460 1471 1637 1721 1721 1741 1787 1800 1900 1932
1940 2038 2046 2047 2054 2097 2205 2287 2311 ------
a) Dado que D1 = P10, tenemos:
Solución Resultado Respuesta
10 (19 + 1) Así que el D1 se encuentra en la El 10% de los corredores
L10 =
100 posición 2, es decir, que ganó 1,471 dólares o
D1 = P10 = 1471 menos por comisión el
L10 = 2
último mes de trabajo.
Ejemplo 4.3
Para los datos del ejemplo 1, calcule los siguientes cuartiles: 𝐶1 𝑦 𝐶3
Recordemos que los datos ordenados de menor a mayor son:
1460 1471 1637 1721 1721 1741 1787 1800 1900 1932
1940 2038 2046 2047 2054 2097 2205 2287 2311 ------
a) Dado que C1 = P25, tenemos:
Solución Resultado Respuesta
25 (19 + 1) Así que el C1 se encuentra en El 25% de los corredores
L25 = la posición 5, es decir, que ganó 1,721 dólares o menos
100
C1 = P25 = 1721 por comisión el último mes de
L10 = 5 trabajo.
Ejercicio 4.4
A continuación, se presentan la edad de un grupo de 12 estudiantes de un colegio de Santiago.
Determine lo siguiente (Use Excel): a) P40, b) P81 y c) P26
13 35 82 41 41 13 20 10 25 45 34 34
a) P40 =
b) P81 =
c) P26 =
Capítulo 4. Medidas de posición 111
4.5 Percentiles, deciles y cuartiles para datos agrupados
El procedimiento para calcular estas medidas para datos agrupados en una distribución de
frecuencias es similar al usado en el cálculo de la mediana.
Como se puede reescribir los deciles y los cuartiles en función de los percentiles, entonces
solamente usaremos la fórmula para calcular los percentiles de una distribución, que será:
P = Li +
( kn
100
− F )c
i −1
k
fi
Ya hemos dicho que las medidas para datos agrupados resultan poco útiles en nuestro tiempo,
así que evitaremos trabajar con ellas.
Estadística Básica 112
UNIVERSIDAD AUTÓNOMA DE SANTO DOMINGO
ESTADÍSTICA BÁSICA
PRÁCTICA 4
MEDIDAS DE POSICIÓN
𝑎)𝑃20 =
Solución Resultado Respuesta
𝑏)𝑃60 =
Solución Resultado Respuesta
Estadística Básica 119
4.2 Rafael es gerente de una compañía que se dedica a vender libros de texto. Ha contratado
39 personas, las cuales hacen visitas a profesores universitarios para recopilar información
que le servirá como insumo para la toma de decisiones. Cada sábado en la mañana solicita
a su personal que le envié un informe, que debe incluir entre otras cosas, la cantidad de
profesores que visitaron la semana anterior. En la lista de abajo, aparece la cantidad de
visitas de la semana pasada. Recuerde interpretar cada resultado.
38 40 41 45 48 50 50 51 51 52 52 53 54 55 55 55 56 56 57 48
59 59 59 62 62 62 63 64 65 66 66 67 67 69 69 71 77 78 79 …
a) Determine el primer cuartil.
b) Calcule el 6to decil.
Organice los datos de menor a mayor
𝑎)𝐶1 =
Solución Resultado Respuesta
𝑏)𝐷6 =
Solución Resultado Respuesta
CAPÍTULO 5
Medidas de Dispersión
Competencias
Específicas
✓ Razona y argumenta.
Reconoce, calcula e interpreta
la varianza y la desviación
estándar de una muestra y/o
una población de datos
sueltos y agrupados.
✓ Comunica
Explica cómo se obtiene la
varianza y la desviación
Fuente: Ministerio de Educación estándar de una muestra y/o
una población para datos
El Programa de Reconocimiento al Mérito Estudiantil se sueltos y agrupados.
institucionaliza en el sector oficial con la finalidad de contribuir a
elevar el nivel académico del estudiantado dominicano, mejorar la ✓ Modela y Representa
calidad de la educación y fortalecer el sistema educativo en sentido Modela situaciones, donde se
general. pueda calcular las medidas
principales de dispersión.
Mediante la Orden Departamental No. 17´96, de fecha 12 de octubre
del año 1996, del Minerd, se estableció y reglamentó el Programa ✓ Conecta
de Reconocimiento al Mérito Estudiantil, en un primer momento, Utiliza conexiones entre las
dirigido a los estudiantes de los centros educativos del sector oficial, medidas principales de
extendiéndose posteriormente a los colegios privados, con el dispersión y las situaciones de
propósito de estimular la formación integral, la excelencia la comunidad educativa.
académica y el desarrollo de talentos en las diversas áreas del
conocimiento. ✓ Resuelve problemas
Resuelve problemas del
Un padre de familia tiene dos hijos en un politécnico, ambos en el contexto educativo que
mismo grado, pero María estudia Enfermería, mientras que Ramón impliquen calcular la
estudia contabilidad. María le dice a su padre que sacó 90 puntos desviación estándar.
como promedio final en la asignatura Enfermería, mientras que ✓ Utiliza herramientas
Ramón obtuvo 80 puntos en Contabilidad. El Padre da más crédito a tecnológicas
María, ya que obtuvo mejor calificación. ¿Es válido el argumento Usa Excel (con el
del padre para gratificar más a María? complemento MegaStat) y
otras herramientas
En esta unidad, se introducen las medidas de dispersión, tales como: tecnológicas para calcular la
el rango, el rango intercuartil, el rango semi-intercuartil la varianza y la desviación
desviación media absoluta, la varianza y la desviación estándar. estándar de una muestra y/o
Nuestro objetivo es resumir un conjunto de datos a través de una población para datos
medidas de tendencias céntricas y las medidas de dispersión, con el sueltos y agrupados.
fin de comprender e interpretar correctamente el lenguaje de los
datos.
Capítulo 5. Medidas de Dispersión 121
5.1 Introducción
Se entregará una laptop, una Tablet, una calculadora gráfica y una mochila a los estudiantes con
los mejores promedios en una clase. Al final del curso el profesor observa que 4 alumnos están
empatados con el mismo promedio (95 puntos). Dado que tienen el mismo promedio debe
buscarse alguna manera no aleatoria para asignar los premios. El maestro evalúa la consistencia
en las calificaciones, y de esta manera entregar los premios de tal modo que el primer lugar lo
obtenga el alumno con menor variabilidad en sus calificaciones. ¿Cómo debe el maestro
distribuir los premios?
Estudiantes Periodo 1 Periodo 2 Periodo 3 Periodo 4 Promedio
A 100 90 94 96 95
B 95 95 90 100 95
C 100 90 100 90 95
D 94 96 95 95 95
➢ ¿Cuál de los estudiantes parece tener menor variación en sus calificaciones con relación a la
media?
➢ ¿Cuál de los estudiantes parece tener mayor variación en sus calificaciones con relación a la
media?
122 Estadística Básica
Importancia de las medidas de dispersión.
Las medidas de dispersión nos proporcionan información adicional que nos permite juzgar la
confiabilidad de nuestra medida de tendencia central. Si los datos se encuentran muy dispersos,
la posición central es menos representativa de los datos, como un todo, que cuando éstos se
agrupan más cerca alrededor de la media.
= x−x
N s=
n −1
5.3 Varianza
Es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución
estadística. También se puede definir como el cuadrado de la desviación estándar.
Varianza de una población Varianza de una muestra
(x − ) ( )
2 2
=
2 x−x
N s2 =
n −1
Capítulo 5. Medidas de Dispersión 123
Los datos del primer ejemplo componen una población. Busque la desviación estándar de cada uno y responda
la inquietud inicial, es decir ¿cómo se deben distribuir los premios?
Notas del alumno A
100 90 94 96
1. Buscamos la media
= x
N
100 + 90 + 94 + 96 380
= = = 95
4 4
= 95
2. Buscamos la desviación estándar
( x − )
2
=
N
(100 − 95) + ( 90 − 95) + ( 94 − 95 ) + ( 96 − 95 )
2 2 2 2
25 + 25 + 1 + 1 52
= = =
4 4 4
= 3.6
=
N
124 Estadística Básica
Notas del alumno C
100 90 100 90
1. Buscamos la media
= x
N
=
N
=
N
Capítulo 5. Medidas de Dispersión 125
Distribución de los premios en forma descendente
Estudiantes Media Desviación estándar Premio
1er
2do
3er
4to
Ejercicio 5.1
Para el siguiente conjunto de datos muestrales, calcule la desviación estándar.
Datos muestrales: 6, 2, 8, 5, 5, 4
1. Busque la media
x=
x
n
( x − x)
2
s=
n −1
126 Estadística Básica
5.4 Uso de la calculadora científica (CASIO fx-82ms) para calcular la media y la
desviación estándar de una población o una muestra de datos.
Ejemplo 5.4
El siguiente conjunto de datos corresponde a una población, calcule la media y la desviación
estándar usando la calculadora. Datos poblacionales: 8, 3, 7, 3 y 4.
1. Programe la calculadora en el modo estadístico. Para hacer esto, presione la tecla MODE
luego el número 2 (SD).
2. Introduzca los datos: 8, 3, 7, 3, 4. Para hacer esto, presiona 8 y luego la tecla de data (M+)
en la pantalla debe aparecer n = 1, indicando que el primer dato ya se introdujo. Con ese
mismo proceso introduzca los demás datos.
𝑥̅ 𝜎𝑥 𝑠𝑥
3. Presionamos segunda función (shift) y luego el 2, en la pantalla debe aparecer
1 2 3
Presionamos el 1 para buscar la media y nos da: 𝜇 = 5, hacemos el mismo proceso y
presionamos el 2 para calcular la desviación estándar, la cual da 𝜎𝑥 ≈ 2.10 (si el caso fuera
una muestra se trabaja con el 3)
Resultados
Media Desviación estándar
𝜇=5 𝜎𝑥 ≈ 2.10
➢ VIDEO TUTORIAL
Si tiene alguna duda les invito a ver el video titulado “Desviación estándar para datos sueltos
usando calculadora” a través del canal de YouTube llamado “Rosario Institud”.
Ejercicio 5.4
Para el siguiente conjunto de datos muestrales, calcule la media y la desviación estándar,
usando la calculadora. Datos muestrales: 6, 2, 8, 5
Resultados
Media Desviación estándar
Capítulo 5. Medidas de Dispersión 127
➢ VIDEO TUTORIAL
Compruebe usando Excel que la media y la desviación estándar de las calificaciones de los 4 alumnos son las
que se muestran a continuación. Para hacer esto les invito a ver el video titulado “Desviación estándar usando
Excel” en mi canal de YouTube llamado “Rosario Institud”
10 Leopoldo Cruz 68 65 64 60
11 Luisa Jaquez 80 100 99 99
12 Marcos Ferreira 80 89 87 95
13 Mercedes Martínez 91 79 75 88
14 Pedro Hernández 99 73 96 81
15 Randy Vegas 85 92 82 86
16 Rudy Morel 71 93 76 77
17 Sabrina García 94 72 78 83
18 Santiago Sánchez 90 74 100 83
19 Solange Cruz 90 96 95 97
20 Sonia Amarante 83 76 99 75
Respuesta
Capítulo 5. Medidas de Dispersión 129
Si los datos aparecen en una distribución de frecuencias, entonces las fórmulas para la
varianza y la desviación estándar serán:
5.9 Varianza para datos agrupados
Para una población Para una muestra
f (x − ) f ( x − x)
2 2
2
= s2 =
N n −1
5.10 Desviación estándar para datos agrupados
Para una población Para una muestra
f (x − ) f ( x − x)
2 2
= s=
N n −1
Ya hemos dicho que las medidas para datos agrupados resultan poco útiles en nuestro tiempo, así que
evitaremos trabajar con ellas.
130 Estadística Básica
5.12 Importancia de la desviación estándar
Hemos visto como dos o más conjuntos pueden tener la misma media, pero uno con mayor
dispersión que el otro. Esto sucede también con las tres distribuciones que se presentan en la
figura siguiente. La media de las tres curvas es la misma, pero la curva A tiene menor
separación (o variabilidad) que la curva B, y ésta tiene menor variabilidad que la C. Si
medimos sólo la media de estas tres distribuciones, estaremos pasando por alto una diferencia
importante que existe entre las tres curvas. Al igual que sucede con cualquier conjunto de
datos, la media, la mediana y la moda sólo nos revelan una parte de la información que
debemos conocer acerca de las características de los datos. Para aumentar nuestro
entendimiento del patrón de los datos, debemos medir también su dispersión, separación o
variabilidad.
Los analistas financieros están preocupados por la dispersión de las ganancias de una
empresa. Las ganancias ampliamente dispersas —que van desde extremadamente altas a
extremadamente bajas e incluso a niveles negativos— son indicativas de un riesgo mayor
para los accionistas y para los acreedores que las ganancias que permanecen relativamente
estables. De manera similar, los expertos en el control de la calidad analizan la dispersión de
los niveles de calidad de un producto. Una medicina cuya pureza promedio es buena, pero
que oscila desde muy pura hasta muy impura puede ser peligrosa para la vida humana.
Capítulo 5. Medidas de Dispersión 131
5.13 Coeficientes de variación (CV):
Cuando se compara la variación de dos conjuntos diferentes de datos, se debe tomar en cuenta
que las desviaciones estándares han de ser aproximadamente iguales o iguales, además los
datos deben tener la misma escala y las mismas unidades. Si las medias son muy diferentes o
si los conjuntos utilizan diferentes escalas o unidades de medición, podemos utilizar el
coeficiente de variación.
El coeficiente de variación es un coeficiente expresado como porcentaje que describe la
desviación estándar en relación con la media. El coeficiente de variación está dado de la
siguiente forma:
Muestra Población
s
CV = 100% CV = 100%
x
Ejemplo 5.6
Un director de escuela tiene dos maestras de primero del nivel inicial. La maestra Juana usa
el método 1 para alfabetizar a sus alumnos de primero A y la maestra Xiomara usa
el método 2 para el mismo fin, con los estudiantes de primero B, al término del curso se miden
las palabras por minutos de ambos grupos, resultando los siguientes datos:
Primero A Primero B
= 40 = 55
=9 = 10
➢ Podemos observar que las medias son distintas, por tanto, no podemos comparar las
desviaciones estándares absolutas, necesitamos calcular el coeficiente de variación para
ambos grupos.
Solución
Coeficiente de variación de primero A Coeficiente de variación de primero B
CV = 100% CV = 100%
9 10
CV = 100% = 22.5% CV = 100% = 18.18%
40 55
CV = 22.5% CV = 18.18%
Conclusión
El método A tubo mayor variación relativa en la lectura de palabras por minutos por parte de
los estudiantes.
132 Estadística Básica
Ejemplo 5.7
Compare la variación de las estaturas de hombres con la variación de sus pesos utilizando los
siguientes resultados: Para los hombres, las estaturas producen x = 68.34 pu lg y s = 3.02 pu lg ;
los pesos producen x = 172.55lb y s = 26.33lb .
Solución
Coeficiente de variación de la estatura Coeficiente de variación del peso
CV = 100% CV = 100%
Conclusión
133 Práctica 5. Medidas de Dispersión
UNIVERSIDAD AUTÓNOMA DE SANTO DOMINGO
ESTADÍSTICA BÁSICA
PRÁCTICA 5
MEDIDAS DE DISPERSIÓN
5.1 ¿Cuáles datos cree usted que tengan mayor variación: ¿los ingresos de una muestra aleatoria
simple de 1000 adultos elegidos de la población en general, o los ingresos de una muestra aleatoria
simple de 1000 profesores de estadística? ¿Por qué?
5.2 ¿Para cuál de las siguientes distribuciones la media es más representativa de los datos como un
todo? ¿Por qué?
5.3 Para medir el éxito escolar, los educadores necesitan probar los niveles de conocimientos y habilidades
de los estudiantes. Tomar en cuenta las diferencias individuales de cada uno de ellos, permite a los
profesores planear mejor el programa académico. Las curvas que se muestran a continuación representan
las distribuciones basadas en resultados anteriores de dos pruebas distintas. ¿Cuál de ellas seleccionaría
usted como mejor opción para los propósitos de los profesores?
134 Estadística Básica
5.4 Una empresa que usa dos métodos diferentes para enviar pedidos a sus clientes encontró
las siguientes distribuciones del tiempo de entrega para los dos métodos, según los
registros históricos. Con la evidencia disponible, ¿qué método de envío recomendaría?
¿por qué?
5.6.1 Sume a cada dato una constante igual a 2. Calcule la desviación estándar para los nuevos
valores. ¿Qué efecto produce sobre la desviación estándar el hecho de sumar una
constante a cada dato?
Desviación estándar de: ____, ____, ____, ____, ____
5.6.2 Multiplique cada dato una constante igual a 2. Calcule la desviación estándar para los
nuevos valores. ¿Qué efecto produce sobre la desviación estándar el hecho de
multiplicar una constante a cada dato?
Desviación estándar de: ____, ____, ____, ____, ____
136 Estadística Básica
5.7 Calcule la desviación estándar de los siguientes datos muéstrales.
a) 6, 8, 7, 3, 6, 4
b) 6, 8, 7, 3, 6, 35
c) ¿Por qué la desviación estándar es tan grande en la parte b, en comparación con la parte a?
Práctica 5. Medidas de Dispersión 137
NOTA:
➢ Para los ejercicios 5.8 hasta 5.12 encuentre la desviación estándar.
5.8 Años para obtener el título de licenciatura. A continuación, se presenta el tiempo (en
años) que le tomó a una muestra aleatoria de estudiantes universitarios obtener su título de
licenciatura. Con base en los resultados, ¿Es inusual que un estudiante obtenga el título de
licenciatura en 12 años?
4 4 4.5 4.5 6 6 8 9 13 15
5.11 Mediciones de la presión sanguínea. Siete estudiantes del segundo año de medicina de Bellevue
Hospital midieron la presión sanguínea de la misma persona. A continuación, se listan las lecturas
sistólicas (en mmHg). Si la presión sanguínea del sujeto permanece constante y los estudiantes de
medicina aplican correctamente la misma técnica de medición, ¿cuál debería ser el valor de la desviación
estándar? Obtenga la desviación estándar.
138 130 135 140 140 130 150
Práctica 5. Medidas de Dispersión 139
5.12 IMC y género. Es bien sabido que los hombres tienden a pesar más y a ser más altos
que las mujeres. El índice de masa corporal (IMC) es una medida que se basa en el peso y
en la estatura. A continuación, se muestran los valores de IMC de hombres y mujeres
elegidos de manera aleatoria. ¿Parece existir una diferencia en la variación entre los dos
conjuntos de datos? Calcule la desviación estándar. (Puedes usar Excel)
Hombres: 23.8 23.2 24.6 26.2 23.5 24.5 21.5 31.4 26.4 22.7 27.8 28.1
Mujeres: 19.6 23.8 19.6 29.1 25.2 21.4 22.0 27.5 33.5 20.6 29.9 17.7
140 Estadística Básica
5.13 Responde las siguientes preguntas.
a) ¿Por qué el rango no es una medida de dispersión tan útil como la desviación estándar?
c) ¿Es posible que el valor del rango, la desviación estándar o la varianza de un conjunto de
datos sea negativo? Explique
Práctica 5. Medidas de Dispersión 141
5.14 A raíz de que los jóvenes en su mayoría están activos sexualmente en nuestras escuelas,
y que las enfermedades de transmisión sexual son de alto riesgo, el psicólogo decide
investigar cómo anda la fidelidad de los estudiantes en el noviazgo en el politécnico Dios
es amor. Para esto, estudia una muestra de 20 alumnos (10 hembras y 10 varones) y
encuentra los siguientes datos. (Puedes usar Excel)
Sexo Número de parejas simultaneas de los 20 estudiantes.
Masculino 1, 1, 3, 2, 4,1, 2, 3, 4, 5
Femenino 1, 1, 1, 1, 2, 3, 2, 1, 1, 1
Calcule lo siguiente:
Medidas Sexo
Masculino Femenino
a) La moda
b) La mediana
c) La media
d) El rango
e) Varianza
f) Desviación estándar
g) Coeficiente de variación
1. ¿Cuál de los dos grupos tiene mayor capacidad de mantenerse con una pareja?
2. Según su criterio, ¿cuáles son las razones que explican la respuesta a la primera pregunta?
10 Leopoldo Cruz 68 65 64 60
11 Luisa Jaquez 80 100 99 99
12 Marcos Ferreira 80 89 87 95
13 Mercedes Martínez 90 96 95 97
14 Pedro Hernández 99 73 96 81
15 Randy Vegas 85 92 82 86
16 Rudy Morel 71 93 76 77
17 Sabrina García 94 72 78 83
18 Santiago Sánchez 90 74 100 83
19 Solange Cruz 90 93 82 75
20 Sonia Amarante 83 76 99 75
Respuesta
CAPÍTULO 6
Concepto, Principios y Cálculo de Probabilidad
Competencias
Específicas
✓ Razona y argumenta.
Reconoce, calcula e
interpreta la probabilidad
de evento simple o
compuesto de tomando en
cuenta los tres enfoques.
✓ Comunica
Explica cómo se obtiene la
probabilidad de evento
Fuente Externa simple o compuesto.
Feminicidio o femicidio es un crimen que consiste en el asesinato
de una mujer por el hecho de ser mujer. El concepto define un ✓ Modela y Representa
acto de máxima gravedad, en un contexto cultural e institucional Modela situaciones, donde
de discriminación y violencia de género, que suele ser se pueda calcular la
acompañado por un conjunto de acciones de extrema violencia. probabilidad de evento
simple o compuesto.
En las estadísticas que lleva la Procuraduría General de la
República, los días que más matan a las mujeres son los sábados ✓ Conecta
Utiliza conexiones entre
y los domingos. Mientras los días que menos ocurren son los
miércoles y viernes. El 18 por ciento de los asesinatos de mujeres las probabilidades y las
situaciones de la
ocurre los sábados, el 21 por ciento los domingos. El lunes, el
comunidad educativa.
martes y el jueves son días que también tienen un alto porcentaje,
equivalente a un 12, 13 y 14 por ciento de asesinato de mujeres. ✓ Resuelve problemas
Al 6 de noviembre, 2017, según las estadísticas de la Procuraduría Resuelve problemas del
contexto educativo que
General de la República, han ocurrido 56 feminicidios por armas
impliquen calcular
de fuego, 52 por armas blancas y 45 por otro tipo de armas,
probabilidades.
equivalente 37%, 34% y 29% respectivamente.
¿Qué posibilidad piensas que tienes de sufrir de violencia ✓ Utiliza herramientas
intrafamiliar? ¿Qué probabilidad piensas que una persona tiene tecnológicas
de sufrir violencia después de una primera vez? ¿Piensas que hay Usa Excel (con el
alguna relación entre la violencia intrafamiliar y la educación de complemento MegaStat) y
las personas violentas o las víctimas? otras herramientas
tecnológicas para calcular
En esta unidad, se introduce el concepto, cálculo y aplicaciones probabilidades.
de la probabilidad. Nuestro objetivo es comprender, calcular y
aplicar probabilidades de evento simple o compuesto, en un
contexto educativo.
144 Estadística Básica
6.1 Introducción
Para Recordar:
✓ Indique cuáles de las siguientes situaciones corresponden a la estadística descriptiva
y cuáles a la estadística inferencial:
a) Un informe anual para accionistas que detalla los bienes de la
corporación.___________________________
b) Un profesor de historia que anuncia a su grupo el número de estudiantes que obtuvieron
la máxima calificación en un examen reciente.___________________________
c) El cálculo de la media de un conjunto de datos de una muestra para
caracterizarla._______________________________
d) El uso de los datos de una muestra en una encuesta para estimar la opinión de la
población._____________________________
e) Realizar un estudio de correlación sobre una muestra para determinar si el nivel educativo
y el ingreso de la población están relacionados.______________________________
Sin importar en cuenta la profesión que haya elegido, algo sí es seguro: en algún momento
se han de tomar decisiones. Con mucha frecuencia esto tendrá que hacerse sin conocer todas
las consecuencias de tales decisiones. Por ejemplo, los inversionistas deben decidir sobre la
conveniencia de invertir en una acción en particular, con base en sus expectativas sobre
rendimientos futuros. Un director debe tomar la decisión respecto a su profesión, sin conocer
con exactitud cuáles serán los resultados.
Ejemplo 6.2
b) Usted es gerente de una compañía de póliza de seguros. Arthur quiere comprarle a usted
un seguro de vida. Arthur tiene 75 años de edad, ha sufrido tres ataques cardiacos y trabaja
como experto en desactivación de bombas en el departamento de policía. ¿Qué usted le
responde a Arthur?
_________________________________________________________________________
_________________________________________________________________________
El negocio de los seguros está muy relacionado con las probabilidades. Tal vez roben su automóvil,
tal vez no; tal vez participe en un accidente, tal vez no; tal vez alguien resbale en la escalera de su
casa y lo demande, tal vez no. Por supuesto, esperamos que no le suceda nada malo a usted o a su
familia, pero el sentido común y el historial estadístico nos dicen que podría ocurrir.
Todas estas cosas se asocian con probabilidades. Por ejemplo, si su automóvil es un Toyota Camry,
la probabilidad de robo es mucho más alta que si conduce un Dodge Caravan. De hecho, en una
estadística reciente que lista los 10 vehículos más robados en Estados Unidos, el Toyota Camry
obtuvo el primer lugar.
Términos Básicos
a) Experimento. Proceso que induce a que ocurra una y sólo una de varias posibles
observaciones.
Ejemplo:
El lanzamiento de una moneda al aire.
Ejemplo 6.3
La probabilidad de que al lanzar una moneda al aire el resultado sea sello es:
1
P (s) = = 0.5 = 50%
2
2. Una encuesta se realizó a 34 estudiantes de una universidad y arrojó los resultados que se
dan. ¿Cuál es la probabilidad de que el estudiante tenga una especialidad en
administración?
Contabilidad 10
Finanzas 5
Economía 3
Administración 6
Marketing 10
a) P ( A) = 17.6% c) P ( A) = 5.66%
b) P ( A) = 29.4% d ) P ( A) = 6%
4. En un pueblo hay 1,200 habitantes. Si la probabilidad de que un habitante sea una mujer
es 1 3 . ¿Cuántas mujeres hay en el pueblo?
a)200 c)400
b)300 d )600
148 Estadística Básica
5. Si en una caja hay 2 fichas blancas y 3 fichas negras, la probabilidad de sacar una ficha
negra es.
2 3
a) P ( N ) = c) P ( N ) =
3 2
3 1
b) P ( N ) = d )P ( N ) =
5 2
Nota: Con los datos dados a continuación responde los ítems del 6 hasta el 8.
Se encuestó a una muestra de personas, arrojando los resultados expuestos a continuación
Piña Manzana Total
Hombres 15 13 28
Mujeres 20 12 32
Total 35 25 60
6. Si eligen una persona al azar, ¿Cuál es la probabilidad de que la persona elegida sea hombre?
a) P ( H ) 0.47 c) P ( H ) 0.58
b) P ( H ) 0.53 d ) P ( H ) 0.25
7. Si eligen una persona al azar, ¿Cuál es la probabilidad de que la persona elegida sea
mujer?
a ) P ( M ) 0.47 c) P ( M ) 0.33
b) P ( M ) 0.53 d ) P ( M ) 0.42
8. Si eligen una persona al azar, ¿Cuál es la probabilidad de que la persona elegida le guste
la tota de piña?
a ) P (TP ) 0.25 c) P (TP ) 0.58
b) P (TP ) 0.53 d ) P (TP ) 0.42
9. Una urna contiene 2 bolas azules, 5 negras y 7 rojas. Si se extrae 1 bola, ¿cuál es la
probabilidad de que sea azul?
a ) P ( A ) 14.29%
b) P ( A ) 50%
c ) P ( A ) 35.71%
d ) P ( A ) 64.29%
Capítulo 6. Conceptos, Principios y Cálculo de Probabilidad 149
NOTA: Con los datos de la tabla: “relación entre empleo – vivienda de un barrio de Santiago” responde los ítems 3 y
4.
Emp. / Viv. Vivienda propia Vivienda alquilada Total
Empleo formal 101 485 586
Empleo informal 80 919 999
Total 181 1,404 1,585
10. La probabilidad de que una persona escogida tenga empleo formal es:
a ) P ( EF ) 36.97%
b) P ( EF ) 55.80%
c ) P ( EF ) 34.54%
d ) P ( EF ) 270.47%
14. Usted quiere llamar a una amiga por teléfono, pero sólo recuerda los 6 primeros dígitos de
su número telefónico y se ha olvidado de los últimos cuatro. ¿Cuál es la probabilidad de
que marque al azar el número correcto si hace un sólo intento?
1
a ) P ( N .C .) =
10000
10000
b) P ( N .C .) =
1
3
c ) P ( N .C .) =
10000
1
d ) P ( N .C .) =
4
150 Estadística Básica
Ejemplo 6.4
Doña Ramona juega el número 6 en la Lotería Nacional: a) ¿Cuál es la probabilidad de que
Ramona se saque en el primer premio? b) ¿Cuál es la probabilidad de que Ramona se saque?
c) ¿Cuál es la probabilidad de que Ramona no se saque?
__________________________________________________________________________
__________________________________________________________________________
Este planteamiento de la probabilidad clásica es útil cuando se trata de los juegos de azar, pero
no es tan útil cuando nos ocupamos de actividades reales en las que: 1) los resultados posibles
no son igualmente probables o 2) los procesos en cuestión no se conocen bien. El
planteamiento clásico de probabilidad supone un mundo que no existe. Supone que no existen
situaciones que son bastante improbables pero que podemos concebir como reales.
Sucesos como que una moneda caiga parada o que el salón de clase se incendie mientras se
analiza el concepto de probabilidad (¡Dios nos libre!) son extremadamente improbable, pero
no imposibles. Sin embargo el planteamiento clásico supone que no existen. Las situaciones
de la vida real, desordenadas y poco probables como son a menudo, hacen que sea útil definir
la probabilidad de otras formas.
Ejemplo 6.5
Una compañía de seguros sabe, por la información obtenida de los datos actuales registrados,
que de los hombres de 40 años de edad, 60 de cada 100,000 morirán en un periodo de un año.
Utilizando este método, la compañía estima la probabilidad de muerte de ese grupo de edad
en particular como:
60
P ( x) = = 0.0006 = 0.06%
100, 000
Ejemplos 6.6
1. La probabilidad de que usted contraiga matrimonio antes de los 30 años.
2. La probabilidad de que el déficit presupuestario de Estados Unidos se reduzca a la mitad
en los siguientes 10 años.
Ejercicios 6.3
En cada uno de los siguientes casos, indique si se utilizó la probabilidad clásica, frecuencia
relativa o subjetiva.
a) Un jugador de béisbol consigue 30 hits en 100 turnos al bate. La probabilidad de que
consiga un hit en su siguiente turno es de 0.3_____________________________
b) Para estudiar problemas ambientales se forma un comité de estudiantes con siete
miembros. ¿Cuál es la probabilidad de que cualquiera de los siete sea elegido vocero
del equipo?__________________________________
c) Usted compra uno de 5 millones de boletos vendidos por el Lotto Canada. ¿Cuáles son
las posibilidades de que gane un millón de dólares?____________________________
d) La probabilidad de un terremoto al norte de California en los próximos 10 años es
de 0.80_______________________________________
Ejemplo 6.7
A = 1, 2, 3, 4
Conjunto vacío es el que no tiene elementos se representa .
Ejemplo 6.8
Sean: A = 1, 2, 3, 4, 5 ; B = 4, 5, 6, 7,8 C = a, b, c, d , e ; encuentre:
a) A B=
b) A C =
c) A A=
d )B C =
Las operaciones con conjuntos se pueden representar gráficamente por medio del Diagrama
de Venn.
A B
A B
Ejemplo 6.9
Sean: A = 1, 2, 3, 4, 5 ; B = 4, 5, 6, 7,8 C = a, b, c, d , e ; encuentre:
a) A B=
b) A C =
c) A A=
d )B C =
Capítulo 6. Conceptos, Principios y Cálculo de Probabilidad 153
La intersección se puede representar gráficamente por el diagrama de Venn de la siguiente
manera:
Unión de eventos. Al menos uno de los posibles eventos ocurre. Una unión se representa
mediante “A o B” ó “A o B o C”, dependiendo del número de eventos.
Intersección de eventos. Dos o más eventos ocurren al mismo tiempo. Tal intersección se
representa mediante “A y B” o “A y B y C”, dependiendo del número de eventos involucrados.
3) Suponga que va a elegir de manera aleatoria un individuo entre una población de 130
personas. En esa población hay 40 niños menores de 12 años, 60 adolescentes y 30 adultos.
¿Cuál es la probabilidad de que el individuo elegido sea un adolecente o un adulto?
2) ¿Cuál es la probabilidad de que al extraer una ficha de un juego dominó esta sea un 6 ó un
blanco?
3) La compañía Herr –Mcfee, que produce barras para combustible nuclear, debe hacer pasar
rayos x e inspeccionar cada barra antes de embarcarla. Karen Wood, una inspectora, ha
observado que por cada 1000 barras que inspecciona, 10 tienen fallas internas, ocho tienen
fallas de recubrimiento y cinco tienen ambas fallas. En su informe trimestral, Karen debe
incluir la probabilidad de fallas en las barras para combustible. ¿Cuál es esta probabilidad?
Ejemplo 6.10
o Se lanza una moneda dos veces. El hecho de que en el primer lanzamiento salga cara
no tiene efecto alguno en la probabilidad para el segundo lanzamiento.
156 Estadística Básica
Regla De La Multiplicación Para Eventos Independientes:
P ( AyB ) = P ( A ) P ( B )
Ejemplo 6.11
Resuelve los siguientes problemas:
Una caja contiene 15 canicas. 5 canicas son negras, 8 azules y 2 blancas. Se extraen dos bolas
con reemplazamiento. Determine la probabilidad de que:
a) La 1ra sea blanca y la 2da azul.
Ejemplo 6.12
a) ¿Cuál es la probabilidad de obtener cruz, cara y cruz en ese orden, en tres lanzamientos
consecutivos de una moneda no alterada?
Capítulo 6. Conceptos, Principios y Cálculo de Probabilidad 157
6.12 Probabilidad Condicionada.
Observa estas situaciones:
1) ¿Cuál es la probabilidad de que un estudiante que no haya estudiado (¡ese sin vergüenza!)
trate de adivinar la pregunta de opción múltiple que tiene 4 opciones?
2) Para inciso 1) imagine que él sabe que la opción c) no puede ser la correcta, ¿Cuál es la
probabilidad de que el elija la respuesta correcta?
Definición. Un evento A está condicionado por otro B, cuando el hecho de haber ocurrido el
evento B influye en la probabilidad de que ocurra A. El símbolo se lee: “La probabilidad de
A dado que B ya ocurrió”
Ejemplos 6.13
a) Una funda contiene 10 canicas: 7 azules y 3 verdes. Se sacan dos canicas sucesivamente
al azar. ¿Cuál es la probabilidad de que la segunda canica sea verde si la primera ha sido
azul?
Ejercicio
NOTA: Con los datos de la tabla: “relación entre empleo – vivienda de un barrio de Santiago” responde los
ítems 1 hasta el 4.
Emp. / Viv. Vivienda propia Vivienda alquilada Total
Empleo formal 101 485 586
Empleo informal 80 919 999
Total 181 1,404 1,585
1. ¿Cuál es la probabilidad de que una persona escogida tenga vivienda propia dado que tiene
empleo formal?
2. ¿Cuál es la probabilidad de que la persona escogida tenga vivienda alquilada dado que
tiene empleo informal?
3. ¿Cuál es la probabilidad de que la persona escogida tenga vivienda alquilada dado que
tiene empleo formal?
4. ¿Cuál es la probabilidad de que una persona escogida tenga vivienda propia dado que tiene
empleo informal?
158 Estadística Básica
6.13 Eventos Dependientes.
Dos eventos son dependientes cuando la ocurrencia de uno afecta la posibilidad del otro.
Ejemplo 6.14
o Cuando se extrae una bola de una funda sin reemplazo.
2) Si un huracán se forma en la parte oriental del Golfo de México, hay 76% de posibilidades
de que éste golpee la costa occidental de Florida. A partir de los datos recabados en
anteriores 50 años pasados, se ha determinado que la probabilidad de que se forme un
huracán en la parte oriental del golfo en cualquier año dado es de 0.85.
a) ¿Cuál es la probabilidad de que un huracán se forme en la parte oriental del Golfo de
México y llegue a la costa occidental de Florida este año?
Capítulo 6. Conceptos, Principios y Cálculo de Probabilidad 159
6.14 Ejemplos complementarios de probabilidades
Resuelve los siguientes problemas:
1. A partir de la siguiente tabla de contingencia:
B B' Total
A 10 20
A' 20 40
Total
b) Si una persona responde que maneja hacia su trabajo, ¿cuál es la probabilidad de que
él o ella sea inquilino?
Concepto de probabilidad
6.1 Escribe el valor de verdad de las siguientes proposiciones:
a) Probabilidad clásica es aquella que se obtiene al dividir el número de elementos
favorables entre el número de resultados posibles. ________
b) Si A = 1, 2,3, 4,5 yB = 3, 4, 6, 7 , entonces, A B = 1, 2, 3, 4, 5, 6, 7 _______
c) Al lanzar un dado al aire la probabilidad de que salga un número natural entre el 1 y el
6 es 1. _______
d) El evento anterior es un ejemplo de probabilidad segura._______
e) Si en dos eventos A y B, la A B = , los eventos son no mutuamente
excluyentes.________
6.2 Una encuesta se realizó a 34 estudiantes de una universidad y mostró que estos tenían las
siguientes especialidades:
Contabilidad 10
Finanzas 5
Economía 3
Administración 6
Marketing 10
6.4 Hay 15 vehículos de motor en una agencia numerado del 1 al 15. Se saca uno al azar.
¿Cuál es la probabilidad de que:
a) El número sea 9? b) El número sea par?
b) ( A B ) ;
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
6.8 Los eventos A y B son mutuamente excluyentes. Suponga que P(A) = 0.30 y P (B) = 0.20.
a) ¿Cuál es la probabilidad de que ocurran ya sea A o B?
6.9 Los eventos x y y son mutuamente excluyentes. Suponga que P(x) = 0.05 y P (y) = 0.02.
a) ¿Cuál es la probabilidad de que x o y ocurran?
6.12 Un estudiante toma dos cursos, historia y matemáticas. La probabilidad de que pase el
curso de historia es de 0.60 y la de que apruebe el de matemáticas es de 0.70. La
probabilidad de pasar ambos es de 0.50. ¿Cuál es la probabilidad de pasar por lo menos
uno?
Práctica 6. Concepto, Principios y Cálculo de Probabilidad 165
Regla especial de la multiplicación P ( A y B ) = P ( A) P ( B )
6.13 Durante los últimos 4 campeonatos de fútbol norteamericano, el lanzamiento de la
moneda cayó cara todas las veces. Su entrenador le dice que pedir sello esta vez aumentará
la probabilidad de que usted gane el lanzamiento. ¿Está en lo cierto o está equivocado?
Explique su respuesta.
6.15 De acuerdo con Bausch & Lomb Corporation, la mitad de quienes necesitan corregir
su visión son pacientes que requieren lentes binoculares.
a. Para un grupo seleccionado al azar de tres personas que requieren corrección de la visión, 1) ¿Cuál
es la probabilidad de que las tres requieran bifocales? 2) ¿Cuál es la probabilidad de que ninguna de
las tres requiera bifocales?
b. Si las personas se hubieran seleccionado de una organización formada por retirados mayores de 65
años, ¿cree que las probabilidades conjuntas calculadas en el inciso (a) todavía serían correctas? De
no ser así, ¿por qué no?
1) P ( b, b, b ) = 0.125 = 12.5%
Re sp.a.
( )
2) P b,b,b = 0.125 = 12.5%
b.Personal
6.16 Hasta el 30 de abril de la temporada de trámite de impuestos de 1999, 13.7% de todas las devoluciones
personales de impuestos fueron preparadas por H & R Block.
a. Si se seleccionan dos personas al azar de quienes tramitan devolución de impuestos durante este
periodo, ¿Cuál es la probabilidad de que las devoluciones de las dos fueron preparadas por H & R
Block?
b. En el inciso (a), ¿Cuál es la probabilidad de que ninguna devolución fuera preparada por H & R
Block?
c. En el inciso (a), ¿Cuál es la probabilidad de que exactamente una de las dos devoluciones fuera
preparada por H & R Block?
a) P ( prep, prep ) = 0.0188 = 1.88%
( )
Re sp. b) P prep, prep = 0.7448 = 74.48%
c) P ( una − de − las − dos ) = 0.2365 = 23.65%
166 Estadística Básica
Probabilidad condicionada P ( A B ) = P ( AyB )
P( B)
6.17 La tienda de departamentos Friendly ha sido objeto de muchos robos durante el último
mes; pero, debido al aumento en las medidas de seguridad, se ha detenido a 250 ladrones.
Se registró el sexo de cada ladrón; también se anotó si se trataba de un primer delito o era
reincidente. Los datos se resumen en la siguiente tabla.
Sexo 1er delito Reincidente Total
Hombre 60 70 130
Mujer 44 76 120
Total 104 146 250
Suponga que se elige al azar un ladrón detenido, calcule:
a ) P ( h ) = 0.520 = 52%
a) La probabilidad de que el ladrón sea hombre.
b) P ( o h ) = 0.4615 = 46.15%
R e sp. c) P ( m r ) = 0.5205 = 52.05%
b) La probabilidad de que un hombre cometa el primer delito. d ) P ( m o ) = 0.4231 = 42.31%
e) P ( h r ) = 0.280 = 28%
6.21 El gerente regional del sureste de General Express, un servicio privado de mensajería,
está preocupado por la probabilidad de una huelga por parte de algunos empleados. Sabe
que la probabilidad de una huelga de pilotos es 0.75 y la probabilidad de una huelga de
choferes es 0.65. Más aún, sabe que, si los choferes hacen una huelga, existe una posibilidad
de 90% de que los pilotos apoyen la huelga.
a) ¿Cuál es la probabilidad de que ambos se vayan a huelga?
b) Si los pilotos hacen huelga, ¿Cuál es la probabilidad de que los choferes apoyen la
huelga?
a ) P ( B y A ) = 0.585
Re sp.
b) P ( B A ) = 0.78
168 Estadística Básica
6.22 A partir de la siguiente tabla de contingencia:
B B' Total
A 10 30
A' 25 35
Total