Está en la página 1de 204

EPE

AUTORES : Silvia Gutiérrez Flores


Walter Luna Flores

TÍTULO : Cuaderno de trabajo

FECHA : Enero 2015

CURSO : Estadística Descriptiva

CODIGO : MA147 y CE19

ÁREA : Ciencias

CICLO : 2015-0
Contenido

EPE 2
Capítulo 1. Organización de datos 5
Subdivisión de la Estadística 5
Definiciones básicas 6
Métodos de recolección de datos 9
Variable 12
Escalas de medición 15
Organización y presentación de datos 25
Tabla de frecuencias para variables cualitativas 28
Representación gráfica de variables cualitativas 31
Representación gráfica de variables discretas 60
Representación gráfica de variables cuantitativas continuas 69
Capítulo 2. Resúmenes de datos 87
Medidas de tendencia central 87
El ingreso promedio mensual en Lima aumentó un 3,9% 87
Medidas de dispersión 111
Medidas de asimetría 120
Capítulo 3. Probabilidades 127
Definiciones básicas de probabilidad 127
Probabilidad condicional 137
Eventos independientes 141
Teorema de la probabilidad total 144
Teorema de Bayes 145
Capítulo 4. Variable aleatoria y distribución de probabilidad 151
Variable aleatoria 151
Variable aleatoria discreta 152
Variable aleatoria continua 161
Distribuciones discretas especiales 162
Distribuciones continuas especiales 174
Capítulo 5 Muestreo 183
Muestreo probabilístico 185
Capítulo 1. Organización de datos 5

Capítulo 1. Organización de datos

Estadística

Es una ciencia que proporciona La finalidad y utilidad es describir, numérica o


un conjunto de métodos, gráficamente al conjunto de datos, así como
técnicas y procedimientos para también realizar inferencias, entendidas como
recopilar, organizar, presentar y generalizaciones de lo observado, de manera que
analizar datos. se puedan obtener conclusiones adecuadas.

Subdivisión de la Estadística

Estadística Descriptiva Estadística Inferencial

Son métodos y
Son métodos y Comprende el uso técnicas que hacen Estas conclusiones
técnicas de de gráficos, tablas, posible estimar no tienen que ser
recolección, diagramas y una o más totalmente
caracterización, criterios para el características de válidas, pueden
resumen y análisis. Existen una población o tener cierto
presentación que diversos tipos de tomar decisiones margen de error,
permite describir gráficos referentes a la por eso se dan con
apropiadamente adecuados a los población basados una medida de
las características distintos datos en el resultado de confiabilidad o
de un conjunto de que se desean muestras elegidas probabilidad.
datos. representar.
adecuadamente.
6 Estadística Básica con Aplicaciones en Excel 2010

Definiciones básicas

Población
•Es el conjunto de todas las unidades elementales de interés en un
determinado estudio.
•Pueden ser personas, animales, objetos, conceptos, etc. de los cuales
sacamos conclusiones a partir de una o más características observables de
naturaleza cualitativa o cuantitativa.

Muestra
•Es una parte o un subconjunto de la población que se selecciona
adecuadamente para obtener información acerca de la población de la cual
proviene.
•Una muestra será representativa si es elegida de forma aleatoria.

Unidad elemental
•Es el objeto sobre el cual se hace la medición.
•También se le denomina unidad de análisis, unidad estadística o elemento.
•Por ejemplo, en estudios de poblaciones humanas, con frecuencia ocurre
que la unidad elemental es cada individuo.

Dato
•Es el resultado de medir una característica de una unidad elemental.
•Los datos pueden ser cualitativos o cuantitativos ya que dependerán del tipo
de variable.

Observación
•Es el conjunto de datos de una unidad elemental.
•La observación se tiene para cada unidad elemental.
Capítulo 1. Organización de datos 7

Ejemplo 1

El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La gerencia general


desea invertir en publicidad para incrementar la cantidad de huéspedes extranjeros en el hotel.
Para conocer qué características del hotel es conveniente resaltar en la publicidad, se aplicó una
encuesta a una muestra aleatoria de 56 mujeres y 59 hombres extranjeros que se hospedaron en-
tre enero y mayo del presente año. A continuación, se presenta parte de la base de datos:

Precio dispuesto
Número de
País de proce- a pagar por
N° Edad Género acompañantes Criterio de selección del hotel
dencia habitación en
por viaje
dólares
1 25 Masculino Inglaterra 80 0 Limpieza del dormitorio
2 35 Femenino Argentina 60 2 Precio
3 45 Masculino Francia 115 3 Buena calidad de las toallas y sábanas
4 65 Masculino Francia 45 0 Precio
5 72 Femenino Francia 55 1 Amigable y cordial staff de empleados
6 28 Masculino Estados Unidos 65 2 Precio
7 45 Femenino Estados Unidos 60 1 Precio
8 85 Masculino China 70 2 Precio
9 25 Masculino Inglaterra 65 3 Limpieza del dormitorio
10 35 Femenino Francia 45 1 Precio
11 20 Masculino Estados Unidos 55 2 Amigable y cordial staff de empleados
      

a. Determine la población, la muestra y la unidad elemental.


b. De la base de datos, proporcione un ejemplo de dato y uno de observación.

Solución

Todos los huéspedes extranjeros que se hospedaron en el hotel La Posada


Población
entre enero y mayo del presente año.

115 huéspedes extranjeros que se hospedaron en el hotel La Posada entre


Muestra
enero y mayo del presente año.

Un huésped extranjero que se hospedó en el hotel La Posada entre enero y


Unidad elemental
mayo del presente año.

Dato X4 = 65 años

Observación X4 = 65 años, masculino, Francia, 45 dólares, 0 acompañantes, precio


8 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 1
De los universitarios que estudian en la ciudad de Lima, se quiere estimar el porcentaje de universi-
tarios que trabajan. Determine la población, la muestra y la unidad elemental.

Población

Muestra

Unidad elemental

Ejercicio 2
Se desea estimar el promedio diario de clientes que ingresan a un supermercado, para lo cual se
eligieron cinco días al azar del presente mes y se registró el número de clientes que ingresó cada
día al supermercado. Los resultados registrados fueron los siguientes: 554, 789, 487, 553 y 625 per-
sonas. Determine la población, la muestra y la unidad elemental.

Población

Muestra

Unidad elemental

Ejercicio 3
La Oficina de Turismo de Cusco recopiló datos sobre los turistas que llegaron a la ciudad. Entre las
16 preguntas de un cuestionario que se entregó a los pasajeros que llegaron en el mes de enero del
presente año, figuraban, entre otras, las siguientes preguntas:
 Esta visita a Cusco es la: ………………… vez (primera, segunda, tercera, etc.).
 El motivo principal de este viaje es: ………………… (16 categorías incluyendo vacaciones, trabajo).
 Voy a estar alojado en: …………………… (10 categorías incluyendo hotel, apartamento, parientes).
 Mi estadía en Cusco va a durar: …………………. días.

Población

Unidad elemental
Capítulo 1. Organización de datos 9

Métodos de recolección de datos

La forma de obtener la información original de las unidades elementales por investigar puede ser
efectuada a través de:

Censo
• Es una encuesta de todos los elementos de la
población.

Encuesta muestral
• Es una encuesta de una parte de la población.

El uso de la encuesta ha ido en rápido


aumento, debido a:

2. Su menor costo con respecto al censo que, en


1. Que las instituciones que determinadas circunstancias, la información resulta más
producen información exacta que la de un censo. Esto se debe a que los errores
disponen de personal en la recolección y procesamiento de los datos pueden
capacitado para efectuar su ser reducidos a través de una mejor capacitación de los
organización, diseño y análisis. empadronadores y la utilización de métodos de
captación de información más objetivos.
10 Estadística Básica con Aplicaciones en Excel 2010

Ejemplo 2

Aprobación de Ollanta Humala cayó a 39% según reveló


encuesta de Datum
ElComercio.pe lunes 8 de julio del 2013

La aprobación del jefe de Estado, Ollanta Humala, registró su por-


centaje más bajo desde que se inició la gestión presidencial. En
una encuesta realizada por Datum, la popularidad de Humala apenas alcanzó 39%. Esto es siete puntos
menos que el mes anterior y un retroceso de 21 unidades respecto de abril.
El estudio puntualizó además que el nivel de desconfianza hacia Humala Tasso aumentó de 69% a 81%,
también tomando en cuenta las cifras del mes que pasó. La esposa del jefe de Estado, Nadine Heredia,
obtuvo 47% de respaldo. Un 46% la desaprobó.
Capítulo 1. Organización de datos 11

Registro administrativo
Existen oficinas públicas que llevan registros administrativos para sus propios fines.

Por ejemplo:
 los Registros Civiles registran nacimientos, casamientos o defunciones,
 el Ministerio de Educación que lleva registros sobre matrícula de alumnos o deserción escolar,
 la Aduana que registra las importaciones y exportaciones.

Los registros administrativos constituyen la forma más económica de obtener información estadística.
Sin embargo, esta información se obtiene tal como está disponible. Los fines del registro administrativo
no siempre coinciden con los de nuestra investigación.

Por ejemplo, se puede consultar las páginas web de las siguientes instituciones:

• Ministerio de Educación http://minedu.gob.pe/


• Ministerio de Salud http://www.minsa.gob.pe/
• Superintendencia Nacional de Aduanas y de Administración Tributaria SUNAT
http://www.sunat.gob.pe/
• Registro Nacional de Identificación y Estado Civil http://www.reniec.gob.pe/
• Ministerio de Economía y Finanzas http://www.mef.gob.pe/
• Sistema Integrado de Información de Comercio Exterior http://www.siicex.gob.pe/
• Instituto Nacional de Estadística e Informática INEI. http://www.inei.gob.pe/

 Ministerio de Trabajo y Promoción del Empleo. http://www.mintra.gob.pe/


12 Estadística Básica con Aplicaciones en Excel 2010

Variable

Variable
Se define así a una característica que presentan los elementos de una población y
que puede asumir diferentes valores cuando se realiza su medición

Variables cualitativas Variables cuantitativas

Son aquellas variables


que al ser medidas Son aquellas variables que al ser medidas quedan
quedan expresadas por expresadas por números que se utilizan para
etiquetas o nombres identificar una característica o atributo.
que se utilizan para Estas a su vez pueden clasificarse en discretas o
identificar una continuas.
característica o atributo.

Variable cuantitativa Variable cuantitativa


discreta continua

Es aquella variable cuyo


número posible de
valores es infinito no
Es aquella variable cuyo numerable, es decir, que
número de posible de puede tomar cualquier
valores es finito o infinito valor en un intervalo
numerable; es decir, que determinado.
sólo puede tomar ciertos En una variable continua,
valores en un intervalo para dos valores
determinado. cualesquiera, siempre se
puede encontrar un tercer
valor entre los dos
primeros.
Capítulo 1. Organización de datos 13

Ejemplos de variables
Las siguientes variables corresponden a una encuesta aplicada a un postulante de una agencia pu-
blicitaria:

Variable

Cualitativa Cuantitativa discreta Cuantitativa continua

Tiempo de
Número de demoran para
Salario actual
Lugar de Grado de capacitaciones Número de trasladarse de
(en nuevos
nacimiento instrucción llevadas en el hijos su casa al
soles)
presente año trabajo (en
minutos)

Ejemplo 3

El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La Gerencia General


desea invertir en publicidad para incrementar la cantidad de huéspedes extranjeros en el hotel.
Para conocer qué características del hotel es conveniente resaltar en la publicidad se aplicó una
encuesta a una muestra aleatoria de 56 mujeres y 59 hombres extranjeros que se hospedaron en-
tre enero y mayo del presente año. A continuación se presenta parte de la base de datos:

Precio dispuesto
Número de
País de a pagar por
N° Edad Género acompañantes Criterio de selección del hotel
procedencia habitación, en
por viaje
dólares
1 25 Masculino Inglaterra 80 0 Limpieza del dormitorio
2 35 Femenino Argentina 60 2 Precio
3 45 Masculino Francia 115 3 Buena calidad de las toallas y sábanas
4 65 Masculino Francia 45 0 Precio
5 72 Femenino Francia 55 1 Amigable y cordial staff de empleados
6 28 Masculino Estados Unidos 65 2 Precio
      

Identifique cada una de las variables que se presenta en la base de datos según su tipo.
Solución
Variable Tipo de variable
Edad Cuantitativa continua
Género Cualitativa
País de procedencia Cualitativa
Precio dispuesto a pagar por habitación, en dólares Cuantitativa continua
Número de acompañantes por viaje Cuantitativa discreta
Criterio de selección del hotel Cualitativa
14 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 4

Los clientes que se suscriben a la revista “Economía al Día” deben llenar un formato con informa-
ción personal. Identifique el tipo de variable.

Variable Tipo de variable


Género

Profesión

Distrito donde vive

Ingreso mensual familiar (en nuevos soles)

Grado de instrucción

Número de teléfono

Estado civil

Ejercicio 5
El gerente de una red de librerías, con sucursales en Santiago de Surco, San Borja y San Luis ha ob-
servado que en los últimos meses las ventas han disminuido, y desea conocer los factores que ori-
ginan este problema. Por ello, realizó una encuesta a 210 clientes seleccionados aleatoriamente de
todas las sucursales. Algunas de las variables recolectadas mediante la encuesta son las siguientes:
 Ingreso mensual familiar (en nuevos soles)
 Distrito de residencia
 Número de hijos en edad escolar
 Nivel de satisfacción con la atención recibida (muy buena, buena, mala, muy mala)
a. Del enunciado anterior identifique la población en estudio, la muestra y la unidad elemental.

Población

Muestra

Unidad elemental

b. Identifique las variables en estudio con su respectivo tipo.

Variable Tipo de variable


Ingreso mensual familiar (en nuevos soles)
Distrito de residencia
Número de hijos en edad escolar
Nivel de satisfacción con la atención recibida
Capítulo 1. Organización de datos 15

Escalas de medición

Por ejemplo, si la
La medición de una característica observada es el El proceso de medición
variable consiste en género de las personas, utiliza las escalas:
asignar un valor a la hacemos una medición de la nominal, ordinal,
característica observada. característica y le asignamos intervalo y razón.
un valor, el de femenino.

•Sólo permite asignar un nombre, etiqueta •Los datos son etiquetas y además el orden
o valor al elemento sometido a medición. es significativo.
•Los números que se puedan asignar a las •Los datos se pueden ordenar en forma
propiedades de los elementos se utilizan ascendente o descendente, de tal manera
sólo como etiquetas con la finalidad de que puedan expresar grados de la
clasificarlos. característica medida.
•Con esta escala no tiene sentido realizar
operaciones aritméticas.

Nominal Ordinal

•Además de asignar un nombre o etiqueta •Los datos tienen todas las propiedades de
y establecer un orden entre los elementos, los datos de intervalo y el cociente de los
esta escala permite calcular diferencias dos valores es significativo.
entre los números asignados a las •Tiene un punto cero absoluto, es decir, el
mediciones (el intervalo entre cero indica la ausencia de la característica
observaciones que se expresa en términos medida.
de una unidad fija de medida). •Se puede realizar las operaciones
•Los datos son numéricos. aritméticas a los números asignados.

Intervalo Razón
16 Estadística Básica con Aplicaciones en Excel 2010

Ejemplos de variables y sus escalas de medición

•El género de las personas •El orden de mérito de los alumnos de la UPC
•La marca de celular •El grado académico de los empleados de un
•La línea aérea de su preferencia banco
•La religión que profesa una persona •La opinión sobre la atención en un
•El número de DNI supermercado (bueno, regular, malo)

•……………………………..........……………… •……………………………..….............................

•………………………………………..........……

Nominal Ordinal

•Las escalas de la temperatura. Por ejemplo, •El sueldo de los trabajadores de un banco
T(°F) = 1.8 x T(°C) + 32 •La altura de una persona.
•El año 2000 fue 2753 en el calendario romano, •La velocidad de un auto en la carretera
2749 en el calendario babilónico, 6236 en el
egipcio, 2544 en el budista, 5119 en el maya
•……………………………………………………………
•La ubicación en una carretera respecto de un
punto de referencia
•………………………………………..…….………......
•………………………...........……………………

Intervalo Razón
Capítulo 1. Organización de datos 17

Ejemplo 4

El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La gerencia general


desea invertir en publicidad para incrementar la cantidad de huéspedes extranjeros en el hotel.
Para conocer qué características del hotel es conveniente resaltar en la publicidad se aplicó una
encuesta a una muestra aleatoria de 56 mujeres y 59 hombres extranjeros que se hospedaron en-
tre enero y mayo del presente año. A continuación se presenta parte de la base de datos:

Precio dispuesto
Número de
País de a pagar por
N° Edad Género acompañantes Criterio de selección del hotel
procedencia habitación, en
por viaje
dólares
1 25 Masculino Inglaterra 80 0 Limpieza del dormitorio
2 35 Femenino Argentina 60 2 Precio
3 45 Masculino Francia 115 3 Buena calidad de las toallas y sábanas
4 65 Masculino Francia 45 0 Precio
5 72 Femenino Francia 55 1 Amigable y cordial staff de empleados
6 28 Masculino Estados Unidos 65 2 Precio
7 45 Femenino Estados Unidos 60 1 Precio
8 85 Masculino China 70 2 Precio
9 25 Masculino Inglaterra 65 3 Limpieza del dormitorio
10 35 Femenino Francia 45 1 Precio
11 20 Masculino Estados Unidos 55 2 Amigable y cordial staff de empleados
      

Identifique el tipo y la escala de medición de cada una de las variables que se presenta en la base
de datos.

Solución

Variable Tipo de variable Escala de medición

Edad Cuantitativa continua Razón

Género Cualitativa Nominal

País de procedencia Cualitativa Nominal

Precio dispuesto a pagar por habitación, en


Cuantitativa continua Razón
dólares

Número de acompañantes por viaje Cuantitativa discreta Razón

Criterio de selección del hotel Cualitativa Nominal


18 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 6

Indique el tipo y la escala de medición que corresponde a cada una de las siguientes variables.

Variable Tipo de variable Escala de medición

Edad

Marca de automóvil

Número de personas a favor de


la pena de muerte

Ventas anuales (en dólares)

Tamaño de bebida (pequeño,


mediano, grande)

Ejercicio 7

La Oficina de Turismo de Cusco recopila datos sobre los turistas que llegan a la ciudad. Entre las 16
preguntas de un cuestionario que se repartió a los pasajeros en los vuelos de llegada durante el
mes pasado figuraban, entre otras, las siguientes:
 Esta visita a Cusco es la: ___________________ vez. (1°, 2°, 3°, etc.)
 El motivo principal de este viaje es: _______________ (16 categorías incluyendo vacaciones,
trabajo, etc.)
 Voy a estar alojado en: ________________ (11 categorías incluyendo hotel, apartamento, pa-
rientes, etc.)
 Mi estadía en Cusco va a durar: ________ días.

Identifique el tipo y la escala de medición de cada una de las variables:

Variable Tipo de variable Escala de medición


Capítulo 1. Organización de datos 19

Parámetro y estimador

Parámetro Estimador

Para obtener Para obtener


su valor se su valor se
Representa , hace necesario Representa, en utiliza la
información Al estimador,
en valor contar con valor
muestral. se le llama
numérico, la toda la numérico, la
también
característica información característica Al valor estadígrafo o
de la que brindan de una numérico del estadístico.
población. los elementos muestra. estimador se le
de una conoce como
población. estimación.

Algunos parámetros y estadísticos importantes

Notación
Nombre
Parámetro Estadístico
N n

Media x i x i
 i 1
x i 1
N n
N n

Varianza  x i   2  x  x  i
2

 
2 i 1
s2  i 1
N n 1

Desviación estándar   2 s  s2

K k
Proporción p pˆ 
N n

Moda Mo mo
20 Estadística Básica con Aplicaciones en Excel 2010

Ejemplo 5

Este fue el flash electoral de CPI para las elecciones presidenciales del 2011.

Identifique la variable en estudio, un estadístico para esta variable y el valor del estadístico.

Solución
 Variable en estudio: candidato de preferencia
 Estadístico para esta variable: proporción del candidato de preferencia
 El valor del estadístico es: 52,5% prefiere a Ollanta Humala y 47,5% prefiere a Keiko Fujimori.

Ejemplo 6

El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La gerencia general


desea invertir en publicidad para incrementar la cantidad de huéspedes extranjeros en el hotel.
Desea conocer qué características del hotel es conveniente resaltar en la publicidad, para ello apli-
có una encuesta a una muestra aleatoria de 56 mujeres y 59 hombres extranjeros que se hospeda-
ron entre enero y mayo del presente año. A continuación, se presenta parte de la base de datos:

Precio dispuesto
Número de
País de a pagar por
N° Edad Género acompañantes Criterio de selección del hotel
procedencia habitación en
por viaje
dólares
1 25 Masculino Inglaterra 80 0 Limpieza del dormitorio
2 35 Femenino Argentina 60 2 Precio
3 45 Masculino Francia 115 3 Buena calidad de las toallas y sábanas
4 65 Masculino Francia 45 0 Precio
5 72 Femenino Francia 55 1 Amigable y cordial staff de empleados
6 28 Masculino Estados Unidos 65 2 Precio
7 45 Femenino Estados Unidos 60 1 Precio
8 85 Masculino China 70 2 Precio
9 25 Masculino Inglaterra 65 3 Limpieza del dormitorio
10 35 Femenino Francia 45 1 Precio
11 20 Masculino Estados Unidos 55 2 Amigable y cordial staff de empleados
      
Capítulo 1. Organización de datos 21

Después de procesar la información se obtuvieron los siguientes resultados:


 El 34% de los huéspedes extranjeros procede de los Estados Unidos.
 La edad promedio de los huéspedes es de 35,2 años.
 El número de acompañantes por huésped extranjero más frecuente es de dos personas.
 El criterio de selección más frecuente es el precio.

Identifique el estimador y el valor del estimador para cada una de las variables de la base de datos.

Solución
Variable Estimador Notación Valor del estimador

Lugar de procedencia Proporción p̂EEUU 0,34

Edad de los huéspedes Promedio x 35,2 años

Número de acompañantes Moda mo 2

Criterio de selección del hotel Moda mo Precio

Ejercicio 8
Un banco estatal ha estudiado la información que dieron sus clientes en el mes de marzo al solicitar
un préstamo vehicular. Al seleccionar una muestra de 180 clientes algunos resultados fueron:

• El 12% declaró tener un trabajo independiente.


• La edad promedio de los clientes al solicitar un préstamo fue de 41,3 años.
• El 50% declaró ser casado.
• El monto promedio de las solicitudes fue de 3025 nuevos soles.

Identifique el estimador y el valor del estimador para cada una de las variables.

Solución

Variable Estimador Notación Valor


22 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 9
Como parte de un estudio de mercado se aplicó este año una encuesta a un grupo de 245 estudian-
tes de la universidad A. Se sabe que en esta universidad el 72% del alumnado pertenece al área de
Humanidades y el resto al área de Ciencias.

Después de procesar la información se obtuvo que 56% de los encuestados era de sexo femenino,
el 33,2% de los encuestados prefiere el rock como género musical, el 45,7% gusta de la emisora
104.7 VIVA F.M. Se sabe, además, que la media del número de veces que un oyente llamó a la radio
en el último mes fue de 2,86 llamadas y la moda de esa misma variable fue igual a uno.

Identifique el estimador o parámetro y su valor para cada una de las variables.

Solución

Variable Parámetro o estimador Notación Valor


Capítulo 1. Organización de datos 23

Ejercicios de aplicación

1. Conteste las siguientes preguntas justificando adecuadamente las respuestas:

a. ¿Qué diferencias existe entre la escala de intervalos y la escala de razón? Muestre ejemplos
que sustenten su respuesta.
b. ¿Qué diferencia existe entre dato y observación? Muestre ejemplos que sustenten su res-
puesta.

2. Se quiere estimar el ingreso mensual de los niños y adolescentes que viven en Iquitos. Identifi-
que la población, la muestra, el elemento y la variable en estudio.

Población

Muestra

Elemento

Variable

3. La entidad bancaria Tubanco tiene presencia en Lima y Callao. Cuenta actualmente con 9 784
clientes distribuidos en diferentes agencias. Su gerente general desea determinar la situación
de la entidad y la de sus clientes. Para ello, seleccionó una muestra de 120 clientes que solicita-
ron préstamo durante el último semestre. Parte de la base de datos correspondiente a la
muestra se presenta a continuación:

Número Edad del Monto del Número de cuo- Tipo de mone-


Tipo de Giro del
de cliente préstamo tas del préstamo da del présta-
préstamo negocio
tarjetas (años) (en dólares) (meses) mo

1 53 Capital trabajo 5000 6 Soles Bodega


3 36 Cuota fija 1500 12 Soles Restaurante
5 54 Cuota fija 4500 18 Soles Abarrotes
2 45 Mi local 12000 36 Soles Abarrotes
      
4 43 Mi local 6000 36 Dólares Mueblería

a. De acuerdo con el enunciado identifique la población, la muestra y la unidad elemental.


b. Identifique un ejemplo de dato y uno de observación.
c. Para cada una de las variables identifique su tipo y escala de medida.
d. ¿Qué estadístico puede calcularse para la variable Monto del préstamo y cuál para la varia-
ble Tipo de préstamo?

4. Fernando, estudiante de administración, tiene la labor de conseguir información acerca de los


turistas que llegaron a la ciudad del Cusco. En su búsqueda, encontró que la agencia de viajes
Turismo Perú realizó un estudio a sus 15 000 turistas extranjeros que llegaron al Cusco el año
pasado. Como parte de la información encontró que todos hablaban más de un idioma, el 35%
eran americanos y el gasto promedio que hicieron en la ciudad fue de 2 000 nuevos soles.
24 Estadística Básica con Aplicaciones en Excel 2010

De acuerdo con el enunciado anterior:


a. Identifique la población, la muestra y la unidad elemental.
b. Para cada una de las variables identifique su tipo y escala de medida.
c. Mencione dos parámetros y un estadígrafo de utilidad para cada variable.

5. Una entidad estatal realizó un estudio para determinar algunos indicadores socioeconómicos
de los inmigrantes peruanos en Estados Unidos. El estudio se llevó a acabo aplicando encuestas
a una muestra de 400 inmigrantes peruanos. Algunas de las preguntas del cuestionario fueron
las siguientes:

 Nivel educativo alcanzado en el Perú.


 Monto enviado (en dólares) el último mes a sus familiares en el Perú.
 ¿Presenta alguno de los siguientes problemas? (indocumentado, discriminado, vivienda no
adecuada, salud y otros).
 Número de veces que ha visitado el Perú desde que viajó por primera vez a los Estados
Unidos.
a. De acuerdo con el enunciado anterior identifique la población y la muestra.
b. Para las respuestas generadas por cada una de las preguntas mostradas identifique el tipo
de variable y su respectiva escala de medida.
c. Para cada una de las variables, proponga el estadístico más adecuado.

6. Edificar es una empresa dedicada al rubro de la construcción que ha crecido notablemente


durante el último año. El gerente de Recursos Humanos ha recibido algunas quejas de los tra-
bajadores y antes este problema ha decidido estudiar la situación laboral de los trabajadores
para obtener algunas medidas de interés que le permita tomar algunas decisiones. Al seleccio-
nar una muestra de 115 trabajadores obtuvo la siguiente información:

Edad Número Ingreso mensual Motivo de la


Trabajador Género Cargo
(en años) de hijos (en nuevos soles) queja
1 M 32 1 Maestro de obra 2862 Mal remunerado
2 M 32 2 Peón 742 Sin bonificación
3 M 25 0 Oficial 2256 Sin horas extras
4 F 21 0 Operario 1696 Mal trato
      
115 M 37 3 Oficial 1438 Mal remunerado

De acuerdo con el enunciado anterior:


a. Identifique la población, la muestra y la unidad elemental.
b. Para cada una de las variables, proponga el estadístico más adecuado que ayude al gerente.
c. Complete la siguiente tabla:

Variable en estudio Tipo de variable Escala de medida


Ingreso mensual (en nuevos soles)
Razón
Nominal
Cuantitativa discreta
Capítulo 1. Organización de datos 25

Organización y presentación de datos


Luego de aplicar una encuesta a una muestra de treinta empleados, una empresa obtiene la si-
guiente base de datos. Se pide redactar un informe que resuma la información.

Tabla. Datos sobre satisfacción laboral


Tiempo en Número de
Ingreso Promoción Número de Relación con
Género Función Edad la empre- promocio-
anual posible capacitaciones la gerencia
sa nes
Femenino Obrero 19 1 11 400 0 Improbable 1 Buenas
Masculino Profesional 31 5 210 600 2 No está seguro 2 Buenas
Masculino Profesional 34 8 193 400 1 Probable 2 Buenas
Masculino Servicios 36 15 30 800 1 Improbable 0 Buenas
Masculino Obrero 44 4 9 850 0 Improbable 1 Regulares
Masculino Obrero 44 10 9 800 0 Improbable 1 Regulares
Masculino Técnico/ventas 31 5 40 840 0 Improbable 3 Buenas
Femenino Profesional 37 8 93 700 1 No está seguro 2 Buenas
Masculino Obrero 45 23 10 150 0 Improbable 1 Regulares
Masculino Obrero 54 18 9 050 0 Muy improbable 1 Regulares
Femenino Profesional 26 2 62 200 2 No está seguro 2 Buenas
Masculino Obrero 44 14 10 200 0 Probable 0 Regulares
Masculino Técnico/ventas 31 2 40 335 0 Muy improbable 2 Buenas
Femenino Producción 28 10 30 990 1 Muy improbable 1 Buenas
Femenino Obrero 23 5 9 360 1 Muy improbable 1 Buenas
Femenino Producción 38 20 33 800 0 Muy improbable 1 Buenas
Masculino Producción 38 9 35 500 1 Muy improbable 2 Buenas
Masculino Técnico/ventas 32 2 40 540 0 Improbable 2 Buenas
Masculino Servicios 36 18 27 500 1 Muy improbable 1 Buenas
Femenino Obrero 48 25 10 200 0 Muy improbable 1 Buenas
Masculino Obrero 45 20 9 650 0 Improbable 1 Regulares
Femenino Técnico/ventas 22 2 44 000 0 No está seguro 2 Buenas
Masculino Técnico/ventas 32 6 48 560 1 Improbable 2 Buenas
Masculino Obrero 46 20 10 300 0 Muy improbable 1 Regulares
Masculino Profesional 28 1 108 700 3 Improbable 5 Buenas
Femenino Producción 27 5 30 550 1 Muy improbable 2 Buenas
Masculino Producción 38 14 32 300 0 Muy improbable 1 Buenas
Masculino Obrero 40 20 9 130 0 No está seguro 0 Regulares
Masculino Profesional 24 1 70 000 1 Probable 3 Buenas
Masculino Obrero 56 30 9 740 0 Muy improbable 1 Regulares

Una vez recopilada la información, con


las variables consideradas de mayor
importancia, el siguiente paso es
¿Qué podemos hacer para resumir
presentarla a través de una tabla de
esta información?
frecuencias o un gráfico que describa
adecuadamente las características
más importantes.
26 Estadística Básica con Aplicaciones en Excel 2010

Distribución de frecuencias

Es el resumen de un
Esta tabla muestra las
conjunto de datos,
frecuencias absolutas, las Las categorías o clases no se
presentado en una tabla
frecuencias relativas y los traslapan.
llamada la tabla de
porcentajes
distribución de frecuencias

Frecuencias absolutas, relativas y porcentuales


 La frecuencia absoluta (fi ) de una clase es la cantidad de elementos que pertenecen a esa cla-
se.

 La frecuencia relativa (hi ) de una clase es la proporción de elementos que pertenecen a esa
clase.
frecuencia absoluta fi
Frecuencia relativahi   
número de datos n

 La frecuencia porcentual (pi) de una clase es la frecuencia relativa multiplicada por 100%.

Frecuencia porcentual pi   hi  100%

Ejemplo

Tomado de Revista Peruana de Epidemiología. Prácticas laborales de riesgo en cultivadores de arroz del valle del Alto Mayo, Región San
Martín, Perú. Romina Tejada Caminiti, Franco Romaní Romaní, Paolo Wong Chero, Jorge Alarcón Villaverde. Junio 2011
http://rpe.epiredperu.net/rpe_ediciones/2011_V15_N01/AO8_Vol15_No1_2011_Tb1.gif.
Capítulo 1. Organización de datos 27

Elementos de un cuadro estadístico

Una tabla de frecuencias o cuadro estadístico debe presentar los siguientes elementos básicos:

Elementos de un gráfico estadístico

La presentación gráfica de la información permite, en la mayoría de casos, obtener conclusiones


descriptivas del comportamiento de la variable que se está analizando.
28 Estadística Básica con Aplicaciones en Excel 2010

Tabla de frecuencias para variables cualitativas

Se deberá presentar en la tabla las diferentes categorías que asume la variable cualitativa y en
la columna de las frecuencias absolutas la cantidad de veces que se repite esta categoría de la
variable.

Si la medición está hecha en escala nominal


sólo deberá mostrarse las frecuencias
absolutas y relativas.
Si la variable cualitativa está medida en
Para elaborar el gráfico de Pareto es escala ordinal, tendrá sentido mostrar las
necesario que la tabla de distribución de frecuencias acumuladas absolutas y
frecuencias presente los valores de las relativas.
frecuencias acumuladas, absolutas y
relativas, con la finalidad de elaborar la
curva creciente .

La distribución de frecuencias es un cuadro que se calcula de la siguiente manera.


Título: ……………………………………………………………..…………….
Categorías Frecuencia absoluta fi Frecuencia relativa hi
f1
Categoría 1 f1 h1 
n
f
Categoría 2 f2 h2  2
n
… … …
fk
Categoría k fk hk 
n
Fuente: ……………………………………..

Tabla de frecuencias para variables cualitativas en Excel

• Asegúrese que cada columna represente una variable en estudio.


• Ubique el cursor en cualquier celda de los datos.
• Haga clic en la opción Insertar de la barra de menú.
• Seleccione Tabla dinámica y haga clic en Aceptar,

• Arrastre la variable de la cual desea el cuadro a la zona de Etiquetas de fila y también a la zona
de ∑ Valores.
• Copie la tabla sin incluir los títulos, en otra celda.
• Calcule la frecuencia relativa (hi)
Capítulo 1. Organización de datos 29

Ejemplo 7

La universidad América realizó una encuesta a 30 jóvenes que están terminando el colegio con la
finalidad de conocer sus preferencias profesionales. Los datos obtenidos se presentan a continua-
ción:

Derecho Periodismo Ingeniería Administración Derecho


Ingeniería Futbolista Chef Ingeniería Administración
Periodismo Ingeniería Periodismo Chef Periodismo
Administración Chef Futbolista Administración Ingeniería
Derecho Chef Ingeniería Derecho Futbolista
Ingeniería Ingeniería Chef Chef Administración

a. Obtenga la tabla de distribución de frecuencia.

b. Interprete la frecuencia absoluta y la frecuencia relativa de la tercera categoría.

Solución

a. Obtenga la tabla de distribución de frecuencia.

Distribución de estudiantes de acuerdo a su preferencia profesional


Preferencia profesional fi hi pi
Administración 5 0,1667 16,67%
Chef 6 0,2000 20,00%
Derecho 4 0,1333 13,33%
Futbolista 3 0,1000 10,00%
Ingeniería 8 0,2667 26,67%
Periodismo 4 0,1333 13,33%
Total general 30 1,0000 100,00%
Fuente: universidad América. 2013

b. Interprete la frecuencia absoluta y la frecuencia relativa de la tercera categoría.

f3 = de un total de treinta jóvenes, cuatro prefieren la carrera de Derecho.

p3 = el 13,3% de los jóvenes prefieren el Derecho como carrera profesional.


30 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 10

Luego de aplicar una encuesta a una muestra de treinta empleados, la empresa Motores S.A. desea
obtener información acerca de la distribución de sus trabajadores de acuerdo a su Función. Los
datos se presentan a continuación:

Obrero Profesional Profesional Servicios Obrero Obrero


Profesional Obrero Técnico/ventas Producción Obrero Producción
Obrero Técnico/ventas Técnico/ventas Obrero Profesional Producción
Obrero Obrero Obrero Profesional Servicios Obrero
Técnico/ventas Obrero Técnico/ventas Producción Producción Profesional

a. Presente la tabla de distribución de frecuencias.


b. Interprete la frecuencia absoluta y la frecuencia relativa de la primera categoría.

Solución

a. Presente la tabla de distribución de frecuencias.

Título: ……………………………………………………………………………………………….

Función fi hi pi

Obrero
Producción
Profesional
Servicios
Técnico/ventas
Total general

Fuente: ……………………………………………………………………………

b. Interprete la frecuencia absoluta y la frecuencia relativa de la primera categoría.

f1 = de un total de ……….……. trabajadores, ………………. son ……………………………

p1 = el ……….……% de los trabajadores son ……………………………………………….……


Capítulo 1. Organización de datos 31

Representación gráfica de variables cualitativas

Gráfico de barras
En el eje horizontal se representa las categorías de la variable y en el eje de ordenadas las frecuen-
cias absolutas, relativas o porcentuales.

Gráfico de barras en Excel

• Seleccione las celdas de la variable y de la de frecuencia absoluta o relativa. Use la tecla Ctrl si
necesita seleccionar celdas no contiguas.
• Haga clic en la opción Insertar de la barra de menú y active el icono Columnas. Seleccione la
opción Columna y presione Aceptar.

• Elimine la leyenda que aparece en el lado derecho del gráfico.


• Haga doble clic en el área del gráfico, aparecerá una pestaña de Herramientas de gráficos con
las opciones: Diseño, Presentación y Formato. Seleccione Presentación, luego escoja los boto-
nes Título de gráfico, Rótulo del eje o Etiquetas de datos para darle el formato deseado a su
gráfico.
• Para cambiar a porcentaje los valores del eje vertical haga doble clic en el eje vertical, seleccio-
ne la opción Número y haga clic en Porcentaje.
32 Estadística Básica con Aplicaciones en Excel 2010

Ejemplo 8

La universidad América realizó una encuesta a 30 jóvenes que están terminando el colegio con la
finalidad de conocer sus preferencias profesionales. Los datos obtenidos se presentan a continua-
ción:

Derecho Periodismo Ingeniería Administración Derecho


Ingeniería Futbolista Chef Ingeniería Administración
Periodismo Ingeniería Periodismo Chef Periodismo
Administración Chef Futbolista Administración Ingeniería
Derecho Chef Ingeniería Derecho Futbolista
Ingeniería Ingeniería Chef Chef Administración

Presente el gráfico de barras porcentuales para los datos.

Solución

Distribución de estudiantes que culminan el colegio


de acuerdo a su preferencia profesional
30%
26.7%
25%
Porcentaje de alumnos

20.0%
20%
16.7%
15% 13.3% 13.3%
10.0%
10%

5%

0%
Ingeniería Chef Administración Derecho Periodismo Futbolista
Preferencia profesional
Fuente: Universidad América. 2013

Interpretación

Del gráfico se puede observar que el 26,7% de los estudiantes prefieren la carrera de Ingeniería
mientras que el 10% prefiere la carrera de futbolista.
Capítulo 1. Organización de datos 33

Ejercicio 11
Luego de aplicar una encuesta a una muestra de treinta empleados, la empresa Motores S.A. desea
obtener información acerca de la distribución de sus trabajadores de acuerdo a su función. Los
datos se presentan a continuación:
Obrero Profesional Profesional Servicios Obrero Obrero
Profesional Obrero Técnico/ventas Producción Obrero Producción
Obrero Técnico/ventas Técnico/ventas Obrero Profesional Producción
Obrero Obrero Obrero Profesional Servicios Obrero
Técnico/ventas Obrero Técnico/ventas Producción Producción Profesional

Realice e interprete el gráfico de barras porcentuales.

Solución

Cuenta de Preferencia
14

12

10

0
Obrero Producción Profesional Servicios Técnico/ventas
Función
Fuente: ..........................................................

Interpretación
34 Estadística Básica con Aplicaciones en Excel 2010

Gráfico circular

En este caso las categorías de la variable cualitativa ocupan un espacio en el círculo que es propor-
cional a la frecuencia que representan. También se denomina diagrama de sector circular, gráfico
tipo torta o pastel.

Si la variable cualitativa es de escala ordinal se recomienda usar el gráfico de barras

Gráfico circular en Excel

• Seleccione las columnas de la variable y la de frecuencia absoluta o relativa . Use la tecla Ctrl si
necesita seleccionar celdas no contiguas.
• Haga clic en la opción Insertar de la barra de menú y active el icono Circular. Seleccione la op-
ción Circular y presione Aceptar.

• Haciendo doble clic en el área del gráfico, aparecerá una pestaña de Herramientas de gráficos
con las opciones: Diseño, Presentación y Formato.
• Seleccione Presentación y escoja el botón Título de gráfico y Etiquetas de datos.
Capítulo 1. Organización de datos 35

Ejemplo 9

La universidad América realizó una encuesta a 30 jóvenes que están terminando el colegio con la
finalidad de conocer sus preferencias profesionales. Los datos obtenidos se presentan a continua-
ción:

Derecho Periodismo Ingeniería Administración Derecho


Ingeniería Futbolista Chef Ingeniería Administración
Periodismo Ingeniería Periodismo Chef Periodismo
Administración Chef Futbolista Administración Ingeniería
Derecho Chef Ingeniería Derecho Futbolista
Ingeniería Ingeniería Chef Chef Administración

Presente el gráfico circular.

Solución

Distribución de estudiantes de acuerdo a su preferencia


profesional

Periodismo Administración
13% 17%

Ingeniería Chef
27% 20%

Futbolista Derecho
10% 13%

Fuente: Universidad América. 2013

Interpretación

Del gráfico se puede observar que el 26,7% de los estudiantes prefieren la carrera de Ingeniería y
solo el 10% prefiere la carrera de Derecho.
36 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 12
Luego de aplicar una encuesta a una muestra de treinta empleados, la empresa Motores S.A. desea
obtener información acerca de la distribución de sus trabajadores de acuerdo a su función. Los
datos se presentan a continuación:

Obrero Profesional Profesional Servicios Obrero Obrero


Profesional Obrero Técnico/ventas Producción Obrero Producción
Obrero Técnico/ventas Técnico/ventas Obrero Profesional Producción
Obrero Obrero Obrero Profesional Servicios Obrero
Técnico/ventas Obrero Técnico/ventas Producción Producción Profesional

Realice e interprete el gráfico circular.

Solución

Fuente: ..........................................................

Interpretación
Capítulo 1. Organización de datos 37

Diagrama de Pareto
El diagrama de Pareto permite ver que, en muchos casos, pocos factores pueden producir la mayo-
ría de las consecuencias, lo que se podría resumir como “pocos factores son vitales y muchos son
triviales”. Por ejemplo, en control de calidad, se puede mostrar que la mayoría de los defectos sur-
gen de un número pequeño de causas.
Los pasos para realizar un diagrama de Pareto son los siguientes:

Construya la tabla de distribución de frecuencias, De existir la categoría Otros


ordenando las categorías en forma descendente colóquela en la última
respecto de la frecuencia absoluta o relativa. posición.

En el eje En el eje vertical izquierdo, marque una


Grafique dos vertical escala de:
ejes verticales derecho, •0 hasta el número total de observaciones,
y un eje use una si usa las frecuencias absolutas
horizontal. escala de •0 a 100%, si usa las frecuencias
0% a 100%. porcentuales

Elabore el diagrama de
En el eje horizontal, marque los espacios donde
barras y dibuje la línea de
estarán dibujadas las barras para cada una de las
frecuencias acumuladas
categorías, incluida la categoría Otros.
(curva de Pareto).

Diagrama de Pareto en Excel

 Elija Insertar del menú principal y como tipo de gráfico Columna.


 Haga clic derecho en cualquiera de las barras Hi y haga clic en Cambiar tipo de gráfico en serie y
elija tipo de gráfico Líneas y presione Aceptar.
 Haga clic derecho sobre el eje Y. Seleccione Dar formato a eje. Elija Opciones del eje y en Máxima
ponga el valor 1 en Fija.
 Haga clic derecho sobre cualquiera de los puntos de la línea y elija la opción Dar Formato de serie
de datos... En el recuadro Opciones de serie, seleccione Eje secundario.
 Haga clic derecho sobre el eje Y derecho. Seleccione Dar formato a eje. Elija Opciones del eje y en
Máxima ponga el valor 1 en Fija.
 Haga clic sobre el gráfico y seleccione Título de gráfico, Rótulos del eje y Etiquetas de datos para
dar el formato al gráfico.
38 Estadística Básica con Aplicaciones en Excel 2010

Ejemplo 10

En el cuadro se muestran, según la página web de la Oficina Nacional de Procesos Electorales, los
resultados de las elecciones presidenciales del 2011 en el Perú. Elabore el diagrama de Pareto co-
rrespondiente. Agrupe en la categoría Otros a los candidatos que obtuvieron menos del 1%.

Organización política Votos Organización política Votos


Gana Perú 4,643,064 Despertar Nacional 21,574
Fuerza 2011 3,449,595 Adelante 17,301
Alianza por el Gran Cambio 2,711,450 Fuerza Nacional 16,831
Perú Posible 2,289,561 Justicia, Tecnología, Ecología 11,275
Alianza Solidaridad Nacional 1,440,143 Partido Descentralista Fuerza Social 9,358
Fonavistas del Perú 37,011

Solución
 Ordene las categorías en orden decreciente. La categoría Otros siempre va al final independien-
temente de su valor.
 Calcule las frecuencias porcentuales (pi ) y las porcentuales acumuladas (Pi )
Distribución de los encuestados según organización política
Organización política Votos pi Pi
Gana Perú 4,643,064 31,70% 31,70%
Fuerza 2011 3,449,595 23,55% 55,25%
Alianza por el Gran Cambio 2,711,450 18,51% 73,76%
Perú Posible 2,289,561 15,63% 89,39%
Alianza Solidaridad Nacional 1,440,143 9,83% 99,23%
Otros 113,350 0,77% 100,00%
Fuente: Web de la Oficina de Procesos Electores ONPE

El resultado debe ser:


Capítulo 1. Organización de datos 39

Del gráfico, vemos que el 73,76% de las personas votó por las organizaciones políticas Gana Perú,
Fuerza 2011 y Alianza por el gran cambio.

Ejercicio 13
Tito´s, empresa de venta de comida rápida por delivery, desea elevar el nivel de satisfacción de sus
clientes. Para ello, llevó a cabo una encuesta por teléfono entre 100 clientes que realizaron pedidos
durante el último mes. Las quejas manifestadas por estos clientes se resumen a continuación:

Quejas hi
Tiempo de entrega del pedido 0,40
Calidad del producto entregado 0,15
Error en el pedido 0,20
Otros 0,10
Cordialidad del empleado 0,10
No existe variedad 0,03
Precio 0,02

a. Presente la tabla de distribución de frecuencias.


b. Complete el gráfico mostrado con los valores y títulos apropiados.
c. ¿Qué recomendaría al gerente de esta empresa de venta de comida rápida por delivery según el
gráfico obtenido?

Solución

a. Presente la tabla de distribución de frecuencias.

Título: …………………………………………………………………………………………………………………………….

Quejas fi hi Hi

Tiempo de entrega del pedido

Error en el pedido

Calidad del producto entregado

Cordialidad del empleado

No existe variedad

Precio

Otros

Fuente: ………………………………………………………………………………………
40 Estadística Básica con Aplicaciones en Excel 2010

b. Complete el gráfico mostrado con los valores y títulos apropiados.

qqqq

qqqq

Fuente: ………………………………………………………..…………………………………………………

c. ¿Qué recomendaría al gerente de esta empresa de venta de comida rápida por delivery según el
gráfico obtenido?
Capítulo 1. Organización de datos 41

Tabulaciones cruzadas

Cuando hay dos variables, se suele estar


Se usan para También son
interesado en observar si existe algún tipo
resumir de manera llamadas tablas de
de dependencia entra las variables, de forma
simultánea los datos contingencia o de
que una de ellas pudiera explicar el
para dos variables. doble entrada.
comportamiento de la otra.

Ejemplo 11

La siguiente tabla muestra el lugar de residencia y el giro de negocio que posee una muestra de
clientes de la entidad bancaria Tubanco que solicitaron préstamo durante el primer trimestre año.

Distribución de clientes según lugar de residencia y giro del negocio


Lugar de residencia
Giro del negocio Total
Lima Callao
Bodega 18 14 32
Frutería 15 8 23
Ferretería 7 6 13
Boutique 35 22 57
Otros 13 15 28
Total 88 65 153

Fuente: Entidad bancaria Tubanco. Primer trimestre

Complete adecuadamente los espacios en blanco:

a. El ………...….. % de los clientes de Tubanco en la muestra tienen ferretería.


b. El …………….. % de los clientes de Tubanco en la muestra que tienen bodega, son del Callao.
c. El ……..……… % de los clientes de Tubanco en la muestra tienen boutique y son de Lima.

Solución

 Dividimos 13/153 = 0,084967, entonces el 8,5% de los clientes de Tubanco en la muestra tienen
ferretería.
 Dividimos 14/32 = 0,4375, entonces el 43,75% de los clientes de Tubanco en la muestra que
tienen bodega, son de una de las agencias del Callao.
 Dividimos 35/153 = 0,22875, entonces el 22,9% de los clientes de Tubanco en la muestra tienen
boutique y son de una de las agencias de Lima.
42 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 14
La tabla que se presenta a continuación fue publicada el mes pasado por el diario Siglo XXI. La en-
cuesta se aplicó a una muestra de 805 hogares según nivel socioeconómico (NSE) y área de residen-
cia. Los resultados se presentan a continuación:
Distribución de hogares según área de residencia y nivel socioeconómico
Área de residencia
Nivel socioeconómico Total
Área urbana Área rural
NSE A 15 2 17
NSE B 48 3 51
NSE C 105 145 250
NSE D 94 175 269
NSE E 38 180 218
Total 300 505 805

Fuente: Diario Siglo XXI

De la tabla anterior, complete los espacios en blanco:

 El número de hogares que pertenecen al NSE C o D es de ………………………………


 …………………………. hogares pertenecen al NSE C y son del área urbana.
 Del total de hogares del área rural, el ………………….% son del NSE E.
 Del total de hogares del NSE D, el ……………………..% son del área urbana.

Ejercicio 15
En los Censos Nacionales 2007 ejecutados por el Instituto Nacional de Estadística e Informática se
preguntó a todos los peruanos la religión que profesa, obteniéndose los siguientes resultados
Perú. Cuadro sobre religión que se profesa y género
Religión que profesa
Sexo
Católica Cristiana - Evangélica Otra Ninguna Total
Hombre 8 379 120 1 200 953 324 445 374 024 10 278 542
Mujer 8 577 602 1 405 102 354 846 234 410 10 571 960
Total 16 956 722 2 606 055 679 291 608 434 20 850 502

Fuente: INEI - Censos Nacionales 2007: XI de Población y VI de Vivienda

Complete los espacios en blanco.


a. El número de cristianos evangélicos en el Perú es …………………..……
b. Del total de peruanos, ………………………………………. son católicos.
c. De …………………………………….. de católicos, ………………………..……………….. son mujeres.
d. El ………….…….% de los hombres peruanos profesa la religión católica.
e. El ………………..% de las peruanas no son cristianas-evangélicas.
f. El ………………..% de los hombres peruanos no profesa religión alguna.
Capítulo 1. Organización de datos 43

Recomendaciones sobre los títulos de tablas y gráficos

 La tabla de doble entrada y su gráfico deben tener el mismo título.


 Una manera ordenada de presentarlo es teniendo en cuenta si la tabla de doble entrada corres-
ponde al total general o si ella corresponde al total de fila o al total de columna.

Si la tabla o gráfico corresponde al total de fila


Si la tabla o gráfico corresponde al total general
100% o columna 100%, el título incluye dos
entonces el título debe incluir las dos variables
palabras claves: según y por, donde el según
en estudio separadas por la letra y. El orden de
determina la variable que va en la leyenda y el
las variables es indistinto.
por la variable que totaliza el 100%.

Tabulación cruzada en Excel

 Ponga el cursor en cualquiera de las celdas de los datos y elija la opción Insertar y luego Tabla
dinámica. Luego, seleccione los datos y haga clic en Aceptar

 Arrastre una de las variables a la zona de Etiquetas de fila y la otra variable a la zona Etiquetas
de columna.
 Luego, arrastre cualquiera de las variables, al campo ∑ valores.
44 Estadística Básica con Aplicaciones en Excel 2010

Ejemplo 12

El área de Recursos Humanos de una empresa de servicios desea analizar la relación de los trabaja-
dores con la gerencia. Después de aplicar una encuesta se obtuvieron los siguientes resultados:

Distribución de trabajadores según su función y relación con la gerencia


Relación con la gerencia
Función
Buena Regular Mala Total general
Apoyo/adm. 18 2 0 20
Obrero 10 29 20 59
Profesional 11 6 0 17
Técnico/ventas 19 7 0 26
Total general 58 44 20 122
Fuente: Área de Recursos Humanos.

Solución
Para interpretar los valores de una tabla absoluta cruzada hay que tener en cuenta si el valor que se
va a interpretar corresponde a un total de fila, a un total de columna o al valor de una celda.
Si deseamos interpretar el valor de una celda hay que tener presente que la celda tiene tres inter-
pretaciones dado que existen tres totales, con respecto a su total de fila, con respecto a su total de
columna y con respecto al gran total. Para ilustrarlo, tomaremos como ejemplo la tabla anterior.

Interpretación

• Total de fila: valor 59


 De un total de 122 trabajadores, 59 son obreros.

• Total de columna: valor 58


 De un total de 122 trabajadores, 58 manifiestan tener una buena relación con la gerencia.

• Valor de celda: 10

 Con respecto al gran total, de un total de 122 trabajadores, 10 son obreros y manifestaron
tener una buena relación con la gerencia.

 Con respecto al total de su fila, de un total de 59 obreros, 10 manifestaron tener una buena
relación con la gerencia.

 Con respecto al total de su columna, de un total de 58 trabajadores que manifestaron tener


una buena relación con la gerencia, 10 son obreros.
Capítulo 1. Organización de datos 45

Para obtener las frecuencias porcentuales respecto al total


 Haga clic derecho sobre la celda Cuenta de Relación con la Gerencia.
 En el menú despegable escoja Configuración de campo de valor.
 Haga clic sobre Mostrar valores como y escoja la opción % del total general.
El resultado debe ser:
Distribución de trabajadores según su función y relación con la gerencia
Relación con la gerencia Total Interpretación
Función
Buena Regular Mala general Del total de trabajadores,
Apoyo/adm. 14,8% 1,6% 0,0% 16,4% - el 48,4% son obreros
Obrero 8,2% 23,8% 16,4% 48,4% - el 47,5% manifestaron tener una buena relación
Profesional 9,0% 4,9% 0,0% 13,9% con la gerencia.
Técnico/ventas 15,6% 5,7% 0,0% 21,3% - el 23,8% son obreros y manifestaron tener una
Total general 47,5% 36,1% 16,4% 100,0% regular relación con la gerencia.
Fuente: Área de Recursos Humanos

Para obtener las frecuencias porcentuales respecto al total de filas


 Haga clic derecho sobre la celda Cuenta de Relación con la Gerencia.
 En el menú despegable escoja Configuración de campo de valor.
 Haga clic sobre Mostrar valores como y escoja la opción % del total de filas.

El resultado debe ser:


Distribución de trabajadores según relación con la gerencia por función
Relación con la gerencia Total Interpretación
Función
Buena Regular Mala general Del total de obreros, el 49,2% tiene una regular
Apoyo/adm. 90,0% 10,0% 0,0% 100,0% relación con la gerencia.
Obrero 16,9% 49,2% 33,9% 100,0%
Profesional 64,7% 35,3% 0,0% 100,0%
Técnico/ventas 73,1% 26,9% 0,0% 100,0%
Total general 47,5% 36,1% 16,4% 100,0%
Fuente: Área de Recursos Humanos

Para obtener las frecuencias porcentuales respecto al total de columnas


 Haga clic derecho sobre la celda Cuenta de Relación con la Gerencia.
 En el menú despegable escoja Configuración de campo de valor.
 Haga clic sobre Mostrar valores como y escoja la opción % del total de columnas.

El resultado debe ser:

Distribución de trabajadores según función por tipo de relación con la gerencia


Relación con la gerencia Total Interpretación
Función
Buena Regular Mala general Del total de trabajadores que tienen una relación
Apoyo/adm. 31,0% 4,6% 0,0% 16,4% regular con la gerencia, el 65,9% son obreros.
Obrero 17,2% 65,9% 100,0% 48,4%
Profesional 19,0% 13,6% 0,0% 13,9%
Técnico/ventas 32,8% 15,9% 0,0% 21,3%
Total general 100,0% 100,0% 100,0% 100,0%
Fuente: Área de Recursos Humanos
46 Estadística Básica con Aplicaciones en Excel 2010

Gráfico de barras comparativas


Gráfico de barras comparativas en Excel

• Seleccione solo las celdas correspondientes a las categorías de ambas variables. No incluya los
totales.
• Haga clic en la opción Insertar de la barra de menú y elija Columna/Columna agrupada.

• Haga clic a cualquier línea horizontal del gráfico y observará que todas las líneas horizontales se
seleccionan. Presione la tecla Supr de su teclado para eliminarlas.
• Haga clic en el área del gráfico y aparecerá la pestaña Herramientas de gráficos con las opcio-
nes: Diseño, Presentación y Formato.
• Seleccione Diseño y elija el estilo que desee haciendo clic en el menú despegable. El estilo 26
(segunda columna fila 4) es el que se presenta como modelo en este material.

• Seleccione ahora la pestaña Presentación, y de ahí escoja los botones Título de gráfico, Rótulo
del eje y Etiqueta de datos para darle el formato deseado.

• Haga clic derecho sobre cualquier valor del eje Y y del menú elija Dar formato al eje…
/Número/Porcentaje/Posiciones decimales: 0/Cerrar.

• Elimine los valores porcentuales iguales a cero para una mejor presentación.
Capítulo 1. Organización de datos 47

Gráfico porcentual con respecto al gran total


Distribución de trabajadores según su función y relación con la gerencia

Relación con la gerencia Total Distribución de los trabajadores


Función
Buena Regular Mala general según su función y relación con la gerencia
Apoyo/adm. 14,8% 1,6% 0,0% 16,4% 25% 23.8%
Obrero 8,2% 23,8% 16,4% 48,4%

Porcentaje de trabajadores
Profesional 9,0% 4,9% 0,0% 13,9% 20%
16.4% 15.6%
14.8%
Técnico/ventas 15,6% 5,7% 0,0% 21,3% 15%
Total general 47,5% 36,1% 16,4% 100,0%
8.2% 9.0%
10%
Fuente: Área de Recursos Humanos 5.7%
4.9%
5%
1.6%
0%
Apoyo/adm. Obrero Profesional Técnico/ventas
Función
Buenas Regulares Malas
Fuente: Área de Recursos Humanos.

Gráfico porcentual con respecto al total de filas


Distribución de trabajadores según relación con la gerencia por función
Relación con la gerencia Total Distribución de los trabajadores según su relación con la
Función
Buena Regular Mala general gerencia por función
100% 90.0%
Apoyo/adm. 90,0% 10,0% 0,0% 100,0%
Porcentaje de trabajadores

Obrero 17,0% 49,2% 33,9% 100,0% 80% 73.1%


64.7%
Profesional 64,7% 35,3% 0,0% 100,0%
60% 49.2%
Técnico/ventas 73,1% 26,9% 0,0% 100,0%
33.9% 35.3%
Fuente: Área de Recursos Humanos
40% 26.9%
17.0%
20% 10.0%

0%
Apoyo/adm. Obrero Profesional Técnico/ventas
Función
Buenas Regulares Malas

Fuente: Área de Recursos Humanos.

Gráfico porcentual respecto al total de columnas


Distribución de trabajadores según su función por tipo de relación con la gerencia
Relación con la gerencia Total Distribución de los trabajadores según su función por
Función
Buena Regular Mala general tipo de relación con la gerencia
100%
Apoyo/adm. 31,0% 4,6% 0,0% 16,4% 100%
Porcentaje de trabajadores

Obrero 17,2% 65,9% 100,0% 48,4% 80%


65.9%
Profesional 19,0% 13,6% 0,0% 13,9%
60%
Técnico/ventas 32,8% 15,9% 0,0% 21,3% 19%
40% 31% 32.8%
Total general 100% 100% 100% 100,0% 15.9%
17.2% 13.6%
Fuente: Área de Recursos Humanos 20%
4.6%
0%
Buenas Regulares Malas
Relación con la gerencia
Apoyo/adm. Obrero
Profesional Técnico/ventas
Fuente: Área de Recursos Humanos.
48 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 16
La estratificación de la población capitalina ha ocasionado que algunos problemas afecten más a
ciertos estatus sociales. Cierto S.A, una encuestadora de la capital, realizó durante el último trimes-
tre un estudio acerca de los principales problemas que enfrenta la capital. La información resumida
se presenta en la siguiente tabla:
Distribución de encuestados según principales problemas de Lima y estatus social
Principales problemas de Lima
Estatus social Total
Tráfico Delincuencia Basura
Alto 70 38 12 120
Medio 52 80 14 146
Bajo 48 88 10 146
Total 170 206 36 412
Fuente: Cierto S.A.

a. Según lo mencionado, complete los siguientes espacios en blanco:


 De 412 ciudadanos, 14 ...……………………………………………….…………………………………………....……..…
 Del total de ciudadanos de clase baja, 88 ………………………………………………………….……………...…..
 Del total de ciudadanos que opinan que el principal problema en Lima es la delincuencia, el
……………..…… % de ellos son de clase media.
 Del total de ciudadanos, el …………..…….% de ellos son de clase alta y opinan que el principal
problema en Lima es la delincuencia.

b. Presente la tabla cruzada para el título: “Distribución porcentual de los ciudadanos según princi-
pal problema de Lima y estatus social”

Principales problemas de Lima


Estatus social Total
Tráfico Delincuencia Basura
Alto
Medio
Bajo
Total
Fuente: Cierto S.A.

c. Presente la tabla cruzada para el título: “Distribución porcentual de los ciudadanos según princi-
pal problema de Lima por estatus social”
Principales problemas de Lima
Estatus social Total
Tráfico Delincuencia Basura
Alto
Medio
Bajo
Total
Fuente: Cierto S.A.
Capítulo 1. Organización de datos 49

d. Presente la tabla cruzada para el título: “Distribución porcentual de los ciudadanos según esta-
tus social por principal problema de Lima”

Principales problemas de Lima


Estatus social Total
Tráfico Delincuencia Basura
Alto
Medio
Bajo
Total
Fuente: Cierto S.A.

e. Elabore el gráfico de barras comparativas para el título: “Distribución porcentual de los ciudada-
nos según principal problema de Lima y estatus social”
50 Estadística Básica con Aplicaciones en Excel 2010

f. Elabore el gráfico de barras comparativas para el título: “Distribución porcentual de los ciudada-
nos según principal problema de Lima por estatus social”

g. Elabore el gráfico de barras comparativas para el título: “Distribución porcentual de los ciudada-
nos según estatus social por principal problema de Lima”
Capítulo 1. Organización de datos 51

Gráfico de barras apiladas

Los datos también pueden ser representados en barras y las cantidades (o los
apiladas de porcentajes donde la cantidad para cada porcentajes) de la segunda
valor de la variable elegida para el eje horizontal variable van a dar lugar a dicha
representa el total parcial (o el 100%) cantidad (o el 100%).

Gráfico de barras apiladas en Excel

• Seleccione solo las celdas correspondientes a las categorías de ambas variables. No incluya los
totales.
• Haga clic en la opción Insertar de la barra de menú y elija Columna/Columna apilada.

• Haga clic a cualquier línea horizontal del gráfico y observará que todas las líneas horizontales se
seleccionan. Presione la tecla Supr de su teclado para eliminarlas.
• Haga clic en el área del gráfico y aparecerá la pestaña Herramientas de gráficos con las opcio-
nes: Diseño, Presentación y Formato.
• Seleccione Diseño y elija el estilo que desee haciendo clic en el menú despegable. El estilo 26
(segunda columna fila 4) es el que se presenta como modelo en este material.
• Seleccione ahora la pestaña Presentación, y de ahí escoja los botones Título de gráfico, Rótulo
del eje y Etiqueta de datos para darle el formato deseado.

• Haga clic derecho sobre cualquier valor del eje Y y del menú elija Dar formato al eje…
/Número/Porcentaje/Posiciones decimales: 0/Cerrar.

• Elimine los valores porcentuales iguales a cero para una mejor presentación.
52 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 17
La tabla que se presenta a continuación fue publicada el mes pasado por el diario Siglo XXI. La en-
cuesta se aplicó a una muestra de 737 hogares según nivel socioeconómico (NSE) y área de residen-
cia. Los resultados se presentan a continuación:
Distribución de los encuestados según nivel socioeconómico y área de residencia
Área de residencia
Nivel socioeconómico Total
Área urbana Área rural
NSE C 105 145 250
NSE D 94 175 269
NSE E 38 180 218
Total 237 500 737
Fuente: Diario Siglo XXI

a. Presente la tabla de contingencia porcentual con respecto al total.


b. A partir de la tabla anterior, elabore e interprete el gráfico apilado.

Solución

a. Presente la tabla cruzada porcentual con respecto al total. Coloque el título apropiado.
Distribución de encuestados según nivel socioeconómico y área de residencia
Área de residencia
Nivel socioeconómico Total
Área urbana Área rural
NSE C 14,25% 19,67% 33,92%
NSE D 12,75% 23,74% 36,50%
NSE E 5,16% 24,42% 29,58%
Total 32,16% 67,84% 100%
Fuente: Diario Siglo XXI

b. A partir de la tabla anterior elabore e interprete el gráfico apilado.

Distribución de encuestados según nivel socioeconómico


y área de residencia
40%
Porcentaje de encuestados

35%
30%
25% 19.67% 23.74%
20%
24.42% Área Rural
15%
10% Área Urbana
14.25% 12.75%
5%
5.16%
0%
NSE C NSE D NSE E
Nivel socioeconómico
Fuente: Diario Siglo XXI

El 24,42% de los hogares son del área rural y pertenecen al nivel socioeconómico E, mientras
que el 14,25% de los hogares son del área urbana y pertenecen al nivel socioeconómico C.
Capítulo 1. Organización de datos 53

Ejercicio 18
Un productor musical de la empresa Creativa´s ha entrevistado a 200 personas haciéndolos oír una
canción y pidiéndoles que la identifiquen.

Distribución de individuos según identificación de la canción y género musical


Género musical Plenamente Medianamente No identifica Total
Reggaetón 35% 3% 4% 42%
Vals 23% 7% 6% 36%
Cumbia 13% 8% 1% 22%
Total 71% 18% 11% 100%
Fuente: Empresa Creativa´s

a. Presente la tabla de contingencia absoluta. Coloque el título apropiado.


b. A partir de la tabla relativa elabore e interprete un gráfico apilado.

Solución
a. Presente la tabla de contingencia absoluta. Coloque el título apropiado.
Distribución de individuos …………………………………………………………………………………………….
Género musical Plenamente Medianamente No identifica Total
Reggaetón
Vals
Cumbia
Total
Fuente: Empresa Creativa´s

b. A partir de la tabla relativa elabore e interprete el gráfico apilado.

Interpretación
54 Estadística Básica con Aplicaciones en Excel 2010

Gráfico de barras apiladas al 100%

Un gráfico de barras apiladas al 100%


El alto de cada barra es el mismo para
muestra todas las series apiladas en una
cada categoría.
sola barra para cada categoría.

Gráfico de barras apiladas al 100% en Excel

• Seleccione solo las celdas correspondientes a las categorías de ambas variables. No incluya los
totales.
• Haga clic en la opción Insertar de la barra de menú y elija Columna/Columna 100% apilada.

• Haga clic en el área del gráfico y aparecerá la pestaña Herramientas de gráficos con las opcio-
nes: Diseño, Presentación y Formato.
• Seleccione Diseño y elija el estilo que desee haciendo clic en el menú despegable. El estilo 26
(segunda columna fila 4) es el que se presenta como modelo en este material.

• Seleccione ahora la pestaña Presentación, y de ahí escoja los botones Título de gráfico, Rótulo
del eje y Etiqueta de datos para darle el formato deseado.

• Haga clic derecho sobre cualquier valor del eje Y y del menú elija Dar formato al eje…
/Número/Porcentaje/Posiciones decimales: 0/Cerrar.
• Elimine los valores porcentuales iguales a cero para una mejor presentación.
Capítulo 1. Organización de datos 55

Ejemplo 13

La tabla que se presenta a continuación fue publicada el mes pasado por el diario Siglo XXI. La en-
cuesta se aplicó a una muestra de 737 hogares según nivel socioeconómico (NSE) y área de residen-
cia. Los resultados se presentan a continuación:

Distribución de los encuestados según nivel socioeconómico y área de residencia


Área de residencia
Nivel socioeconómico Total
Área urbana Área rural
NSE C 105 145 250
NSE D 94 175 269
NSE E 38 180 218
Total 237 500 737
Fuente: diario Siglo XXI

a. Presente la tabla cruzada porcentual por área de residencia. Coloque el título apropiado.
b. A partir de la tabla anterior elabore e interprete un gráfico de barras apiladas al 100%.

Solución
a. Presente la tabla cruzada porcentual por área de residencia. Coloque el título apropiado.

Distribución de encuestados según nivel socioeconómico por área de residencia


Área de residencia
Nivel socioeconómico
Área urbana Área rural
NSE C 35,00% 28,71%
NSE D 31,33% 34,65%
NSE E 12,67% 35,64%
Total 100,0% 100,0%
Fuente: Diario Siglo XXI

b. A partir del cuadro anterior elabore e interprete un gráfico de barras apiladas al 100%.

Distribución de encuestados según nivel socioeconómico


por área de residencia
100%
Porcentaje de encuestados

12.67%
80% 35.64%

60% 31.33%
NSE E
34.65%
40% NSE D

20% 35.00% NSE C


28.71%
0%
Área Urbana Área Rural
Área de residencia
Fuente: Diario Siglo XXI

 Del total de encuestados cuya área de residencia es el área urbana, el 35% pertenece al NSE C
mientras que el 12,67% pertenece al NSE E.
 Del total de encuestados cuya área de residencia es del área rural, el 35,64% pertenece al NSE E
mientras que el 28,71% pertenece al NSE C.
56 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 19
Un productor musical de la empresa Creativa´s ha entrevistado a 200 personas haciéndolos oír una
canción y pidiéndoles que la identifiquen.

Distribución de individuos según identificación de la canción por género musical


Género musical Plenamente Medianamente No identifica Total
Reggaetón 84% 7% 9% 100%
Vals 63% 19% 18% 100%
Cumbia 59% 37% 4% 100%
Fuente: Empresa Creativa´s

Presente e interprete el gráfico de barras apiladas al 100% para la tabla anterior.

Solución

Presente el gráfico de barras apiladas al 100%.

Título del gráfic o


100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
Reggaetón Vals Cumbia
Tít ulo del eje

Fuente: …………………………………………………………………….

Interpretación
Capítulo 1. Organización de datos 57

Distribución de frecuencias de variables discretas

Es un resumen de un conjunto de datos que Es un cuadro que presenta además de las


consiste en presentar para cada valor de la frecuencias absolutas y relativas las
variable el número de elementos (frecuencia) que frecuencias acumuladas absolutas y
la componen. acumuladas relativas.

Título: …………………………………………………………………………………………….……………………..
Valores de la variable Frecuencia Frecuencia Frecuencia absoluta Frecuencia relativa
discreta absoluta fi relativa hi acumulada Fi acumulada Hi
f1
x1 f1 h1  F1  f1 H1  h1
n
f
x2 f2 h2  2 F2  f2  F1 H2  h2  H1
n
… … … … …
fk
xk fk hk  Fk  fk  Fk 1 Hk  hk  Hk 1
n
Fuente:……………………………………………………………………………………..

Distribución de frecuencias de variables discretas en Excel

• Seleccione Insertar de la barra de menú y luego elija Tabla dinámica.

• Seleccione el rango de datos.


• Haga clic en Aceptar y arrastre Número de capacitaciones a la zona de Etiquetas de fila y a la
zona de ∑ Valores. Coloque el cursor en la opción Suma de la variable y haga clic derecho,
cambie Recuento en vez de Suma.

• Copie la tabla dinámica sin incluir la primera fila.


• Calcule la frecuencia relativa (h i) y las frecuencias acumuladas.
58 Estadística Básica con Aplicaciones en Excel 2010

Ejemplo 14

Los siguientes datos corresponden al número de capacitaciones recibidas por los colaboradores de
la empresa Creativa’s en lo que va del año.

1 2 2 0 1 1 3 2 1 1 2 0 2 1 1
1 2 2 1 1 1 2 2 1 5 2 1 0 3 1

a. Presente la tabla de distribución de frecuencias.


b. Interprete f2 , F2 , h3 y H2

Solución
El resultado debe ser:

Distribución del número de capacitaciones recibidas


Número de capacitaciones fi hi Fi Hi
0 3 0,100 3 0,1000
1 14 0,467 17 0,5667
2 10 0,333 27 0,9000
3 2 0,067 29 0,9667
5 1 0,033 30 1,0000
Total 30 1,000
Fuente: Empresa Creativa´s

Interprete:

f2 = 14 De 30 empleados, 14 han recibido solo una capacitación al año

F2 = 17 De 30 empleados, 17 han recibido de una a menos capacitaciones al año

h3 = 0,467 El 46,7% de los trabajadores han recibido solo una capacitación al año

H2 = 0,567 El 56,7% de los trabajadores han recibido de una a menos capacitaciones al año
Capítulo 1. Organización de datos 59

Ejercicio 20
Los siguientes datos corresponden a una encuesta realizada por un grupo de estudiantes de la uni-
versidad San Vicente de Arequipa a una muestra de 40 aficionados al cine. Al formular la pregunta,
¿cuántas veces ha visto su película preferida? las respuestas fueron las siguientes:

1 2 3 4 3 3 2 3 5 3 3 4 5 5 2 3 3 2 4 1
2 3 4 3 1 1 2 4 1 2 2 3 1 3 4 2 1 4 5 2

a. Presente la tabla de distribución de frecuencias.


b. Interprete f3 , h1, F2 y H4

Solución
a. Presente la tabla de distribución de frecuencias.

TÍtulo: ………………………………………………………………………………………………………………………………………

fi hi Fi Hi

Fuente: …………………………………………………………………………………

b. Interprete:

f3 = …………...

F2 = ………..…

h1 = …………..

H4 = …………..
60 Estadística Básica con Aplicaciones en Excel 2010

Representación gráfica de variables discretas

Gráfico de bastones o líneas

Su uso es adecuado cuando existen muchas


Por lo general, el gráfico de bastones es
observaciones pero pocos valores de la
utilizado cuando la variable es discreta.
variable.

Gráfico de bastones o líneas en Excel


• Construya la tabla de distribución de frecuencias
• Seleccione las columnas Número de capacitaciones y frecuencia absoluta (fi) o relativa (hi).
• En la barra de menú, elija la opción Insertar, seleccione el tipo Dispersión sólo con marcadores.

• Elimine la leyenda.
• Seleccione el gráfico, elija la opción Presentación y elija la opción Barras de error. En esa opción
seleccione Más opciones de las barras de error…
• En Barras de error verticales seleccione la opción Menos. Luego en Cuantía de error, elija Por-
centaje y coloque el valor 100%. Borre las barras de error horizontales que aparecen automáti-
camente.

• Haga clic sobre el gráfico y seleccione Título de gráfico, Rótulos del eje y Etiquetas de datos
para dar el formato al gráfico.
• De ser necesario, coloque los valores del eje Y en formato Porcentaje.
Capítulo 1. Organización de datos 61

Ejercicio 21
Los siguientes datos corresponden al número de capacitaciones recibidas por los colaboradores de
la empresa Creativa’s en lo que va del año.

1 2 2 0 1 1 3 2 1 1 2 0 2 1 1
1 2 2 1 1 1 2 2 1 5 2 1 0 3 1

Presente e interprete el gráfico de bastones para los siguientes datos.

Solución
Distribución del número de capacitaciones recibidas
Número de capacitaciones fi hi Fi Hi
0 3 0,100 3 0,1000
1 14 0,467 17 0,5667
2 10 0,333 27 0,9000
3 2 0,067 29 0,9667
5 1 0,033 30 1,0000
Total 30 1,000
Fuente: Empresa Creativa´s

Distribución del número de capacitaciones


recibidas
16 14
Número de colaboradores

14
12 10
10
8
6
4 3
2
1
2
0
0 1 2 3 4 5
Número de capacitaciones
Fuente: Empresa Creativa´s

Interpretación
De un total de treinta empleados, catorce de ellos han recibido una capacitación y solo un colaborador
ha recibido cinco capacitaciones en lo que va del año
62 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 22
Los siguientes datos corresponden a una encuesta realizada por un grupo de estudiantes de la uni-
versidad San Vicente de Arequipa a una muestra de 40 aficionados al cine. Al formular la pregunta,
¿cuántas veces ha visto su película preferida? las respuestas fueron las siguientes:

1 2 3 4 3 3 2 3 5 3 3 4 5 7 2 3 3 2 4 1
2 3 4 3 1 1 2 4 1 2 2 3 1 3 4 2 1 4 5 2

Presente e interprete el gráfico de bastones para los siguientes datos.

Solución

Presente el gráfico de bastones para los siguientes datos.

Interpretación
Capítulo 1. Organización de datos 63

Distribución de frecuencias de variables continuas

Los tres pasos para elaborar una tabla de


distribución de frecuencias para variables
Es un resumen de un conjunto de datos cuantitativas continuas son:
que consiste en presentar para cada •Determinar la cantidad de clases
categoría el número de elementos
•Determinar el ancho de cada clase
(frecuencia) que la componen.
•Determinar los límites de cada clase

Cantidad de clases
 Se recomienda usar entre 5 y 20 clases, inclusive.
 La idea es emplear suficientes clases para mostrar la variación de los datos, pero no tantas,
porque puede ocurrir que varias contengan ningún o pocos elementos.
 Para determinar el número de clases se puede usar la regla de Sturges. Si la estimación tiene
decimales, se toma el entero más próximo (redondeo simple).

Regla de Sturges: k = 1 + 3,322 x log n

Amplitud o ancho de cada clase


 Usualmente se usa el mismo ancho para todas las clases.
 Se calcula de la siguiente manera:
rango r
Amplitud  w  
k k
 La amplitud del intervalo debe tener la misma cantidad de cifras decimales que tienen los datos
originales. El redondeo empleado es el redondeo a más. Por ejemplo:

w
Datos con
(redondeo a más)
Cero decimales w = 50,2387 w = 51
Una cifra decimal w = 12,1066 w = 12,2
Dos cifras decimales w = 125,4463 w = 125,45
Tres cifras decimales w = 587,9308 w = 587,931

Marcas de clase
 Son los puntos medios de los límites de cada intervalo.
 Su notación es X i'
 Se calcula de la siguiente manera:
Límiteinf erior  Límitesuperior LI  LS
Xi'  
2 2
64 Estadística Básica con Aplicaciones en Excel 2010

Límites de cada clase


 Los límites de clase se escogen de tal manera que cada valor de dato pertenezca a una clase y
sólo a una.
 El límite inferior de clase es el valor mínimo posible de los datos que se asigna a la clase y el
límite superior de clase es el valor máximo posible de los datos que se asigna a la clase.

Distribución de frecuencias de variables continuas en Excel

 En el menú principal elija la opción Datos/Análisis de datos/Estadística descriptiva

 En Rango de entrada seleccione las celdas donde se encuentran los datos.

 Marque Rótulo en la primera fila si los datos han sido seleccionados desde el nombre de la va-
riable en la primera fila, caso contrario no seleccione esta opción.
 A continuación, haga clic en Rango de salida y ubique el cursor en el recuadro del lado derecho
haga clic en una celda en blanco, en donde saldrán los resultados.
 Finalmente, haga clic a Resumen de estadísticas y dé Aceptar

Cálculo de las frecuencias

• Seleccione el rango en el cual aparecerán las frecuencias respectivas.


• Haga clic en el icono de Insertar función, seleccione =Frecuencia y dé Aceptar.
Capítulo 1. Organización de datos 65

• En la ventana de Frecuencia, en la opción Datos ingrese el rango de datos que se desea contar
y en Grupos, ingrese solo el rango de celdas que corresponde a los límites superiores de los in-
tervalos.
• A continuación mantenga presionadas las teclas Ctrl + Shift y a continuación presione Enter con
lo cual aparecerán las frecuencias absolutas.
• Calcule las demás frecuencias y las marcas de clase para completar la tabla.

Ejemplo 15

El jefe de la Oficina de Rentas de una municipalidad ha realizado un estudio sobre los impuestos
que pagan los vecinos del distrito. La tabla en Excel muestra los pagos de impuestos, en nuevos
soles, de 48 viviendas elegidas al azar en el 2012.

A B C D E F G H I J K L
1 145,1 216,3 252,5 303,6 196,9 234,8 265,2 317,2 206,5 242,9 289,1 331,7
2 151,0 225,9 257,1 305,8 202,6 238,4 271,0 320,2 208,0 244,0 291,0 344,6
3 159,0 227,1 259,2 315,4 204,9 239,9 286,7 324,8 208,0 247,7 291,9 346,7
4 195,6 231,2 262,5 315,5 206,1 241,1 288,1 331,1 209,3 249,5 294,5 351,1

Elabore la tabla de frecuencias para la variable Pago por impuestos municipales año 2012.

Solución

El rango r se calcula con:

r = valor máximo – valor mínimo = 351,1 – 145,1 = 206

Siguiendo la regla de Sturges, el número de intervalos es:

k  1  3,322log10 n  1  3,322log10(48)  6,585  7 (Use redondeo simple)

La amplitud se calcula por:


r 206
w   29,429  29,5
k 7

Usamos redondeo por exceso a un decimal debido a que los datos tienen como máximo un deci-
mal.
66 Estadística Básica con Aplicaciones en Excel 2010

Usando las funciones del Excel 2010 sería:

A B
6 Máximo 351,1 =MAX(A1:L4)
7 Mínimo 145,1 =MIN(A1:L4)
8 Rango 206 =B6-B7
9 Cantidad de datos (n) 48 =CONTAR(A1:L4)
10 k (por regla de Sturges) 6,58508 =1+3,322*LOG10(B9)
11 k (entero) 7
12 w (Amplitud) 29,4286 =B8/B11
13 Número de decimales de los datos 1
14 w (redondeada) 29,5

Otra manera de hacerlo en Excel 2010 es:

 Copie los datos en la columna A del Excel y en la fila 1 agregue el nombre de la variable; por lo
tanto los datos estarán comprendidos en el rango A2:A49
 En el menú principal elija la opción Datos/Análisis de datos/Estadística descriptiva
 En Rango de entrada seleccione las celdas A2:A49
 Dé clic a Rótulo en la primera fila dado que nuestros datos tienen en la primera fila el nombre
de la variable
 Dé clic a Rango de salida y ubique el cursor dentro del recuadro para dar a continuación clic en
una celda en blanco, por ejemplo C2.
 Finalmente, haga clic a Resumen de estadísticas y dé Aceptar

La salida obtenida en la celda C2 será:

Impuestos
Media 257,25625
Error típico 7,6183196
Mediana 251
Moda 208
Desviación estándar 52,7812664
Varianza de la muestra 2785,86209
Curtosis -0,68012624
Coeficiente de asimetría -0,07342341
Rango 206
Mínimo 145,1
Máximo 351,1
Suma 12348,3
Cuenta 48
Capítulo 1. Organización de datos 67

Completamos los siguientes cálculos:

k (por regla de Sturges) 6,5851


k (entero) 7
w (Amplitud) 29,4286
Número de decimales de los datos 1
w (redondeada) 29,5

Cálculo de las frecuencias absolutas

• Seleccione el rango en el cual aparecerán las frecuencias absolutas.


• Haga clic en el icono de Insertar función, seleccione Frecuencia y de Aceptar.
• En la ventana de Frecuencia, ingrese en Datos el rango de los datos que se desea contar. En
Grupos, ingrese el rango de celdas de los límites superiores de los intervalos.

• Manteniendo presionado Ctrl + Shift, presione Enter, con lo cual aparecerán las frecuencias
absolutas.
• Calcule las demás frecuencias y las marcas de clase para completar la tabla.

A continuación la tabla de distribución de frecuencias:

Distribución del pago de impuesto municipal (en nuevos soles)


Pago de impuestos Marca de clase fi hi Fi Hi
[145,1 ; 174,6] 159,85 3 0,0625 3 0,0625
]174,6 ; 204,1] 189,35 3 0,0625 6 0,1250
]204,1 ; 233,6] 218,85 10 0,2084 16 0,3334
]233,6 ; 263,1] 248,35 12 0,2500 28 0,5834
]263,1 ; 292,6] 277,85 7 0,1458 35 0,7292
]292,6 ; 322,1] 307,35 7 0,1458 42 0,8750
]322,1 ; 351,6] 336,85 6 0,1250 48 1,0000
Total 48
Fuente: Oficina de Rentas de la Municipalidad
68 Estadística Básica con Aplicaciones en Excel 2010

Interprete:

En tres viviendas pagaron más de 174,60 nuevos soles y hasta de 204,10 nuevos
f2 = 3
soles

F2 = 6 En seis viviendas pagaron hasta 204,10 nuevos soles

El 20,84% de las viviendas pagaron más de 204,10 nuevos soles y hasta 233,6
h3 = 0,2084
nuevos soles

H3 = 0,3334 El 33,34% de las viviendas pagaron hasta 233,60 nuevos soles

Ejercicio 23
A continuación, se muestra el tiempo de servicio, en meses, de los trabajadores de la empresa Óp-
tima, Usando la regla de Sturges construya la tabla de distribución de frecuencias.

10 24 38 40 43 44 51 53 55 57
16 25 39 40 43 46 51 53 55 57
21 31 39 40 43 46 52 53 55 58
21 31 40 43 44 47 53 54 55 62
23 33 40 43 44 48 53 54 55 65

Solución

Cálculo de los límites de los intervalos

Máximo =MAX(datos)
Mínimo =MIN(datos)
Rango =MAX(datos) – MIN(datos)
Cantidad de datos (n) =CONTAR(datos)
k (por regla de Sturges) =1+3,322*LOG10(n)
k (entero)
w (amplitud) =Rango/k (entero)
Número de decimales de los datos
w (redondeada por exceso)

Distribución del tiempo de servicio, en meses, de los trabajadores de la empresa Óptima


Tiempo de servicio Marca de clase fi hi Fi Hi
  
  
  
  
  
  
  
Fuente: Empresa Óptima
Capítulo 1. Organización de datos 69

Interprete

f4 = …………..

F2 = ………….

h1 = …………..

H4 = ………….

Representación gráfica de variables cuantitativas continuas

Histograma de frecuencias

Este resumen gráfico se prepara a


Se traza colocando la variable sobre el eje horizontal y las
partir de una tabla de frecuencias
frecuencias sobre el eje vertical.
absolutas, relativas o porcentuales.

Cada frecuencia de clase se representa trazando un


rectángulo, cuya base es el intervalo de clase sobre el eje Los rectángulos adyacentes se tocan
horizontal y cuya altura es proporcional a la frecuencia entre sí.
correspondiente.

Histograma de frecuencias en Excel

 Seleccione la columna de frecuencia absoluta o relativa, luego seleccione Insertar en la barra


de menú, elija Columna, y luego Columna agrupada.
70 Estadística Básica con Aplicaciones en Excel 2010

 Elimine la leyenda.
 Para que se junten los rectángulos: haga clic en una barra y elija Dar formato a serie de da-
tos…, luego ponga Ancho del intervalo igual a 0%.
 Para cambiar los valores del eje X haga clic derecho y seleccione Seleccionar datos – Editar.
 Haga clic sobre el gráfico y seleccione Título de gráfico, Rótulos del eje y Etiquetas de datos
para dar el formato al gráfico.

Ejemplo 16

La gerencia de una compañía, que brinda servicios de llamadas por celulares, está preocupada por
el poco monto de las llamadas realizadas por sus clientes. Para corroborarlo se encargó al área de
administración que eligiera, del mes de enero, una muestra de clientes de Lima y registrara el mon-
to que representan sus llamadas, en nuevos soles. El encargado mostró los resultados en una tabla
de distribución de frecuencias:

Monto de las llamadas en Lima (en nuevos soles)


Tiempo de servicio Marca de clase fi hi Fi Hi

0  10  5 12 0,1000 12 0,1000

10 20  15 22 0,1833 34 0,2833

20 30  25 45 0,3750 79 0,6583

30 40  35 23 0,1917 102 0,8500

40 50  45 12 0,1000 114 0,9500

50 60  55 6 0,0500 120 1,0000

 120 1
Fuente: Área de Administración

Grafique el histograma de frecuencias porcentuales.


Capítulo 1. Organización de datos 71

Solución

Distribución del monto de las llamadas en Lima


(en nuevos soles)
40% 37.5%
35%
Porcentaje de clientes

30%
25%
18.3% 19.2%
20%
15%
10.0% 10.0%
10%
5.0%
5%
0%
0-10 10-20 20-30 30-40 40-50 50-60
Monto de las llamadas

Fuente: Área de Administración

Interpretación: A partir del gráfico podemos observar que el 37,5% de los clientes de Lima tienen
montos superiores a 20 y como máximo de 30 nuevos soles y que solo el 5% de estos clientes tie-
nen montos superiores a 50 y como máximo de 60 nuevos soles.

Ejercicio 24
A continuación, se muestra el tiempo de servicio, en meses, de los trabajadores de la empresa Óp-
tima. Grafique el histograma de frecuencias relativas.
10 16 21 21 23 24 25 31 31 33 38 39 39 40 40 40 40
40 43 43 43 43 43 44 44 44 46 46 47 48 51 51 52 53
53 53 53 53 54 54 55 55 55 55 55 57 57 58 62 65

Solución
Título: ………………………………………………………………………………………………………………………………
Marca de clase fi hi Fi Hi

Fuente: ………………………………………………………………………………………………….
72 Estadística Básica con Aplicaciones en Excel 2010

Título: .............................................................................

40%
Porcentaje de .........................

35%
30%
25%
20%
15%
10%
5%
0%
-5 5 15 25 35 45 55 65
..................................................

Fuente: …………………………………………………………………….
Interpretación
Capítulo 1. Organización de datos 73

Polígono de frecuencias

Los polígonos de frecuencias se


Es la representación de las Se obtiene uniendo con cierran creando dos marcas de
frecuencias, absolutas, segmentos de recta los clase ficticias,
relativas o relativas, puntos de intersección de
mediante una figura las marcas de clase con las una antes de la primera marca de
poligonal cerrada. frecuencias. clase y la otra después de la
última marca de clase.

La gráfica debe presentarse solo en el primer


Las marcas de clase, creadas por el
cuadrante aún las marcas de clase creadas por el
artificio pueden toman valores negativos.
artificio sean negativas.

Polígono de frecuencias en Excel

 Antes de elaborar este gráfico deberá usar el siguiente artificio: agregue una primera marca de
clase ficticia y una última marca de clase ficticia, con frecuencias relativas igual a cero, en am-
bos casos. Su finalidad es obtener un polígono como figura geométrica cerrada.
 A continuación, seleccione la columna de frecuencia absoluta o relativa.
 Luego, seleccione Insertar en la barra de menú, elija Línea - Línea con marcadores.

 Elimine la leyenda.
 Para cambiar los valores del eje X haga clic derecho y seleccione Seleccionar datos –Editar.
 Haga clic sobre el gráfico y seleccione Título de gráfico, Rótulos del eje y Etiquetas de datos para
dar el formato al gráfico.
 Coloque las etiquetas y los valores del eje Y en formato Porcentaje.
74 Estadística Básica con Aplicaciones en Excel 2010

Ejemplo 17

La gerencia de la compañía Óptima, que brinda servicios de llamadas por celulares, está preocupa-
da por el poco monto de las llamadas realizadas por sus clientes. Para corroborarlo se encargó al
área de Administración que eligiera, del mes de enero, una muestra de clientes de Lima y registrara
el monto que representan sus llamadas, en nuevos soles.

El encargado mostró los resultados en la siguiente tabla de distribución de frecuencias.

Monto de las llamadas en Lima (en nuevos soles)


Tiempo de servicio Marca de clase fi hi Fi Hi
0  10  5 12 0,1000 12 0,1000
10 20  15 22 0,1833 34 0,2833
20 30  25 45 0,3750 79 0,6583
30 40  35 23 0,1917 102 0,8500
40 50  45 12 0,1000 114 0,9500
50 60  55 6 0,0500 120 1,0000
 120 1
Fuente: Empresa Óptima

Grafique el polígono de frecuencias relativas.

Solución

 Para cerrar el gráfico del polígono, emplearemos el siguiente artificio: agregue una primera
marca de clase ficticia y una última marca de clase ficticia, con frecuencias relativas igual a cero,
en ambos casos.

Marca de clase Xi hi
Artificio: X1 - amplitud -5 0
5 0,1000
15 0,1833
25 0,3750
35 0,1917
45 0,1000
55 0,0500
Artificio: X7 + amplitud 65 0

 A continuación, seleccione la columna de frecuencia absoluta o relativa.


Capítulo 1. Organización de datos 75

 Luego, seleccione Insertar en la barra de menú, elija Línea - Línea con marcadores.

 Elimine la leyenda.
 Para cambiar los valores del eje X haga clic derecho y seleccione Seleccionar datos –Editar.
 Haga clic sobre el gráfico y seleccione Título de gráfico, Rótulos del eje y Etiquetas de datos
para dar el formato al gráfico.
 Si corresponde, coloque las etiquetas y los valores del eje Y en formato Porcentaje.

Distribución del monto de las llamadas en Lima


(en nuevos soles)

40%
37.5%
35%
Porcentaje de clientes

30%
25%
20% 19.2%
18.3%
15%
10% 10.0% 10.0%
5% 5.0%
0%
-5 5 15 25 35 45 55 65
Monto de las llamadas

Fuente: Empresa Óptima


76 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 25
A continuación, se muestra el tiempo de servicio, en meses, de los trabajadores de la empresa Óp-
tima. Grafique el polígono de frecuencias relativas.

10 24 38 40 43 44 51 53 55 57
16 25 39 40 43 46 51 53 55 57
21 31 39 40 43 46 52 53 55 58
21 31 40 43 44 47 53 54 55 62
23 33 40 43 44 48 53 54 55 65

Solución

Título: .............................................................................

40%
Porcentaje de .........................

35%
30%
25%
20%
15%
10%
5%
0%
-5 5 15 25 35 45 55 65
..................................................

Fuente: …………………………………………………………………………
Capítulo 1. Organización de datos 77

Ojiva

Es la gráfica de una distribución Con la ojiva se puede estimar el número o


acumulada de frecuencias, absoluta o porcentaje de observaciones que corresponden a
relativa. un intervalo determinado.

Se obtiene uniendo con segmentos de recta los


La ojiva siempre es un gráfico
puntos de intersección del límite superior de cada
creciente.
intervalo y la frecuencia acumulada respectiva.

 Si se usa la frecuencia acumulada relativa, el valor máximo del eje Y debe ser igual a 1.
 Si se usa el porcentaje acumulado, el valor máximo del eje Y debe ser igual a 100%.
 Si se usa la frecuencia acumulada absoluta, el valor máximo del eje Y debe ser el tamaño de la
muestra.

Ojiva en Excel

 Para que la ojiva aplique el siguiente artificio: inserte una fila, escriba el mínimo valor de los
datos en la celda correspondiente al límite superior y en la columna de frecuencias relativas
acumuladas Hi coloque el valor cero.
 A continuación, seleccione la columna de frecuencia acumulada absoluta o relativa.
 Luego, seleccione Insertar en la barra de menú, elija Línea - Línea con marcadores.

 Elimine la leyenda.
 Elimine las líneas horizontales.
 Para cambiar los valores del eje X haga clic derecho y seleccione Seleccionar datos –Editar.
 Haga clic en Editar e indique la posición de los rótulos del eje.
 Coloque las etiquetas y los valores del eje Y en formato Porcentaje.
 Finalmente, coloque el título del gráfico y los rótulos de los ejes X e Y.
78 Estadística Básica con Aplicaciones en Excel 2010

Ejemplo 18

La gerencia de una compañía Óptima, que brinda servicios de llamadas por celulares, está preocu-
pada por el poco monto de las llamadas realizadas por sus clientes. Para corroborarlo se encargó al
área de Administración que eligiera, del mes de enero, una muestra de clientes de Lima y registrara
el monto que representan sus llamadas, en nuevos soles. El monto más pequeño que se registró
fue de 5 nuevos soles. El encargado mostró los resultados en la siguiente tabla de distribución de
frecuencias:
Monto de las llamadas en Lima (en nuevos soles)
Tiempo de servicio Marca de clase fi hi Fi Hi

0  10  5 12 0,1000 12 0,1000

10 20  15 22 0,1833 34 0,2833

20 30  25 45 0,3750 79 0,6583

30 40  35 23 0,1917 102 0,8500

40 50  45 12 0,1000 114 0,9500

50 60  55 6 0,0500 120 1,0000

 120 1

Grafique la ojiva de frecuencias relativas.

Solución
 Para que la ojiva comience a crecer desde el límite inferior del primer intervalo, inserte una fila,
escriba el mínimo valor de los datos en la celda correspondiente al límite superior y en la co-
lumna de frecuencias relativas acumuladas Hi coloque el valor cero.

Límite superior Hi
Límite superior = mínimo Escriba Hi = 0
valor 5 0
10 0,1000
20 0,2833
30 0,6583
40 0,8500
50 0,9500
60 1,0000

 A continuación, seleccione la columna de frecuencia acumulada absoluta o relativa.


 Luego, seleccione Insertar en la barra de menú, elija Línea - Línea con marcadores.
Capítulo 1. Organización de datos 79

 Elimine la leyenda.
 Si lo desea, elimine las líneas horizontales.
 Para cambiar los valores del eje X, haga clic derecho y seleccione Seleccionar datos –Editar.
 Haga clic en Editar e indique la posición de los rótulos del eje.
 Si corresponde, coloque las etiquetas y los valores del eje Y en formato Porcentaje.
 Finalmente, coloque el título del gráfico y los rótulos de los ejes X e Y.

Distribución del monto de las llamadas en Lima


(en nuevos soles)
100.0%
95.0%
100%
85.0%
90%
Porcentaje de clientes

80%
65.8%
70%
60%
50%
40% 28.3%
30%
20% 10.0%
10%
0%
5 10 20 30 40 50 60
Monto de las llamadas

Fuente: Empresa Óptima

Interpretación
A partir del gráfico podemos observar que el 85% de los clientes de Lima tienen montos de llamada
como máximo de 40 nuevos soles y que solo el 10% de estos clientes tienen montos de llamadas
como máximo de 10 nuevos soles.
80 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 26
A continuación, se muestra el tiempo de servicio, en meses, de los trabajadores de la empresa Óp-
tima. Presente la ojiva de frecuencias relativas para los siguientes datos.

10 24 38 40 43 44 51 53 55 57
16 25 39 40 43 46 51 53 55 57
21 31 39 40 43 46 52 53 55 58
21 31 40 43 44 47 53 54 55 62
23 33 40 43 44 48 53 54 55 65

Solución

Título: .............................................................................

40%

35%
Porcentaje de .........................

30%

25%

20%

15%

10%

5%

0%
-5 5 15 25 35 45 55 65
..................................................

Fuente: ……………………………………………………………….

Interpretación
Capítulo 1. Organización de datos 81

Ejercicios de aplicación

1. El gerente de un banco está interesado en estudiar el comportamiento del número de cuentas


de ahorros cerradas por día. La información disponible para este fin se muestra a continuación:

0 3 1 2 1 0 2 3 0 1
1 5 0 5 4 1 0 2 1 3
4 1 4 4 0 4 3 1 2 2
0 3 2 1 1 2 5 4 0 1

a. Construya la tabla de distribución de frecuencias para la variable en estudio.


b. Construya el gráfico de bastones para representar la variable en estudio.

2. Una entidad estatal realizó un estudio para determinar algunos indicadores socioeconómicos
de los inmigrantes peruanos en Estados Unidos. El estudio se llevó a cabo aplicando encuestas
a una muestra de 400 inmigrantes peruanos. Una de las preguntas buscaba identificar el pro-
blema principal que estos inmigrantes presentaban. Con los datos recogidos se elaboró el si-
guiente gráfico:

a. Construya el gráfico de Pareto.


b. Presente sus conclusiones basándose en el gráfico de Pareto.

3. El departamento de logística de una aerolínea ha registrado el día 12 de marzo del 2006, en


cada uno de sus 20 vuelos, el número de asientos sobrantes (con negativos), esto es cuando se
presentaron menos pasajeros que la capacidad total del avión y el número de asientos faltantes
(con positivos), cuando se presentaron más pasajeros que la capacidad total del avión.

-2 0 0 1 1
0 -1 0 2 -1
0 -1 -2 -1 1
-1 2 1 -3 0

Elabore un gráfico para representar la información anterior.


82 Estadística Básica con Aplicaciones en Excel 2010

4. Se realizó un estudio a los establecimientos dedicados a la venta de alimentos del distrito de


San Miguel en Lima, para este propósito se han elegido aleatoriamente una muestra de 20 es-
tablecimientos y se han considerado algunas variables como: número de empleados, condición
del establecimiento e ingreso mensual, en miles de dólares.

Establecimiento Número de Condición del Ingreso Establecimiento Número de Condición del Ingreso
empleados establecimiento empleados establecimiento
1 6 Buena 20,0 11 5 Regular 35,1
2 4 Buena 20,4 12 5 Mala 40,0
3 3 Regular 20,5 13 4 Buena 40,4
4 5 Regular 25,9 14 3 Buena 45,1
5 7 Mala 28,8 15 3 Mala 45,3
6 8 Buena 29,1 16 8 Muy buena 46,0
7 5 Regular 30,0 17 4 Buena 50,4
8 5 Regular 30,1 18 3 Muy buena 50,5
9 3 Muy buena 30,5 19 9 Buena 50,8
10 4 Buena 30,9 20 7 Muy buena 60,6

Elabore un gráfico que represente la información de la variable cualitativa. Además, elabore un


cuadro que resuma la información de la variable cuantitativa continua.

5. En los X Censos Nacionales de Población y V de Vivienda de año 2005 se preguntó por el tipo de
alumbrado de la vivienda según área (urbana o rural).

Tipo de alumbrado del hogar Área Urbana Área Rural Total


Electricidad 3 875 390 353 544 4 228 934
Kerosene (mechero / lamparín) 148 084 817 581 965 665
Petróleo / gas (lámpara) 6 219 11 479 17 698
Vela 201 220 312 327 513 547
Generador 6 562 6 819 13 381
Otro 70 647 20 608 91 255
No tiene 17 949 9 720 27 669
Total 4 326 071 1 532 078 5 858 149

Elabore una gráfica de barras apiladas al 100% que permita ver la composición del tipo de
alumbrado dentro de cada área.

6. Los siguientes datos corresponden a los ingresos de una muestra de 60 clientes del banco Nue-
vo Horizonte, los montos están expresados en cientos de nuevos soles.
5,25 7,22 8,53 9,27 9,54 10,21 10,32 10,45 10,52 10,76
10,85 11,25 11,56 12,42 13,27 14,65 15,72 16,85 17,22 18,56
19,32 20,56 21,72 22,85 23,12 24,32 25,65 26,72 28,72 29,65
31,42 32,71 33,55 34,28 35,21 37,45 38,32 39,65 41,22 43,28
45,72 47,32 49,45 51,27 52,38 54,75 55,81 56,27 57,45 58,22
59,32 61,45 63,75 65,72 66,85 69,32 69,54 72,30 75,81 77,42
a. Construya una tabla completa de distribución de frecuencias usando la regla de Sturges.
b. Interprete los valores de f2, h3 y H4.
c. Elabore el gráfico de histograma de frecuencia absoluta.
d. Elabore el gráfico de ojiva de frecuencia relativa.
Capítulo 1. Organización de datos 83

7. Los directivos de una empresa solicitaron a los gerentes de cada una de sus dos locales de ven-
tas, A y B, que informen sobre los sueldos de todos sus trabajadores correspondientes al mes
de marzo del año en curso. La información proporcionada (en nuevos soles) por el gerente del
local A se muestra a continuación.

i Sueldos fi
1 [ 1 000 – 2 000 2
2  2 000 – 3 000 3
3  3 000 – 4 000 14
4  4 000 – 5 000 15
5  5 000 – 6 000 5
6  6 000 – 7 000] 1

a. Complete la tabla anterior con la frecuencia relativa y las frecuencias acumuladas, absolu-
tas y relativas.
b. Interprete los valores de f3, h4 y H2.
c. Elabore el gráfico de la ojiva para los sueldos del local A.
d. Los siguientes datos corresponden a los sueldos (en nuevos soles) del local B. Construya la
tabla de distribución de frecuencias usando la regla de Sturges.

Local B
58,7 99,3 118,1 173,3 177,5 205,3 206,2 206,3 222,9 224,4
242,9 245,7 260,9 262,0 265,9 272,9 273,2 274,0 275,9 295,0
299,8 319,7 319,9 324,5 328,1 330,0 332,3 338,9 342,1 364,1
372,3 373,0 381,3 393,8 394,5 419,2 432,4 435,0 436,1 441,6
454,1 459,7 463,3 501,2 503,3 505,7 518,8 522,2 544,8 602,7

e. Elabore el gráfico comparativo de la ojiva para los sueldos de los locales A y B.

8. A continuación, se presenta la información del número de veces que una muestra de clientes
elegidos al azar del banco América presentaron solicitudes de préstamo, así como el destino de
dichos préstamos: V (vivienda), N (negocio), E (estudio) y D (viaje).

Número de solicitudes de préstamo

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2
2 2 2 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4

Destino del préstamo


V V E E E E E E D D D D D V V V D E E E V V V V N
N N N E E D D D E E D N N N V V V V V E E E E E D

a. Presente la tabla de distribución de frecuencias que resuma la información de la variable


cuantitativa. Interprete f3.
b. Represente gráficamente la variable cuantitativa. Presente su conclusión.
c. Presente la tabla de distribución de frecuencias que resuma la información de la variable
cualitativa. Interprete f2.
d. Represente gráficamente la variable cualitativa. Presente su conclusión.
84 Estadística Básica con Aplicaciones en Excel 2010

9. A un grupo de personas tomadas al azar entre aquellas que ayer ingresaron a una tienda de
automóviles, se les preguntó sobre el color de carro que pensaban comprar. Los resultados ob-
tenidos fueron:
Blanco Azul Verde Verde Verde Negro Rojo Negro Rojo Verde
Negro Rojo Rojo Azul Azul Azul Rojo Verde Negro Azul
Azul Blanco Verde Blanco Blanco Rojo Blanco Rojo Azul Verde
Negro Rojo Negro Rojo Rojo Verde Negro Negro Blanco Blanco
Blanco Blanco Negro Negro Azul Negro Azul Blanco Verde Blanco

a. Realice un gráfico circular


b. Realice un gráfico de barras de frecuencia absoluta
c. Con los gráficos obtenidos ¿Qué puede observar acerca del color de auto?

10. La gerente de la tienda de ropa Fashion Woman desea elaborar un gráfico que le permita iden-
tificar claramente las principales quejas de sus clientas. Además, desea mostrar en el mismo
gráfico, las frecuencias acumuladas de las principales quejas. En el presente mes, la gerente
realizó entre algunas de sus clientas una encuesta obteniendo los siguientes resultados:

Queja Número de clientas


Los precios son muy caros 10
La atención de las vendedoras no es cordial 30
Los diseños no son muy de moda 37
El horario de atención es muy restringido 5
Otras razones 18

¿A qué conclusión llegará el gerente con el gráfico obtenido?

11. Se tiene información de una muestra de 805 hogares según nivel socioeconómico y área de
residencia. Los resultados se presentan a continuación:

Área de residencia
Nivel socioeconómico Total
Área urbana Área rural
NSE A 15 2 17
NSE B 48 3 51
NSE C 105 145 250
NSE D 94 175 269
NSE E 38 180 218
Total 300 505 805

a. ¿Cuál sería el título apropiado para la tabla anterior?


b. De la tabla anterior:
 Calcule el número de hogares que pertenecen al NSE B o C.
 Calcule el número de hogares que pertenecen al NSE B y son del área urbana.
 Del total de hogares del área rural, calcule el porcentaje que son del NSE A.
 Del total de hogares del NSE C, calcule el porcentaje que son del área urbana.
c. Elabore una gráfica de barras apiladas al 100%. Interprete.
Capítulo 1. Organización de datos 85

12. La siguiente tabla muestra el total de productos con quiebre de stock por sección y por motivo
del quiebre en el supermercado El Regalón.

Artículo Problema Problema stock Quiebre


Sección Total
descontinuado comercial teórico logístico
Bebidas 2 12 16 88 118
Comestibles 4 25 56 220 305
Cuidado personal 2 14 15 84 115
Total 8 51 87 392 538

Construya un gráfico de barras apiladas al 100% por motivo del quiebre según sección.
Capítulo 2. Resúmenes de datos 87

Capítulo 2. Resúmenes de datos

Medidas de tendencia central


Son aquellas medidas que localizan el centro de una distribución, indicando el valor alrededor del
cual tienden a concentrarse o distribuirse las demás observaciones. El objetivo es conseguir un va-
lor que sea representativo del conjunto total de datos que se está analizando.

Medidas de tendencia central

Media Mediana Moda

Media aritmética
La media aritmética (media o promedio) de un conjunto de valores de una variable es la suma de
dichos valores dividida entre el número de valores. Se denota por x , M(X)
n

x i
Para su cálculo se usará la siguiente expresión x  i 1
n

El ingreso promedio mensual en Lima aumentó un 3,9%


Noviembre del 2012

El mayor crecimiento, de 7,2%, se observó entre la población con educación técnica.


El INEI informó que durante el tercer trimestre móvil (agosto-octubre) del 2012 el ingreso promedio
mensual en Lima Metropolitana fue de S/.1 311,8; registrando un incremento de 3,9%(S/.49,3 nue-
vos soles) en relación al año anterior.
El salario mensual de los hombres llegó a S/.1 536 y el de las mujeres, a S/. 1016,9; lo que represen-
tó un aumento de 4,3% y 3,5%, respectivamente.
Fuente: http:// www.gestion.pe/

Media aritmética en Excel


Con Excel 2010, use la función =PROMEDIO(datos)
88 Estadística Básica con Aplicaciones en Excel 2010

Ejemplo 19

Los siguientes datos corresponden al número de visitas al mes que una muestra de 30 estudiantes
realizó a la cafetería de la universidad.

4 2 4 2 1 3 3 1 3 3 4 1 1 4 1
5 5 5 3 1 3 1 4 1 1 2 4 1 4 1

Calcule e interprete la media de la variable en estudio.

Solución
Con Excel 2010, use la función =PROMEDIO(datos)
El promedio de los ingresos mensuales de una muestra de 2,6 visitas al mes.
Esto significa que en promedio los estudiantes visitan la cafetería de la universidad 2,6 veces al
mes.
Ejercicio 27
Los siguientes datos corresponden a la estatura, en metros, de una muestra aleatoria de hombres
peruanos de 18 años. Calcule e interprete la media de la estatura de la muestra.

1,73 1,73 1,84 1,71 1,61 1,50 1,78 1,50 1,90 1,81 1,72 1,84 1,75 1,69 1,63
1,51 1,77 1,81 1,77 1,80 1,68 1,56 1,71 1,78 1,49 1,57 1,71 1,82 1,66 1,69

Calcule e interprete el promedio de la variable en estudio

Solución
Con Excel 2010, use la función =PROMEDIO(datos)
El promedio de la estatura de una muestra de hombres peruanos de 18 años es ………………………..….

Esto significa que………………………………………………………………………………………………………………….……………

Propiedades de la media aritmética

• La media aritmética de una cantidad constante es la misma constante.


M(k) = k
• La media de una variable a la que se le suma o resta una constante equivale a la media de la
variable más o menos dicha constante.
M(X  k) = M(X)  k
• La media de una variable multiplicada por una constante equivale a la media de la variable mul-
tiplicada por dicha constante.
M(kX) = kM(X)
• En general, para dos constantes a y b tenemos.
M(aX  b) = aM(X)  b
Capítulo 2. Resúmenes de datos 89

Ejemplo 20

Se sabe que los ingresos mensuales que perciben los trabajadores de una empresa tienen un pro-
medio de 2800 nuevos soles, determine el nuevo ingreso promedio que se obtendría luego de reali-
zar los siguientes aumentos:

a. los ingresos de los trabajadores se incrementan en 250 nuevos soles.

b. los ingresos se incrementan en un 7,5%.

c. los ingresos se incrementan en un 12,5% más una bonificación de 125 nuevos soles.

Solución

Definamos las variables: X := antiguo ingreso de un trabajador y Y = nuevo ingreso de un trabajador

a. Y = X + 250, entonces M(Y) = M(X) + 250 = 2800 + 250 = 3 050 nuevos soles.

b. Y = X + 0,075X = 1,075X, entonces M(Y) = M(1,075X) = (1,075)(2 800) = 3 010 nuevos soles.

c. Y = X + 0,125X + 125 = 1,125X + 125. Entonces, M(Y) = (1,125)(2 800) + 125 = 3 275 nuevos soles.
90 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 28
En una negociación por aumento de salarios, la gerencia de una empresa ofrece a sus empleados
dos alternativas. La primera consiste en un aumento general del 5%, mientras que, la segunda con-
siste en un aumento general del 2% más un bono de 150 nuevos soles. Indique la alternativa que da
a los empleados el mayor promedio de sueldos, si la media de los sueldos es actualmente de 1 800
nuevos soles.

Solución

Alternativa 1

Alternativa 2

Mejor alternativa
Capítulo 2. Resúmenes de datos 91

Ejercicio 29
La siguiente base de datos muestra las respuestas obtenidas de una encuesta realizada a una mues-
tra de 40 empleados de una empresa de servicios.

Edad Categoría Tiempo de servicio Número Estado Ingreso mensual


ID Género
(años) laboral (meses) de hijos Civil (en soles)
1 Masculino 35 Técnico/ventas 94 1 Divorciado 4658
2 Masculino 74 Gerencial 274 2 Casado 5678
3 Femenino 36 Profesional 99 0 Divorciado 4818
4 Masculino 42 Obrero 109 1 Conviviente 2550
5 Masculino 46 Producción 127 1 Casado 3220
6 Femenino 54 Obrero 142 1 Casado 2918
7 Femenino 45 Servicios 124 1 Divorciado 2855
8 Masculino 38 Obrero 94 1 Casado 2500
9 Femenino 25 Servicios 62 2 Divorciado 1405
10 Femenino 29 Producción 61 3 Divorciado 2699
11 Masculino 49 Apoyo/adm. 132 3 Divorciado 3053
12 Masculino 48 Gerencial 132 1 Casado 5711
13 Masculino 41 Obrero 108 1 Casado 4957
14 Masculino 59 Gerencial 160 0 Divorciado 5784
15 Masculino 63 Gerencial 200 3 Casado 6316
16 Masculino 73 Profesional 200 2 Divorciado 4670
17 Masculino 35 Gerencial 94 1 Casado 5940
18 Masculino 43 Obrero 120 4 Casado 4860
19 Masculino 43 Gerencial 121 4 Casado 5315
20 Masculino 72 Obrero 280 2 Conviviente 5071
21 Masculino 45 Gerencial 124 3 Divorciado 5612
22 Masculino 35 Técnico/ventas 94 3 Casado 4956
23 Masculino 74 Obrero 192 4 Casado 4831
24 Masculino 57 Gerencial 146 3 Casado 6512
25 Masculino 72 Obrero 186 4 Divorciado 4892
26 Masculino 42 Gerencial 112 1 Casado 5599
27 Masculino 48 Gerencial 132 1 Conviviente 4978
28 Masculino 42 Obrero 111 2 Divorciado 4602
29 Masculino 36 Gerencial 100 1 Conviviente 5678
30 Masculino 57 Gerencial 145 1 Casado 5475
31 Masculino 59 Profesional 150 1 Casado 4313
32 Masculino 59 Profesional 160 3 Casado 4818
33 Masculino 63 Obrero 200 2 Divorciado 4892
34 Masculino 38 Profesional 99 1 Conviviente 4978
35 Masculino 42 Gerencial 112 4 Divorciado 6036
36 Femenino 65 Producción 171 2 Conviviente 4032
37 Masculino 52 Producción 139 4 Divorciado 3904
38 Masculino 42 Gerencial 112 1 Conviviente 5599
39 Masculino 72 Profesional 186 2 Divorciado 4670
40 Masculino 69 Profesional 182 2 Divorciado 3482

En una negociación por aumento de salarios, la gerencia de la empresa ofrece a sus empleados dos
alternativas. La primera consiste en un aumento general del 6%, mientras que, la segunda consiste
en un aumento general del 3% más un bono de 120 nuevos soles por concepto de refrigerio. Indi-
que la alternativa que da a los empleados el mayor promedio de sueldos.
92 Estadística Básica con Aplicaciones en Excel 2010

Solución

Alternativa 1

Alternativa 2

Mejor alternativa
Capítulo 2. Resúmenes de datos 93

Mediana
La mediana de un conjunto de datos observados de una variable es el valor que ocupa la posición
central una vez puestos los datos en orden de magnitud. La mediana es el valor tal que aproxima-
damente el 50% de las observaciones son menores o iguales a su valor.

Características de la mediana

 Se puede calcular para variables medidas en escala de ordinal, intervalo o razón.


 La mediana es un estadístico robusto, es decir, no se ve afectada por valores extremos. Por eso
se le utiliza cuando hay datos inusuales o la distribución de frecuencias no es simétrica.

Mediana en Excel
Con Excel 2010, use la función =MEDIANA(datos)

Ejemplo 21

Los siguientes datos corresponden al número de visitas que realizó el presente mes una muestra
de30 estudiantes a la cafetería de la universidad.

4 2 4 2 1 3 3 1 3 3
5 5 5 3 1 3 1 4 1 1
4 1 1 4 1 2 4 1 4 1

Calcule e interprete la mediana de la variable en estudio.

Solución

Con Excel 2010, use la función =MEDIANA(datos)

La mediana del número de visitas es igual a tres veces al mes, esto significa que el 50% de los estu-
diantes visitaron la cafetería de la universidad como máximo tres veces al mes.
94 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 30
A continuación, se presenta la información de una muestra aleatoria de 15 profesionales egresados
de la carrera de Administración.

Número Género Edad Estatura Número Género Edad Estatura


1 Hombre 15 154 9 Hombre 22 168
2 Hombre 19 154 10 Mujer 31 161
3 Hombre 21 156 11 Mujer 31 171
4 Hombre 34 184 12 Mujer 28 175
5 Hombre 21 173 13 Mujer 31 187
6 Hombre 24 170 14 Mujer 28 161
7 Hombre 30 176 15 Mujer 24 172
8 Hombre 26 188

Calcule e interprete el valor de la mediana de la edad para el grupo de hombres y para el grupo de
mujeres.

Solución

Con Excel 2010, use la función =MEDIANA(datos)

La mediana de la edad para el grupo de hombres es igual a 22 años, esto significa que el 50% de los
hombres tiene una edad igual o menor a 22 años

La mediana de la edad para el grupo de mujeres es igual a ……………………………….. años, esto significa
que….………………………………………………………………………………………………………………………………………….……..

Ejercicio 31
La siguiente base de datos muestra las respuestas obtenidas de una encuesta realizada a una mues-
tra de 40 empleados de una empresa de servicios.

Edad Categoría Tiempo de servicio Número Estado Ingreso mensual


ID Género
(años) laboral (meses) de hijos Civil (en soles)
1 Masculino 35 Técnico/ventas 94 1 Divorciado 4658
2 Masculino 74 Gerencial 274 2 Casado 5678
3 Femenino 36 Profesional 99 0 Divorciado 4818
4 Masculino 42 Obrero 109 1 Conviviente 2550
5 Masculino 46 Producción 127 1 Casado 3220
6 Femenino 54 Obrero 142 1 Casado 2918
7 Femenino 45 Servicios 124 1 Divorciado 2855
8 Masculino 38 Obrero 94 1 Casado 2500
9 Femenino 25 Servicios 62 2 Divorciado 1405
10 Femenino 29 Producción 61 3 Divorciado 2699
11 Masculino 49 Apoyo/adm. 132 3 Divorciado 3053
12 Masculino 48 Gerencial 132 1 Casado 5711
13 Masculino 41 Obrero 108 1 Casado 4957
14 Masculino 59 Gerencial 160 0 Divorciado 5784
15 Masculino 63 Gerencial 200 3 Casado 6316
16 Masculino 73 Profesional 200 2 Divorciado 4670
Capítulo 2. Resúmenes de datos 95

17 Masculino 35 Gerencial 94 1 Casado 5940


18 Masculino 43 Obrero 120 4 Casado 4860
19 Masculino 43 Gerencial 121 4 Casado 5315
20 Masculino 72 Obrero 280 2 Conviviente 5071
21 Masculino 45 Gerencial 124 3 Divorciado 5612
22 Masculino 35 Técnico/ventas 94 3 Casado 4956
23 Masculino 74 Obrero 192 4 Casado 4831
24 Masculino 57 Gerencial 146 3 Casado 6512
25 Masculino 72 Obrero 186 4 Divorciado 4892
26 Masculino 42 Gerencial 112 1 Casado 5599
27 Masculino 48 Gerencial 132 1 Conviviente 4978
28 Masculino 42 Obrero 111 2 Divorciado 4602
29 Masculino 36 Gerencial 100 1 Conviviente 5678
30 Masculino 57 Gerencial 145 1 Casado 5475
31 Masculino 59 Profesional 150 1 Casado 4313
32 Masculino 59 Profesional 160 3 Casado 4818
33 Masculino 63 Obrero 200 2 Divorciado 4892
34 Masculino 38 Profesional 99 1 Conviviente 4978
35 Masculino 42 Gerencial 112 4 Divorciado 6036
36 Femenino 65 Producción 171 2 Conviviente 4032
37 Masculino 52 Producción 139 4 Divorciado 3904
38 Masculino 42 Gerencial 112 1 Conviviente 5599
39 Masculino 72 Profesional 186 2 Divorciado 4670
40 Masculino 69 Profesional 182 2 Divorciado 3482

Calcule e interprete el valor de la mediana del tiempo de servicio para el grupo de hombres y para
el grupo de mujeres.

Solución

 Ubique el cursor en cualquier celda de la primera fila de la base de datos.


 Del menú principal elija la opción Inicio/Ordenar y filtrar
 Haga clic en el menú despegable de la variable Género, desactive la opción Seleccionar todo y
active la opción Femenino.
 Una vez obtenido el filtro seleccione el Rango de celdas de la variable Tiempo de servicio. Copie
y pegue el filtro en una hoja nueva o por debajo de la base de datos pero nunca al costado.
 Con Excel 2010, use la función =MEDIANA(datos)
 Repita el mismo procedimiento para el caso del grupo Masculino.

Entonces el resultado será:

La mediana del tiempo de servicio para el grupo de hombres es igual a ………………………… meses,
esto significa que el 50% de ………………………………………………………………………………………………………………
………………………………………………………………………………………………………………………………………………………….
La mediana del tiempo de servicio para el grupo de mujeres es igual a ………………………… meses, esto
significa que ………………………………………………………………………………………………………………………………………
96 Estadística Básica con Aplicaciones en Excel 2010

Moda
La moda de un conjunto de datos observados de una variable es el valor que se presenta con mayor
frecuencia.

Características de la moda

 La moda se puede calcular para cualquier escala de medición.


 El valor de la moda no se ve afectada por valores extremos.
 La moda no siempre es un valor único. Una serie de datos puede tener dos modas (bimodal) o
más de dos modas (multimodal). Algunas series de datos no tienen moda.
 Un conjunto de datos pudiera incluso no tener moda.
 La moda es una medida menos importante que la mediana o la media debido a su ambigüe-
dad.

Moda en Excel

En Excel 2010, existen dos funciones para calcular la moda .

 use la función =MODA.UNO(datos) solo si los datos tuvieran una moda.

 use la función =MODA.VARIOS(datos) si los datos tuvieran más de una moda. Recomendamos
usar esta función pues de antemano no sabemos si el conjunto de datos con los cuales esta-
mos trabajando tienen más de una moda.

Ejemplo 22

Los siguientes datos corresponden al número de visitas que realizó el presente mes una muestra de
30 estudiantes a la cafetería de la universidad.

4 2 4 2 1 3 3 1
5 5 5 3 1 3 1 4
4 1 1 4 1 2 4 1
3 1 1 3 1 4

Calcule e interprete la moda de la variable en estudio.

Solución

En este caso, el resultado es igual a una vez al mes. Esto significa que los estudiantes visitan con
mayor frecuencia la cafetería de la universidad una vez al mes.
Capítulo 2. Resúmenes de datos 97

Ejercicio 32
A continuación, se presenta la información de una muestra aleatoria de 15 profesionales egresados
de la carrera de Administración.

Estatura Estatura
Número Género Edad Número Género Edad
(en cm) (en cm)
1 Hombre 15 154 9 Hombre 22 168
2 Hombre 19 154 10 Mujer 31 161
3 Hombre 21 156 11 Mujer 31 171
4 Hombre 34 184 12 Mujer 28 175
5 Hombre 21 173 13 Mujer 31 187
6 Hombre 24 170 14 Mujer 28 161
7 Hombre 30 176 15 Mujer 24 172
8 Hombre 26 188

Calcule e interprete la moda de la estatura.

Solución
 Primero, seleccione un rango de celdas donde aparecerá la moda o las modas.
 A continuación, use la función =MODA.VARIOS(datos)
 Finalmente, presione las teclas Ctrl, Shift y Enter

En este caso, el resultado son dos modas, la primera moda es igual a ………………….. cm. y la segunda
moda es igual a ………………………….. cm. Esto significa que .………………………………………………………………..
…………………………………………………………………………………………………………………………………………………………..

Ejercicio 33
La siguiente base de datos muestra las respuestas obtenidas de una encuesta realizada a una mues-
tra de 40 empleados de una empresa de servicios.

Edad Categoría Tiempo de servicio Número Estado Ingreso mensual


ID Género
(años) laboral (meses) de hijos Civil (en soles)
1 Masculino 35 Técnico/ventas 94 1 Divorciado 4658
2 Masculino 74 Gerencial 274 2 Casado 5678
3 Femenino 36 Profesional 99 0 Divorciado 4818
4 Masculino 42 Obrero 109 1 Conviviente 2550
5 Masculino 46 Producción 127 1 Casado 3220
6 Femenino 54 Obrero 142 1 Casado 2918
7 Femenino 45 Servicios 124 1 Divorciado 2855
8 Masculino 38 Obrero 94 1 Casado 2500
9 Femenino 25 Servicios 62 2 Divorciado 1405
10 Femenino 29 Producción 61 3 Divorciado 2699
11 Masculino 49 Apoyo/adm. 132 3 Divorciado 3053
12 Masculino 48 Gerencial 132 1 Casado 5711
13 Masculino 41 Obrero 108 1 Casado 4957
14 Masculino 59 Gerencial 160 0 Divorciado 5784
15 Masculino 63 Gerencial 200 3 Casado 6316
16 Masculino 73 Profesional 200 2 Divorciado 4670
17 Masculino 35 Gerencial 94 1 Casado 5940
18 Masculino 43 Obrero 120 4 Casado 4860
98 Estadística Básica con Aplicaciones en Excel 2010

19 Masculino 43 Gerencial 121 4 Casado 5315


20 Masculino 72 Obrero 280 2 Conviviente 5071
21 Masculino 45 Gerencial 124 3 Divorciado 5612
22 Masculino 35 Técnico/ventas 94 3 Casado 4956
23 Masculino 74 Obrero 192 4 Casado 4831
24 Masculino 57 Gerencial 146 3 Casado 6512
25 Masculino 72 Obrero 186 4 Divorciado 4892
26 Masculino 42 Gerencial 112 1 Casado 5599
27 Masculino 48 Gerencial 132 1 Conviviente 4978
28 Masculino 42 Obrero 111 2 Divorciado 4602
29 Masculino 36 Gerencial 100 1 Conviviente 5678
30 Masculino 57 Gerencial 145 1 Casado 5475
31 Masculino 59 Profesional 150 1 Casado 4313
32 Masculino 59 Profesional 160 3 Casado 4818
33 Masculino 63 Obrero 200 2 Divorciado 4892
34 Masculino 38 Profesional 99 1 Conviviente 4978
35 Masculino 42 Gerencial 112 4 Divorciado 6036
36 Femenino 65 Producción 171 2 Conviviente 4032
37 Masculino 52 Producción 139 4 Divorciado 3904
38 Masculino 42 Gerencial 112 1 Conviviente 5599
39 Masculino 72 Profesional 186 2 Divorciado 4670
40 Masculino 69 Profesional 182 2 Divorciado 3482

Calcule e interprete el valor de la moda del número de hijos para el grupo de hombres y para el
grupo de mujeres.

Solución

 Ubique el cursor en cualquier celda de la primera fila de la base de datos.


 Del menú principal elija la opción Inicio/Ordenar y filtrar
 Haga clic en el menú despegable de la variable Género, desactive la opción Seleccionar todo y
active la opción Femenino.
 Una vez obtenido el filtro seleccione el Rango de celdas de la variable Número de hijos. Copie y
pegue el filtro en una hoja nueva o por debajo de la base de datos pero nunca al costado.
 Con Excel 2010, use la función =MODA.VARIOS(datos)
 Repita el mismo procedimiento para el caso del grupo Masculino.

Entonces el resultado será:

La moda del número de hijos para el grupo de hombres es igual a ………………………… hijos, esto signi-
fica que ……………………………..………………………………………………………………………………………………………………
………………………………………………………………………………………………………………………………………………………….
La moda del número de hijos para el grupo de mujeres es igual a ………………………… hijos, esto signi-
fica que ……………………………..………………………………………………………………………………………………………………
………………………………………………………………………………………………………………………………………………………….
Capítulo 2. Resúmenes de datos 99

Ejercicio 34
La siguiente base de datos muestra las respuestas obtenidas de una encuesta realizada a una mues-
tra de 40 empleados de una empresa de servicios.

Edad Categoría Tiempo de servicio Número Estado Ingreso mensual


ID Género
(años) laboral (meses) de hijos Civil (en soles)
1 Masculino 35 Técnico/ventas 94 1 Divorciado 4658
2 Masculino 74 Gerencial 274 2 Casado 5678
3 Femenino 36 Profesional 99 0 Divorciado 4818
4 Masculino 42 Obrero 109 1 Conviviente 2550
5 Masculino 46 Producción 127 1 Casado 3220
6 Femenino 54 Obrero 142 1 Casado 2918
7 Femenino 45 Servicios 124 1 Divorciado 2855
8 Masculino 38 Obrero 94 1 Casado 2500
9 Femenino 25 Servicios 62 2 Divorciado 1405
10 Femenino 29 Producción 61 3 Divorciado 2699
11 Masculino 49 Apoyo/adm. 132 3 Divorciado 3053
12 Masculino 48 Gerencial 132 1 Casado 5711
13 Masculino 41 Obrero 108 1 Casado 4957
14 Masculino 59 Gerencial 160 0 Divorciado 5784
15 Masculino 63 Gerencial 200 3 Casado 6316
16 Masculino 73 Profesional 200 2 Divorciado 4670
17 Masculino 35 Gerencial 94 1 Casado 5940
18 Masculino 43 Obrero 120 4 Casado 4860
19 Masculino 43 Gerencial 121 4 Casado 5315
20 Masculino 72 Obrero 280 2 Conviviente 5071
21 Masculino 45 Gerencial 124 3 Divorciado 5612
22 Masculino 35 Técnico/ventas 94 3 Casado 4956
23 Masculino 74 Obrero 192 4 Casado 4831
24 Masculino 57 Gerencial 146 3 Casado 6512
25 Masculino 72 Obrero 186 4 Divorciado 4892
26 Masculino 42 Gerencial 112 1 Casado 5599
27 Masculino 48 Gerencial 132 1 Conviviente 4978
28 Masculino 42 Obrero 111 2 Divorciado 4602
29 Masculino 36 Gerencial 100 1 Conviviente 5678
30 Masculino 57 Gerencial 145 1 Casado 5475
31 Masculino 59 Profesional 150 1 Casado 4313
32 Masculino 59 Profesional 160 3 Casado 4818
33 Masculino 63 Obrero 200 2 Divorciado 4892
34 Masculino 38 Profesional 99 1 Conviviente 4978
35 Masculino 42 Gerencial 112 4 Divorciado 6036
36 Femenino 65 Producción 171 2 Conviviente 4032
37 Masculino 52 Producción 139 4 Divorciado 3904
38 Masculino 42 Gerencial 112 1 Conviviente 5599
39 Masculino 72 Profesional 186 2 Divorciado 4670
40 Masculino 69 Profesional 182 2 Divorciado 3482

Calcule e interprete el valor de las medidas de tendencia central para el tiempo de servicio por ca-
tegoría laboral.
100 Estadística Básica con Aplicaciones en Excel 2010

Solución

 Ubique el cursor en cualquier celda de la primera fila de la base de datos


 Del menú principal elija la opción Inicio/Ordenar y filtrar
 Haga clic en el menú despegable de la variable Estado civil, desactive la opción Seleccionar todo
y active la opción Casado.
 Una vez obtenido el filtro seleccione el Rango de celdas de la variable Tiempo de servicio. Copie
y pegue el filtro en una hoja nueva o por debajo de la base de datos pero nunca al costado.
 A continuación usaremos la opción Análisis de datos para obtener las medidas de tendencia
central:
 En el menú principal elija la opción Datos/Análisis de datos/Estadística descriptiva
 En Rango de entrada seleccione el rango de celdas que contiene los datos de la variable fil-
trada.
 Dé clic a Rótulo en la primera fila dado que nuestros datos tienen en la primera fila el
nombre de la variable.
 Dé clic a Rango de salida y ubique el cursor dentro del recuadro y a continuación dé clic en
una celda en blanco donde Excel le colocará los resultados del análisis.
 Finalmente, dé clic a Resumen de estadísticas y Aceptar
 Realice el mismo procedimiento para las categorías Conviviente y Divorciado.

La salida obtenida:

Tiempo de servicio Tiempo de servicio Tiempo de servicio


Estadísticos (meses) (meses) (meses)
Casado Conviviente Divorciado
Media 141.823529 143.285714 135.75
Error típico 11.166927 24.6766849 11.4802366
Mediana 132 112 128
Moda 94 #N/A 124
Desviación estándar 46.0424197 65.2883713 45.9209466
Varianza de la muestra 2119.90441 4262.57143 2108.73333
Curtosis 3.26127103 3.8372381 1.06145333
Coeficiente de asimetría 1.61260652 1.95880668 0.05949087
Rango 180 181 139
Mínimo 94 99 61
Máximo 274 280 200
Suma 2411 1003 2172
Cuenta 17 7 16

Observaciones

• Con la opción Análisis de datos Excel no puede identificar si los datos tienen más de una moda.
• De existir más de una moda Excel solo le mostrará la primera que encuentre.
• Se recomienda usar la función Moda. Varios vista anteriormente.
• El valor #N/A significa que no existe moda para el conjunto de datos.
Capítulo 2. Resúmenes de datos 101

Casado:

Media: ………….….

Mediana: ……….…

Moda: ……………..

Conviviente:

Media: ………….….

Mediana: ……….…

Moda: ……………..

Divorciado:

Media: ………….….

Mediana: ……….…

Moda: ……………..
102 Estadística Básica con Aplicaciones en Excel 2010

Media ponderada

Se utiliza cuando los datos a promediar es decir, algunos datos tiene mayor
no tienen la misma importancia relativa importancia, peso o ponderación dentro del
dentro del conjunto total, conjunto de observaciones.

Se usará la siguiente expresión para su cálculo:

x w i i
xw  i 1
n

w
i 1
i

donde:
xi : Dato individual.
wi : Peso asignado a cada dato

Ejemplo 23

María y Pedro dedican ocho horas por semana a hacer deporte. Otros ocho estudiantes dedican
cada semana cuatro horas a hacer deporte. María y Pedro dedican, además, una hora cada semana
a escuchar música y los otros ocho estudiantes, tres horas.
a. ¿Cuál es el número medio de horas que hacen deporte cada semana los 10 estudiantes?
b. ¿Cuál es el número medio de horas que escuchan música los 10 estudiantes?
c. ¿Cuál sería el número medio de horas que estos 10 estudiantes dedican, cada semana, entre las
dos actividades: hacer deporte y escuchar música?

Solución

a. ¿Cuál es el número medio de horas que hacen deporte cada semana los 10 estudiantes?

2 8  8  4
xDeporte   4,8 horas
28

b. ¿Cuál es el número medio de horas que escuchan música los 10 estudiantes?

2 1  8  3
xMúsica   2,6 horas
28

c. ¿Cuál sería el número medio de horas que estos 10 estudiantes dedican, cada semana, entre las
dos actividades: hacer deporte y escuchar música?

10 4,8  10 2,6


xDeporte y música   3,7 horas
10  10
Capítulo 2. Resúmenes de datos 103

Ejercicio 35
Las notas de un alumno de cierto curso son:

EC1 EC2 EC3 CL Trabajo EB


12 18 15 14 15 14

Si el peso de las evaluaciones continuas (EC) son 5%, 7% y 8% respectivamente, del control de lec-
tura (CL) 20%, del examen final 35% y del trabajo final 25% ¿cuál es el promedio final del alumno?

Solución
En Excel 2010, construya la siguiente tabla:

Evaluación Nota Peso Nota x Peso


EC1 12
EC2 18
EC3 15
CL 14
Trabajo 15
EB 14

 Multiplique cada nota por su peso.


 Calcule los totales de las columnas Peso y Nota x Peso
 Divida según la fórmula.

x w i i
...........................
xw  i 1
n   ..................
...........................
w
i 1
i

El promedio final del alumno es ………………………


104 Estadística Básica con Aplicaciones en Excel 2010

Medidas de posición o cuantiles

Las medidas de posición o cuantiles son los valores que determinan la posición de un dato respecto
a todos los demás datos de una serie y que previamente ha sido ordenada de menor a mayor.

Los cuantiles más importantes dividen a los datos ordenados de menor a mayor en 4, 10 y 100 can-
tidades iguales de datos, denominándose cuartiles, deciles y percentiles, respectivamente.

Cuantiles

Cuartiles Deciles Percentiles


(en 4) (en 10) (en 100)

Dividen el conjunto de Dividen el conjunto de Dividen el conjunto de


datos en cuatro partes datos en 10 partes datos en 100 partes
porcentualmente iguales porcentualmente iguales. porcentualmente iguales.
El percentil k, Pk. es el valor
Se les denota como Q1, Q2 Se les denota como D1 , D2, numérico tal que
y Q3 respectivamente. D3, …, D9 respectivamente. aproximadamente el k por
ciento de los datos
ordenados está por debajo
Se denomina así a cada Se denomina así a cada de ese valor y el (100 – k)
uno de los tres percentiles: uno de los nueve por ciento de los datos está
P25, P50, P75. percentiles: P10, P20, ..., P90. por encima de ese valor.

Percentil k
Capítulo 2. Resúmenes de datos 105

Percentil en Excel

En Excel 2010, hay dos funciones para calcular un percentil:

 Para calcular el percentil k use la función =PERCENTIL.EXC(datos,k/100)


 Para calcular el percentil k use la función =PERCENTIL.INC(datos,k/100)

La diferencia entre las funciones =PERCENTIL.INC y =PERCENTIL.EXC es que, en la primera el valor


de k es está dentro del rango de 0 a 1, ambos inclusive, y en la segunda, el valor de k está dentro
del intervalo 0 a 1 exclusivo.

Ejemplo 24

A continuación se presentan los ingresos mensuales (en nuevos soles) de 12 trabajadores.

2710 2755 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325

a. Calcule el valor del percentil 25


b. Calcule el valor del percentil 85

Solución

a. Calcule el valor del percentil 25

Para calcular el percentil 25 en Excel 2010, use la función =PERCENTIL.EXC(datos,0.25)

El valor del percentil 25 es 2857,50 nuevos soles; esto quiere decir que el 25% de los trabajadores
tienen un ingreso mensual máximo de 2857,50 nuevos soles.

b. Calcule el valor del percentil 85

Para calcular el percentil 85 en Excel 2010, use la función =PERCENTIL.EXC(datos,0.85)

El valor del percentil 85 es 3139,75 nuevos soles; esto quiere decir que el 85% de los trabajadores
tienen un ingreso mensual máximo de 3139,75 nuevos soles.
106 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 36
En muchos procesos de manufactura se utiliza el término “Trabajo en proceso” (TEM). En un taller
que procesa libros, el TEM representa el tiempo que transcurre para que se doblen, junten, cosan,
peguen por un extremo y encuadernen las hojas procedentes de la prensa. El tiempo de procesa-
miento (TDP), se define de forma operacional como el tiempo, en días, transcurrido desde que las
hojas salen de la prensa hasta que los libros se empacan en cajas. Para una muestra de 80 libros se
ha registrado el TDP en la siguiente tabla:

10,4 11,6 7,1 8,1 10,4 11,7 10,3 8,1 11,6 10,4 11,6 9,7 8,9 7,9 9,8 7,4
6,8 11,1 6,5 5,4 8,0 13,7 12,3 9,6 13,3 10,6 14,1 11,5 9,5 13,6 7,4 8,7
10,2 14,7 10,3 10,0 13,9 9,3 7,4 12,1 8,7 12,6 6,9 10,8 9,6 6,0 10,2 8,0
11,7 7,2 10,9 6,1 13,0 10,8 9,9 10,0 14,3 9,8 9,2 11,5 11,5 10,9 8,5 11,1
9,8 9,0 9,6 9,8 10,8 11,1 10,3 10,1 9,8 12,8 7,4 9,4 8,8 9,6 11,2 9,8

a. Calcule e interprete el percentil 25 de los tiempos de procesamiento (TDP).

Solución

Para calcular el percentil 25 en Excel 2010, use la función =PERCENTIL.EXC(datos,0,25)

El valor del percentil 25 es ……………………., esto quiere decir que ……………..

b. Calcule el tiempo de procesamiento (TDP) mínimo para estar en el 15% de los libros con mayo-
res tiempos de procesamiento (TDP).

Solución
Para cumplir con lo pedido debemos calcular el percentil ………….. cuyo valor es: …………..…

c. Calcule el tiempo de procesamiento (TDP) máximo para estar en el 15% de los libros con meno-
res tiempos de procesamiento (TDP).

Solución

Para cumplir con lo pedido debemos calcular el percentil …………... cuyo valor es: …………..…
Capítulo 2. Resúmenes de datos 107

Ejercicio 37
La siguiente base de datos muestra las respuestas obtenidas de una encuesta realizada a una mues-
tra de 40 empleados de una empresa de servicios.

Edad Categoría Tiempo de servicio Número Estado Ingreso mensual


ID Género
(años) laboral (meses) de hijos Civil (en soles)
1 Masculino 35 Técnico/ventas 94 1 Divorciado 4658
2 Masculino 74 Gerencial 274 2 Casado 5678
3 Femenino 36 Profesional 99 0 Divorciado 4818
4 Masculino 42 Obrero 109 1 Conviviente 2550
5 Masculino 46 Producción 127 1 Casado 3220
6 Femenino 54 Obrero 142 1 Casado 2918
7 Femenino 45 Servicios 124 1 Divorciado 2855
8 Masculino 38 Obrero 94 1 Casado 2500
9 Femenino 25 Servicios 62 2 Divorciado 1405
10 Femenino 29 Producción 61 3 Divorciado 2699
11 Masculino 49 Apoyo/adm. 132 3 Divorciado 3053
12 Masculino 48 Gerencial 132 1 Casado 5711
13 Masculino 41 Obrero 108 1 Casado 4957
14 Masculino 59 Gerencial 160 0 Divorciado 5784
15 Masculino 63 Gerencial 200 3 Casado 6316
16 Masculino 73 Profesional 200 2 Divorciado 4670
17 Masculino 35 Gerencial 94 1 Casado 5940
18 Masculino 43 Obrero 120 4 Casado 4860
19 Masculino 43 Gerencial 121 4 Casado 5315
20 Masculino 72 Obrero 280 2 Conviviente 5071
21 Masculino 45 Gerencial 124 3 Divorciado 5612
22 Masculino 35 Técnico/ventas 94 3 Casado 4956
23 Masculino 74 Obrero 192 4 Casado 4831
24 Masculino 57 Gerencial 146 3 Casado 6512
25 Masculino 72 Obrero 186 4 Divorciado 4892
26 Masculino 42 Gerencial 112 1 Casado 5599
27 Masculino 48 Gerencial 132 1 Conviviente 4978
28 Masculino 42 Obrero 111 2 Divorciado 4602
29 Masculino 36 Gerencial 100 1 Conviviente 5678
30 Masculino 57 Gerencial 145 1 Casado 5475
31 Masculino 59 Profesional 150 1 Casado 4313
32 Masculino 59 Profesional 160 3 Casado 4818
33 Masculino 63 Obrero 200 2 Divorciado 4892
34 Masculino 38 Profesional 99 1 Conviviente 4978
35 Masculino 42 Gerencial 112 4 Divorciado 6036
36 Femenino 65 Producción 171 2 Conviviente 4032
37 Masculino 52 Producción 139 4 Divorciado 3904
38 Masculino 42 Gerencial 112 1 Conviviente 5599
39 Masculino 72 Profesional 186 2 Divorciado 4670
40 Masculino 69 Profesional 182 2 Divorciado 3482

a. Calcule e interprete el valor de los percentiles P25 y P60 para el ingreso mensual por género.

b. Calcule e interprete el valor de los percentiles P20 y P90 para el tiempo de servicio por género.
108 Estadística Básica con Aplicaciones en Excel 2010

Solución

a. Calcule e interprete el valor de los percentiles P25 y P60 para el ingreso mensual por género.

Ingreso mensual del grupo de hombres:

P25 : ………….….

P60 : ……………..

Ingreso mensual del grupo de mujeres:

P25 : ………….….

P60 : ……………..

b. Calcule e interprete el valor de los percentiles P20 y P90 para el tiempo de servicio por género.

Tiempo de servicio para el grupo de hombres:

P20 : ………….….

P90 : ……………..

Tiempo de servicio para el grupo de mujeres:

P20 : ………….….

P90 : ……………..
Capítulo 2. Resúmenes de datos 109

Ejercicios de aplicación

1. Una compañía vende cuatro tipos de vallas a los propietarios de locales. La instalación de la
valla del tipo A le cuesta a la compañía 20 nuevos soles por metro lineal, la tipo B le cuesta 12
nuevos soles por metro lineal, la tipo C le cuesta 8 nuevos soles por metro lineal y la tipo D le
cuesta 6,5 nuevos soles por metro lineal. Ayer la compañía instaló 100 metros de A, 150 metros
de B, 75 metros de C y 200 metros de D. ¿cuál fue el costo medio del metro de valla instalado
ayer?

2. Una empresa de consultorías se especializa en leyes empresariales. Cobran 275 dólares la hora
de investigación de un caso, 180 dólares la hora de asesoría, y 200 dólares la hora de redacción
de un expediente. La semana pasada uno de los consultores dedicó 12 horas a la investigación
del caso, 10 horas de asesoría a un cliente, y 16 horas a la redacción del expediente. ¿Cuál fue
el monto promedio de honorarios de este consultor por hora?

3. En la actualidad todos los vehículos que circulan en Lima Metropolitana deben pasar las revi-
siones técnicas con el fin de reducir el nivel de contaminación en la ciudad. Inicialmente la em-
presa encargada de dichas revisiones contaba con dos plantas (Cono Norte y Cono Sur) y era de
interés investigar si se necesitaba abrir más plantas analizando el tiempo de atención por
vehículo. Los tiempos (en minutos) que se demoraron en ser atendidos una muestra aleatoria
de vehículos particulares que asistieron a cada una de las plantas se presenta a continuación:

Cono Norte Cono Sur


Número de Número de Número de Número de
Tiempo Tiempo Tiempo Tiempo
vehículo vehículo vehículo vehículo
1 9,0 12 13,1 1 10,2 12 11,8
2 11,9 13 13,2 2 10,2 13 11,8
3 12,6 14 13,5 3 10,3 14 12,2
4 12,6 15 13,5 4 10,8 15 12,2
5 12,6 16 13,7 5 10,8 16 12,3
6 12,8 17 13,8 6 10,9 17 13,3
7 12,8 18 13,8 7 10,9 18 13,3
8 12,8 19 14,1 8 10,9 19 13,4
9 12,9 20 14,1 9 11,2 20 13,4
10 12,9 21 14,3 10 11,6 21 13,4
11 13,1 22 15,1 11 11,8 22 21,3

a. ¿En cuál de las plantas el tiempo promedio de atención es mayor?


b. ¿En cuál de las plantas se tiene una mayor mediana? Interprete.
c. ¿Cuál es el tiempo de atención más frecuente en ambas plantas? Interprete.
d. ¿Cuál de be ser el tiempo de atención mínimo en la planta del cono norte para pertenecer
al 25% de los clientes que esperan más?
e. ¿Cuál debe ser el tiempo de atención máximo en la planta del cono sur para pertenecer al
52% de los clientes que esperan menos?

4. Un agente de compras puso a prueba una muestra de 20 baterías de calculadoras de bolsillo de


un cierto fabricante. Cada batería se probó en una calculadora que estaba programada para lle-
var a cabo un ciclo de cálculos ordinarios. El tiempo de vida, en horas, de cada batería se mues-
tra a continuación:
110 Estadística Básica con Aplicaciones en Excel 2010

11,98 11,99 12,02 12,03 12,04 12,05 12,06 12,08 12,08 12,08
12,09 12,09 12,14 12,18 12,19 12,20 12,21 12,21 12,23 12,25

Si el agente de compras quiere encontrar un tiempo máximo para el 18% de las baterías que du-
ran menos y un tiempo mínimo para el 23% de los que duran más, ¿cuál serían esos tiempos de
vida? Justifique numéricamente su respuesta.

5. Los gastos semanales en transporte urbano (nuevos soles) que efectúan los habitantes de las
ciudades en Vista Grande y Pueblo Hermoso han sido estudiados mediante muestras aleatorias
independientes. Los datos captados fueron:

Gastos semanales en movilidad en Gastos semanales en movilidad en


Vista Grande Pueblo Hermoso
22,0 22,0 22,1 23,2 23,2 23,2 23,6 23,6 18,1 18,5 18,7 19,9 20,4 20,5 21,1
24,0 24,1 24,1 24,2 24,2 24,5 24,7 25,5 21,3 21,3 21,5 22,0 22,0 22,2 22,4

a. Estime e interprete las siguientes medidas de tendencia central: media, mediana y moda
para los gastos semanales en movilidad en la ciudad de Vista Grande.
b. Calcule e interprete Q3, P10 y P36 para los gastos semanales en movilidad en la ciudad de
Pueblo Hermoso.

6. Un fabricante desea adquirir una máquina empaquetadora para el llenado de bolsas de apro-
ximadamente 150 gramos. Se realizan 20 ensayos con la máquina obteniéndose los siguientes
pesos, en gramos:

143 145 146 148 149 150 150 150 150 150
150 150 150 150 150 151 152 154 155 155

a. Calcule e interprete la media, mediana y moda del peso de las bolsas empaquetadas por la
máquina.
b. Si el equipo de medición que se empleó para medir los pesos de las bolsas producidas por
la máquina estaba descalibrado y los verdaderos pesos serían 10% menores a los medidos
y, además, con una constante de menos dos gramos, ¿cuál es el peso promedio verdadero
de bolsas de la máquina?
Capítulo 2. Resúmenes de datos 111

Medidas de dispersión

Con las medidas de tendencia central Las medidas de variabilidad indican


es posible determinar el valor central cuán alejados están los valores de una
de una distribución, pero no indican variable del valor que los representa y
qué tan cercanos o lejanos están los por lo tanto permiten evaluar la
datos de dicho valor central. confiabilidad de ese valor central.

Cuando la medida de dispersión tiene un valor pequeño, los datos están


concentrados alrededor de la medida de tendencia central,
en cambio si la medida de dispersión tiene un valor grande, los datos no están
concentrados alrededor de la medida de tendencia central.

Algunas medidas de dispersión

Rango Desviación Coeficiente


Rango Varianza
intercuartil estándar de variación

Rango

El rango (amplitud o recorrido) de un conjunto de datos observados es la diferencia entre el dato


mayor y el dato menor.
R = Xmax - Xmin

Características del rango


 Se puede calcular en variables medidas en escala de intervalo o razón
 Se ve muy afectado por valores extremos.
112 Estadística Básica con Aplicaciones en Excel 2010

Rango intercuartil

Es la diferencia entre el tercer y primer cuartil. Es el rango del 50% central de los datos. El rango
intercuartil elimina la influencia de los valores extremos.

Rango intercuartil = RIC = Q3 – Q1= P75 – P25


donde:

Q1 es el primer cuartil o percentil 25


Q3 es el tercer cuartil o percentil 75

Características del rango intercuartil

 Se puede calcular en variables medidas en escala de intervalo o razón


 No se ve afectado por valores extremos.

Rango intercuartil en Excel

Excel no calcula directamente el rango intercuartil, por lo que es necesario usar las funciones:
 =PERCENTIL.EXC(datos,0.75) para calcular el valor del percentil 75,
 =PERCENTIL.EXC(datos,0.25) para calcular el valor del percentil 25,
 Luego el valor del rango intercuartil es P75 – P25.

Ejemplo 25

Ante la pregunta sobre el número de hijos por familia, una muestra de 12 hogares marcó las res-
puestas mostradas en la siguiente tabla:

2 1 2 4 1 3 2 3 2 0 5 1

Calcule e interprete los valores del rango y rango intercuartil.

Solución

 El rango R = máximo – mínimo = 5 - 0 = 5. Esto significa, que el rango o amplitud para el número
de hijos por familia en la muestra de 12 hogares es 5 hijos.

 El rango intercuartil RIC = 3 – 1= 2. Esto significa que la dispersión en el 50% de los datos centra-
les del número de hijos en las familias es igual a dos hijos.
Capítulo 2. Resúmenes de datos 113

Ejercicio 38
FibraTex S.A. es una empresa exportadora de fibra textil, actualmente cuenta con 18 operarios. Los
datos que se presentan a continuación corresponden al tiempo de horas extras semanales trabaja-
dos por todos sus operarios.

2,8 2,0 3,2 4,0 4,0 4,4 1,3 2,9 3,9 2,1 2,3 1,6 1,5 2,2 2,4 1,2 2,5 2,7

Calcule e interprete el rango y el rango intercuartil.

Solución

Para calcular el rango, en Excel use la función =MAX(datos) y =MIN(datos) para calcular el valor del
máximo y mínimo valor de los datos, respectivamente.

El dato mayor es ……………………………y el dato menor es ………………………………., luego el

valor del rango es igual a …………………………….……….

Esto significa que ……………………………………………………………………………………………………………………….……..

……………………………………………………………………………………………………….………………………………………….……..

Para calcular el rango intercuartil, en Excel use la función:

 =PERCENTIL.EXC(datos,0.75) para calcular el valor del percentil 75,


 =PERCENTIL.EXC(datos,0.25) para calcular el valor del percentil 25,

El percentil 75 es igual a …………………………………y el percentil 25 es igual a ……………………..…………….,

luego el valor del rango intercuartil es …………………………………..…….

Esto significa que ……………………………………………………………………………………………………………………..……..

……………………………………………………………………………………………………….………………………………………..……..
114 Estadística Básica con Aplicaciones en Excel 2010

Varianza
Se define como el promedio de los cuadrados de las desviaciones de los datos respecto de su media
aritmética.

 La varianza mide el grado de dispersión o variación de los valores de una variable con respecto a
su media aritmética.
 Las unidades de la varianza son las unidades de los datos al cuadrado.

Se denota por V(X),  2 (varianza poblacional), s2 (varianza muestral).

Se calcula usando la siguiente fórmula:

 x    i
2

Varianza poblacional: 2  i 1
N
n

 x  x i
2

Varianza muestral: s2  i 1
n 1

Desviación estándar
Se define como la raíz cuadrada positiva de la varianza. Se denota por  (desviación estándar po-
blacional) o s (desviación estándar muestral).

Características de la varianza y la desviación estándar


 La varianza y la desviación estándar son números reales no negativos.
 Se pueden calcular para variables medidas en escala de intervalo o razón.
 Se ven afectadas por valores extremos.
 La varianza es expresada en unidades cuadráticas a las unidades de los datos, mientras que la
desviación estándar es expresada en las mismas unidades de los datos.

Varianza y la desviación estándar en Excel

En Excel 2010, use la función:


 =VAR.S para calcular la varianza muestral.
 =DESVEST.M para calcular la desviación estándar muestral.
 =VAR.P para calcular la varianza poblacional.
 =DESVEST.P para calcular la desviación estándar poblacional.
Capítulo 2. Resúmenes de datos 115

Ejemplo 26

Ante la pregunta sobre el número de hijos por familia, una muestra de 12 hogares marcó las res-
puestas mostradas en la siguiente tabla:

2 1 2 4 1 3 2 3 2 0 5 1

Calcule la varianza y la desviación estándar de la variable en estudio.

Solución

En Excel 2010, use la función:

 =VAR.S para calcular la varianza muestral, s2 = 1,9697 hijos2.


 =DESVEST.M para calcular la desviación estándar muestral, s = 1,4035 hijos.

Ejercicio 39

FibraTex S.A. es una empresa exportadora de prendas de vestir. Los datos que se presentan a con-
tinuación corresponden a la edad de todos los trabajadores de esta empresa.

41 45 49 46 52 42 39 49 44 39 47 49 40 43 51 41 58 59 49 44 41 48 50 44 51
40 37 38 40 41 50 54 41 40 45 37 40 36 36 42 39 55 45 44 38 40 37 47 33 48
44 50 51 41 47 56 44 41 59 38 41 44 49 45 37 40 28 49 45 39 59 51 40 43 44
40 38 44 43 39 45 43 44 43 40 42 29 37 48 49 51 46 39 43 56 44 60 57 47 49

Calcule la varianza y la desviación estándar de la variable en estudio.

Solución

En Excel 2010, use la función:

 =VAR.P para calcular la varianza poblacional, σ2 = ………….…………...……. ……………………………….


(unidades)
 =DESVEST.P para calcular la desviación estándar poblacional, σ = ……..………. .........................
(unidades)
116 Estadística Básica con Aplicaciones en Excel 2010

Coeficiente de variación

Las medidas de dispersión estudiadas son El coeficiente de variación es una medida de


medidas de variación absolutas pues estas se dispersión relativa libre de unidades por lo que es
expresan en las mismas unidades que la útil para comparar la variabilidad de dos o más
variable original, excepto la varianza que se grupos de datos aunque estén expresados en
expresa en unidades al cuadrado. distintas unidades de medida.

Es útil al comparar la variabilidad de dos o más series de datos que se El coeficiente de variación
expresan en distintas o iguales unidades, pero difieren a tal punto que se calcula en variables
una comparación directa de las respectivas desviaciones estándar no es medidas en escala de
muy útil, por ejemplo, cuando las medias están muy distantes. razón.

Coeficiente de variación poblacional Coeficiente de variación muestral


 s
CV   100% cv   100%
 x

Coeficiente de variación en Excel

Excel no calcula directamente el coeficiente de variación, por lo que es necesario usar las funciones:
 =PROMEDIO(datos) para calcular la media
 =DESVEST.M(datos) para calcular la desviación estándar
Para luego, dividir la desviación estándar entre su respectiva media.

Ejemplo 27

Los siguientes datos representan resúmenes del número de mediciones de resistencia de cierto
artículo que realizaron dos grupos de técnicos.

Grupo 1: Media = 3 y desviación estándar = 1,10


Grupo 2: Media = 5 y desviación estándar = 1,66

¿En cuál de los grupos el número de mediciones es más disperso?

Solución
Como los promedios son diferentes, se usa como indicador el coeficiente de variación:
s  1,10 
CV1  1  100%     100%  36,67%
x2  3 
s  1,66 
CV2  2  100%     100%  33,207%
x2  5 
El número de mediciones es más disperso en el grupo 1, puesto que su coeficiente de variación es
mayor.
Capítulo 2. Resúmenes de datos 117

Ejercicio 40

Los datos presentados a continuación corresponden a los montos y el tipo de pago realizados por
una muestra de 100 clientes de una cadena de supermercados. Los directivos de esta empresa pi-
dieron tomar la muestra para conocer el comportamiento de los pagos de los clientes.

Cheque
5,00 17,87 18,77 21,11 22,67 25,96 30,60 31,07 31,74 34,67
35,38 36,09 36,48 37,20 37,60 37,94 38,58 39,55 40,51 41,10
41,58 42,69 42,83 43,14 48,95 49,21 50,58 51,66 52,04 52,87
54,84 55,40 57,59 58,11 58,64 58,75 59,78 69,22 72,46 78,16

Efectivo
1,09 1,27 1,85 2,44 2,87 2,96 3,31 3,65 4,34 4,75
5,08 5,15 5,91 5,98 6,93 7,02 7,17 7,22 7,40 7,41
7,88 8,81 8,85 9,00 11,17 11,54 11,77 12,07 13,09 14,28
15,07 15,10 15,57 16,28 16,38 16,69 18,09 20,48

Tarjeta
14,44 19,78 22,59 25,57 26,57 26,91 27,66 27,89 33,76 44,53
46,13 46,24 48,11 50,30 52,35 52,63 53,32 54,19 55,21 57,55
69,77 94,36

¿Cuál de las tres formas de pago presenta mayor homogeneidad?

Solución

Para calcular el coeficiente de variación use las funciones:


 =PROMEDIO(datos) para calcular la media
 =DESVEST.M(datos) para calcular la desviación estándar.

Luego, divida cada desviación estándar entre su respectiva media.

El resultado debe ser:

Forma de pago Promedio Desviación Estándar Coeficiente de variación

Cheque

Efectivo

Tarjeta

Por lo tanto, la forma de pago más homogénea es……………………………………………………………….. porque

…………………………………………………………………………………………………………………………………………………………..
118 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 41
La siguiente base de datos muestra las respuestas obtenidas de una encuesta realizada a una mues-
tra de 40 empleados de una empresa de servicios.

Edad Categoría Tiempo de servicio Número Estado Ingreso mensual


ID Género
(años) laboral (meses) de hijos Civil (en soles)
1 Masculino 35 Técnico/ventas 94 1 Divorciado 4658
2 Masculino 74 Gerencial 274 2 Casado 5678
3 Femenino 36 Profesional 99 0 Divorciado 4818
4 Masculino 42 Obrero 109 1 Conviviente 2550
5 Masculino 46 Producción 127 1 Casado 3220
6 Femenino 54 Obrero 142 1 Casado 2918
7 Femenino 45 Servicios 124 1 Divorciado 2855
8 Masculino 38 Obrero 94 1 Casado 2500
9 Femenino 25 Servicios 62 2 Divorciado 1405
10 Femenino 29 Producción 61 3 Divorciado 2699
11 Masculino 49 Apoyo/adm. 132 3 Divorciado 3053
12 Masculino 48 Gerencial 132 1 Casado 5711
13 Masculino 41 Obrero 108 1 Casado 4957
14 Masculino 59 Gerencial 160 0 Divorciado 5784
15 Masculino 63 Gerencial 200 3 Casado 6316
16 Masculino 73 Profesional 200 2 Divorciado 4670
17 Masculino 35 Gerencial 94 1 Casado 5940
18 Masculino 43 Obrero 120 4 Casado 4860
19 Masculino 43 Gerencial 121 4 Casado 5315
20 Masculino 72 Obrero 280 2 Conviviente 5071
21 Masculino 45 Gerencial 124 3 Divorciado 5612
22 Masculino 35 Técnico/ventas 94 3 Casado 4956
23 Masculino 74 Obrero 192 4 Casado 4831
24 Masculino 57 Gerencial 146 3 Casado 6512
25 Masculino 72 Obrero 186 4 Divorciado 4892
26 Masculino 42 Gerencial 112 1 Casado 5599
27 Masculino 48 Gerencial 132 1 Conviviente 4978
28 Masculino 42 Obrero 111 2 Divorciado 4602
29 Masculino 36 Gerencial 100 1 Conviviente 5678
30 Masculino 57 Gerencial 145 1 Casado 5475
31 Masculino 59 Profesional 150 1 Casado 4313
32 Masculino 59 Profesional 160 3 Casado 4818
33 Masculino 63 Obrero 200 2 Divorciado 4892
34 Masculino 38 Profesional 99 1 Conviviente 4978
35 Masculino 42 Gerencial 112 4 Divorciado 6036
36 Femenino 65 Producción 171 2 Conviviente 4032
37 Masculino 52 Producción 139 4 Divorciado 3904
38 Masculino 42 Gerencial 112 1 Conviviente 5599
39 Masculino 72 Profesional 186 2 Divorciado 4670
40 Masculino 69 Profesional 182 2 Divorciado 3482

a. ¿En qué categoría laboral el tiempo de servicio presenta mayor dispersión?


b. ¿En qué categoría laboral el tiempo de servicio es más disperso en el 50% central?
Capítulo 2. Resúmenes de datos 119

Solución

Cuando se tiene una base de datos, una manera más rápida de obtener las medidas de dispersión
es utilizando la opción de Datos/Análisis de datos tal como se muestra a continuación:

Estadísticos Casado Conviviente Divorciado


Media 141,823529 143,285714 135,75
Mediana 132 112 128
Moda 94 #N/A 124
Desviación estándar 46,0424197 65,2883713 45,9209466
Varianza de la muestra 2119,90441 4262,57143 2108,73333
Coeficiente de asimetría 1,61260652 1,95880668 0,05949087
Rango 180 181 139
Mínimo 94 99 61
Máximo 274 280 200
Cuenta 17 7 16

De la salida obtenida, Excel nos arroja solo los valores de la varianza, desviación estándar y rango.

a. ¿En qué categoría laboral el tiempo de servicio presenta mayor dispersión?

Para dar respuesta a la pregunta completaremos la siguiente tabla:

Estado civil Promedio Desviación Estándar Coeficiente de variación

Casado

Conviviente

Divorciado

Por lo tanto, el tiempo de servicio es más disperso en el estado civil …………………………….…..... porque
…………………………………………………………………………………………………………………………………………………………..

b. ¿En qué categoría laboral el tiempo de servicio es más dispersión en el 50% central?

Para dar respuesta a la pregunta completaremos la siguiente tabla:

Estado civil Q1 Q3 RIC

Casado

Conviviente

Divorciado

Por lo tanto, el tiempo de servicio es más disperso en el 50% central de los datos es en el estado
civil …………………………….. porque …………………………………………………………………………………………….…………
120 Estadística Básica con Aplicaciones en Excel 2010

Medidas de asimetría

Además de las medidas de


Si los datos se distribuyen Si los datos por debajo de la
tendencia central y
con igual frecuencia y media son más frecuentes
dispersión, podemos estar
alejamiento por debajo y que aquellos por encima de
interesados en saber la
por encima de la media, se la media o viceversa, se
forma que presenta un
dice que la distribución es dice que la distribución es
conjunto unimodal de
simétrica. asimétrica.
datos.

Relación entre media, mediana y moda


Para una distribución unimodal, es decir, que tenga una sola moda, se cumplen de manera general
las siguientes relaciones.

 Para una distribución simétrica: x  Mediana  Moda


 Para una distribución asimétrica positiva: x  Mediana  Moda
 Para una distribución asimétrica negativa: x  Mediana  Moda

Media = Mediana = Moda

Simetría o sesgo nulo

Media < Mediana < Moda

Sesgo izquierdo o negativo

Moda < Mediana < Media

Sesgo derecho o positivo


Capítulo 2. Resúmenes de datos 121

Coeficiente de asimetría de Fisher


El coeficiente de asimetría de Fisher se define como:

3
 xi  x 
n
n
As   
n  1n  2 i 1  s 

Se tiene que:
 Para una distribución simétrica As = 0
 Para una distribución asimétrica positiva As > 0
 Para una distribución asimétrica negativa As < 0

Coeficiente de asimetría de Fisher en Excel

En Excel 2010, use la función =COEFICIENTE.ASIMETRIA(datos).

Ejercicio 42
Los datos presentados corresponden a la cantidad de dinero gastado, en nuevos soles, para com-
prar regalos navideños entre un grupo de hombres y de mujeres durante el diciembre pasado en
Lima Metropolitana. Calcule e interprete el coeficiente de asimetría de Fisher en ambos grupos.
Mujeres
460 507 575 420 568 558 581 334 400 426 434 290 468 546 419 726 364 432 519 503
470 519 430 250 514 447 504 543 350 473 614 441 630 432 417 421 531 523 321 405
450 393 553 430 421 461 320 930 290 718 361 383 477 280 385 416 398 503 431 406
407 558 313 387 585 503 527 511 383 402 453 429 499 179 600 373 459 410 850 847

Hombres
498 349 185 80 324 616 680 355 352 648 696 308 581 481 297 205 285 175 447 603
626 368 275 149 100 254 540 279 275 200 538 604 575 600 137 734 436 284 198 610
767 80 266 537 358 624 120 244 341 724 425 305 75 688 253 514 236 475 606 475
271 230 466 120 398 60 429 517 268 580 431 173 612 317 529 647 542 544 464 610

Solución

En Excel 2010, para calcular el coeficiente de asimetría de Fisher, use la función:


=COEFICIENTE.ASIMETRIA(datos).

Género Coeficiente de asimetría de Fisher

Femenino

Masculino

Por lo tanto,

 el gasto de las mujeres presenta ………………………………………………….…………………..…

 el gasto de los hombres presenta ………………………………………………………..………………


122 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 43
La siguiente base de datos muestra las respuestas obtenidas de una encuesta realizada a una mues-
tra de 40 empleados de una empresa de servicios.

Edad Categoría Tiempo de servicio Número Estado Ingreso mensual


ID Género
(años) laboral (meses) de hijos civil (en soles)
1 Masculino 35 Técnico/ventas 94 1 Divorciado 4658
2 Masculino 74 Gerencial 274 2 Casado 5678
3 Femenino 36 Profesional 99 0 Divorciado 4818
4 Masculino 42 Obrero 109 1 Conviviente 2550
5 Masculino 46 Producción 127 1 Casado 3220
6 Femenino 54 Obrero 142 1 Casado 2918
7 Femenino 45 Servicios 124 1 Divorciado 2855
8 Masculino 38 Obrero 94 1 Casado 2500
9 Femenino 25 Servicios 62 2 Divorciado 1405
10 Femenino 29 Producción 61 3 Divorciado 2699
11 Masculino 49 Apoyo/adm. 132 3 Divorciado 3053
12 Masculino 48 Gerencial 132 1 Casado 5711
13 Masculino 41 Obrero 108 1 Casado 4957
14 Masculino 59 Gerencial 160 0 Divorciado 5784
15 Masculino 63 Gerencial 200 3 Casado 6316
16 Masculino 73 Profesional 200 2 Divorciado 4670
17 Masculino 35 Gerencial 94 1 Casado 5940
18 Masculino 43 Obrero 120 4 Casado 4860
19 Masculino 43 Gerencial 121 4 Casado 5315
20 Masculino 72 Obrero 280 2 Conviviente 5071
21 Masculino 45 Gerencial 124 3 Divorciado 5612
22 Masculino 35 Técnico/ventas 94 3 Casado 4956
23 Masculino 74 Obrero 192 4 Casado 4831
24 Masculino 57 Gerencial 146 3 Casado 6512
25 Masculino 72 Obrero 186 4 Divorciado 4892
26 Masculino 42 Gerencial 112 1 Casado 5599
27 Masculino 48 Gerencial 132 1 Conviviente 4978
28 Masculino 42 Obrero 111 2 Divorciado 4602
29 Masculino 36 Gerencial 100 1 Conviviente 5678
30 Masculino 57 Gerencial 145 1 Casado 5475
31 Masculino 59 Profesional 150 1 Casado 4313
32 Masculino 59 Profesional 160 3 Casado 4818
33 Masculino 63 Obrero 200 2 Divorciado 4892
34 Masculino 38 Profesional 99 1 Conviviente 4978
35 Masculino 42 Gerencial 112 4 Divorciado 6036
36 Femenino 65 Producción 171 2 Conviviente 4032
37 Masculino 52 Producción 139 4 Divorciado 3904
38 Masculino 42 Gerencial 112 1 Conviviente 5599
39 Masculino 72 Profesional 186 2 Divorciado 4670
40 Masculino 69 Profesional 182 2 Divorciado 3482

a. Determine la forma de la distribución del ingreso mensual, en soles, por género.

b. Determine la forma de la distribución del tiempo de servicio, en meses, por género.


Capítulo 2. Resúmenes de datos 123

Solución

a. Determine la forma de la distribución del ingreso mensual, en soles, por género.

Género Coeficiente de asimetría de Fisher

Femenino

Masculino

Por lo tanto,

 el ingreso mensual de las mujeres presenta ……………………………………………………..…

 el ingreso mensual de los hombres presenta ………………………………………………………

b. Determine la forma de la distribución del tiempo de servicio, en meses, por género.

Género Coeficiente de asimetría de Fisher

Femenino

Masculino

Por lo tanto,

 el tiempo de servicio de las mujeres presenta ……………………………………………………..…

 el tiempo de servicio de los hombres presenta ………………………………………………………


124 Estadística Básica con Aplicaciones en Excel 2010

Ejercicios de aplicación

1. Una empresa tiene sucursales en dos países. En el primer país, el sueldo promedio mensual es
de 450 dólares, con una desviación estándar de 50 dólares, mientras que en el otro país el
sueldo promedio es de 1500 nuevos soles y una varianza de 8500 nuevos soles2 ¿En qué país
los sueldos presentan mayor variabilidad?

2. En la Bolsa de Valores de Lima se analiza la cotización de las acciones de dos empresas. En Las
acciones de C&M S.A. se cotizan en promedio a 4,50 nuevos soles con una desviación estándar
de 0,50 nuevos soles, mientras que las acciones de Damis S.A se cotizan en promedio a 15
nuevos soles con una varianza de 0,85 nuevos soles2 ¿Qué empresa tiene las acciones más
riesgosas (mayor variabilidad)?

3. Los gastos semanales en transporte urbano (nuevos soles) que efectúan los habitantes de las
ciudades Vista Grande y Pueblo Hermoso han sido estudiados mediante muestras aleatorias
independientes. Los datos captados fueron:

Gastos semanales en movilidad en Gastos semanales en movilidad en


Vista Grande Pueblo Hermoso
22,0 22,0 22,1 23,2 23,2 23,2 23,6 23,6 18,1 18,5 18,7 19,9 20,4 20,5 21,1
24,0 24,1 24,1 24,2 24,2 24,5 24,7 25,5 21,3 21,3 21,5 22,0 22,0 22,2 22,4

a. ¿En qué ciudad los gastos semanales en movilidad son más homogéneos?
b. Evalúe la asimetría de los gastos semanales en movilidad en las dos ciudades usando el coe-
ficiente de simetría de Pearson.

4. En la actualidad todos los vehículos que circulan en Lima Metropolitana deben pasar las revi-
siones técnicas con el fin de reducir el nivel de contaminación en la ciudad. Inicialmente la em-
presa encargada de dichas revisiones contaba con dos plantas (Cono Norte y Cono Sur) y era
de interés investigar si se necesitaba abrir más plantas analizando el tiempo de atención por
vehículo. Los tiempos (en minutos) que se demoraron en ser atendidos una muestra aleatoria
de vehículos particulares que asistieron a cada una de las plantas se presenta a continuación:

Cono Norte Cono Sur


Número de Número de Número de Número de
Tiempo Tiempo Tiempo Tiempo
vehículo vehículo vehículo vehículo
1 9,0 12 13,1 1 10,2 12 11,8
2 11,9 13 13,2 2 10,2 13 11,8
3 12,6 14 13,5 3 10,3 14 12,2
4 12,6 15 13,5 4 10,8 15 12,2
5 12,6 16 13,7 5 10,8 16 12,3
6 12,8 17 13,8 6 10,9 17 13,3
7 12,8 18 13,8 7 10,9 18 13,3
8 12,8 19 14,1 8 10,9 19 13,4
9 12,9 20 14,1 9 11,2 20 13,4
10 13,1 21 14,3 10 11,6 21 13,4
11 13,4 22 15,1 11 11,8 22 21,3
Capítulo 2. Resúmenes de datos 125

a. Calcule las medidas de dispersión para el tiempo, en minutos, que demoraron en ser aten-
didos los vehículos particulares que asistieron a la planta del Cono Sur.
b. Calcule las medidas de dispersión para el tiempo, en minutos, que demoraron en ser aten-
didos los vehículos particulares que asistieron a la planta del Cono Norte.
c. ¿Es posible afirmar que el tiempo de atención es más homogéneo en el Cono Norte? Justi-
fique numéricamente su respuesta.
d. ¿Es posible afirmar que en el Cono Sur el tiempo de atención es más homogéneo en el 50%
central? Justifique numéricamente su respuesta.
e. Compare la simetría del tiempo que demoran en ser atendidos los vehículos particulares
que asistieron a las plantas del Cono Norte y cono sur usando el coeficiente de Fisher. Co-
mente.

5. La siguiente información corresponde al tiempo de servicio (en meses) de una muestra de pu-
blicistas que laboran en dos conocidas agencias de la capital.

Agencia Omega Agencia Sigma


Media 18,93 Media 19,64
Mediana 14,00 Mediana 15,00
Moda 6,00 Moda 11,00
Desviación estándar 15,78 Varianza 94,2841
Muestra 15 Muestra 25

a. ¿Qué tipo de asimetría presenta la distribución del tiempo de servicio de la agencia publici-
taria Omega? ¿Por qué?
b. ¿En cuál de las agencias publicitarias el tiempo de servicio (en meses) es más homogéneo?
Justifique su respuesta.

6. Se han analizado los puntajes de un examen en un curso de capacitación en una empresa, y se


ha obtenido la siguiente información: el puntaje medio en la sección A es de 74, el puntaje
modal es 83 y la mediana es 77, mientras que en la sección B, el puntaje medio es de 80, el
puntaje modal es 71 y la mediana es 77. Indique el tipo de asimetría de la distribución de los
puntajes para cada sección.
126 Estadística Básica con Aplicaciones en Excel 2010

Resumen

Estadístico Fórmula Función en Excel


Media n =promedio(datos)
x i
x i 1
n
Mediana =mediana(datos)

Moda =moda.uno(datos)
=moda.varios(datos)

Media ponderada n

x w i i
xw  i 1
n

wi 1
i

Rango r = Xmax - Xmin =max(datos)-min(datos)

Percentil k =percentil.exc(datos, k/100)

Rango intercuartil RIC = Q3 – Q1= P75 – P25 =percentil.exc(datos, 0.75) - per-


centil.exc(datos, 0.25)

Coeficiente de variación s =desvest.m(datos)/promedio(datos)


cv   100%
muestral x

Coeficiente de asimetría 3 =coeficiente.asimetria(datos)


 xi  x 
n


n
de Fisher As   
n  1n  2 i1  s 
Capítulo 3. Probabilidades 127

Capítulo 3. Probabilidades

Definiciones básicas de probabilidad

Experimento no aleatorio o determinístico


Un experimento determinista es aquel en el que se puede predecir el resultado de su realización y
existe ley o fórmula matemática que permite explicarlo. Los experimentos de la física son determi-
nistas. Por ejemplo, el movimiento de caída libre.

Experimento aleatorio, espacio muestral, evento y probabilidad


Los conceptos probabilísticos se aplican sobre experimentos aleatorios.

Experimento aleatorio
•Es un proceso que al ser realizado u observado
repetidas veces, bajo las mismas condiciones,
genera más de un posible resultado que no puede
ser determinado de antemano.

Espacio muestral
•Es el conjunto de todos los posibles resultados que
genera un experimento aleatorio.

Evento
•Es todo subconjunto de un espacio muestral.

Probabilidad
•Es una medida de la posibilidad de ocurrencia de un
evento.
128 Estadística Básica con Aplicaciones en Excel 2010

Espacio muestral
Se denota mediante el símbolo . Cada elemento del espacio muestral se denomina punto mues-
tral.

Evento
Es todo subconjunto de un espacio muestral.

Se denotan mediante letras mayúsculas, por ejemplo, A y B.

 Evento simple: Es un evento formado por un solo punto muestral. No se puede descomponer.
 Evento compuesto: Es un evento formado por más de un punto muestral.

Probabilidad
Es una medida de la posibilidad de ocurrencia de un evento.

Ejemplo de experimento aleatorio, espacio muestral, eventos y probabilidad

Experimento aleatorio
• Lanzar un dado

Espacio muestral
•Ω = {1, 2, 3, 4, 5, 6}

Eventos
•A = {1}
•B = {1, 2, 3}
•C = {2, 4, 6}, etc.

Probabilidad
•P(A) = n(A) / n(Ω) = 1 / 6 = 0,1667
•P(B) = n(B) / n(Ω) = 3 / 6 = 0,5
•P(C) = n(C) / n(Ω) = 3 / 6 = 0,5
Capítulo 3. Probabilidades 129

Combinación de eventos
Con frecuencia se construyen eventos mediante la combinación de eventos más sencillos. Es usual
emplear la notación de conjuntos para describir los eventos construidos de esta forma. Sea  un
experimento aleatorio y Ω el espacio muestral asociado. Si A y B son dos eventos definidos en Ω, se
define:

Complemento (AC)
Para un evento A cualquiera se define su complemento, AC , como el evento consistente en todos
los puntos de Ω que no están en A.

Unión (A  B)
Para dos eventos A y B, la unión del evento A con el evento B es el evento que contienen todos los
puntos de Ω que pertenecen a A o a B o a ambos.

Intersección (A∩B)
Para dos eventos A y B, la intersección de los eventos A y B es el evento que contienen todos los
puntos de Ω que pertenecen tanto a A como a B.
130 Estadística Básica con Aplicaciones en Excel 2010

Eventos mutuamente excluyentes


Dos eventos son mutuamente excluyentes o disjuntos si no tienen puntos de Ω en común. Los
eventos A y B son mutuamente excluyentes si y solo si A  B = .

Axiomas de la probabilidad
Sea un experimento aleatorio, Ω el espacio muestral asociado a dicho experimento aleatorio y A un
evento definido en Ω, entonces la probabilidad del evento A, denotada por P(A), es aquel número
que cumple los siguientes axiomas:

 Axioma 1: 0  P(A)  1

 Axioma 2: P(Ω) = 1

 Axioma 3: Si A y B son dos eventos mutuamente excluyentes entonces:

P(A  B) = P(A) + P(B)

Definición clásica de probabilidad

Algunos autores definen la probabilidad como una medida de la posibilidad de ocurrencia de un


evento. La definición clásica propone que si el espacio muestral es numerable y cada punto mues-
tral tiene la misma posibilidad de ocurrencia, entonces la probabilidad de ocurrencia de un evento
A definido sobre  es:

nA Número de casos favorablesal evento A


P A  
n Número de casos totales

Teoremas básicos de probabilidad


 P() = 0, donde  es el evento imposible.
 P(AC) = 1 – P(A)
 Si A y B son eventos cualesquiera, entonces:

P(A  B) = P(A) + P(B) – P(A  B)


Capítulo 3. Probabilidades 131

Ejercicio 44
Se seleccionó una muestra aleatoria de trabajadores de la empresa Óptima para determinar sus
planes de jubilación después de cumplir los 65 años de edad. Los trabajadores en la muestra se
dividieron en: ejecutivos, empleados y obreros. Los resultados obtenidos fueron:

Planes después de los 65 años


Trabajador
Se jubile No se jubile No ha decidido su jubilación
Ejecutivo 8 3 1
Empleado 20 10 5
Obrero 50 22 11

Si se selecciona un trabajador al azar.

a. ¿Cuál es la probabilidad de que no se jubile del trabajo?

Solución

Sea el evento ……… : …………………………………………………………….

Se pide calcular:
P(…………….) = ………………………………………..

b. ¿Cuál es la probabilidad de que se jubile o no sea ejecutivo?

Solución

Sean los eventos

……… : …………………………………………………………………………………………………………………….

……… : …………………………………………………………………………………………………………………….

Se pide calcular:
P(…………….) = ………………………………………..

c. ¿Cuál es la probabilidad de que sea obrero y no haya decidido su jubilación?

Solución

Sean los eventos

……… : ………………………………………………………………………………………………..………………….

……… : ……………………………………………………………………………………..…………………………….

Se pide calcular:
P(…………….) = ………………………………………..
132 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 45

En la ciudad de Arequipa se realizó una encuesta a personas adultas para conocer la opinión que
tienen respecto a una nueva ley del gobierno. La siguiente tabla muestra los resultados de la en-
cuesta. Los entrevistados fueron clasificados según su género.

Opinión
Género Total
A favor En contra Abstinencia
Masculino 11 29 9
Femenino 14 17 15
Total

Si se elige una persona al azar,

a. ¿Cuál es la probabilidad de que no esté a favor de la nueva ley de gobierno y sea hombre?

Solución

Sea el evento ……… : …………………………………………………………………..…………………………….

Sea el evento ……… : ……………………………………………………………………………..………………….

Se pide calcular:
P(…………….) = ………………………………………..

b. ¿Cuál es la probabilidad de que esté a favor o en contra de la nueva ley del gobierno?

Solución

Sea el evento ……… : ……………………………………………………………………………………………….

Sea el evento ……… : ……………………………………………………………………………..……………….

Se pide calcular:
P(…………….) = ………………………………………..

c. ¿Cuál es la probabilidad de que esté en contra de la nueva ley de gobierno?

Solución

Sea el evento ……… : ……………………………………………………………………………………………….

Se pide calcular:
P(…………….) = ………………………………………..
Capítulo 3. Probabilidades 133

Ejemplo 28

Un instituto de investigaciones académicas desea determinar si existe relación entre el interés de


un estudiante en finanzas, su habilidad en matemáticas y su género. Se selecciona una muestra de
200 estudiantes y mediante una prueba se mide su habilidad matemática y su interés en finanzas.
Los resultados fueron los siguientes:

Género
Interés Femenino (A1) Masculino (A2)
Total
en finanzas Habilidad en matemáticas Habilidad en matemáticas
Baja (C1) Media (C2) Alta (C3) Baja (C1) Media (C2) Alta (C3)
Bajo (B1) 25 9 6 35 6 10 91
Medio (B2) 4 22 7 11 21 3 68
Alto (B3) 2 5 15 3 7 9 41
Total 31 36 28 49 34 22 200

Si se selecciona un estudiante al azar,

a. ¿Cuál es la probabilidad de seleccionar un estudiante con un interés alto en finanzas?

Solución
Sea el evento B3: Interés alto en finanzas

41
PB3    0,205
200

b. ¿Cuál es la probabilidad de que no tenga una alta habilidad en matemáticas y tenga un interés
medio en finanzas?

Solución
Sean los eventos:

C3: Habilidad alta en matemáticas


B2: Interés medio en finanzas


P C 3C  B2   4  22  11  21
200
 0,29

c. ¿Cuál es la probabilidad de que sea hombre o tenga un bajo interés en finanzas?

Solución
Sean los eventos:

A2: Masculino
B1: Interés bajo en finanzas

P A2  B1   P A2   P B1   P A2  B1 


49  34  22 91 51
P A2  B1      0,725
200 200 200
134 Estadística Básica con Aplicaciones en Excel 2010

Ejemplo 29

Una encuesta entre suscriptores de una revista local indicó que 45,8% de ellos habían rentado un
automóvil por motivos de negocios, 54% por motivos personales y 30% por motivos de negocios y
personales a la vez.

a. ¿Cuál es la probabilidad de que un suscriptor rente un automóvil por motivos de negocios o


personales?
b. ¿Cuál es la probabilidad de que un suscriptor rente un automóvil por motivos que no sean de
negocios ni personales?
c. ¿Cuál es la probabilidad de que un suscriptor rente un automóvil por motivos exclusivamente
de negocios?

Solución

Definamos los eventos:

A: Rentar un automóvil por negocios


B: Rentar un automóvil por motivos personales

Luego, hagamos un diagrama de Venn y completemos todos los espacios con las probabilidades
respectivas.

Del texto se tiene que PA  0,458 , PB  0,54 y PA B  0,30 .

Con esta información completemos el diagrama.

Del diagrama se tiene que:

a. PA  B  PA  PB  PA  B  0,458  0,54  0,30  0,698

   
b. P AC  BC  P A  B  1  PA  B  1  0,698  0,302
C

c.  
P A  BC  0,158
Capítulo 3. Probabilidades 135

Ejercicio 46
En una ciudad el 28% de los trabajadores toma vacaciones dos veces al año, el 45% de los trabaja-
dores toma tres cursos de capacitación al año y el 7% de los trabajadores toma vacaciones dos ve-
ces al año y toma tres cursos de capacitación al año.

a. ¿Cuál es la probabilidad que al elegir un trabajador al azar solo tome vacaciones dos veces al
año?
b. ¿Cuál es la probabilidad que al elegir un trabajador al azar solo tome vacaciones dos veces al año
o solo tome tres cursos de capacitación al año?
c. ¿Cuál es la probabilidad que al elegir un trabajador al azar no tome vacaciones dos veces al año
ni tome tres cursos de capacitación al año?

Solución
Sean los eventos

…… : ……………………………………………………………………………………………………………

…… : ……………………………………………………………………………………………………………

a. ¿Cuál es la probabilidad que al elegir un trabajador al azar solo tome vacaciones dos veces al
año?

Se pide calcular:

P...................  ..................................................................................................

b. ¿Cuál es la probabilidad que al elegir un trabajador al azar solo tome vacaciones dos veces al año
o solo tome tres cursos de capacitación al año?

Se pide calcular:

P...........................................  ................................................................

c. ¿Cuál es la probabilidad que al elegir un trabajador al azar no tome vacaciones dos veces al año
ni tome tres cursos de capacitación al año?

Se pide calcular:

P...........................................  ................................................................
136 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 47

La probabilidad de que un alumno de administración lea la revista “Finanzas” es igual al 40% y la


probabilidad de que lea la revista “Actualidad” es igual al 30%, además la probabilidad de que lea
ambas revistas es igual al 10%.
a. ¿Cuál es la probabilidad de que un alumno seleccionado al azar no lea ninguna de estas dos re-
vistas?
b. ¿Cuál es la probabilidad de que un alumno seleccionado al azar lea al menos una de estas dos
revistas?

Solución

Sean los eventos

…… : ……………………………………………………………………

……. : ……………………………………………………………………

a. ¿Cuál es la probabilidad de que un alumno seleccionado al azar no lea ninguna de estas dos re-
vistas?

Se pide calcular:

P...................  ..................................................................................................

b. ¿Cuál es la probabilidad de que un alumno seleccionado al azar lea al menos una de estas dos
revistas?

Se pide calcular:

P...........................................  ................................................................
Capítulo 3. Probabilidades 137

Probabilidad condicional

Sea  un experimento aleatorio y  el espacio muestral asociado. Sean A, B dos eventos definidos
en . La probabilidad de ocurrencia del evento A sabiendo que el evento B ha ocurrido se denota
por P(A/B) y se llama probabilidad condicional de A dado B:

P A  B 
PA/B   ; PB  0
PB

Ejemplo 30

La mayoría de las estaciones de servicio venden tres tipos de gasolina: 90 octanos, 95 octanos y 97
octanos que, a su vez, pueden estar enriquecidas con un aditivo. La tabla siguiente ilustra los por-
centajes de clientes que prefieren cada tipo de gasolina.

Tipo de gasolina 90 octanos (B) 95 octanos (C) 97 octanos (D) Total


Con aditivo(A) 0,05 0,10 0,05 0,20
/
Sin aditivo (A ) 0,15 0,40 0,25 0,80
Total 0,20 0,50 0,30 1,00

Se selecciona al azar un cliente que ha comprado uno de estos tipos de gasolina:

a. ¿Cuál es la probabilidad de que haya comprado gasolina con aditivo o no sea de 95 octanos?

     
P A  C C  PA  P C C  P A  C C  0,20  0,50  (0,05  0,05)  0,60

b. Si el cliente no compró gasolina de 95 octanos, ¿cuál es la probabilidad de que hay comprado


gasolina de 97 octanos?


P D CC   P(D  C C ) 0,30
 
P CC

0,50
 0,60

c. Si el cliente no compró gasolina de 90 0ctanos, ¿cuál es la probabilidad de que haya comprado


gasolina sin aditivo?


P AC BC   P(AC  BC ) 0,65
P(BC )

0,80
 0,8125
138 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 48
El administrador de una tienda de ropa de vestir para caballeros ha recopilado la siguiente informa-
ción sobre el número de boletas de pago entregadas a sus clientes por la compra de camisas de
manga corta, manga larga y manga tres cuartos durante el primer trimestre del año en curso.

Mes evaluado Manga corta Manga larga Manga tres cuartos Total
Enero 25 45 43
Febrero 35 25 35
Marzo 29 29 12
Total

a. Si se elige una boleta al azar, ¿cuál es la probabilidad que haya sido entregada por la venta de
una camisa de manga corta?

Sea el evento ……… : ………………………………………………………………………………….………………….

Se pide calcular:
P............  ...........................

b. Si se elige una boleta al azar y ésta fue del mes de febrero, ¿cuál es la probabilidad de que haya
sido por la compra de una camisa de manga corta?

Sea el evento ……… : …………………………………………………………….

Sea el evento ……… : …………………………………………………………….

Se pide calcular:
..................... ...............
P....................    ..............
.................... ...............

c. Si se elige una boleta al azar y ésta fue por la compra de una camisa de manga larga, ¿cuál es la
probabilidad de que haya sido entregada en el mes de enero?

Sea el evento ……… : …………………………………………………………….

Sea el evento ……… : …………………………………………………………….

Se pide calcular:

..................... ...............
P....................    ..............
.................... ...............
Capítulo 3. Probabilidades 139

Ejercicio 49

En los Censos Nacionales 2007 ejecutados por el Instituto Nacional de Estadística e Informática se
preguntó a todos los peruanos por los servicios de comunicación con los que contaba su hogar y su
área de residencia, obteniéndose los siguientes resultados:

Servicios con que los cuenta el hogar Urbano Rural Total


Hogares sin ningún tipo de servicio 1 682 454 1 468 889 3 151 343
Solo tienen teléfono fijo 480 831 6 170 487 001
Solo tienen teléfono celular 1 299 037 138 721 1 437 758
Solo tienen Internet 3 336 275 3 611
Solo tienen TV por cable 56 343 2 688 59 031
Tienen teléfono fijo y teléfono celular 506 759 2 912 509 671
Tienen teléfono fijo e Internet 15 684 31 15 715
Tienen teléfono fijo y TV por cable 117 733 186 117 919
Tienen teléfono celular e Internet 9 970 84 10 054
Tienen teléfono celular y TV por cable 204 563 1 981 206 544
Tienen Internet y TV por cable 1 288 19 1 307
Tienen teléfono fijo, teléfono celular e Internet 93 103 110 93 213
Tienen teléfono fijo, teléfono celular y TV por cable 326 181 468 326 649
Tienen teléfono fijo, Internet y TV por cable 19 732 9 19 741
Tienen teléfono celular, Internet y TV por cable 15 424 49 15 473
Los cuatro servicios 298 911 133 299 044
Total 5 131 349 1 622 725 6 754 074

a. Indique el elemento y las variables estudiadas en esta investigación.


b. Si se selecciona un hogar que no cuenta con ningún servicio, ¿cuál es la probabilidad de que sea
de zona rural?
c. Si se selecciona un hogar de la zona urbana, ¿cuál es la probabilidad de que cuente con tres ser-
vicios por lo menos?
d. Si se selecciona un hogar al azar, ¿cuál es la probabilidad de que sea de la zona rural y que tenga
todos los servicios?

Solución

a. Indique el elemento y las variables estudiadas en esta investigación.


140 Estadística Básica con Aplicaciones en Excel 2010

b. Si se selecciona un hogar que no cuenta con ningún servicio, ¿cuál es la probabilidad de que sea
de zona rural?

Sean los eventos

…… : ……………………………………………………………………

……. : ……………………………………………………………………

Se pide calcular:

P..........................  .......................................................................................

c. Si se selecciona un hogar de la zona urbana, ¿cuál es la probabilidad de que cuente con tres ser-
vicios por lo menos?

Sean los eventos

…… : ……………………………………………………………………

……. : ……………………………………………………………………

Se pide calcular:

P..........................  .......................................................................................

d. Si se selecciona un hogar al azar, ¿cuál es la probabilidad de que sea de la zona rural y tenga
todos los servicios?

Sean los eventos

…… : ……………………………………………………………………

……. : ……………………………………………………………………

Se pide calcular:

P..........................  .......................................................................................
Capítulo 3. Probabilidades 141

Eventos independientes

Dos eventos son independientes si la ocurrencia de uno de ellos no afecta la ocurrencia del otro. Lo
anterior se traduce, usando probabilidades condicionales, en:

P(A/B) = P(A) P(B/A) = P(B)

Propiedad de los eventos independientes

Dos eventos cualesquiera A y B son independientes si y solo si

P(A  B) = P(A) × P(B)

Ejemplo 31

La probabilidad que Jorge dispare y de en el blanco es 0,25 y para Luis la probabilidad correspon-
diente es 0,40. Suponga que Jorge y Luis disparan de forma independiente:

a. ¿Cuál es la probabilidad de que ambos den en el blanco?


b. ¿Cuál es la probabilidad de al menos uno de en el blanco?

Solución

Sean los eventos:

A: Jorge dispara y da en el blanco.


B: Luis dispara y da en el blanco.

Se tiene que PA  0,25 y PB  0,40

a. PA  B  PA PB  0,25 0,40  0,10

b. PA  B  PA  PB  PA  B  0,25  0,40  0,10  0,55


142 Estadística Básica con Aplicaciones en Excel 2010

Ejemplo 32

En una gran área metropolitana se seleccionó una muestra de 500 encuestados para determinar
información diversa respecto al comportamiento de los consumidores. Entre las preguntas formu-
ladas estaba “¿Disfruta comprar ropa?” De 240 hombres, 136 respondieron que sí, mientras que,
de las 260 mujeres, 244 respondieron que sí.

Se definen los eventos:

A = El consumidor disfruta comprar ropa


B = El consumidor es hombre

¿Son los eventos A y B independientes?

Solución

Para que los eventos sean independientes se debe cumplir que PA B   PA PB . De acuerdo
con los datos, se tiene que:

Género Sí No Total
Hombres 136 104 240
Mujeres 244 16 260
Total 380 120 500

Calculamos:

136
P A  B    0,272
500

380 240
PA PB    0,3648
500 500

Por lo tanto, como PA  B   PA PB entonces A y B no son eventos independientes.

Ejercicio 50

Una empresa desea establecer dos negocios adicionales, una juguería y una heladería, en dos loca-
les diferentes. Por experiencias pasadas sabe que la probabilidad de que tenga éxito en la juguería
es del 60%, mientras que tenga éxito en la heladería es del 70%. Si podemos considerar a los dos
negocios como independientes,

a. Calcule la probabilidad de que se tenga éxito en al menos uno de los negocios.


b. Calcule la probabilidad de que se tenga éxito solo en la juguería.
c. Calcule la probabilidad de que no tenga éxito en ninguno de los negocios.
Capítulo 3. Probabilidades 143

Solución

Sean los eventos:

……. : ...……………………………………………………..……….. luego, P..........  ..............

……. : ...……………………………………………………..……….. luego, P..........  ..............

Se pide:

a. Calcule la probabilidad de que se tenga éxito en al menos uno de los negocios.

P..............................  ..................................................................

b. Calcule la probabilidad de que se tenga éxito solo en la juguería.

P..............................  ..................................................................

c. Calcule la probabilidad de que no tenga éxito en ninguno de los negocios.

P..............................  ..................................................................
144 Estadística Básica con Aplicaciones en Excel 2010

Partición de un espacio muestral

Sean E1, E2, ... , Ek eventos definidos en Ω, tales que:

i. Ei  Ej = , para todo i  j (disjuntos dos a dos)


k
ii. E
i 1
i   (eventos colectivamente exhaustivos)

Entonces se dice que los eventos E1, E2, ... , Ek definen una partición del espacio muestral Ω.

Teorema de la probabilidad total

Sea A un evento cualquiera definido sobre Ω y sea E1, E2,..., Ek una partición del espacio muestral
entonces:

k
P A  PA E PE 
i 1
i i

Ejemplo 33

Una empresa de manufactura recibe embarques de una determinada pieza de dos proveedores.
Actualmente el 65% de las piezas adquiridas por la empresa provienen del proveedor 1 y 35% res-
tante del proveedor 2. La calidad de las piezas adquiridas varía con la fuente de suministro. Con
base a los datos históricos se sabe que la probabilidad que una pieza del proveedor 1 sea defectuo-
sa es 0,02 y la probabilidad de que una pieza del proveedor 2 sea defectuosa es 0,05. Si seleccio-
namos al azar una de las piezas adquiridas por la empresa, ¿cuál es la probabilidad de que sea de-
fectuosa?

Solución

Sean los eventos:


E1 = La pieza proviene del proveedor 1, luego se tiene que P(E1) = 0,65
E2 = La pieza proviene del proveedor 2, luego se tiene que P(E2) = 0,35
A = Pieza defectuosa.
Ac = Pieza no defectuosa.
Capítulo 3. Probabilidades 145

P(A/E1) = 0,02 y consecuentemente P(Ac/E1) = 0,98. Asimismo, P(A/E2) = 0,05 y consecuentemente


P(Ac/E2) = 0,95. Luego, el diagrama de árbol correspondiente es:

Entonces, P(A) = P(A/E1) P(E1) + P(A/E2) P(E2) = 0,02 × 0,65 + 0,05 × 0,35 = 0,0305

Teorema de Bayes

Sea  un experimento aleatorio, A un evento cualquiera definido sobre Ω y E1, E2, ... , Ek una parti-
ción del espacio muestral Ω, entonces

P A / E j P E j 
P E j /A   k para j = 1, 2,…, k
 PA / E PE 
i 1
i i

Diagrama de árbol

Es la representación gráfica de los resultados posibles de la realización de un experimento aleato-


rio. Cada parte terminal representa un resultado posible del experimento aleatorio y las probabili-
dades se indican en las ramas.
146 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 51

El departamento de créditos de una tienda comercial sabe que sus ventas se pagan con dinero en
efectivo, con cheque o al crédito, con probabilidades respectivas de 0,35; 0,25 y 0,4. La probabili-
dad de que una venta sea por más de 50 dólares, es igual a 0,2 si ésta es en efectivo, es igual a 0,9 si
ésta es con cheque y es igual a 0,6 si ésta es al crédito.

a. ¿Cuál es la probabilidad de que una persona compre por más de 50 dólares?


b. Si compra por más de 50 dólares, ¿cuál es la probabilidad de que la compra se haya realizado en
efectivo?

Solución

Sean los eventos:

E: La compra se realiza con dinero en efectivo


CH: La compra se realiza con cheque
C: La compra se realiza al crédito
M: La compra es por más de 50 dólares
MC: La compra no es por más de 50 dólares

Complete el diagrama del árbol.

Se pide calcular:

a. P...............  ...........................................................................................................

b. P......./ ......  ............................................................ ............................................


Capítulo 3. Probabilidades 147

Ejercicio 52
Un banco comercial que opera en Lima ha estimado por experiencias anteriores, que el 15% de
clientes a los que se les hizo préstamo resultaron morosos. Además, se sabe que el 27% de los
clientes morosos utilizaron el préstamo para financiar ampliaciones en la vivienda y el 68% de los
préstamos pagados a tiempo se hicieron para realizar ampliaciones en la vivienda. Si el día de hoy
se hizo préstamo a un cliente, determine:
a. La probabilidad de que dicho préstamo no se utilice para realizar ampliaciones en la vivienda.
b. Si el préstamo se utilizó para ampliar la vivienda, ¿cuál es la probabilidad de que el cliente no
sea moroso?
c. Si el préstamo no se utilizó para ampliar la vivienda, ¿cuál es la probabilidad de que el cliente
sea moroso?

Solución

Sean los eventos:

……….... : ………………………………………………………………………………………………………….………..
……….... : …………………………………………………………………………………………………………….……..
……….... : …………………………………………………………………………………………………….……………..
……….... : ………………………………………………………………………………………………….………………..
Elabore el diagrama del árbol.

Se pide calcular:

a. P...............  ...........................................................................................................

b. P......./ ......  ............................................................ ............................................

c. P......./ ......  ............................................................ ............................................


148 Estadística Básica con Aplicaciones en Excel 2010

Ejercicios de aplicación

1. La probabilidad de que María no apruebe su curso de Estadística es de 1/3, que apruebe María
o Pedro es 5/6 y que no apruebe Pedro es 1/2. Determine la probabilidad de que solo uno de
ellos apruebe el curso. Rpta: 1/2

2. La probabilidad de que una empresa alemana invierta en minería en el departamento de Junín


es de 0,7; de que invierta en Cajamarca es de 0,4 y de que invierta en al menos una de ellas es
de 0,8. Determine la probabilidad de que dicha empresa finalmente se localice:
a. sólo en Cajamarca. Rpta: 0,4
b. en ninguno de los lugares mencionados. Rpta: 0,2

3. En una muestra de 2000 hogares de Lima Metropolitana se registró el nivel educativo alcanza-
do por el jefe de hogar y el nivel socioeconómico al cual pertenece.

Nivel educativo del jefe Nivel Socioeconómico (NSE)


Total
de hogar A B C D E
Ningún nivel alcanzado 0 1 5 120 180 306
Primaria 2 5 200 220 120 547
Secundaria 20 150 300 280 95 845
Superior 78 44 95 80 5 302
Total 100 200 600 700 400 2000

Si se selecciona un hogar al azar, determine la probabilidad de que el jefe de hogar:

a. pertenezca al NSE A o D Rpta: 800/2000


b. tenga como mínimo un nivel educativo primario. Rpta: 1694/2000
c. tenga un nivel educativo secundario y no sea de NSE C. Rpta: 545/2000
d. tenga un nivel educativo primario o pertenezca al NSE D. Rpta: 1027/2000

4. En una encuesta de hogares realizada en la ciudad de Lima se entrevistó 248 hogares. La si-
guiente tabla muestra los hogares clasificados según sus ingresos familiares, tenencia de auto y
tenencia de casa propia.

Hogares con ingresos de $1000 o menos Hogares con ingresos de más de $1000
Con casa propia Sin casa propia Con casa propia Sin casa propia
Con auto 37 14 37 8
Sin auto 48 40 49 15

Si elegimos un hogar encuestado al azar de esta ciudad, calcule la probabilidad de que:


a. tenga casa propia. Rpta: 171/248
b. tenga un ingreso mayor a $1000. Rpta: 109/248
c. tenga un ingreso máximo de $1000 y tenga auto. Rpta: 51/248
d. tenga casa propia o no tenga auto. Rpta: 226/248
e. tenga un ingreso máximo de $1000 y que no tenga casa propia. Rpta: 54/248

5. La compañía de investigación de mercado “Seria Opinión”, realiza un estudio para evaluar la


aceptación de un nuevo producto que se desea lanzar al mercado. Por estudios previos en pro-
ductos similares, se pronostica una probabilidad del 78% de que el producto resulte exitoso.
Capítulo 3. Probabilidades 149

Sin embargo, se ha comprobado que sólo el 65% de los productos que se pronosticaban como
exitosos lo fueron efectivamente, y que de los productos pronosticados como no exitosos por
las encuestas, el 13% resultaron siendo exitosos.

a. ¿Cuál es la probabilidad de que el producto resulte realmente exitoso en el mercado?


Rpta: 0,5356
b. Si el producto no ha resultado exitoso. ¿cuál es la probabilidad de que se haya pronosticado
como tal? Rpta: 0,4121

6. En una empresa el 25% son mujeres y el 75% son hombres. Un día ha llegado tarde a trabajar el
3% de las mujeres y el 5% de los hombres. Si se elige, al azar, a un trabajador que ha llegado
tarde, calcule la probabilidad de que sea elegida una mujer. Rpta: 0,1667

7. Una encuesta realizada en universidades privadas entre alumnos de maestría presenta los re-
sultados que se muestran en la siguiente tabla:

Principal motivo para solicitar ingreso a universidad


Modalidad de
Total
estudio
Calidad de la universidad Costo o comodidad Otros

Tiempo completo 421 393 76 890


Tiempo parcial 400 593 46 1039
Total 821 986 122 1929

Se elige al azar un alumno de maestría en una universidad privada, determine:

a. ¿Cuál es la probabilidad de que sea de tiempo parcial y haya solicitado su ingreso conside-
rando la calidad de la universidad?
b. Si el alumno es de tiempo completo, ¿cuál es la probabilidad de que la calidad de la institu-
ción no sea el motivo principal para elegirla?
c. Sean los eventos: A = Alumno es de tiempo completo, B = El costo o comodidad es el prin-
cipal motivo de elección. ¿Son independientes los eventos A y B?

8. Se han llevado a cabo numerosos estudios de la planeación de los consumidores para la com-
pra de bienes duraderos como televisores, refrigeradores, lavadoras, estufas, y automóviles. En
uno de estos estudios se le preguntó a 1000 individuos elegidos al azar si estaban planeando
comprar una nueva televisión en los siguientes 12 meses. Un año después se entrevistó a las
mismas personas para ver si realmente hicieron la compra. La respuesta a ambas entrevistas se
muestran en la siguiente tabla.

Planea comprar TV en los Finalmente compró Finalmente no compró


siguientes 12 meses una nueva TV una nueva TV
Sí 200 50
No 100 650

Si de la muestra anterior se selecciona un individuo aleatoriamente:

a. ¿Cuál es la probabilidad de que en el último año haya planeado comprar o finalmente haya
comprado una nueva televisión?
b. Si el encuestado planeó comprar una nueva televisión, ¿cuál es la probabilidad de que fi-
nalmente haya comprado una?
150 Estadística Básica con Aplicaciones en Excel 2010

9. Debido al auge de la comunicación en línea, las empresas colocan cada vez más órdenes elec-
trónicas. Una empresa de estudios socioeconómicos ha recopilado información acerca de las
órdenes llenadas correctamente por cuatro tipos de empresas. Los resultados obtenidos se
muestran en la siguiente tabla:

Industria
Orden
Farmacéutica Consumo Computadoras Telecomunicaciones
Correcta 207 136 151 178
Incorrecta 3 4 9 12

Si elegimos al azar una empresa de los rubros mencionados.

a. ¿Cuál es la probabilidad de que se elija una empresa de consumo y haya solicitado su orden
de manera incorrecta? Rpta: 4/700
b. Si la empresa elegida es de telecomunicaciones, ¿cuál es la probabilidad de que la orden
haya sido llenada de manera correcta? Rpta: 178/190

10. Un joven estima, por experiencias pasadas, que en una gran fiesta la probabilidad de que en
una chica acepte bailar con él es del 4%. Si en una fiesta saca a bailar a 40 chicas. Asuma inde-
pendencia entre la decisión de una chica y otra. Calcule la probabilidad de que baile por lo me-
nos con una de ellas. Rpta: 0,8046

11. La investigación de mercados es el proceso de recopilación, procesamiento y análisis de infor-


mación, respecto a temas relacionados con el marketing, como: clientes, competidores y mer-
cado. En una compañía hay dos bases de datos sobre clientes, en la primera el 4,1% de los da-
tos están equivocados, mientras que en la segunda el 3,4% de los datos están equivocados. De
la primera base de datos, se saca el 75% de los datos de los clientes y el 25% restante viene de
la segunda. Si se elige un cliente al azar y sus datos están equivocados, calcule la probabilidad
de que provengan de la segunda base de datos. Rpta: 0,2166

12. Una empresa necesita aportaciones de sus socios para dos proyectos. La probabilidad de que
sus socios aporten para el proyecto de pago anticipado de deuda es 0,3 y que aporten para el
proyecto de expansión de la capacidad productiva es de 0,6; la probabilidad de que aporten
para ambos proyectos es de 0,08.

a. ¿Cuál es la probabilidad de que los socios solamente aporten para uno de los proyectos?
Rpta: 0,74
b. ¿Cuál es la probabilidad de que los socios aporten para la expansión, si no aportaron para el
pago anticipado de deuda? Rpta: 0,7429
Capítulo 4. Variable aleatoria y distribución de probabilidad 151

Capítulo 4. Variable aleatoria y distribución de


probabilidad
Variable aleatoria

Sea  un experimento aleatorio y  el espacio muestral asociado. Una variable aleatoria asocia un
valor numérico a cada uno de los resultados experimentales. El valor numérico de la variable alea-
toria depende del resultado del experimento.

Las variables aleatorias se designan por letras mayúsculas (X, Y, Z, etc.), y a sus valores por letras
latinas minúsculas.

Variable aletoria
Una variable aleatoria es una descripción numérica
del resultado de un experimento.

Rango o recorrido de una variable aleatoria


Se denomina así al conjunto de valores posibles que puede asumir la variable aleatoria X. Se
denota por RX.

Discreta Continua

Si el rango está determinado por un conjunto Si el rango está determinado por un conjunto
finito o infinito numerable de valores. infinito no numerable de valores.

Ejemplo de variable aleatoria discreta


Sea el experimento aleatorio  consistente en lanzar dos monedas, entonces este experimento
determina el espacio muestral Ω = {C1C2, C1S2, S1C2, S1S2}.
Si se define la variable aleatoria X como número de caras obtenidas, entonces el rango o recorrido
es RX = {0, 1, 2}

Ejemplo de variable aleatoria continua


Sea el experimento aleatorio  consistente en registrar el tiempo en que se mete el primer gol de
un partido de fútbol durante los 90 minutos de juego,   x  / 0  x  90 . Si se define la varia-
ble aleatoria X como el tiempo registrado, entonces el rango o recorrido es RX  x  / 0  x  90.
152 Estadística Básica con Aplicaciones en Excel 2010

Variable aleatoria discreta


Una variable aleatoria es discreta si el conjunto de valores que puede tomar es finito o infinito nu-
merable.

Una variable aleatoria discreta asume cada uno de los valores con cierta probabilidad que se deno-
ta por P(X = x)

Distribución de probabilidad de una variable aleatoria discreta


La distribución de probabilidad de una variable aleatoria discreta X se describe como una función
de probabilidad representada por f(x) que asigna a cada valor de la variable aleatoria, la probabili-
dad de que X asuma ese valor, esto es:

f(x) = P(X = x)

Toda función de probabilidad debe cumplir que:


 f(x)  0
n
  f x   1
i 1
i

Ejemplo 34

Sea el experimento aleatorio  : lanzar una moneda dos veces.


El espacio muestra es Ω = {C1C2, C1S2, S1C2, S1S2} y n(Ω) = 4
Sea la variable aleatoria X: número de caras obtenidas, entonces el rango de X es RX = {0, 1, 2}

Donde:

La probabilidad de no obtener cara: f(0) = P(X = 0) = ¼ = 0,25

La probabilidad de obtener una cara: f(1) = P(X = 1) = ¼ + ¼ = 2/4 = 0,50

La probabilidad de obtener dos caras: f(2) = P(X = 2) = ¼ = 0,25

La tabla de función de probabilidad sería:

x 0 1 2
f(x) = P(X = x) 0,25 0,50 0,25

Esta tabla cumple con las siguientes condiciones:

 f(x)  0  cada probabilidad es positiva y mayor o igual que cero


n
  f x   1 
i 1
i la suma de todas las probabilidades es igual a uno
Capítulo 4. Variable aleatoria y distribución de probabilidad 153

Ejemplo 35

La distribución de probabilidad de la variable aleatoria X definida como número de defectos por


cada 10 metros de una tela sintética en rollos continuos de ancho uniforme, es:

x 0 1 2 3 4
f(x) = P(X = x) 0,41 0,37 k 0,05 0,01

a. Determine la constante k.
b. Calcule las siguientes probabilidades: P(X > 3), P(X > 1 / X < 3) y P(1 < X  4)

Solución
4
a. Para hallar la constante k, usamos la condición que  f x   1
i 1
i

 f x   f 0  f 1  f 2  f 3  f 4  1 , por lo tanto k = 0,16


i 0
i

b. Calcule las siguientes probabilidades:

PX  3  f 4   0,01
P  X  2 f 2 0,16
PX  1 X  3     0,1702
P X  3) f 0  f 1  f 2  f 3 0,41  0,37  0,16
P1  X  4  f 2  f 3  f 4  0,16  0,05  0,01  0,22

Ejercicio 53
La solicitud de préstamo que presentan los clientes de un banco está compuesta por cinco rubros.
El gerente de préstamos desea realizar un estudio sobre la distribución de la cantidad de rubros
rechazados por cada solicitud. La siguiente tabla muestra la distribución de probabilidad de la va-
riable aleatoria X definida como el número de rubros rechazados por solicitud.

X=x 0 1 2 3 4 5
f x   P  X  x  0,79 2k k 0,03 0,02 0,01

a. Determine la constante k y grafique la función f(x)


Si se elige una solicitud al azar:
b. Calcule la probabilidad de que tengan dos rubros rechazados.
c. Calcule la probabilidad de que tenga más de un rubro rechazado.
d. Calcule la probabilidad de que tenga menos de tres rubros rechazados.
e. Calcule la probabilidad de que tenga más de uno pero menos de cuatro rubros rechazados.

Solución
4
a. Para hallar la constante k, usamos la condición que  f x   ........., por lo tanto, k =……………
i 1
i

Remplazando tenemos:
X=x 0 1 2 3 4 5
f x   P  X  x  0,79 0,03 0,02 0,01
154 Estadística Básica con Aplicaciones en Excel 2010

1.2
1.0
0.8

f(x)
0.6
0.4
0.2
0.0
0 1 2 3 4 5
X

Si se elige una solicitud al azar:

b. Calcule la probabilidad de que tenga dos rubros rechazados.

P.......................  ..................................................................................

c. Calcule la probabilidad de que tenga más de un rubro rechazado.

P.......................  ..................................................................................

d. Calcule la probabilidad de que tenga menos de tres rubros rechazados.

P.......................  ..................................................................................

e. Calcule la probabilidad de que tenga más de uno pero menos de cuatro rubros rechazados.

P.......................  ..................................................................................

Valor esperado de una variable aleatoria discreta


El valor esperado o esperanza matemática de una variable aleatoria X o media de una distribución
de probabilidad de X se denota E(X).

n
 X  E  X    xi f xi   x1 f x1  x2 f x2   ...  xn f xn 
i 1

Propiedades del valor esperado


Sean a, b y k constantes numéricas y X una variable aleatoria, entonces:

 E(k) = k
 E(aX+b) = aE(X)+b
Capítulo 4. Variable aleatoria y distribución de probabilidad 155

Varianza de una variable aleatoria discreta


La varianza V(X) de una variable aleatoria discreta X con distribución de probabilidad f(x) se calcula
por:

 
V X   E X 2  E X 2
 La varianza de la variable aleatoria X, V(X), también se denota por  X2 , o simplemente como  2 .

Propiedades de la varianza
Sean a, b y k constantes numéricas y X una variable aleatoria, entonces:

 V(k) = 0
 V(aX+b) = a2V(X)

Desviación estándar
Se denota por  o DE(X). Sea X una variable aleatoria discreta con función de probabilidad f(x). La
desviación estándar de X es dada por la siguiente expresión:

  V( X )

Ejemplo 36

Uno de los mayores errores cometidos por la mayoría de las empresas es la ausencia de planifica-
ción. Los negocios han de tener en cuenta que abrir un perfil en las redes sociales no significa ha-
blar solo de la empresa o de sus productos y/o servicios sino que es vital la elaboración de una es-
trategia adecuada a las necesidades y en la que se determine el público al que se quiere llegar me-
diante estos medios. En el siguiente gráfico se muestra la distribución de la variable aleatoria X,
definida como número de veces que la empresa actualiza su perfil a la semana.

Distribución de probabilidad del número de veces que actualiza su


perfil a la semana
0.30
6k
0.25 0,20
Probabilidad

0.20 0,16
0,14
0.15 0,12
0,10
0.10
k
0.05
0.00
1 2 3 4 5 6 7
Número de veces que actualiza su perfil
156 Estadística Básica con Aplicaciones en Excel 2010

a. En base a la información mostrada en el gráfico, obtenga el valor de la constante k y complete la


tabla de distribución de probabilidades:

4
Para hallar la constante k, usamos la condición que  f x   1 , por lo tanto, k =0,04
i 1
i

Remplazando tenemos:

X = veces que actualiza su perfil a la semana 1 2 3 4 5 6 7


f x   P  X  x  0,04 0,12 0,2 0,24 0,14 0,16 0,10

b. Calcule las veces que se espera que las empresas actualicen su perfil a la semana. Interprete

E X   1  0,04  2  0,12  ...  7  0,10  4,2 veces por semana

Si el experimento se repitiera muchas veces, a la larga las veces que se espera que las empresas
actualicen su perfil a la semana es de 4,2 veces.

Ejemplo 37

Según un reporte histórico de ventas de la empresa Kallpa, se ha podido determinar que el número
de días transcurrido hasta la venta de un auto presenta la siguiente distribución de probabilidades:

X = número de días hasta la venta 2 3 4 5 6 7


f x   P  X  x  0,1 0,2 0,4 0,15 0,1 0,05

Cada auto vendido, le reporta a la empresa una ganancia fija de $800; sin embargo, si el tiempo
para la venta es menos de cuatro días gana adicionalmente $120, pero si el tiempo para la venta
está entre 4 y 5 días gana adicionalmente $80, en otro caso no obtiene ganancia adicional.

a. Determine el tiempo esperado para la venta de un auto y su desviación estándar.

E X   2  0,13 0,2  4  0,4  5 0,15  6  0,1  7  0,05  4,1 días


 
E X 2  22  0,1  32  0,2  42  0,4  52  0,15  62  0,1  72  0,05  18,4
Luego, calculamos la varianza V X   18,4  4,12  1,59 días2 siendo el valor de la desviación es-
tándar   1,59  1,26 días.

b. Calcule la ganancia que espera obtener la empresa.

G = ganancia en dólares 800 880 920


f(G) = Probabilidad 0,15 0,55 0,30

E(G) = 800 x 0,15 + 880 x 0,55 + 920 x 0,30 = $880


Capítulo 4. Variable aleatoria y distribución de probabilidad 157

Ejercicio 54
La demanda diaria de un producto es una variable aleatoria X cuya distribución probabilidades está
dada por la siguiente tabla:

x 1 2 3 4 5
f(x) 1/16 4/16 6/16 4/16 1/16

La empresa obtiene por cada unidad demandada de producto 100 nuevos soles de utilidad. Si la
cantidad demanda en un día es mayor a dos unidades, se obtiene una utilidad adicional de 15 nue-
vos soles por unidad demandada de producto. Calcule el valor esperado de la utilidad por la de-
manda diaria de productos.

Solución
Completamos la tabla calculando primero la utilidad:

Utilidad (U) f(U) U x f(U)

Esperado de la utilidad E(U)

Por lo tanto, el valor esperado de la utilidad por la demanda diaria de productos es………………...

Ejercicio 55

La siguiente tabla muestra la distribución de probabilidad de la variable aleatoria X: Número de


cuentas de correo que tiene un estudiante universitario.

X:= número de cuentas de correo 1 2 3 4


Probabilidad f(x) 2k + 0,03 0,30 0,40 k

a. Determine el valor de k para que f(x) sea función de probabilidad


158 Estadística Básica con Aplicaciones en Excel 2010

b. Obtenga la probabilidad de que un estudiante universitario tenga al menos uno pero menos de
cuatro cuentas de correo.

c. Determine e interprete el valor esperado del número de cuentas de correo.

d. Si por cada cuenta de correo le demanda al alumno 15 minutos diarios revisar cada cuenta
¿cuántos minutos esperaría un estudiante dedicar a sus cuentas de correo diariamente?

Ejercicios

1. El número de días necesario para que un obrero procese cierta pieza se modela con una varia-
ble aleatoria X con la siguiente función de probabilidad:

X:= número de días 2 3 4 5 6 7


f(x) 0,1 0,1 0,3 0,2 0,2 0,1

a. Calcule el tiempo medio de procesamiento de una pieza y la varianza. Rpta: 4,6 y 2,04
b. Para cada pieza procesada el obrero gana una cantidad fija de S/.5, pero si utiliza menos de
seis minutos gana S/.1,20 por cada minuto ahorrado. Determinar la media y la varianza de
la variable aleatoria ganancia obtenida por pieza ensamblada. Rpta: 6,8 y 2,38

2. La siguiente tabla muestra la distribución de probabilidad de la variable aleatoria X:= número


de papeletas impuestas a un taxista por exceso de velocidad en las zonas restringidas de una
ciudad durante el último año.

X:= número de papeletas 0 1 2 3 4


Probabilidad f(x) 0,40 b 2b 0,07 0,08
Capítulo 4. Variable aleatoria y distribución de probabilidad 159

a. Determine el valor de b para que f(x) sea función de probabilidad. Rpta: 0,15
b. Calcule la probabilidad que un taxista tenga por lo menos una pero menos de cuatro pape-
letas por exceso de velocidad. Rpta: 0,52
c. Si el costo de una papeleta por exceso de velocidad es de 430 nuevos soles, calcule el valor
esperado que paga un taxista por este tipo de papeletas durante el último año.
Rpta: 550,40 nuevos soles
d. Si a la municipalidad le genera una utilidad por papeleta impuesta por exceso de velocidad
con la siguiente función U(x)  150 x  20x . Obtenga la utilidad que espera tener la muni-
2

cipalidad por taxista. Rpta: 126,80 nuevos soles

3. La siguiente tabla muestra la distribución de probabilidad de la variable aleatoria X: Número de


cuentas de correo que tiene un estudiante universitario.

X:= número de cuentas de correo 1 2 3 4


Probabilidad f(x) 2k+0,03 0,30 0,40 k

a. Determine el valor de k para que f(x) sea función de probabilidad


Rpta: 0,09
b. Obtenga la probabilidad que un estudiante universitario tenga al menos uno pero menos
de cuatro cuentas de correo.
Rpta: 0,91
c. Determine e interprete el valor esperado del número de cuentas de correo.
Rpta: 2,37 cuentas
d. Si por cada cuenta de correo le demanda al alumno15 minutos diarios revisar cada cuenta
¿cuántos minutos espera un estudiante dedicar a sus cuentas de correo diariamente?
Rpta: 35,55 min.

4. Uno de los mayores errores cometidos por la mayoría de las empresas es la ausencia de planifi-
cación. Los negocios han de tener en cuenta que abrir un perfil en las redes sociales no significa
hablar solo de la empresa o de sus productos y/o servicios sino que es vital la elaboración de
una estrategia adecuada a las necesidades y en la que se determine el público al que se quiere
llegar mediante estos medios. En el siguiente gráfico se muestra la distribución de la variable
aleatoria X: Número de veces que la empresa actualiza su perfil a la semana.

Distribución de probabilidad del número de


veces que actualiza su perfil a la semana
0.30 6k
0.25 0.2
Probabilidad

0.20 0.16
0.14
0.15 0.12
0.1
0.10 k
0.05
0.00
1 2 3 4 5 6 7

Número de veces que actualiza su perfil

a. Si seleccionamos una empresa al azar, calcule la P(X  2 / X < 6) Rpta: 0,9459


160 Estadística Básica con Aplicaciones en Excel 2010

b. Si el coeficiente de variación de la variable aleatoria X es mayor o igual al 15% entonces la


distribución de probabilidades es heterogénea. ¿Esta distribución es heterogénea?
Rpta: 38,97%
c. Si cada actualización de perfil demora 35 minutos, calcule el tiempo que se espera dedicar a
la actualización del perfil a la semana. Rpta: 147 min.

5. La solicitud de préstamo que presentan los clientes de un banco puede ser aceptada o negada
por el gerente de préstamos. Se desea realizar un estudio sobre la distribución de la cantidad
de solicitudes aceptadas por el gerente de préstamos. La siguiente tabla muestra la distribu-
ción de probabilidad de la variable aleatoria X: Número de solicitudes aceptadas por día por el
gerente de préstamos.

X:=número de solicitudes aceptadas por día 0 1 2 3 4 5


Probabilidad f(x) 0,05 0,15 0,05 2k 0,15 k

a. Determine el valor de k para que f(x) sea función de probabilidad. Rpta: 0,20
b. Si se sabe que el gerente puede aceptar al menos una solicitud al día, ¿cuál sería la probabi-
lidad que tenga que aceptar a lo más cuatro solicitudes al día? Rpta: 0,79
c. Determine e interprete el valor esperado de la variable X. Rpta: 3,05 solicitudes
d. Calcule el coeficiente de variación de X. Rpta: CV(X)= 46,91%
Capítulo 4. Variable aleatoria y distribución de probabilidad 161

Variable aleatoria continua

Función de densidad de probabilidad

Es la función que cumple las siguientes condiciones:

i. f(x)  0, para todo x de RX

ii.  f (x)dx  1
RX

Esta función no asigna probabilidades en un punto como si lo hace la función de probabilidad de


una variable aleatoria discreta. Para determinar probabilidades en un intervalo [a, b] contenido en
el rango de X se usa:
b
P a  X  b  f (x)dx

a

Valor esperado de una variable aleatoria continua

El valor esperado de una variable aleatoria continua definida en RX está dado por:

E  X   x f x dx

RX

Varianza de una variable aleatoria continua


La varianza para una variable aleatoria continua definida en RX está dada por:

    
V X   E X 2  E X 2 , donde E X 2  x 2 f ( x ) dx
RX
162 Estadística Básica con Aplicaciones en Excel 2010

Distribuciones discretas especiales

Distribución binomial

Un experimento binomial consiste en una serie de n


pruebas o ensayos, donde n se fija antes de realizar el
experimento.

Las pruebas son


Las pruebas son idénticas y
independientes entre sí por lo
cada una de ellos puede La probabilidad de éxito es
que el resultado de un
resultar en uno de dos constante de una prueba a
intento en particular no
posibles resultados que otra y la denotamos como p.
influye en el resultado de
denotan éxito o fracaso.
cualquier otro.

Entonces, si se tiene un experimento binomial con n intentos y la probabilidad p de éxito en cual-


quier intento, la probabilidad de tener x éxitos en los n intentos está dada por:

f x   PX  x   C xn px 1  pn x x = 0, 1, 2,... , n

Se dice que la variable aleatoria X sigue una distribución binomial con parámetros n y p
Se denota X ~ B (n, p)

Características
Es simétrica si p = 0,5. Para valores de p < 0,5 la distribución tiene sesgo derecho y para valores
p>0,5 tiene sesgo izquierdo, independientemente de los valores de n.
Para valores de n suficientemente grandes (n > 50), y sólo tomando en cuenta los valores rele-
vantes de probabilidad, la distribución es prácticamente simétrica.
El esperado de una variable binomial es   E X   np
La varianza de una variable binomial es  2  V X   np1  p
Capítulo 4. Variable aleatoria y distribución de probabilidad 163

Distribución binomial en Excel


En Excel 2010, use la función =DISTR.BINOM.N(Núm_éxito, Ensayos, Prob_éxito, acumulado)

Ejemplo 38

La probabilidad de obtener éxito en un negocio de exportación de productos naturales es igual a


0,4. Un empresario está interesado en invertir en cinco sucursales de este rubro de manera inde-
pendiente.

a. Defina la variable, su distribución y rango o recorrido.


b. ¿Cuál es la probabilidad que el empresario tenga éxito en al menos una sucursal?
c. Determine el número esperado de sucursales en el que tendrá éxito.
d. Determine la probabilidad de que no tenga éxito en al menos cuatro sucursales.

Solución

a. Defina la variable, su distribución, parámetros y rango o recorrido.


Definamos la variable aleatoria X = Número de sucursales con éxito.
Su distribución y parámetros: X  B (n = 5, p = 0,4)
Rango o recorrido: RX = {0, 1, 2, 3, 4, 5}

b. ¿Cuál es la probabilidad que el empresario tenga éxito en al menos una sucursal?

En Excel 2010, use la función =DISTR.BINOM.N(Núm_éxito, Ensayos, Prob_éxito, acumulado)


En la ventana que aparece realice lo siguiente:

 Núm_éxito: digite o haga clic a la celda que contiene el menor valor del rango de la variable,
en este caso A5
 Ensayos: se refiere al tamaño de muestra. Digite 5 o haga clic a la celda B2. Presione F4 para
fijar la celda.
 Prob_éxito: se refiere a la probabilidad de éxito. Digite 0.4 o haga clic a la celda B1. Presione
F4 para fijar la celda.
 Acumulado: Como vamos a obtener la tabla de función de probabilidad digitamos el valor 0.
Colocamos el valor cero porque lo que se va a obtener son probabilidades puntuales.

Finalmente, compruebe que la suma de las probabilidades debe darle uno. Con esta tabla esta-
remos listos para obtener cualquier valor de probabilidad.
164 Estadística Básica con Aplicaciones en Excel 2010

La probabilidad solicitada será:

PX  1  0,2592 0,3456 0,2304 0,0768 0,0102 0,9222

c. Determine el número esperado de sucursales en el que tendrá éxito.


E X   n  p  5 0,4  2

d. Determine la probabilidad de que no tenga éxito en al menos cuatro sucursales.


Debemos observar que en esta pregunta la variable ha cambiado, ahora estamos interesados en
las que no tienen éxitos; por lo tanto, ha cambiado también la probabilidad de éxito.

Realice los pasos mostrados en la pregunta a. para dar respuesta a la pregunta.

Definamos la variable aleatoria Y= Número de sucursales sin éxito.


Su distribución y parámetros: Y  B (n = 5, p = 0,6)
Rango o recorrido: Ry ={0, 1, 2, 3, 4, 5}

La probabilidad solicitada será: PY  4  0,33696

Ejercicio 56
Una empresa especializada en proyectos de inversión tiene en cartera 10 proyectos elaborados y
expeditos para ser sometidos a la evaluación de concursos de licitación pública estatal. De acuerdo
con su experiencia, el gerente de la empresa sabe que el 20% de los proyectos ganan la buena pro.
Suponga que en un concurso de licitación pública se presentan estos diez proyectos.

a. Calcule la probabilidad de que dos proyectos ganen la licitación.

b. Calcule la probabilidad de que por lo menos ocho proyectos ganen la licitación.

c. Calcule la probabilidad de que a lo más cuatro proyectos ganen la licitación.

d. Calcule la probabilidad de que más de tres pero como máximo 7 proyectos ganen la licitación.
Capítulo 4. Variable aleatoria y distribución de probabilidad 165

Solución

La variable en estudio es ………………….……………………………………………………..

Sus parámetros son: n = ………………………..………. y p = …………………….…………..

El rango de la variable X es ………………………………………………………………..……

En Excel 2010, use la función =DISTR.BINOM.N(…………, …………, ……..…, …….…)

a. Calcule la probabilidad de que dos proyectos ganen la licitación.

La probabilidad pedida es: …………………........ cuyo valor es: ………..…………………

b. Calcule la probabilidad de que por lo menos ocho proyectos ganen la licitación.

La probabilidad pedida es: …………………........ cuyo valor es: ………..…………………

c. Calcule la probabilidad de que a lo más cuatro proyectos ganen la licitación.

La probabilidad pedida es: …………………........ cuyo valor es: ………..…………………

d. Calcule la probabilidad de que más de tres pero como máximo siete proyectos ganen la licita-
ción.

La probabilidad pedida es: …………………........ cuyo valor es: ………..…………………


166 Estadística Básica con Aplicaciones en Excel 2010

Distribución hipergeométrica

El experimento
Como en el caso de la hipergeométrico consiste en
Consideremos N elementos,
distribución binomial se desea extraer al azar y sin reemplazo
de los cuales r son
calcular la probabilidad de n elementos de un conjunto
considerados éxitos y por lo
obtener x éxitos en una de N elementos, r de los cuales
tanto N - r como fracasos.
muestra de n elementos. son éxitos y (N - r )son
fracasos.

La probabilidad de obtener de x éxitos en la muestra de n elementos es:


C xr C nNxr
f x   , x = máximo{0, n+r- N},…,mínimo{n, r}
C nN

0.50

0.40

0.30
f(x)

0.20

0.10

0.00
0 1 2 3 4 5
X

Se dice que la variable X sigue una distribución hipergeométrica con parámetros N, r y n.


Se denota X ~ H (N, n, r)

Características
r
El esperado de una variable hipergeométrica es   E  X   n
N
r r  N  n 
La varianza de una variable hipergeométrica es  2  V  X   n  1   
N  N  N  1 
Capítulo 4. Variable aleatoria y distribución de probabilidad 167

Distribución hipergeométrica en Excel

En Excel 2010, use la función =DISTR.HIPERGEOM.N(Muestra_éxito, Núm_de_muestra, Pobla-


ción_éxito,Núm_de_población, Acumulado)

Ejemplo 39

La SUNAT tiene en su almacén diversos artículos producto de la incautación por evasión tributaria.
Entre los productos incautados se encuentran 11 camionetas, de las cuales cinco son de marca ja-
ponesa y el resto de procedencia china. Si el encargado selecciona al azar siete camionetas para un
remate,
a. Determine la probabilidad de que se encuentren a lo más tres camionetas de procedencia chi-
na.
b. Determine la probabilidad de que se encuentren más de tres camionetas de procedencia china.
c. Determine la probabilidad de que se encuentren más de tres pero como máximo cinco camio-
netas de procedencia china.

Solución

Definimos la variable aleatoria X: número de camionetas de procedencia china.


Su distribución y parámetros: X  H (N = 11, n = 7, r = 6)
Rango o recorrido: RX = máximo{0, 7+6-11},…, mínimo{7, 6}, luego RX ={ 2, 3, 4, 5, 6}

En Excel 2010, use la función =DISTR.HIPERGEOM.N(Muestra_éxito, Núm_de_muestra, Pobla-


ción_éxito, Núm_de_población, acumulado)

En la ventana que aparece realice lo siguiente:

 Muestra_éxito: digite o haga clic a la celda que contiene el menor valor del rango de la variable.
En este caso la celda A6 contiene al menor valor del rango de la variable.

 Núm_de_muestra: se refiere al tamaño de muestra. Digite 7 o haga clic a la celda B2. Presione
F4 para fijar la celda.

 Población_éxito: se refiere al número de éxitos en la población. Digite 6 o haga clic a la celda B3.
Presione F4 para fijar la celda.

 Núm_de_población: se refiere al tamaño de la población. Digite 11 o haga clic a la celda B1.


Presione F4 para fijar la celda.

 Acumulado: Como vamos a obtener la tabla de función de probabilidad digitamos el valor 0.


Colocamos el valor cero porque lo que vamos a obtener son probabilidades puntuales.
168 Estadística Básica con Aplicaciones en Excel 2010

Finalmente, compruebe que la suma de las probabilidades debe darle uno. Con esta tabla estare-
mos listos para obtener cualquier valor de probabilidad.

a. Determine la probabilidad de que se encuentren a lo más tres camionetas de procedencia chi-


na.
PX  3  P(X  2)  P(X  3)  0,3485

b. Determine la probabilidad de que se encuentren más de tres camionetas de procedencia china.

PX  3  P(X  4)  P(X  5)  P(X  6)  0,6515

c. Determine la probabilidad de que se encuentren más de tres pero como máximo cinco camio-
netas de procedencia china.
P3  X  5  P(X  4)  P(X  5)  0,6364
Capítulo 4. Variable aleatoria y distribución de probabilidad 169

Ejercicio 57
Una florería tiene 10 vehículos de reparto que se utilizan principalmente para llevar flores y arre-
glos florales en la ciudad. Suponga que dos de los 10 camiones tienen problemas con los frenos. Si
se seleccionan al azar cuatro vehículos al azar para probarlos, ¿cuál es la probabilidad de que dos
de los camiones probados no tengan frenos defectuosos?

Solución

La variable en estudio es ………………………….…………………………………………………………………………….….……..

Sus parámetros son: N = ………………. , n = …………………. y r = ………………………..

El rango de la variable X es ………………………………………………………………………

En Excel 2010, use la función =DISTR.HIPERGEOM.N(………., ………., ………., ………., )

La probabilidad pedida es: …………………........ cuyo valor es: ……………………………


170 Estadística Básica con Aplicaciones en Excel 2010

Distribución de Poisson

El experimento que origina una variable aleatoria que sigue una distribución de
Poisson se denomina proceso de Poisson y posee las siguientes propiedades:

La probabilidad de que
ocurra un solo resultado
El número de resultados
durante el intervalo muy
que ocurre en un intervalo o La probabilidad de que
corto o región muy pequeña
región de espacio ocurra más de un resultado
es proporcional a la longitud
cualquiera es independiente en tal intervalo corto o caiga
del intervalo o al tamaño de
del número que ocurre en en tal región pequeña es
la región y no depende del
cualquier otro intervalo o insignificante.
número de resultados que
región del espacio disjunto.
ocurren fuera del intervalo
o región.

La probabilidad de tener x resultados en un intervalo dado o en una región específica es:

e  x
f ( x)  , donde RX = 0, 1, 2, 3,…
x!

x = número de éxitos por unidad de tiempo o región.


 = número esperado de éxitos por unidad de tiempo o región o razón promedio de ocurrencia.
t = periodo de evaluación
e = 2,71828…

0.16
0.14
0.12
0.10
f(x)

0.08
0.06
0.04
0.02
0.00
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
X

Se dice que la variable aleatoria X sigue una distribución de Poisson con parámetro 
Se denota X ~ P()
Siempre es una distribución sesgada a la derecha. A medida que  aumenta y tomando en
cuenta sólo los valores relevantes de probabilidad, la distribución tiende a hacerse simétrica.
Capítulo 4. Variable aleatoria y distribución de probabilidad 171

El esperado de una variable Poisson es   E X   t


La varianza de una variable Poisson es  2  V X   t

Distribución de Poisson en Excel

En Excel 2010, use la función =POISSON.DIST(x, media, acumulado)

Ejemplo 40
Entre las 10:00 am. y 11:00 am. en promedio ocho personas hacen uso de un cajero automático,
ubicado al lado de la puerta de entrada de un banco. Asimismo, el número de clientes que ingresan
al banco entre las 10:00 am. y 11:00 am. en promedio es 15 clientes. Considere que el número de
clientes que hacen uso del cajero es independiente del número de clientes que ingresan al banco y
ambos siguen un proceso de Poisson.
a. ¿Cuál es la probabilidad de que menos de 10 pero más de 8 usen el cajero en ese horario?
b. ¿Cuál es la probabilidad de que entre las 10:00 am y las 10:30 am, ingresen al banco menos de
tres clientes?

Solución
a. Definamos la variable aleatoria X = Número de clientes que hacen uso del cajero entre las 10 y
11 am. X  P( = 8)

En Excel 2010, use la función =POISSON.DIST(x, 8, 0)

La probabilidad pedida es P(8 < X < 10) = P(X = 9) = 0,1241

b. Definamos la variable aleatoria:

X = Número de clientes que ingresan al banco entre las 10 y 10:30 am. X  P( = 7,5)

En Excel 2010, use la función =POISSON.DIST(x, 7.5, 0)

La probabilidad pedida es: P(X < 3) = 0,0203

Ejercicio 58
El número de barcos que llegan a un puerto cada semana (siete días) es una variable aleatoria que
tiene distribución de Poisson con media igual a 14 barcos. ¿Cuál es la probabilidad de que en tres
días lleguen más de dos barcos?

Solución
La variable en estudio es ……………………………………………………………….……..

La razón promedio es …………………………………………………………………………

El periodo de evaluación t = …………………………………………………………………..

Por lo tanto, la media es …………………………………………………………………..….


172 Estadística Básica con Aplicaciones en Excel 2010

En Excel 2010, use la función =POISSON.DIST(……..…………, …..…………., …..………….)

La probabilidad pedida es: …………………………………......... cuyo valor es: ……………………………………………

Ejercicio 59

El banco Credibank ha planificado abrir una agencia frente a una universidad. Asumiendo que lle-
gan a la agencia en promedio tres personas por minuto. Calcule la probabilidad de que en dos mi-
nutos lleguen como mínimo dos y como máximo cuatro personas a la agencia.

Solución

La variable en estudio es ……………………………………………………………………………………………….………….……..

La razón promedio es …………………………………………………………………………..……

El periodo de evaluación t = …………………………………………………………….………..

Por lo tanto, la media es ………………………………………………………………………..….

En Excel 2010, use la función =POISSON.DIST(……..…………, …..…………., …..………….)

La probabilidad pedida es: ………………………………….…........ cuyo valor es: …………………………………………

Ejercicios de aplicación

1. La empresa textil Pima sabe por experiencias previas que el porcentaje de pedidos que cumple
con la entrega en el plazo establecido con sus clientes del exterior es del 92%.
a. Si se eligen al azar cinco pedidos, calcule la probabilidad de tres pedidos se entreguen en el
plazo establecido. Rpta: 0,0498
b. Si se eligen al azar cinco pedidos, calcule la probabilidad de que por lo menos cuatro pedi-
dos no se entreguen en el plazo establecido. Rpta: 0,0002

2. Un fabricante de piezas garantiza que una caja de sus piezas contendrá como máximo un defec-
tuoso. Si la caja contiene 10 piezas, y la experiencia ha demostrado que ese proceso de fabrica-
ción produce 5% de piezas defectuosas, ¿cuál es la probabilidad de que una caja elegida al azar
satisfaga la garantía? Rpta: 0,9139

3. La empresa Copimix alquila máquinas fotocopiadoras usadas, debido a que tiene muchas solici-
tudes de sus clientes no se abastece a darle un mantenimiento efectivo, por lo que algunos de
sus clientes devuelven las fotocopiadoras por mal funcionamiento. Entre ocho fotocopiadoras
usadas que se suministraron, tres funcionan mal. Un cliente desea alquilar cuatro máquinas rá-
pidamente y se le envían sin verificarlas. Calcule la probabilidad que el cliente reciba, por lo
menos una de las máquinas que trabajan mal.

4. Los tipos de usuarios que frecuentan las redes sociales son:


 Los usuarios creadores, aquellos que crean blogs y comparten información
 Los usuarios críticos, que comentan en blogs y escriben opiniones.
Capítulo 4. Variable aleatoria y distribución de probabilidad 173

Si de un total de 14 usuarios, de los cuales 11 son creadores se seleccionan al azar a cinco


usuarios, ¿cuál es la probabilidad de encontrar por lo menos tres usuarios creadores?
Rpta: 0,9725

5. A una garita de peaje en promedio llegan 240 autos por hora según un proceso de Poisson. El
administrador de la garita ordena atender inicialmente solamente una caseta, pero si en el lap-
so de dos minutos llegan como mínimo 10 autos (considera que se produce una congestión),
entonces ordena inmediatamente atender en otra caseta más hasta que se produzca el des-
congestionamiento. ¿Cuál es la probabilidad que el administrador tenga que ordenar atender
en otra caseta?

6. La llegada de reclamos a una oficina reguladora sigue un proceso Poisson con media de dos
reclamos cada cuatro minutos.
a. Calcule la probabilidad que en un minuto se reciba 2 reclamos.
b. Determine la probabilidad que en 10 minutos se presenten por lo menos dos reclamos.
c. Calcule la probabilidad de que en 1 hora se reciba exactamente 28 reclamos.

7. Una florería tiene quince camiones de reparto que se utilizan principalmente para llevar flores y
arreglos en una ciudad. Supóngase que seis de los quince camiones tienen frenos defectuosos.
Se seleccionaron cinco camiones al azar para probarlos. ¿Cuál es la probabilidad que menos de
dos de los camiones probados tengan frenos defectuosos?

8. Al pintar planchas de acero con cierto tipo de pintura ocurren pequeños defectos que se distri-
buyen aleatoriamente en la superficie según una distribución de Poisson con un promedio de
2,5 defectos por cada 100 cm2. Calcule la probabilidad de que presente por lo menos dos defec-
tos en una plancha de acero de 20 cm2.

9. En un almacén de una empresa importadora de electrodomésticos se tienen 23 equipos de


sonido para su comercialización, 15 de estos equipos de sonido son de la marca Sonyc y el resto
son de la marca Power. El gerente de ventas de la empresa le ha encargado a uno de los em-
pleados que seleccione al azar 5 equipos de sonido para llevarlos a la tienda para la venta del
día. Calcule la probabilidad que el empleado lleve más de dos equipos de sonido de la marca
Power.

10. Una empresa especializada en proyectos de inversión tiene en cartera 10 proyectos elaborados
y expeditos para ser sometidos a la evaluación de concursos de licitación pública estatal. De
acuerdo con su experiencia, el gerente de la empresa sabe que el 20% de los proyectos ganan la
buena pro. Suponga que en un concurso de licitación pública se presentan estos diez proyectos.
Calcule la probabilidad de que dos o tres proyectos ganen la licitación.
174 Estadística Básica con Aplicaciones en Excel 2010

Distribuciones continuas especiales

Distribución de probabilidad uniforme

Función de densidad

 1
axb
f x    b  a
 0 en otro caso

Se dice que X tiene una distribución uniforme con parámetros a y b.

Se denota X ~ U (a, b)

Características
ab
Es simétrica respecto al eje X 
2
ab
El esperado de una variable uniforme es   E  X  
2
b  a2
La varianza de una variable uniforme es  2  V  X  
12
Capítulo 4. Variable aleatoria y distribución de probabilidad 175

Ejemplo 41

Las ventas semanales (en miles de nuevos soles) en un restaurante tiene distribución uniforme
entre 2,5 y 12,5

a. Si el restaurante necesita vender como mínimo 5000 nuevos soles para cubrir sus gastos, de-
termine la probabilidad de que en una semana cualquiera no pueda cubrir sus gastos.
b. ¿Cuál es la probabilidad de que en la siguiente semana las ventas se desvíen del promedio a lo
más en 800 nuevos soles?

Solución

Sea la variable aleatoria X = Las ventas semanales (en miles de nuevos soles) en un restaurante.
X ~ Ua  2,5 ; b  12,5

a. Si el restaurante necesita vender como mínimo 5000 nuevos soles para cubrir sus gastos, de-
termine la probabilidad de que en una semana cualquiera no pueda cubrir sus gastos.
2,5
La probabilidad pedida es P X  5   0,25
10,0

b. ¿Cuál es la probabilidad de que en la siguiente semana las ventas se desvíen del promedio a lo
más en 800 nuevos soles?
1,6
La probabilidad pedida es: P6,7  X  8,3   0,16
10,0

Ejercicio 60
La empresa Almacenes Unidos se encarga de la distribución de cierto producto a los supermercados
de Lima. El tiempo que transcurre entre la recepción del pedido y su entrega es una variable aleato-
ria que se distribuye uniformemente entre 18 y 36 minutos.

a. Determine la probabilidad de que el tiempo que transcurre entre la recepción del pedido y su
entrega sea a lo más en de media hora.
b. Determine la probabilidad de que el tiempo que transcurre entre la recepción del pedido y su
entrega esté comprendido entre 20 y 30 minutos.
c. Determine la probabilidad de que el tiempo que transcurre entre la recepción del pedido y su
entrega sea por más de 25 minutos.

Solución

La variable en estudio es ……………………………………………………………….…..…..

Sus parámetros son: a = ……………………..………. , b = ………………………………….


176 Estadística Básica con Aplicaciones en Excel 2010

a. Determine la probabilidad de que el tiempo que transcurre entre la recepción del pedido y su
entrega sea a lo más media hora.

La probabilidad pedida es …………………........ cuyo valor es ………………..……………

b. Determine la probabilidad de que el tiempo que transcurre entre la recepción del pedido y su
entrega esté comprendido entre 20 y 30 minutos.

La probabilidad pedida es …………………........ cuyo valor es ………………..……………

c. Determine la probabilidad de que el tiempo que transcurre entre la recepción del pedido y su
entrega sea por más de 25 minutos.

La probabilidad pedida es …………………........ cuyo valor es ………………..……………


Capítulo 4. Variable aleatoria y distribución de probabilidad 177

Distribución normal

Función de densidad

2
1  x  
1   
f x   e 2  
 2

Se dice que la variable aleatoria X sigue una distribución normal con parámetros media  y va-
rianza 2.
Se denota X  N (, 2)

Características
La función de densidad tiene forma de campana y es simétrica, por lo que las medidas de ten-
dencia central coinciden.
El rango de la variable normal es toda la recta real, esto es, de – a + .

Estandarización
Se toma como referencia una distribución normal estándar ( = 0 y 2 = 1). Se trabaja con la distan-
cia entre x y  en función de la desviación estándar, tal como se muestra.
X 
Z

178 Estadística Básica con Aplicaciones en Excel 2010

Distribución normal en Excel

En Excel 2010, use la función:

 P(X ≤ x)=DISTR.NORM.N(x, media, desviación estándar, acumulado)


 k =INV.NORM(α, media, desviación estándar), tal que P(X ≤ k) = α

Ejemplo 42

En un proceso fotográfico, el tiempo de revelado de las impresiones puede considerarse una varia-
ble aleatoria con distribución normal con media 16,28 segundos y desviación estándar de 0,12 se-
gundos.
a. Si se elige una impresión al azar, calcule la probabilidad de que el tiempo de revelado sea me-
nor de 16,55 segundos.
b. Calcule el tiempo máximo de impresión para ser considerada en el grupo del 10% con los me-
nores tiempos de revelados.

Solución
a. Sea la variable aleatoria X =tiempo de revelado de las impresiones (en segundos), entonces
X  N( = 16,28;  2 = 0,122)

En Excel 2010, use la función =DISTR.NORM.N(16,55, 16.28, 0.12, 1) = 0,9878

La probabilidad pedida es PX  16,55  0,9878

b. El tiempo máximo de impresión para ser considerada en el grupo del 10% con los menores
tiempos de revelados cumple que PX  k   0,10

En Excel 2010, use la función =INV.NORM(0,1, 16.28, 0.12); de donde, k = 16,13 segundos.

Ejercicio 61
El consumo mensual de energía eléctrica en KW de una ciudad tiene distribución normal con media
de 140 KW, con una desviación estándar de 20 KW.
a. ¿Cuál es la probabilidad que un hogar tenga un consumo menor de 150 KW?
b. ¿Qué porcentaje de hogares registran un consumo entre 115 y 160 KW?
c. Calcule el consumo mínimo de energía eléctrica para pertenecer al 15% de los mayores consu-
midores.

Solución

La variable en estudio es …...…………………………………………………………………….……..

Sus parámetros son:  = ……………………..………. y 2 = ………………………………..…….

a. La probabilidad pedida es …………………..……........ cuyo valor es …………….……

b. La probabilidad pedida es …………………..……........ cuyo valor es …………….……

c. El percentil a calcular es …………………..………...... cuyo valor es ……………………


Capítulo 4. Variable aleatoria y distribución de probabilidad 179

Función de probabilidad o
Distribución Rango E(X) V(X)
función de densidad

Binomial f x   C xn p x 1  pn x 0, 1, 2, . . ., n np np1  p

C xr C nNxr max{0, n  (N  r )} r r r  N  n 
Hipergeométrica f ( x)  n n  1   
C nN ,...,min{n, r } N N  N  N  1 

e   x    .t
Poisson f ( x)  0, 1, 2, 3, ...  2   .t
x!

Uniforme f x  
1
a≤x≤b
ab b  a 2
ba 2 12

2
1  x  
1   
Normal f x   e 2   Toda la recta real  2
 2
180 Estadística Básica con Aplicaciones en Excel 2010

Ejercicios de aplicación

1. La llegada de cada uno de los empleados a su centro de labores se produce independiente-


mente, de acuerdo con la distribución uniforme en el intervalo de 8:00 a 8:25 am.
a. Calcule la probabilidad de que un empleado llegue a su centro de labores después de las
8:17 am. Rpta: 8/25
b. Si le informan que un empleado llegó después de 8:17 am, calcule la probabilidad de que
haya llegado entre las 8:18 y las 8:20 am. Rpta: 2/8

2. La cantidad de productos (demanda diaria de cierto producto) que se vende en una distribui-
dora tiene distribución uniforme en el intervalo [5000, 8000]. Para la venta diaria esta distri-
buidora debe almacenar el producto al inicio del día. Determine la cantidad que se debe alma-
cenar de modo que el 1% de días esta distribuidora no pueda satisfacer la demanda.
Rpta: 7 970

3. Asuma que los ingresos mensuales, en nuevos soles, de los trabajadores del sector público
están distribuidos uniformemente con parámetros a y b. Si se sabe que el ingreso promedio
mensual es 1350 nuevos soles y la varianza es 3002 12 nuevos soles2.
a. Determine los parámetros de la distribución. Rpta: a = 1200, b = 1500
b. Calcule la probabilidad de que un trabajador elegido al azar tenga un ingreso mensual entre
1350 y 1520 nuevos soles. Rpta: 170/300

4. Actualmente se está realizando una auditoria a los dos bancos financieros que operan en una
ciudad norteña a los que llamaremos Alfa y Beta. Se ha determinado que el banco Alfa tiene el
65% de clientes y Beta el resto. Además, los depósitos bancarios de Alfa tienen distribución uni-
forme entre 1500 y 5000 dólares mensuales, mientras que los depósitos bancarios de Beta tie-
nen distribución normal con media de 3000 dólares y desviación estándar 1800 dólares por mes.
Si los auditores encargados tienen a disposición los depósitos bancarios de ambos bancos y eli-
gen uno al azar, determine:
a. La probabilidad de que dicho depósito exceda los 3500 dólares. Rpta: 0,4153
b. Si el depósito bancario elegido excede los 3500 dólares, determine la probabilidad de que
dicho depósito pertenezca al banco Beta. Rpta: 0,3292

5. Una máquina llena recipientes con determinado producto. Se sabe que la media y desviación
estándar para los pesos de llenado, de acuerdo con datos históricos, son 18,123 onzas y 0,6 on-
zas. El peso de llenado se modelo mediante una variable aleatoria normal.
a. Si se selecciona un recipiente al azar, ¿cuál es la probabilidad que su peso sea mayor a 16
onzas pero menor o igual que 20 onzas? Rpta: 0,9989
b. ¿Cuál es el peso máximo de un recipiente para estar considerado dentro del 25% de los re-
cipientes menos pesados? Rpta: 17,72 onzas

6. El salario semanal que percibe un trabajador de una empresa dedicada a la construcción civil se
distribuye normalmente con una media de 900 nuevos soles y desviación estándar de 100 nue-
vos soles.
a. ¿Cuál es la probabilidad de que un trabajador elegido al azar tenga un salario semanal me-
nor de 910 nuevos soles? Rpta: 0,5398
b. El 10% de los trabajadores de esta empresa son jefes de cuadrillas y son los mejores paga-
dos. ¿Cuál es salario mínimo de un jefe de cuadrilla? Rpta: 1028,16 nuevos soles
Capítulo 4. Variable aleatoria y distribución de probabilidad 181

7. Perubank, es una institución bancaria que proporciona una amplia gama de servicios financieros,
que comprende todo tipo de depósitos, prestamos, hipotecas, seguros, entre otros servicios de
inversión, todos dentro del marco de una estrategia única. Se ha determinado que un cliente de
Perubank con una buena historia crediticia tiene una deuda que se distribuye normalmente con
promedio de 15015 soles y una desviación estándar de 3540 soles.

a. Si se selecciona a un cliente con buena historia crediticia, ¿cuál es la probabilidad de que el


monto de su deuda se encuentre entre 12000 y 18000 soles? Rpta: 0,6033
b. La gerencia de Perubank ha determinado amonestar a los clientes que hayan alcanzado
deudas muy altas al final del mes. Determine el valor de la deuda mínima a partir del cual
se amoneste al 11% de los clientes con deudas muy altas. Rpta: 19357

8. Suponga que el tiempo utilizado en revisar sugerencias y comentarios de los clientes tiene dis-
tribución normal con media de 8,5 horas y una desviación estándar de 2,5 horas.

a. Calcule la probabilidad de que el tiempo sea mayor a 7,5 horas Rpta: 0,65542
b. Determine el tiempo mínimo que emplea un ejecutivo para atender al 15,38% de los
clientes que tienen muchas dudas, lo que implica que dedican más tiempo en consultas.
Rpta: 11,05 minutos

9. El tiempo que demoran en atender a un cliente en la ventanilla de una empresa financiera se


considera una variable aleatoria que tiene distribución uniforme con media 6,5 minutos y va-
rianza 3 minutos2. Calcule la probabilidad de demorar en atender a un cliente entre 5 y 7 minu-
tos. Rpta: 0,33

10. Así como el uso de redes sociales tiene ventajas para las empresas, también se presentan ries-
gos. El valor medio de las pérdidas se estima en 15 mil soles. Si esta variable se considera uni-
formemente distribuida con varianza mil soles2. Determine la probabilidad de que una em-
presa haya registrado una pérdida superior de 14,2 miles de soles. Rpta: 0,66
Capítulo 5. Muestreo 183

Capítulo 5 Muestreo
Unidad elemental
Es el objeto sobre el cual se hace la medición.

También es llamada unidad de observación, unidad de análisis, unidad estadística, caso o elemento.
Por ejemplo, en estudios de poblaciones humanas, con frecuencia ocurre que la unidad elemental
es cada individuo.

Población muestreada
Es el conjunto de todas las unidades de elementales posibles que podrían extraerse en una mues-
tra; es decir, es la población de donde se extrae la muestra.

Unidad de muestreo
Es la unidad donde realizamos la muestra.

Por ejemplo, podríamos querer estudiar a las personas, pero no tenemos una lista de todos los
individuos que pertenecen a la población objetivo. En vez de eso, la unidad de muestreo es cada
familia y la unidad elemental es cada individuo que vive en una familia.

Marco muestral
Es una lista de las unidades de muestreo que están disponibles para elección.

Ejemplo
Para las encuestas telefónicas el marco de muestreo podría ser una lista de todos los números tele-
fónicos residenciales de la ciudad; para las entrevistas personales una lista de las direcciones de
todas las calles; para una encuesta de agricultura una lista de todas las granjas o un mapa con todas
las áreas que contienen granjas.

Ejemplo
184 Estadística Básica con Aplicaciones en Excel 2010

Censo
Es el estudio completo de todas unidades elementales de la población.

Muestreo
Un estudio estadístico se inicia con la selección de una muestra, este proceso recibe el nombre de
muestreo el cual comprende por lo menos dos etapas:
 La selección de las unidades
 El registro de las observaciones.

Ejemplo

Niveles socioeconómicos en Lima Metropolitana y Callao


Asociación Peruana de Empresas de Investigación de Mercados (APEIM)

Miraflores, Abril de 2005

Ficha técnica

Universo de estudio
Se consideró como universo de estudio a todos los hogares pertenecientes a Lima Metropolitana entendi-
da como los distritos de Lima ubicados en el núcleo urbano (sin considerar balnearios) y la Provincia Consti-
tucional del Callao.
Se definió como hogar, al conjunto de personas que, habitando en la misma vivienda, preparan y consu-
men sus alimentos en común.
La persona informante fue el jefe de familia, definido como aquella persona que más aporta económica-
mente en el hogar.

Marco muestral

Para el desarrollo de la investigación se consideró como marco muestral:


 La base de datos de viviendas del Instituto Nacional de Estadística e Informática (INEI).
 Actualización mediante aplicación de rastreo de campo efectuada por APEIM en las zonas de mayor
crecimiento de la ciudad (conos)

Tamaño de la muestra
Se entrevistó a un total de 3 598 hogares distribuidos en 41 distritos. El margen de error máximo probable
con un nivel de confianza del 95,1 % y considerando el máximo de dispersión (p = q = 50%) fue de ± 1,63%.
Dentro de esta muestra se realizaron 200 entrevistas en Distritos con predominio de los N.S.E. Muy Al-
to/Alto con el propósito de obtener una submuestra estadísticamente significativa para este segmento.
El total de entrevistas fue desagregado proporcionalmente a la distribución poblacional de cada uno de los
distritos de Lima Metropolitana.

Selección de la muestra
Determinada la cantidad de entrevistas a aplicar por distrito, se procedió a sortear tantas manzanas como
entrevistas se requerían.
Dentro de cada manzana se seleccionó por un sistema aleatorio simple cinco viviendas: una titular y cuatro
reemplazos o suplentes.
Los hogares originalmente seleccionados (titulares), fueron visitados hasta en tres oportunidades antes de
proceder al reemplazo. Se controló que la tasa de reemplazo no excediera el 10% del total de entrevistas
originalmente sorteadas.
Capítulo 5. Muestreo 185

Muestreo probabilístico

En el muestreo probabilístico, la selección de cada elemento de la muestra se hace siguiendo reglas


matemáticas de decisión. Todos los elementos de la población tienen una probabilidad real y cono-
cida de ser seleccionados. Existen diversos métodos de muestreo probabilístico, como por ejemplo:

Muestreo aleatorio
Muestreo sistemático Muestreo estratificado
simple
•Se selecciona una •Se selecciona un primer •Se selecciona la muestra
muestra en forma elemento aleatoriamente de los diversos estratos.
aleatoria y sin reemplazo y, luego, los demás Un estrato es una parte
a n unidades de muestreo elementos que de la población, cuyos
de una población que conformarán la muestra elementos tienen
contiene un total de N cada cierto intervalo. características similares.
unidades. •Este muestreo supone •El objetivo de estratificar
•Se garantiza que cada que se cuenta con una la población es buscar
una de las muestras enumeración completa homogeneidad entre los
posibles tiene la misma de los elementos de la estratos.
probabilidad de ser población.
elegida.

Muestreo aleatorio simple


En este procedimiento, se selecciona una muestra en forma aleatoria y sin reemplazo a n unidades
de muestreo de una población que contiene un total de N unidades.
Se garantiza que cada una de las muestras posibles tiene la misma probabilidad de ser elegida.

Pasos a seguir para seleccionar una muestra simple aleatoria


1. Enumere las unidades del marco muestral con números sucesivos.
2. Seleccione tantos elementos del marco muestral como sea el tamaño requerido de la muestra,
usando una tabla de números aleatorios.

El muestreo aleatorio simple presenta dos propiedades:


 Representativa: Cada unidad tiene las mismas posibilidades de ser escogida.
 Independencia: La selección de una unidad no influye en la selección de otras unidades.
Pero en el mundo real es difícil encontrar muestras completamente independientes y representati-
vas. Por ejemplo, hacer una encuesta a los votantes marcando números de teléfono al azar es un
método no representativo pues no tiene en cuenta a los votantes que no disponen de teléfono y
cuenta varias veces a los que tienen varios números.
186 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 62
Una empresa de consumo tiene un total de 150 trabajadores y ha registrado en el cuadro siguiente,
información acerca del ingreso mensual (en nuevos soles) y años cumplidos en la empresa de cada
uno de sus trabajadores.
Trabajadores registrados
Ingreso Años en la Ingreso Años en la Ingreso Años en la
Nº Nº Nº
(en soles) empresa (en soles) empresa (en soles) empresa
1 2300 5 51 2100 13 101 2400 16
2 2800 11 52 2100 9 102 1700 0
3 2400 4 53 1800 1 103 2500 12
4 2500 2 54 2000 9 104 1700 3
5 2300 3 55 2100 10 105 2400 17
6 2100 2 56 1900 4 106 2400 16
7 1700 2 57 2000 10 107 1900 7
8 2000 0 58 2300 11 108 1700 1
9 2200 7 59 2000 7 109 2100 6
10 2100 4 60 1700 1 110 2000 5
11 1700 0 61 1900 6 111 2000 3
12 2500 2 62 2000 9 112 2500 13
13 2800 13 63 2400 17 113 1700 0
14 2400 9 64 1700 0 114 2500 19
15 1700 1 65 1700 2 115 1700 3
16 2400 9 66 2400 17 116 2600 19
17 2200 10 67 2500 13 117 1600 1
18 2200 4 68 2600 16 118 1800 6
19 2300 10 69 2100 14 119 2100 10
20 2800 11 70 1900 7 120 1700 0
21 2100 7 71 2000 9 121 2400 16
22 1700 1 72 1800 7 122 2600 17
23 2500 6 73 2100 10 123 2100 10
24 2400 9 74 2300 12 124 2100 8
25 2700 17 75 2700 20 125 2400 17
26 1700 0 76 2800 20 126 1700 1
27 1600 2 77 1800 3 127 2600 20
28 2600 17 78 1700 5 128 2400 16
29 2500 13 79 1700 4 129 2700 17
30 2500 16 80 1700 0 130 2100 12
31 2700 17 81 1700 1 131 1600 0
32 1700 1 82 2100 6 132 2100 15
33 1600 1 83 2600 17 133 1900 5
34 2400 11 84 2400 9 134 2100 12
35 1900 3 85 2600 19 135 2200 12
36 1800 5 86 1900 7 136 2400 13
37 1800 3 87 1600 0 137 1800 4
38 2400 14 88 1900 3 138 2600 17
39 2600 16 89 2100 14 139 2700 20
40 2700 18 90 1700 0 140 2500 16
41 2100 11 91 2100 15 141 2500 16
42 2300 14 92 1700 1 142 1900 6
43 1700 0 93 2300 14 143 2100 15
44 2200 13 94 2500 16 144 1700 9
45 2900 20 95 2600 18 145 1500 0
46 1800 5 96 1900 3 146 1800 18
47 2100 16 97 2500 19 147 2100 10
Capítulo 5. Muestreo 187

48 2000 12 98 1800 6 148 2700 19


49 2000 12 99 1700 2 149 1800 9
50 2900 20 100 2000 10 150 2100 15
a. Seleccione una muestra de 15 trabajadores usando muestreo simple aleatorio. Use las colum-
nas C4, C8, C11 y C15 de la tabla de números aleatorios.

Solución
Seleccionemos tantos elementos del marco muestral como sea el tamaño requerido de la muestra.
Como el marco muestral tiene 150 elementos usemos las columnas C4, C5 y C6, para elegir números
de tres cifras y luego C8, C9 y C10.
Tabla de números aleatorios
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
                   
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8

Los elementos seleccionados son:


Posición 114 81 134 148 39 97 105 98 126 64 109 122 142 145 149
188 Estadística Básica con Aplicaciones en Excel 2010

b. Seleccione una muestra de diez trabajadores usando muestreo simple aleatorio. Use las colum-
nas C11, C6, C1 y C9 de la tabla de números aleatorios.

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
Los elementos seleccionados son:
Posición
Capítulo 5. Muestreo 189

Muestreo sistemático

En el muestreo sistemático se elige un elemento del marco muestral cada cierto intervalo. Este
muestreo supone que se cuenta con una enumeración completa de los elementos de la población.

Procedimiento para seleccionar una muestra sistemática


N
1. Calcule el valor de k, donde k  . El valor de k se redondea al valor del entero menor.
n
2. Seleccione aleatoriamente un número entero entre 1 y k llamado arranque aleatorio (A)
3. A partir de este número elegido, seleccione el siguiente que ocupa la posición (A + k) del lista-
do del marco muestral y así sucesivamente hasta completar la muestra.

Ejemplo 43

Se tiene una población de 12 personas y se desea elegir a cuatro de ellas mediante un muestreo
sistemático. ¿Cuál es el arranque aleatorio para este ejemplo? Use la columna C3, C6 y C12

Solución
N 12
Calculemos el valor de k, donde k    3 . El valor de k se redondea al valor del entero menor,
n 4
luego k = 3.

Seleccionemos aleatoriamente un número entero entre 1 y k = 3, llamado arranque aleatorio (A).


Observando la columna C3 de la tabla de números aleatorios tenemos que A = 2.

Tabla de números aleatorios

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4

A partir de este número elegido, seleccionemos el dato que ocupa la posición (A + k), es decir la
quinta posición (3 + 2 = 5) del listado del marco muestral y así sucesivamente hasta completar la
muestra. Es decir, elegiremos los datos de las posiciones 2, 5, 8 y 11.
190 Estadística Básica con Aplicaciones en Excel 2010

Ejemplo 44

Se tiene una población de 15 personas y se desea elegir a seis de ellas mediante un muestreo sis-
temático. ¿Cuál es el arranque aleatorio para este ejemplo? Use la columna C4, C8 y C1

Solución
N 15
Calculemos el valor de k, donde k    2,5 . El valor de k se redondea al valor del entero me-
n 6
nor, luego k = 2.

Seleccionemos aleatoriamente un número entero entre 1 y k = 2, llamado arranque aleatorio (A).


Observando la columna C4 de la tabla de números aleatorios tenemos que A = 1.

Tabla de números aleatorios


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7

A partir de este número elegido, seleccionemos el dato que ocupa la posición (A + k), es decir la
tercera posición (1 + 2 = 3) del listado del marco muestral y así sucesivamente hasta completar la
muestra. Es decir, elegiremos los datos de las posiciones 1, 3, 5, 7, 9 y 11.

Ejemplo 45
Se tiene información de 40 personas de un barrio de Lima Metropolitana. Obtenga una muestra
aleatoria de ocho personas usando el muestreo sistemático y elabore una tabla con los elementos
seleccionados. Utilice las columnas C8; C10; C11 de la tabla de números aleatorios.

Individuos registrados
Nº Sexo Edad Estatura Nº Sexo Edad Estatura Nº Sexo Edad Estatura
1 Mujer 15 154 15 Mujer 19 178 29 Hombre 33 147
2 Hombre 16 154 16 Mujer 30 163 30 Hombre 17 167
3 Hombre 21 156 17 Hombre 29 180 31 Mujer 34 69
4 Mujer 31 184 18 Mujer 25 174 32 Mujer 20 76
5 Hombre 21 173 19 Hombre 29 137 33 Mujer 26 74
6 Mujer 24 170 20 Hombre 25 153 34 Hombre 25 90
7 Hombre 32 176 21 Mujer 16 168 35 Mujer 23 164
8 Hombre 26 188 22 Hombre 31 161 36 Hombre 20 164
9 Mujer 21 169 23 Hombre 18 270 37 Mujer 34 176
10 Mujer 22 173 24 Hombre 21 173 38 Hombre 35 188
11 Hombre 18 177 25 Hombre 31 187 39 Mujer 30 155
12 Hombre 25 181 26 Mujer 28 161 40 Mujer 29 141
13 Mujer 29 164 27 Mujer 19 172
14 Hombre 25 159 28 Hombre 31 162

Solución
N 40
Calculemos el valor de k, donde k   5
n 8
El valor de k se redondea al valor del entero menor, luego k = 5.
Capítulo 5. Muestreo 191

Seleccionemos aleatoriamente un número entero entre 1 y k = 5, llamado arranque aleatorio (A).

Observando la columna C8 de la tabla de números aleatorios tenemos que A = 5.


Tabla de números aleatorios
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7

A partir de este número elegido, seleccionemos el dato que ocupa la posición (A + k), es decir la
décima posición (5+5 = 10) del listado del marco muestral y así sucesivamente hasta completar la
muestra. Es decir, elegiremos los datos de las posiciones 5, 10, 15, 20, 25, 30, 35 y 40.

Los elementos seleccionados son:

Posición 5 10 15 20 25 30 35 40

Ejercicio 63
Una empresa de telecomunicaciones tiene un total de 150 empleados y ha registrado en la tabla
que se muestra a continuación información acerca de las variables: ingreso mensual (en soles),
nivel de educación y años cumplidos en la empresa.
Trabajadores registrados
Ingreso Nivel de Años en Ingreso Nivel de Años en Ingreso Nivel de Años en
Nº Nº Nº
(soles) Educación empresa (soles) Educación empresa (soles) Educación empresa
1 2300 Secundaria 5 51 2100 Técnica 13 101 2400 Técnica 16
2 2800 Secundaria 11 52 2100 Técnica 9 102 1700 Técnica 0
3 2400 Secundaria 4 53 1800 Técnica 1 103 2500 Técnica 12
4 2500 Secundaria 2 54 2000 Técnica 9 104 1700 Técnica 3
5 2300 Secundaria 3 55 2100 Técnica 10 105 2400 Técnica 17
6 2100 Secundaria 2 56 1900 Técnica 4 106 2400 Técnica 16
7 1700 Secundaria 2 57 2000 Técnica 10 107 1900 Técnica 7
8 2000 Secundaria 0 58 2300 Técnica 11 108 1700 Técnica 1
9 2200 Secundaria 7 59 2000 Técnica 7 109 2100 Técnica 6
10 2100 Secundaria 4 60 1700 Técnica 1 110 2000 Técnica 5
11 1700 Secundaria 1 61 1900 Técnica 6 111 2000 Superior 3
12 2500 Secundaria 2 62 2000 Técnica 9 112 2500 Superior 13
13 2800 Secundaria 13 63 2400 Técnica 17 113 1700 Superior 0
14 2400 Secundaria 9 64 1700 Técnica 0 114 2500 Superior 19
15 1700 Secundaria 1 65 1700 Técnica 2 115 1700 Superior 3
16 2400 Secundaria 9 66 2400 Técnica 17 116 2600 Superior 19
17 2200 Secundaria 10 67 2500 Técnica 13 117 1600 Superior 1
18 2200 Secundaria 4 68 2600 Técnica 16 118 1800 Superior 6
19 2300 Secundaria 10 69 2100 Técnica 14 119 2100 Superior 10
20 2800 Secundaria 11 70 1900 Técnica 7 120 1700 Superior 0
21 2100 Secundaria 7 71 2000 Técnica 9 121 2400 Superior 16
22 1700 Secundaria 1 72 1800 Técnica 7 122 2600 Superior 17
23 2500 Secundaria 6 73 2100 Técnica 10 123 2100 Superior 10
24 2400 Secundaria 9 74 2300 Técnica 12 124 2100 Superior 8
25 2700 Secundaria 17 75 2700 Técnica 20 125 2400 Superior 17
26 1700 Secundaria 0 76 2800 Técnica 20 126 1700 Superior 1
192 Estadística Básica con Aplicaciones en Excel 2010

27 1600 Secundaria 2 77 1800 Técnica 3 127 2600 Superior 20


28 2600 Secundaria 17 78 1700 Técnica 5 128 2400 Superior 16
29 2500 Secundaria 13 79 1700 Técnica 4 129 2700 Superior 17
30 2500 Secundaria 16 80 1700 Técnica 0 130 2100 Superior 12
31 2700 Secundaria 17 81 1700 Técnica 1 131 1600 Superior 0
32 1700 Secundaria 1 82 2100 Técnica 6 132 2100 Superior 15
33 1600 Secundaria 1 83 2600 Técnica 17 133 1900 Superior 5
34 2400 Secundaria 11 84 2400 Técnica 9 134 2100 Superior 12
35 1900 Secundaria 3 85 2600 Técnica 19 135 2200 Superior 12
36 1800 Secundaria 5 86 1900 Técnica 7 136 2400 Superior 13
37 1800 Secundaria 3 87 1600 Técnica 0 137 1800 Superior 4
38 2400 Secundaria 14 88 1900 Técnica 3 138 2600 Superior 17
39 2600 Secundaria 16 89 2100 Técnica 14 139 2700 Superior 20
40 2700 Secundaria 18 90 1700 Técnica 0 140 2500 Superior 16
41 2100 Técnica 11 91 2100 Técnica 15 141 2500 Superior 16
42 2300 Técnica 14 92 1700 Técnica 1 142 1900 Superior 6
43 1700 Técnica 0 93 2300 Técnica 14 143 2100 Superior 15
44 2200 Técnica 13 94 2500 Técnica 16 144 1700 Superior 9
45 2900 Técnica 20 95 2600 Técnica 18 145 1500 Superior 0
46 1800 Técnica 5 96 1900 Técnica 3 146 1800 Superior 18
47 2100 Técnica 16 97 2500 Técnica 19 147 2100 Superior 10
48 2000 Técnica 12 98 1800 Técnica 6 148 2700 Superior 19
49 2000 Técnica 12 99 1700 Técnica 2 149 1800 Superior 9
50 2900 Técnica 20 100 2000 Técnica 10 150 2100 Superior 15

Aplique el muestreo sistemático para seleccionar una muestra de ocho empleados. Elabore un lis-
tado con el número seleccionado. Utilice la columna C7, C10, y C15 de la tabla de números aleatorios.

Solución
N
Calculemos el valor de k, donde k    ………………………...
n
El valor de k se redondea al valor del entero menor, luego k = ……………..……..

Seleccionemos aleatoriamente un número entero entre 1 y k, llamado arranque aleatorio (A).

Observando la columna C7 y C8 de la tabla de números aleatorios tenemos que A = …………….....

Tabla de números aleatorios


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8

A partir de este número elegido, seleccionemos el dato que ocupa la posición (A + k) del listado del
marco muestral y así sucesivamente hasta completar la muestra.
Los elementos seleccionados son:

Posición
Capítulo 5. Muestreo 193

Tabla de números aleatorios


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
194 Estadística Básica con Aplicaciones en Excel 2010

Muestreo estratificado

Estratificar significa dividir a la población en varias partes de acuerdo con ciertas características de
sus elementos.

El objetivo de estratificar la población es buscar homogeneidad entre los estratos.

Pasos a seguir para seleccionar una muestra estratificada

1. Divida a la población en estratos que sean mutuamente excluyentes. Esto es, que incluyan a
todos los elementos de la población y que cada elemento pertenezca solamente a un estrato.

2. Calcule la cantidad de elementos a seleccionar en cada estrato.

3. Seleccione muestras aleatorias simples para cada uno de los estratos.

Recomendaciones para el uso de muestras estratificadas

 Si se tiene que usar más de una variable para formar los estratos, cuidar que estas no estén
relacionadas entre sí.
 No se deben considerar la formación de muchos estratos, generalmente se usan entre tres y
ocho estratos.
 Los estratos pequeños no contribuyen mucho a la reducción del error, por lo tanto pueden no
ser considerados.
Capítulo 5. Muestreo 195

Ejemplo 46
La empresa de telecomunicaciones RTV tiene 120 empleados de los cuales tiene información de las
variables: ingreso en soles, nivel de educación y años en la empresa.
Años
Ingreso Años Ingreso Ingreso Años
Nivel de Nivel de cumplidos Nivel de
Nº (en cumplidos Nº (en Nº (en cumplidos
educación educación en la empre- educación
soles) en la empresa soles) soles) en la empresa
sa
1 2300 Secundaria 5 41 2100 Técnica 13 81 2000 Superior 3
2 2800 Secundaria 11 42 2100 Técnica 9 82 2500 Superior 13
3 2400 Secundaria 4 43 1800 Técnica 1 83 1700 Superior 0
4 2500 Secundaria 2 44 2000 Técnica 9 84 2500 Superior 19
5 2300 Secundaria 3 45 2100 Técnica 10 85 1700 Superior 3
6 2100 Secundaria 2 46 1900 Técnica 4 86 2600 Superior 19
7 1700 Secundaria 2 47 2000 Técnica 10 87 1600 Superior 1
8 2000 Secundaria 0 48 2300 Técnica 11 88 1800 Superior 6
9 2200 Secundaria 7 49 2000 Técnica 7 89 2100 Superior 10
10 2100 Secundaria 4 50 1700 Técnica 1 90 1700 Superior 0
11 1700 Secundaria 0 51 1700 Técnica 1 91 2400 Superior 16
12 2500 Secundaria 2 52 2100 Técnica 6 92 2600 Superior 17
13 2800 Secundaria 13 53 2600 Técnica 17 93 2100 Superior 10
14 2400 Secundaria 9 54 2400 Técnica 9 94 2100 Superior 8
15 1700 Secundaria 1 55 2600 Técnica 19 95 2400 Superior 17
16 2400 Secundaria 9 56 1900 Técnica 7 96 1700 Superior 1
17 2200 Secundaria 10 57 1600 Técnica 0 97 2600 Superior 20
18 2200 Secundaria 4 58 1900 Técnica 3 98 2400 Superior 16
19 2300 Secundaria 10 59 2100 Técnica 14 99 2700 Superior 17
20 2800 Secundaria 11 60 1700 Técnica 0 100 2100 Superior 12
21 2100 Secundaria 7 61 2100 Técnica 15 101 1600 Superior 0
22 1700 Secundaria 1 62 1700 Técnica 1 102 2100 Superior 15
23 2500 Secundaria 6 63 2300 Técnica 14 103 1900 Superior 5
24 2400 Secundaria 9 64 2500 Técnica 16 104 2100 Superior 12
25 2700 Secundaria 17 65 2600 Técnica 18 105 2200 Superior 12
26 1700 Secundaria 0 66 1900 Técnica 3 106 2400 Superior 13
27 1600 Secundaria 2 67 2500 Técnica 19 107 1800 Superior 4
28 2600 Secundaria 17 68 1800 Técnica 6 108 2600 Superior 17
29 2500 Secundaria 13 69 1700 Técnica 2 109 2700 Superior 20
30 2500 Secundaria 16 70 2000 Técnica 10 110 2500 Superior 16
31 2100 Técnica 11 71 2400 Técnica 16 111 2500 Superior 16
32 2300 Técnica 14 72 1700 Técnica 0 112 1900 Superior 6
33 1700 Técnica 0 73 2500 Técnica 12 113 2100 Superior 15
34 2200 Técnica 13 74 1700 Técnica 3 114 1700 Superior 9
35 2900 Técnica 20 75 2400 Técnica 17 115 1500 Superior 0
36 1800 Técnica 5 76 2400 Técnica 16 116 1800 Superior 18
37 2100 Técnica 16 77 1900 Técnica 7 117 2100 Superior 10
38 2000 Técnica 12 78 1700 Técnica 1 118 2700 Superior 19
39 2000 Técnica 12 79 2100 Técnica 6 119 1800 Superior 9
40 2900 Técnica 20 80 2000 Técnica 5 120 2100 Superior 15

Aplique el muestreo estratificado para seleccionar una muestra de 16 empleados. Use como varia-
ble de estratificación el nivel educacional. Elabore un listado identificando el número de dato selec-
cionado.
Para el estrato 1 use las columnas C1, C3 y C5, para el estrato 2 use las columnas C8, C9, C10 y C11 y
para el estrato 3 use las columnas C4, C3, C5 y C7.
196 Estadística Básica con Aplicaciones en Excel 2010

Solución

Se divide a la población en estratos que sean mutuamente excluyentes, luego los estratos 1, 2 y 3
son: secundaria, técnica y superior, respectivamente. Para cada uno de los estratos, seleccionamos
muestras aleatorias simples.

Números de elemen- Posiciones Nh


Estratos Cantidad seleccionada por estrato nh  n
tos en el estrato Nh (desde – hasta) N
N1 30
1. Secundaria N1 = 30 1 – 30 n1  n   16  4
N 120
N 50
2. Técnica N2 = 50 31 – 80 n2  2  n   16  6,67  7
N 120
N 40
3. Superior N3 = 40 81 – 120 n3  3  n   16  5,33  5
N 120
Total N = 120 n = 16

Para el estrato Secundaria, realizamos un muestreo aleatorio simple usando las columnas C1, C3 y
C5. Observemos que las posiciones de los elementos a elegir están entre el 1 y el 30.

Tabla de números aleatorios

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8

Luego, el cuadro con los datos elementos seleccionados para el estrato Secundaria es:

Estrato Secundaria Posición 2 16 29 13

Para el estrato Técnica, realizamos un muestreo aleatorio simple usando las columnas C8, C9, C10 y
C11. Observemos que las posiciones de los elementos a elegir están entre el 31 y el 80.

Tabla de números aleatorios


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7

Luego, el cuadro con los datos elementos seleccionados para el estrato Técnica es:

Estrato Técnica Posición 54 62 66 77 48 67 44


Capítulo 5. Muestreo 197

Para el estrato Superior, realizamos un muestreo aleatorio simple usando las columnas C4, C3, C5 y
C7. Observemos que las posiciones de los elementos a elegir están entre el 81 y el 120.

Tabla de números aleatorios


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4

Luego, el cuadro con los datos elementos seleccionados para el estrato Superior es:

Estrato Superior Posición 114 81 97 105 83

Ejercicio 64
La siguiente tabla muestra a los 120 alumnos de la especialidad de Administración, de la universi-
dad El Saber, a quienes se les preguntó por su emisora radial preferida y por la cantidad de horas a
la semana que la escucha.

Posición Radio Horas Posición Radio Horas Posición Radio Horas


1 Estudio 92 6 41 Oxígeno 6 81 Oxígeno 4
2 Estudio 92 10 42 Oxígeno 6 82 Oxígeno 3
3 Estudio 92 4 43 Oxígeno 8 83 Oxígeno 3
4 Estudio 92 2 44 Oxígeno 9 84 Oxígeno 5
5 Estudio 92 3 45 Oxígeno 4 85 Oxígeno 5
6 Estudio 92 6 46 Oxígeno 6 86 Oxígeno 8
7 Estudio 92 7 47 Oxígeno 7 87 Planeta 7
8 Estudio 92 6 48 Oxígeno 9 88 Planeta 6
9 Estudio 92 8 49 Oxígeno 8 89 Planeta 9
10 Estudio 92 9 50 Oxígeno 10 90 Planeta 9
11 Estudio 92 11 51 Oxígeno 12 91 Planeta 4
12 Estudio 92 3 52 Oxígeno 9 92 Planeta 2
13 Estudio 92 4 53 Oxígeno 9 93 Planeta 11
14 Estudio 92 2 54 Oxígeno 8 94 Planeta 2
15 Estudio 92 6 55 Oxígeno 4 95 Planeta 3
16 Estudio 92 4 56 Oxígeno 6 96 Planeta 8
17 Estudio 92 9 57 Oxígeno 7 97 Planeta 6
18 Estudio 92 5 58 Oxígeno 8 98 Planeta 7
19 Estudio 92 2 59 Oxígeno 7 99 Planeta 9
20 Estudio 92 7 60 Oxígeno 3 100 Planeta 4
21 Estudio 92 4 61 Oxígeno 6 101 Planeta 8
22 Estudio 92 6 62 Oxígeno 9 102 Planeta 7
23 Estudio 92 7 63 Oxígeno 2 103 Planeta 7
198 Estadística Básica con Aplicaciones en Excel 2010

24 Estudio 92 8 64 Oxígeno 5 104 Planeta 9


25 Estudio 92 9 65 Oxígeno 1 105 Planeta 6
26 Estudio 92 10 66 Oxígeno 4 106 Planeta 7
27 Estudio 92 5 67 Oxígeno 7 107 Planeta 9
28 Estudio 92 4 68 Oxígeno 6 108 Planeta 8
29 Estudio 92 7 69 Oxígeno 7 109 Planeta 3
30 Estudio 92 8 70 Oxígeno 8 110 Planeta 11
31 Estudio 92 4 71 Oxígeno 4 111 Planeta 13
32 Oxígeno 6 72 Oxígeno 5 112 Planeta 14
33 Oxígeno 7 73 Oxígeno 3 113 Planeta 9
34 Oxígeno 5 74 Oxígeno 6 114 Planeta 8
35 Oxígeno 8 75 Oxígeno 5 115 Planeta 6
36 Oxígeno 9 76 Oxígeno 8 116 Planeta 5
37 Oxígeno 4 77 Oxígeno 7 117 Planeta 7
38 Oxígeno 5 78 Oxígeno 9 118 Planeta 3
39 Oxígeno 2 79 Oxígeno 10 119 Planeta 6
40 Oxígeno 9 80 Oxígeno 3 120 Planeta 5

Seleccione una muestra aleatoria de tamaño 12 mediante muestreo estratificado. Use la variable
radio de su preferencia como variable de estratificación.

Elabore un listado con el alumno seleccionado. Para el estrato 1 use las columnas C6, C4 y C2, para el
estrato 2 use las columnas C15, C10, C2 y C11 y para el estrato 3 use las columnas C6, C17, C12; C4, C1, y
C7.

Posición Nh
Estrato Nh nh  n
(desde – hasta) N

Estudio 92 N1= n1=

Oxígeno N2= n2=

Planeta N3= n3=

Total

Estrato 1:
Posición
Estudio 92

Estrato 2:
Posición
Oxígeno

Estrato 3:
Posición
Planeta
Capítulo 5. Muestreo 199

Tabla de números aleatorios


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
200 Estadística Básica con Aplicaciones en Excel 2010

Ejercicios de aplicación
1. La empresa de telecomunicaciones R&M tiene un total de 140 empleados, de los cuales tiene
información sobre: el ingreso mensual (en nuevos soles) y años cumplidos en la empresa.

Nº Ingreso Años Nº Ingreso Años Nº Ingreso Años Nº Ingreso Años


1 2300 5 36 1800 5 71 2000 9 106 2400 16
2 2800 11 37 1800 3 72 1800 7 107 1900 7
3 2400 4 38 2400 14 73 2100 10 108 1700 1
4 2500 2 39 2600 16 74 2300 12 109 2100 6
5 2300 3 40 2700 18 75 2700 20 110 2000 5
6 2100 2 41 2100 11 76 2800 20 111 2500 16
7 1700 2 42 2300 14 77 1800 3 112 1900 6
8 2000 0 43 1700 0 78 1700 5 113 2100 15
9 2200 7 44 2200 13 79 1700 4 114 1700 9
10 2100 4 45 2900 20 80 1700 0 115 1500 0
11 1700 0 46 1800 5 81 1700 1 116 1800 18
12 2500 2 47 2100 16 82 2100 6 117 2100 10
13 2800 13 48 2000 12 83 2600 17 118 2700 19
14 2400 9 49 2000 12 84 2400 9 119 1800 9
15 1700 1 50 2900 20 85 2600 19 120 2100 15
16 2400 9 51 2100 13 86 1900 7 121 2400 16
17 2200 10 52 2100 9 87 1600 0 122 2600 17
18 2200 4 53 1800 1 88 1900 3 123 2100 10
19 2300 10 54 2000 9 89 2100 14 124 2100 8
20 2800 11 55 2100 10 90 1700 0 125 2400 17
21 2100 7 56 1900 4 91 2100 15 126 1700 1
22 1700 1 57 2000 10 92 1700 1 127 2600 20
23 2500 6 58 2300 11 93 2300 14 128 2400 16
24 2400 9 59 2000 7 94 2500 16 129 2700 17
25 2700 17 60 1700 1 95 2600 18 130 2100 12
26 1700 0 61 1900 6 96 1900 3 131 1600 0
27 1600 2 62 2000 9 97 2500 19 132 2100 15
28 2600 17 63 2400 17 98 1800 6 133 1900 5
29 2500 13 64 1700 0 99 1700 2 134 2100 12
30 2500 16 65 1700 2 100 2000 10 135 2200 12
31 2700 17 66 2400 17 101 2400 16 136 2400 13
32 1700 1 67 2500 13 102 1700 0 137 1800 4
33 1600 1 68 2600 16 103 2500 12 138 2600 17
34 2400 11 69 2100 14 104 1700 3 139 2700 20
35 1900 3 70 1900 7 105 2400 17 140 2500 16

a. Seleccione una muestra de ocho empleados utilizando el muestreo aleatorio simple. Elabore
un listado con los trabajadores seleccionados. Utilice las columnas: C7, C5, C10 y C15 de la tabla
de números aleatorios.

b. Seleccione una muestra sistemática de tamaño 11 empleados. Elabore un listado con los tra-
bajadores seleccionados. Use las columnas C4, C10 y C6 de la tabla de números aleatorios.
Capítulo 5. Muestreo 201

2. La siguiente tabla muestra el registro de todos los clientes de una empresa de señal por cable
del distrito de Los Olivos. Las variables consideradas fueron: ingreso semanal (en dólares), nú-
mero de televisores en el hogar y nivel educativo alcanzado por el jefe de familia.

Número Número Número


Ingreso Nivel Ingreso Nivel Ingreso Nivel
N° de televi- N° de televi- N° de televi-
semanal educativo semanal educativo semanal educativo
sores sores sores
1 100 3 Primaria 35 190 1 Primaria 69 430 3 Secundaria
2 80 2 Primaria 36 250 2 Primaria 70 400 3 Secundaria
3 100 3 Primaria 37 205 2 Primaria 71 220 2 Secundaria
4 85 1 Primaria 38 220 3 Primaria 72 230 2 Secundaria
5 105 2 Primaria 39 285 4 Primaria 73 300 2 Secundaria
6 110 2 Primaria 40 220 2 Primaria 74 340 3 Superior
7 102 4 Primaria 41 400 3 Primaria 75 420 2 Superior
8 110 2 Primaria 42 350 2 Primaria 76 550 2 Superior
9 90 2 Primaria 43 400 2 Primaria 77 430 2 Superior
10 130 3 Primaria 44 540 2 Primaria 78 690 3 Superior
11 180 1 Primaria 45 250 3 Primaria 79 500 2 Superior
12 90 3 Primaria 46 295 4 Primaria 80 430 2 Superior
13 104 3 Primaria 47 230 1 Primaria 81 620 3 Superior
14 100 2 Primaria 48 240 2 Primaria 82 400 3 Superior
15 90 2 Primaria 49 400 3 Primaria 83 630 2 Superior
16 80 1 Primaria 50 270 5 Primaria 84 585 1 Superior
17 120 1 Primaria 51 320 2 Secundaria 85 350 2 Superior
18 85 1 Primaria 52 200 1 Secundaria 86 520 2 Superior
19 100 2 Primaria 53 335 1 Secundaria 87 402 2 Superior
20 98 3 Primaria 54 250 2 Secundaria 88 220 3 Superior
21 120 2 Primaria 55 250 3 Secundaria 89 690 1 Superior
22 105 2 Primaria 56 120 2 Secundaria 90 420 2 Superior
23 120 1 Primaria 57 130 2 Secundaria 91 450 2 Superior
24 250 3 Primaria 58 235 2 Secundaria 92 530 2 Superior
25 300 4 Primaria 59 500 3 Secundaria 93 300 3 Superior
26 120 2 Primaria 60 200 1 Secundaria 94 335 1 Superior
27 195 3 Primaria 61 395 2 Secundaria 95 330 1 Superior
28 120 3 Primaria 62 330 3 Secundaria 96 380 2 Superior
29 250 2 Primaria 63 310 3 Secundaria 97 230 2 Superior
30 300 3 Primaria 64 300 3 Secundaria 98 385 1 Superior
31 250 2 Primaria 65 530 3 Secundaria 99 303 2 Superior
32 230 2 Primaria 66 540 2 Secundaria 100 540 2 Superior
33 150 2 Primaria 67 200 2 Secundaria 101 490 3 Superior
34 200 3 Primaria 68 285 1 Secundaria 102 495 2 Superior

Seleccione una muestra de 12 clientes aplicando el muestreo sistemático. Elabore un listado con
el número. Utilice la columna C4, C9 y C15 de la tabla de números aleatorios.
202 Estadística Básica con Aplicaciones en Excel 2010

3. Los siguientes datos han sido extraídos de una investigación realizada por La Defensoría del
Pueblo, Comisión de la Verdad y Reconciliación, Comité Internacional Cruz Roja y Coordinadora
Nacional de Derechos Humanos sobre un total de 150 personas extraviadas en el Perú entre los
años 1980 y 1996 en los tres principales departamentos donde hubo el brote terrorista: Ayacu-
cho, Huánuco y San Martín.

Edad al Edad Edad


Lugar de Lugar de Lugar de
Nº Sexo momento de la Nº Sexo al momento de Nº Sexo al momento de
procedencia procedencia procedencia
desaparición la desaparición la desaparición
1 Ayacucho M 12 51 Ayacucho M 44 101 Huánuco M 24
2 Ayacucho M 40 52 Ayacucho M 39 102 Huánuco M 28
3 Ayacucho M 20 53 Ayacucho M 17 103 Huánuco F 4
4 Ayacucho M 43 54 Ayacucho F 19 104 Huánuco F 2
5 Ayacucho M 28 55 Ayacucho M 24 105 Huánuco M 33
6 Ayacucho M 12 56 Ayacucho F 15 106 Huánuco M 25
7 Ayacucho F 15 57 Ayacucho M 17 107 Huánuco M 21
8 Ayacucho M 28 58 Ayacucho M 22 108 Huánuco M 21
9 Ayacucho M 13 59 Ayacucho M 50 109 Huánuco M 30
10 Ayacucho M 45 60 Ayacucho M 42 110 Huánuco M 21
11 Ayacucho M 10 61 Ayacucho M 19 111 Huánuco M 21
12 Ayacucho F 25 62 Ayacucho M 21 112 Huánuco M 54
13 Ayacucho M 24 63 Ayacucho M 15 113 Huánuco M 38
14 Ayacucho M 32 64 Ayacucho M 43 114 Huánuco M 16
15 Ayacucho M 48 65 Ayacucho M 16 115 Huánuco M 28
16 Ayacucho M 23 66 Ayacucho M 30 116 Huánuco M 36
17 Ayacucho F 7 67 Ayacucho M 48 117 Huánuco M 27
18 Ayacucho F 5 68 Ayacucho M 45 118 Huánuco M 24
19 Ayacucho M 4 69 Ayacucho M 41 119 Huánuco M 45
20 Ayacucho F 9 70 Ayacucho M 23 120 Huánuco M 21
21 Ayacucho M 6 71 Ayacucho M 22 121 Huánuco M 66
22 Ayacucho M 66 72 Ayacucho M 20 122 Huánuco F 70
23 Ayacucho M 18 73 Ayacucho M 22 123 Huánuco F 26
24 Ayacucho F 36 74 Ayacucho M 16 124 Huánuco M 26
25 Ayacucho M 26 75 Ayacucho M 45 125 Huánuco M 14
26 Ayacucho M 17 76 Ayacucho F 56 126 Huánuco M 18
27 Ayacucho M 28 77 Ayacucho M 33 127 Huánuco M 28
28 Ayacucho M 30 78 Ayacucho M 22 128 San Martín M 25
29 Ayacucho F 19 79 Ayacucho M 70 129 San Martín M 32
30 Ayacucho M 17 80 Ayacucho M 34 130 San Martín M 22
31 Ayacucho F 20 81 Ayacucho M 69 131 San Martín M 21
32 Ayacucho M 21 82 Ayacucho F 31 132 San Martín M 28
33 Ayacucho M 37 83 Huánuco M 21 133 San Martín M 18
34 Ayacucho M 58 84 Huánuco M 27 134 San Martín M 29
35 Ayacucho M 18 85 Huánuco F 19 135 San Martín M 20
36 Ayacucho F 18 86 Huánuco M 27 136 San Martín M 18
37 Ayacucho M 19 87 Huánuco M 20 137 San Martín M 21
38 Ayacucho M 18 88 Huánuco M 25 138 San Martín M 26
39 Ayacucho M 22 89 Huánuco M 18 139 San Martín M 23
40 Ayacucho F 23 90 Huánuco M 47 140 San Martín M 35
41 Ayacucho M 50 91 Huánuco M 28 141 San Martín M 17
Capítulo 5. Muestreo 203

42 Ayacucho M 26 92 Huánuco M 32 142 San Martín M 32


43 Ayacucho F 19 93 Huánuco M 18 143 San Martín F 32
44 Ayacucho M 54 94 Huánuco M 22 144 San Martín M 41
45 Ayacucho M 13 95 Huánuco M 28 145 San Martín M 26
46 Ayacucho M 46 96 Huánuco M 31 146 San Martín M 20
47 Ayacucho M 28 97 Huánuco M 34 147 San Martín M 21
48 Ayacucho M 46 98 Huánuco M 25 148 San Martín M 15
49 Ayacucho M 42 99 Huánuco M 27 149 San Martín M 22
50 Ayacucho M 40 100 Huánuco M 19 150 San Martín M 45

a. Aplique el muestreo sistemático para obtener una muestra de 10 personas desaparecidas.


Elabore un listado con el número seleccionado. Utilice las columnas C14, C2 y C8 de la tabla de
números aleatorios.

b. Aplique el muestreo aleatorio simple para obtener una muestra de 14 personas desaparecidas.
Elabore un listado con el número seleccionado. Utilice las columnas C7, C12, C5, C16 y C3 de la
tabla de números aleatorios.

c. Aplique el muestreo estratificado para obtener una muestra de 10 personas desaparecidas.


Elabore un listado con el número seleccionado. Utilice como variable de estratificación: Lugar
de procedencia.

Estrato 1: Ayacucho C3, C5, C7


Estrato 2: Huánuco C5; C9, C10, C12
Estrato 3: San Martín C4, C8, C11,C15
204 Estadística

TABLA DE NÚMEROS ALEATORIOS

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8

204
Anexos 205

Índice
Axiomas de la probabilidad 128 propiedades 86
Censo 182 Media ponderada 100
Coeficiente de asimetría Mediana 91
de Fisher 119 Medidas de asimetría 118
Coeficiente de variación 114 Medidas de dispersión 109
Cuantiles 102 Medidas de tendencia central 85
Desviación estándar 112 Moda 94
de una variable aleatoria 153 Muestreo 182
Diagrama de árbol 143 aleatorio simple 183
Distribución estratificado 192
binomial 160 probabilístico 183
de frecuencias 26, 57, 63, 64 sistemático 187
hipergeométrica 164 Nivel de confianza 203
normal 176 Interpretación 204
Poisson 168 Población muestreada 181
t-Student 208 Probabilidad
uniforme 173 condicional 135
Escalas de medición 15 Definición clásica de 128
Espacio muestral 126 Teoremas básicos de 128
Partición de un 142 Rango
Estimación de una variable 109
por intervalo 203 Rango intercuartil 110
puntual 203 Registro administrativo 11
Estimador 19 Tabulaciones cruzadas 41
Evento 126 Tamaño de muestra
Complemento 127 para estimar la media 215
Eventos para estimar la proporción poblacional 222
independientes 139 Teorema de Bayes 143
Intersección de 127 Teorema de la probabilidad total 142
mutuamente excluyentes 128 Unidad de muestreo 181
Unión de 127 Unidad elemental 181
Gráfico Valor esperado
circular 34 de una variable aleatoria continua 159
de barras 31 de una variable aleatoria discreta 152
de barras apiladas 46, 51 Variable
de barras apiladas al 100% 46, 54 definición 12
de Pareto 37 Variable aleatoria
Histograma 69 continua 159
Ojiva 76 definición 149
Polígono de frecuencias 72, 73 discreta 150
Intervalo de confianza Función de densidad de probabilidad 159
para la media poblacional 204 Función de probabilidad 150
proporción poblacional 218 Varianza 112
Marco muestral 181 de una variable aleatoria continua 159
Margen de error 203 de una variable aleatoria discreta 153
Media aritmética 85

205

También podría gustarte