Está en la página 1de 199

CUADERNO DE TRABAJO

EPE
CE86 ESTADÍSTICA APLICADA 1
EPE 1

EPE
CE86: ESTADÍSTICA APLICADA 1

Descripción breve
Material de trabajo para el curso:
Estadística Aplicada 1
EPE
2 CE86 Estadística Aplicada 1

Contenido
Estadística Aplicada 1 4
Logro del curso 4
Competencia: Razonamiento cuantitativo 4
Unidad 1. 6
Conceptos Básicos. Organización de datos. 6
Estadística 6
Subdivisión de la Estadística 6
Población 6
Muestra 7
Unidad elemental 7
Encuesta 7
Dato 8
Observación 8
Variable 9
Escalas de medición 11
Organización y presentación de datos 17
Tabla de distribución de frecuencias para variables cualitativas 18
Representación gráfica de variables cualitativas 19
Tabla de distribución de frecuencias de variables cuantitativas discretas 24
Representación gráfica de variables cuantitativas discretas 24
Tabla de distribución de frecuencias: variables cuantitativas continuas 27
Representación gráfica de variables cuantitativas continuas 30
Ejercicios propuestos 32
Unidad 2. 37
Medidas de resumen: Medidas de tendencia central, de posición y de variación 37
Medidas de tendencia central ¡Error! Marcador no definido.
Media 38
Mediana 39
Moda 40
Propiedades de la media aritmética 41
Medidas de posición o cuantiles 42
Percentil 44
Medidas de dispersión o variabilidad 45
Varianza 45
Desviación estándar 45
Coeficiente de variación 46
Medida de asimetría 49
Coeficiente de asimetría de Fisher 49
Ejercicios propuestos 55
Unidad 3. 57
Probabilidades 57
EPE 3

Experimento aleatorio 57
Espacio muestral 57
Evento 57
Probabilidad ¡Error! Marcador no definido.
Definición clásica de probabilidad 58
Álgebra de eventos 59
Complemento de un evento 59
Unión de eventos 59
Intersección de eventos 59
Axiomas de la probabilidad 59
Teoremas de probabilidad60
4 CE86 Estadística Aplicada 1

Probabilidad condicional 61
Partición de un espacio muestral 64
Diagrama de árbol64
Teorema de la probabilidad total 64
Teorema de Bayes 64
Ejercicios propuestos ¡Error! Marcador no definido.
Unidad 4. 70
Variable aleatoria 70
Distribución Normal 86
Función de densidad 86
Características 86
Estandarización 87
Ejercicios propuestos 93
Unidad 5. 96
Muestreo 96
Conceptos importantes 97
Tipos de muestreo probabilístico 98
Muestreo aleatorio simple 98
Muestreo estratificado 105
Tamaño de muestra 111
Tamaño de muestra (n) si el objetivo del estudio es estimar la media o promedio (µ) de una población
112
Tamaño de muestra (n) si el objetivo del estudio es estimar la proporción (p) de una población 115
EPE 5

Estadística Aplicada 1

LOGRO DEL CURSO


Al finalizar el curso, el estudiante analiza datos estadísticos que le permitan tomar decisiones
sobre problemáticas reales, propias de su profesión.
6 CE86 Estadística Aplicada 1

Competencia: Razonamiento cuantitativo


Es la capacidad para interpretar, representar, comunicar y utilizar información cuantitativa diversa
en situaciones de contexto real.
Implica calcular, razonar, emitir juicios y tomar decisiones con base en esta información
cuantitativa.

Dimensiones Indicación sobre lo que hará el estudiante

Habilidad para identificar el problema a resolver en el contexto de la


situación.

¿Qué significa?

Interpretación El estudiante redacta el problema, con un lenguaje sencillo, como


pregunta u objetivo

Habilidad para elegir la herramienta, fórmula o técnica estadística que


usará para resolver el problema.

¿Qué significa?

Representación El estudiante indica la variable, tabla, gráfico, medida y/o herramienta


estadística que utilizará en la solución del problema.

Habilidad de calcular para obtener los resultados.

¿Qué significa?

El estudiante muestra los cálculos realizados para dar respuesta al


Cálculo problema.

Habilidad de entender los resultados.

¿Qué significa?

Análisis El estudiante indica con que valor calculado responde el problema.

Habilidad de comunicar y sustentar la decisión final en base a su análisis.

¿Qué significa?

El estudiante redacta la decisión que tomará a partir del resultado de


Argumentación su análisis.
EPE 7

Unidad 1.
LOGRO
Al finalizar la unidad 1, el estudiante elabora y analiza datos organizados en tablas y gráficos.

Conceptos Básicos. Organización de datos.


8 CE86 Estadística Aplicada 1

Estadística
Es la ciencia que proporciona un conjunto de métodos, técnicas y procedimientos para recopilar, organizar,
presentar y analizar datos con el fin de describirlos o realizar generalizaciones válidas.

Subdivisión de la Estadística

Estadística descriptiva
Son métodos asociados a la caracterización, resumen y presentación de
datos, que permiten describirlos apropiadamente.
Comprende el uso de gráficos, tablas e indicadores de resumen obtenidos al
realizar algunos cálculos.

Estadística inferencial
Son métodos y técnicas que hacen posible estimar una o más características
de una población o tomar decisiones referentes a una población, basados en Flash
los resultados obtenidos del estudio de muestras elegidas adecuadamente. electoral

Estas conclusiones no tienen que ser totalmente válidas, pueden tener cierto
margen de error, por eso se dan con una medida de confiabilidad o
probabilidad.

Población
Es el conjunto de todas las unidades elementales de interés en un determinado estudio.
Pueden ser personas, animales, objetos, conceptos, etc. de los cuales sacamos conclusiones a partir de una
o más características observables de naturaleza cualitativa o cuantitativa

Muestra
Es una parte o un subconjunto de la población que se selecciona adecuadamente para obtener información
acerca de la población de la cual proviene.
Una muestra será representativa si es elegida de forma aleatoria.
EPE 9

Unidad elemental
Es el objeto sobre el cual se hace la medición. También se le conoce como unidad de análisis, unidad
estadística o elemento
Por ejemplo, en estudios de poblaciones humanas, con frecuencia ocurre que la unidad elemental es cada
individuo.
10 CE86 Estadística Aplicada 1

Censo vs Encuesta
Un censo es un método para recopilar datos de toda una población. Los datos recopilados, sobre las
variables de estudio, son precisos y detallados.
Una encuesta es un método de recopilación de datos de parte de una población que puede enfocarse en
conocer diferentes tipos de temas e información, como opiniones, comportamientos, preferencias de
consumidores, etc.
EPE 11

Ejercicio 1
La empresa SAI, Systems Artificial Intelligence, se dedica al
desarrollo de sistemas basados en inteligencia artificial y está
conformada por un equipo de especialistas de ingeniería
industrial y de sistemas. Para cumplir con las metas del próximo
año, la empresa actualmente se ha sometido a un proceso de
evaluación. Por tal motivo la empresa evaluadora ha seleccionado
al azar 105 productos de sistemas de inteligencia artificial
desarrollados en los últimos cinco años.
Determine la población, muestra, unidad elemental.
12 CE86 Estadística Aplicada 1

Población Sistemas Basados en Inteligencia Artificial

Muestra Selección al azar de 105 productos

Unidad elemental Un sistema.

Ejercicio 2
La empresa constructora Concreto S.A., para realizar un control de calidad de sus instrumentos, está
analizando 158 teodolitos electrónicos actualmente en uso. El propósito es estimar la vida útil promedio de
estos instrumentos. Determine:

Teodolito
Población

Muestra
Teodolito
Unidad elemental

Ejercicio 3
Se desea estimar el promedio diario de clientes que ingresan a Promart, para lo cual se decide elegir cinco
días al azar del presente mes y registrar el número de clientes que ingresó cada día a la tienda. Determine:

Clientes diarios
Población
5 clientes diarios
Muestra
Cliente
Unidad elemental

Dato
Es el resultado de medir una característica de una unidad elemental.

Observación
Es el conjunto de datos obtenidos al medir las características de una unidad elemental.
La observación o registro se obtiene para cada unidad elemental.
EPE 13

Dato Dato

Observación o Registro
14 CE86 Estadística Aplicada 1

Variable
Se define así a una característica que presentan los elementos de una población y que puede asumir
diferentes valores cuando se realiza su medición.

Variables cualitativas

También son conocidas como categóricas. Son aquellas variables que al ser medidas quedan expresadas por
etiquetas o nombres que se utilizan para identificar una característica o atributo.

Variables cuantitativas

Son aquellas variables que al ser medidas quedan expresadas por números que se utilizan para identificar una
característica o atributo.
Estas a su vez pueden clasificarse en discretas o continuas.

 Una variable es cuantitativa discreta si el conjunto de posibles valores que toma es finito o infinito
numerable, es decir, que sólo puede tomar ciertos valores en un intervalo determinado.
 Una variable es cuantitativa continua si el conjunto de posibles valores es infinito no numerable, es decir,
que puede tomar cualquier valor en un intervalo determinado.

Ejercicio 4
La Corporación Aceros Perú es una empresa que se dedica a la industria del acero. Actualmente, la empresa
produce principalmente barras de acero dulce siendo su principal mercado el sector de la construcción. Al
departamento de control de calidad se le ha encargado realizar un estudio sobre las devoluciones. Al
seleccionar una muestra aleatoria de 80 barras de acero dulce de la sección de devoluciones del almacén,
se midieron las siguientes características:
EPE 15

1.- Uso más frecuente de barras de acero dulce:


 Estribos  Vigas cajón
 Tableros  Vigas
 Losas
2.- Resistencia a la tracción: ………………… (Kg/cm 2)
3- Categoría del límite de fluencia
 Alta  Regular  Baja
16 CE86 Estadística Aplicada 1

4.- Tipo de defecto


 Pliegues  Marcas mecánicas  Porosidad
 Grietas  Fisuras  Corrosión

Considerando esta información, determine la población bajo estudio, la muestra analizada, la unidad
elemental y el tipo de variable.

Población Barras de acero

Muestra 80

Unidad elemental Acero Dulce

Variable Tipo

1. Cualitativa

2. Cuantitativa

3. Cuantitativa continua

4. Cualitativa

Ejercicio 5
La empresa SAI, Systems Artificial Intelligence, se dedica al desarrollo de sistemas basados en inteligencia
artificial y está conformada por un equipo de especialistas de ingeniería industrial y de sistemas. Para
cumplir con las metas del próximo año, la empresa actualmente se ha sometido a un proceso de
evaluación. Por tal motivo la empresa evaluadora ha seleccionado al azar 105 productos de sistemas de
inteligencia artificial desarrollados en los últimos cinco años. Las características de interés auditadas son:
  Utilidades (en cientos de miles de soles)
 Tiempo de desarrollo (días)
 Número de programadores.
 Tipo de problemas: Falta de programadores, pocas capacitaciones, insuficientes reuniones de
coordinación, falta de diseñadores.
 Nivel de dificultad: Básico, promedio, avanzado.
Determine la población, muestra, unidad elemental y tipo de cada variable.

Población Sistemas

Muestra 105

Unidad elemental Productos

Variable Tipo

I. Cuantitativa discreta

II. Cuantitativa discreta

III. Cuantitativa discreta

IV. Cualitativa
EPE 17

V. Cuantitativa continua

Escalas de medición
Otra forma común de clasificar las variables es mediante el uso de cuatro niveles de medición; nominal,
ordinal, de intervalo y de razón. Cuando la estadística se aplica a problemas reales el nivel de medición de
las variables es un factor importante para determinar el procedimiento a usar.
18 CE86 Estadística Aplicada 1

Escala nominal Escala ordinal Escala de Escala de razón


Los valores que toma La escala de medición intervalo Tiene las propiedades
una variable en escala ordinal permite Tiene las propiedades de la escala de
nominal carecen de un establecer un orden de la escala ordinal, intervalo con la
orden o de un entre los diferentes pero con la propiedad adicional de
significado numérico, valores que toma la característica adicional tener un punto de
no pueden utilizarse variable. En esta escala que la diferencia entre partida natural o cero,
para realizar cálculos. A de medición no es dos valores cualquiera que indica que nada de
menudo se asignan posible determinar las de la variable tiene un la variable se
números a las diferencias entre los significado. Sin encuentra presente.
diferentes categorías, valores de la variable o embargo, los valores Para esta escala de
pero no tienen tales diferencias en esta escala no medición además de
significado carecen de sentido. tienen un punto de las diferencias, las
computacional y partida natural o cero. proporciones también
cualquier promedio CERO = Valor Relativo tienen significado.
que se calcule carece CERO = Valor Absoluto
de sentido.

Ejercicio 6
Las redes basadas en cableado de fibra óptica están muy extendidas en su uso dentro del entorno de las
telecomunicaciones y redes de área local. Poseen una gran capacidad para transmitir datos.
Habitualmente el profesional que demanda un cableado de fibra óptica lo hace para conectar puntos con
gran necesidad de caudal de información, o bien para establecer líneas de datos de alta seguridad.
Optical Network, empresa dedicada al cableado de fibra óptica, como parte de un estudio, analiza la
información recopilada correspondiente a las siguientes variables:

I. Tipos de instalación más solicitada (Aprovechando una canalización existente, Tendido aéreo, Tendido
por fachada, Realizando obra civil)
II. Cantidad de servidores por empresa.
III. Costo de instalación (en dólares)
IV. Modelo de pistola pasacable usada (EZ50, EZ100, EZ300). Ordenadas por orden cronológico y mejoras
realizadas.

Identifique el tipo de variable y la escala de medición correspondiente.

Variable Tipo Escala


EPE 19

I. Cualitativa Nominal

II. Cuantitativa discreta Razón

III. Cuantitativa discreta Razón

IV. Cualitativa Nominal

Ejercicio 7
Complete la siguiente tabla:
20 CE86 Estadística Aplicada 1

Variable Tipo Escala de medición


Intervalo
Número de celular Cuantitativa continua
Longitud de cable de fibra óptica Razón
Cuantitativa discreta
usado en una instalación industrial
Marca de un medidor láser de
distancia
Tiempo de vida útil de una laptop.

Peso de un celular, en kilogramos


Grado en el ejército (general,
coronel, comandante, etc.)
Kilometraje de un auto
Tamaña de una bebida (personal,
mediana, grande)

Parámetro Estadístico
Un parámetro es un valor que representa alguna Un estadístico o estimador es un valor que
característica de la población. representa alguna característica de la muestra.

Algunos parámetros y estadísticos que se pueden calcular son:

Ejemplo 1.
En este ejemplo, el parámetro es <porcentaje poblacional de votantes que lo hicieron por FREPAP> y su
valor es 9.66%. Es parámetro pues el porcentaje se calculó considerando todos los votos válidos.
EPE 21
22 CE86 Estadística Aplicada 1
Fuente: ONPE. Resultado de elecciones congresales al 100% de actas

Ejemplo 2.
En este ejemplo, el estadístico es <porcentaje muestral de electores que votarían a favor de los candidatos
del partido morado>. Es estadístico pues el porcentaje fue calculado de una muestra obtenida antes de la
votación. Su valor: 4%

Fuente: Ipsos-Perú

Ejercicio 8
El banco A estudió la información que dieron sus clientes en el presente mes al solicitar un préstamo
vehicular. Al analizar una muestra de 180 clientes se obtuvieron algunos resultados que se muestran:
• El 12% declaró tener un trabajo independiente.
• La media de la edad de los clientes al solicitar un préstamo fue de 41,3 años.
• El 50% declaró ser casado.
• La media del monto de las solicitudes fue de 3025 soles.
Identifique el estimador y el valor del estimador para cada una de las variables.
Solución

Variable Estimador Valor

Proporción muestral 12%


Situación laboral
Media muestral 41.3 años
Edad
Estado civil Proporción muestral 50%

Solicitudes Media poblacional 3025


Ejemplo 3.

El hotel La Posada es nuevo en el mercado hotelero de Puno. La gerencia general desea invertir en
publicidad para incrementar la cantidad de huéspedes extranjeros en el hotel. Se desea conocer qué
características del hotel es conveniente resaltar en la publicidad, para ello aplicó una encuesta a una
muestra aleatoria de 56 mujeres y 64 hombres extranjeros que se hospedaron entre enero y mayo del
presente año. A continuación, se presenta parte de la base de datos:

Precio dispuesto
Número de
País de a pagar por
N° Edad Género acompañantes Criterio de selección del hotel
Procedencia habitación en
por viaje
dólares
1 25 Masculino Inglaterra 80 0 Limpieza del dormitorio
EPE 23

2 35 Femenino Argentina 60 2 Precio


3 45 Masculino Francia 115 3 Buena calidad de las toallas y sábanas
4 65 Masculino Francia 45 0 Precio
5 72 Femenino Francia 55 1 Amigable y cordial staff de empleados
6 28 Masculino Estados Unidos 65 2 Precio
7 45 Femenino Estados Unidos 60 1 Precio
… … … … … … …

Después de procesar la información se obtuvieron los siguientes resultados:


 El 34% de los huéspedes extranjeros procede de los Estados Unidos.
 La edad promedio de los huéspedes es de 35,2 años.
 El número de acompañantes por huésped extranjero más frecuente es de dos personas.
24 CE86 Estadística Aplicada 1

 El criterio de selección más frecuente es el precio.


Responda a las siguientes preguntas:
a. Determine la población, la muestra y la unidad elemental. Huespedes extranjeros, 56 m y 64 h,
huespedes
b. ¿Cuántas observaciones hay? 7
c. ¿Cuántos datos conforman una observación? 6
d. ¿Cuántos datos hay en total? 42
e. Proporcione un ejemplo de dato y uno de observación.
f. Indique la escala y el tipo de cada variable.
g. Identifique el estimador y el valor del estimador para cada variable de la base de datos.

Solución
a. Determine la población, la muestra y la unidad elemental.
Todos los huéspedes extranjeros que se hospedaron en el hotel La Posada entre
Población
enero y mayo del presente año.
(Algunos) 120 huéspedes extranjeros que se hospedaron en el hotel La Posada
Muestra
entre enero y mayo del presente año.
Un huésped extranjero que se hospedó en el hotel La Posada entre enero y
Unidad elemental
mayo del presente año.

b. ¿Cuántas observaciones hay? Hay 120 observaciones


c. ¿Cuántos datos conforman una observación? Seis datos, pues hay seis variables.
d. ¿Cuántos datos hay en total? Hay 720 datos (6 x 120)
e. Proporcione un ejemplo de dato y uno de observación.

Dato X4 = 65 años
Observación X4 = 65 años, masculino, Francia, 45 dólares, 0 acompañantes, precio
f. Indique la escala y el tipo de cada variable.

Variable Tipo de variable Escala de medición

Edad Cuantitativa continua Razón

Género Cualitativa Nominal

País de procedencia Cualitativa Nominal

Precio dispuesto a pagar por habitación Cuantitativa continua Razón

Número de acompañantes por viaje Cuantitativa discreta Razón

Criterio de selección del hotel Cualitativa Nominal

g. Identifique el estimador y el valor del estimador para cada una de las variables de la base de datos.

Variable Estimador Valor del estimador


Proporción de huéspedes
Lugar de procedencia 0,34
que procede de EEUU
Edad de los huéspedes Promedio 35,2 años
Número de acompañantes Moda 2
EPE 25

Criterio de selección del hotel Moda Precio


26 CE86 Estadística Aplicada 1

Organización y presentación de datos


Luego de aplicar una encuesta a una muestra de 30 empleados, una empresa obtiene la siguiente base de
datos. Se pide redactar un informe que resuma la información.

Base de datos sobre satisfacción laboral


Tiempo en Número de Promoción Número de Relación con
Género Función Edad Ingreso anual
la empresa promociones posible capacitaciones la gerencia

Femenino Obrero 19 1 11 400 0 Improbable 1 Buenas


Masculino Profesional 31 5 210 600 2 No está seguro 2 Buenas
Masculino Profesional 34 8 193 400 1 Probable 2 Buenas
Masculino Servicios 36 15 30 800 1 Improbable 0 Buenas
Masculino Obrero 44 4 9 850 0 Improbable 1 Regulares
Masculino Obrero 44 10 9 800 0 Improbable 1 Regulares
Masculino Técnico/ventas 31 5 40 840 0 Improbable 3 Buenas
Femenino Profesional 37 8 93 700 1 No está seguro 2 Buenas
Masculino Obrero 45 23 10 150 0 Improbable 1 Regulares
Masculino Obrero 54 18 9 050 0 Muy improbable 1 Regulares
Femenino Profesional 26 2 62 200 2 No está seguro 2 Buenas
Masculino Obrero 44 14 10 200 0 Probable 0 Regulares
Masculino Técnico/ventas 31 2 40 335 0 Muy improbable 2 Buenas
Femenino Producción 28 10 30 990 1 Muy improbable 1 Buenas
Femenino Obrero 23 5 9 360 1 Muy improbable 1 Buenas
Femenino Producción 38 20 33 800 0 Muy improbable 1 Buenas
Masculino Producción 38 9 35 500 1 Muy improbable 2 Buenas
Masculino Técnico/ventas 32 2 40 540 0 Improbable 2 Buenas
Masculino Servicios 36 18 27 500 1 Muy improbable 1 Buenas
Femenino Obrero 48 25 10 200 0 Muy improbable 1 Buenas
Masculino Obrero 45 20 9 650 0 Improbable 1 Regulares
Femenino Técnico/ventas 22 2 44 000 0 No está seguro 2 Buenas
Masculino Técnico/ventas 32 6 48 560 1 Improbable 2 Buenas
Masculino Obrero 46 20 10 300 0 Muy improbable 1 Regulares
Masculino Profesional 28 1 108 700 3 Improbable 5 Buenas
Femenino Producción 27 5 30 550 1 Muy improbable 2 Buenas
Masculino Producción 38 14 32 300 0 Muy improbable 1 Buenas
Masculino Obrero 40 20 9 130 0 No está seguro 0 Regulares
Masculino Profesional 24 1 70 000 1 Probable 3 Buenas
Masculino Obrero 56 30 9 740 0 Muy improbable 1 Regulares
EPE 27

Tabla de distribución de frecuencias o tablas estadísticas

Frecuencias absolutas, relativas y porcentuales


28 CE86 Estadística Aplicada 1

 La frecuencia absoluta (fi ) de una clase es la cantidad de elementos que pertenecen a esa clase.
 La frecuencia relativa (hi ) de una clase es la proporción de elementos que pertenecen a esa clase.
frecuencia absoluta fi
Frecuencia relativa  hi   
número de datos n
 La frecuencia porcentual (pi) de una clase es la frecuencia relativa multiplicada por 100%.

Frecuencia porcentual  pi   hi  100%

Tabla de distribución de frecuencias para variables cualitativas


Se deberá presentar en la tabla las diferentes categorías que asume la variable cualitativa y en la columna
de las frecuencias absolutas la cantidad de veces que se repite esta categoría de la variable.

 Si la medición está hecha en escala nominal sólo deberá mostrarse las frecuencias absolutas y relativas.
 Si la variable cualitativa está medida en escala ordinal, tendrá sentido mostrar las frecuencias
acumuladas absolutas y relativas.

La distribución de frecuencias es un cuadro que se calcula de la siguiente manera:

Distribución de <unidades elementales> según <variable>


Variable Frecuencia absoluta fi Frecuencia relativa hi Frecuencia porcentual pi
f1
Categoría 1 f1 h1  p1  h1  100
n
f2
Categoría 2 f2 h2  p2  h2  100
n
… … … …
fk
Categoría k fk hk  pi  hi  100
n
Fuente: ……………………………………..

Título de una tabla de distribución de frecuencias

De acuerdo con el INEI, para los títulos seguiremos el siguiente esquema:


Distribución de <unidades elementales> según <variable>

Ejercicio 9
Motores S.A. es una empresa que brinda servicios de mantenimiento y reparación de autos. El último
semestre reporta se siguiente información sobre la función del trabajador dentro de la empresa:
Obrero Profesional Técnico Servicios Obrero Obrero Obrero Obrero
Profesional Producción Técnico Producción Obrero Producción Obrero Obrero
Obrero Técnico Profesional Obrero Técnico Producción Profesional
Obrero Producción Técnico Profesional Servicios Obrero Profesional
a. Presente la tabla de distribución de frecuencias.
b. Interprete la frecuencia absoluta y la frecuencia relativa de la primera categoría.
c. Realice e interprete el gráfico de barras de frecuencias absolutas.
EPE 29

Solución
a. Presente la tabla de distribución de frecuencias.
Título: ……………………………………………………………………………………………………………………………………….
Función fi hi pi
Obrero
Producción
Profesional
Servicios
30 CE86 Estadística Aplicada 1

Técnico
Total
Fuente: ……………………………………………………………………………

b. Interprete la frecuencia absoluta y la frecuencia relativa de la primera categoría.


f1 = de un total de ……….…30………... trabajadores, ………12……..……. son ……obreros…………
p1 = el …40% de los trabajadores son ………obreros…………..………………………….……

Representación gráfica de variables cualitativas

Gráfico de barras
En el eje horizontal se representa las categorías de la variable y en el
eje de ordenadas las frecuencias absolutas, relativas o porcentuales.

Gráfico circular
En este caso las categorías de la variable cualitativa ocupan un espacio en el
círculo que es proporcional a la frecuencia que representan. También se
denomina diagrama de sector circular, gráfico tipo torta o pastel.

Si la variable cualitativa es de escala ordinal se recomienda usar el gráfico de


barras.

Ejemplo 4.
La universidad A realizó una encuesta a 30 jóvenes que están terminando el colegio con la finalidad de
conocer sus preferencias profesionales. De los datos obtenidos se construyó la siguiente tabla:

Distribución de estudiantes según su preferencia profesional


Preferencia profesional fi hi pi
Administración 5 0.1667 16.67%
Gastronomía 6 0.2000 20.00%
Derecho 4 0.1333 13.33%
Deporte 3 0.1000 10.00%
Ingeniería 8 0.2667 26.67%
Periodismo 4 0.1333 13.33%
Total 30 1.0000 100.00%
Fuente: Universidad A

a. Presente el gráfico de barras de frecuencias porcentuales.


EPE 31
32 CE86 Estadística Aplicada 1

Interpretación
Del gráfico se puede observar que el 26.7% de los estudiantes prefieren la carrera de Ingeniería y solo el
10% prefiere la carrera de Deporte.

b. Presente el gráfico circular de frecuencias porcentuales.

Interpretación
Del gráfico se puede observar que el 26,7% de los estudiantes prefieren la carrera de Ingeniería y solo el
10% prefiere la carrera de Deporte.

Ejercicio 10
Motores S.A. es una empresa que brinda servicios de mantenimiento y reparación de autos. El último
semestre reporta la siguiente información sobre la función del trabajador dentro de la empresa:
Obrero Profesional Técnico Servicios Obrero Obrero Obrero Obrero
Profesional Producción Técnico Producción Obrero Producción Obrero Obrero
Obrero Técnico Profesional Obrero Técnico Producción Profesional
Obrero Producción Técnico Profesional Servicios Obrero Profesional
Realice e interprete el gráfico de barras de frecuencias relativas.

Solución
EPE 33
34 CE86 Estadística Aplicada 1

Interprete:
La frecuencia relativa simple de la cuarta categoría

Diagrama de Pareto
El diagrama de Pareto es una representación gráfica que permite identificar y seleccionar los aspectos
prioritarios que hay que tratar para dar solución a la mayor cantidad de problemas reportados.
La regla de Pareto propone: “El 80% de los problemas que ocurren en cualquier actividad son
ocasionados por el 20% de los elementos que intervienen en producirlos”. Esto también se conoce como
“los pocos vitales y muchos triviales”
La regla o ley 80-20 también se interpreta como: “En un 20% de los factores o causas se concentra el 80%
del efecto”

Su uso más común:


 Buscar causas principales que generan la mayoría de los problemas reportados
 Identificar oportunidades para mejorar
 Identificar productos para mejora de la calidad
 Evaluar los resultados de cambios en el proceso comparando diagramas sucesivos

Pasos para su construcción:


1. Construya la distribución de frecuencias ordenando las categorías en forma decreciente respecto
de la frecuencia absoluta simple. La categoría “Otros” es ubicada en la última posición sin importar
cuán grande sea su frecuencia
2. Dibujar un eje vertical derecho, un eje vertical izquierdo y un eje horizontal
3. En el eje vertical derecho: usar una escala de 0% a 100%
4. En el eje vertical izquierdo: usar una escala de 0 hasta el total de observaciones (n)
5. En el eje horizontal: considerar las categorías de la variable cualitativa ya ordenadas (paso 1)
6. Elaborar el gráfico de barras considerando el eje vertical izquierdo
7. Elaborar el gráfico de líneas considerando el eje vertical derecho (Curva de Pareto)

Ejemplo 5.
La siguiente tabla muestra información ordenada de Defensa Civil sobre los defectos observados con mayor
frecuencia en los puentes vecinales construidos en estructura de madera de cierta localidad del interior del
país:
Defectos fi hi Hi Hi%
Pandeos y rajaduras 40 0.32 0.32 32
Pudrimiento de las piezas 30 0.24 0.56 56
Efectos del desgaste 20 0.16 0.72 72
Deformaciones 15 0.12 0.84 84
Ataques de insectos 10 0.08 0.92 92
Acción de fuego 5 0.04 0.96 96
Otros 5 0.04 1 100
Total 125 1    
EPE 35

Con la información mostrada construya un gráfico de Pareto y determine los principales defectos a ser
atendidos con prioridad que generan como máximo un 75% de los defectos reportados.
36 CE86 Estadística Aplicada 1

Fuente: Defensa civil

Gráfico de Pareto con Excel:

Elaborada la tabla de frecuencias, con


las categorías ya ordenadas, seleccione
la columna de categorías, la columna fi,
CTRL, columna Hi

Del menú principal elegir “Insertar”, “gráficos


recomendados”, “Todos los gráficos”,
“Cuadro combinado”

 Luego, doble clic sobre la línea horizontal, elegir “Eje secundario”


 Doble clic sobre el eje vertical izquierdo: Máximo = número de datos, Mínimo = 0
 Doble clic sobre el eje vertical derecho: Máximo = 1, Mínimo = 0
 Finalmente se debe configurar el título principal y los títulos de los ejes verticales y horizontal
EPE 37

Tabla de distribución de frecuencias de variables cuantitativas discretas

Distribución de <unidades elementales> según <variable>


38 CE86 Estadística Aplicada 1

Valores de la Frecuencia Frecuencia Frecuencia absoluta Frecuencia relativa


variable discreta absoluta fi relativa hi acumulada Fi acumulada Hi
f1
x1 f1 h1  F1  f1 H1  h1
n
f
x2 f2 h2  2 F2  f2  F1 H2  h2  H1
n
… … … … …
fk
xk fk hk  Fk  fk  Fk 1 H k  hk  H k 1
n
Fuente:……………………………………………………………………………………..

Representación gráfica de variables cuantitativas discretas

Gráfico de bastones o de varas


Por lo general, el gráfico de bastones es utilizado cuando la variable cuantitativa es discreta.
Su uso es adecuado cuando existen muchas observaciones, pero pocos valores de la variable.

Ejemplo 6.
Los siguientes datos corresponden al número de capacitaciones recibidas por los colaboradores
(trabajadores) de la empresa Creativa en lo que va del año.
1 2 2 0 1 1 3 2 1 1 2 0 2 1 1 1 2 2 1 1 1 2 2 1 5 2 1 0 3 1

a. Presente la tabla de distribución de frecuencias.


Distribución de colaboradores según número de capacitaciones recibidas
Número de capacitaciones fi hi Fi Hi
0 3 0.100 3 0.1000
1 14 0.467 17 0.5667
2 10 0.333 27 0.9000
3 2 0.067 29 0.9667
5 1 0.033 30 1.0000
Total 30 1.000
Fuente: Empresa Creativa

b. Interprete f2 , F2 , h3 y H2%
f2 = 14 De 30 colaboradores, 14 han recibido solo una capacitación al año
F2 = 17 De 30 colaboradores, 17 han recibido de una a menos capacitaciones al año
h2 = 0,467 La proporción de colaboradores que han recibido solo una capacitación al año es 0,467
H2%= 56,7% El 56,7% de los colaboradores han recibido de una a menos capacitaciones al año
c. Presente e interprete el gráfico de bastones de frecuencias absolutas para los siguientes datos.
EPE 39
40 CE86 Estadística Aplicada 1

Interpretación
De un total de treinta colaboradores, catorce de ellos han recibido una capacitación y solo un colaborador
ha recibido cinco capacitaciones en lo que va del año

Ejercicio 11

Calcule e interprete f2 y h1

Ejercicio 12
Luego de un periodo de tres meses de entrenamiento, los trabajadores que se integran a la empresa
metalúrgica Meppsa S.A. deben asistir a un máximo de 6 capacitaciones el primer año. A continuación, se
muestra el número de capacitaciones a las que asistieron los trabajadores incorporados a la empresa el
último año:
1 6 3 4 6 3 2 3 6 3 3 4 6 3 6 3 3 6 4 1
2 6 4 3 1 6 2 4 1 2 2 3 6 3 4 2 1 4 6 2

Solución
a. Presente la tabla de distribución de frecuencias.
Título: …………………………………………………………………..……………………………………………………………………………
fi hi Fi Hi
EPE 41

Fuente: …………………………………………………………………………………

b. Interprete los siguientes valores:

f3 = …………...
F2 = ………..…
h1 = …………..
H4 = …………..
42 CE86 Estadística Aplicada 1

c. Presente e interprete el gráfico de bastones.

Tabla de distribución de frecuencias: variables cuantitativas continuas

Para agrupar convenientemente los datos obtenidos al medir una variable cuantitativa continua,
seguiremos el siguiente procedimiento:

1ro: Determinar el Rango


Está determinado por la diferencia entre el máximo y mínimo valor:
Rango = Xmáx - Xmín
2do: Calcular el número de intervalos
Usaremos la regla de Sturges, la cual propone:
k = 1 + 3,322 x log n
Si la estimación tiene decimales, se toma el entero más próximo (redondeo simple).

3ro: Determinar la amplitud o ancho de cada intervalo


Se calcula de la siguiente manera:

W se redondea por exceso y con la cantidad de decimales que presenten los datos.

Por ejemplo:
w
Si los datos tienen
(redondeo a más)
Cero decimales w = 50.2381 w = 51
Una cifra decimal w = 50.2381 w = 50.3
Dos cifras decimales w = 50.2381 w = 50.24
Dos cifras decimales w = 0.38000
Dos cifras decimales w = 0.38001

Marcas de clase ( )
Son los puntos medios de los límites de cada intervalo.

Ejemplo 7.
EPE 43

El jefe de la Oficina de Rentas de una municipalidad ha realizado un estudio sobre los impuestos que pagan
los vecinos del distrito. Los datos de los pagos de impuestos, en soles, de 48 viviendas elegidas al azar en el
2015 son:

145.1 151 159 195.6 196.9 202.6 204.9 206.1 206.5 208 208 209.3
216.3 225.9 227.1 231.2 234.8 238.4 239.9 241.1 242.9 244 247.7 249.5
252.5 257.1 259.2 262.5 265.2 271 286.7 288.1 289.1 291 291.9 294.5
303.6 305.8 315.4 315.5 317.2 320.2 324.8 331.1 331.7 344.6 346.7 351.1

Elabore la tabla de frecuencias para la variable “Pago por impuestos municipales” para el presente año.
44 CE86 Estadística Aplicada 1

Solución
El rango r se calcula con:
r = valor máximo – valor mínimo = 351,1 – 145,1 = 206

Número de intervalos es: k  1  3,322 log10 n  1  3,322 log10 (48)  6,585  7 (redondeo simple)

r 206
La amplitud se calcula por: w   29,429  29,5
k 7

Usamos redondeo por exceso a un decimal debido a que los datos tienen como máximo un decimal.

A continuación, la tabla de distribución de frecuencias.

Distribución de viviendas según pago de impuesto municipal (en soles)


Pago de impuestos Marca de clase fi hi Fi Hi
[145.1 ; 174.6] 159.85 3 0.0625 3 0.0625
]174.6 ; 204.1] 189.35 3 0.0625 6 0.1250
]204.1 ; 233.6] 218.85 10 0.2084 16 0.3334
]233.6 ; 263.1] 248.35 12 0.2500 28 0.5834
]263.1 ; 292.6] 277.85 7 0.1458 35 0.7292
]292.6 ; 322.1] 307.35 7 0.1458 42 0.8750
]322.1 ; 351.6] 336.85 6 0.1250 48 1.0000
Total 48 1.000
Fuente: Oficina de Rentas de la Municipalidad

Interprete:

f2 = 3 En tres viviendas pagaron más de 174.60 soles y hasta de 204.10 soles

F2 = 6 En seis viviendas pagaron hasta 204.10 soles

h3 %= 20.84% El 20.84% de las viviendas pagaron más de 204.10 soles y hasta 233.6 soles

H3 %= 33.34% El 33.34% de las viviendas pagaron hasta 233.60 soles

Ejercicio 13
MetalTec es una empresa que brinda servicios de instalación, mantenimiento y reparación de estructuras
metálicas que viene operando desde el año 2005. La gerencia se ha propuesto evaluar la eficiencia para
atender los pedidos de sus clientes. Con este propósito selecciona aleatoriamente una muestra de registros
de ventas resaltando siguientes características:
 Tiempo que se tarda para atender un pedido.
 Nivel de satisfacción del cliente (completamente satisfecho, satisfecho, poco satisfecho nada satisfecho)
 Distrito en el que se encuentra el cliente.
Algunos de los resultados obtenidos luego de analizar la muestra, fueron:
 El tiempo promedio de atención es de 52 minutos.
 En cuanto al nivel de satisfacción el 31.5% estaban completamente satisfecho, 33.7% satisfecho, 29.2% poco
satisfecho y el resto nada satisfecho.
 El 30% de los pedidos son realizados en el distrito de Ate.
a) Determine la población, muestra, variables, tipo de variables, escalas de medición
EPE 45

Población

Muestra

Unidad elemental

Variable Tipo Escala

I.
46 CE86 Estadística Aplicada 1

II.
III.

b) Los tiempos en atender los pedidos (minutos), se presentan a continuación:


73.7 69.3 32.2 33.7 64.9 10 99.3
3.6 15 24.6 35 23.7 66 36.8
7.3 58.5 31.8 6.7 53.9 63.9 24.2
7.6 73.8 85.9 15.7 88.3 50.3 79.3
9.9 12.3 10.1 12.6 42 5.1 85.9
Presente los datos en una tabla de frecuencia.

Solución
Cálculo de los límites de los intervalos

Máximo =MAX(datos)
Mínimo =MIN(datos)
Rango =MAX(datos) – MIN(datos)
Cantidad de datos (n) =CONTAR(datos)
k (por regla de Sturges) =1+3,322*LOG10(n)
k (entero)
w (amplitud) =Rango/k (entero)
w (redondeada por exceso)

Distribución de ……………………… según ……………………..….


Marca de
Tiempo de servicio fi hi Fi Hi
clase
            
            
            
            
            
            
  
         
Fuente: …………………………….

Interprete:

f4 = …………..

F2 = ………….

h1 = …………..

H4 = ………….
EPE 47

Representación gráfica de variables cuantitativas continuas


Histograma

Este gráfico se realiza a partir de una tabla de frecuencias absolutas, relativas o porcentuales.
 Se traza colocando la variable sobre el eje horizontal y las frecuencias
sobre el eje vertical.
 Cada frecuencia de clase se representa trazando un rectángulo, cuya base es
el intervalo de clase sobre el eje horizontal y cuya altura es proporcional a la
frecuencia correspondiente.
 Los rectángulos adyacentes se tocan entre sí.
48 CE86 Estadística Aplicada 1

Ejercicio 14
A continuación, se muestra el tiempo de servicio, en meses, de los trabajadores de la empresa A.
Título: …………….………………………………………………………………………………………………………………………………
Marca de clase fi hi Fi Hi
[10 , 20 6
20 , 30 15
30 , 40 45
40 , 50 63
50 , 60 80
Total
Fuente: Empresa A

Grafique el histograma de frecuencias relativas.


Solución

Fuente: …………………………………………………………………….
Interpretación

Ejemplo 8.
La gerencia de una compañía, que brinda servicios de llamadas por celulares, está preocupada por el poco
monto de las llamadas realizadas por sus clientes. Para corroborarlo se encargó al área de administración
que eligiera, del mes de enero, una muestra de clientes de Lima y registró el monto que costaron sus
llamadas, en soles.

El encargado mostró los resultados en una tabla de distribución de frecuencias:

Distribución de clientes según monto de las llamadas (en soles)


Marca de
Monto de llamadas fi hi Fi Hi
clase
0  10  5 12 0.1000 12 0.1000
EPE 49

10 20  15 22 0.1833 34 0.2833


20 30  25 45 0.3750 79 0.6583
30 40  35 23 0.1917 102 0.8500
40 50  45 12 0.1000 114 0.9500
50 60  55 6 0.0500 120 1.0000
Total 120 1
Fuente: Área de Administración

Grafique el histograma de frecuencias porcentuales.


50 CE86 Estadística Aplicada 1

Solución

Interpretación
A partir del gráfico podemos observar que el 37,5% de los clientes de Lima tienen montos superiores a 20 y
como máximo de 30 soles y que solo el 5% de estos clientes tienen montos superiores a 50 y como máximo
de 60 soles.
EPE 51

Ejercicios propuestos

1. El gobierno está preocupado por la ocurrencia de un sismo de alta intensidad en el departamento


de Lima y por las consecuencias que esto podría generar, especialmente en algunos distritos como el
Cercado de Lima. Por esta razón Defensa Civil realizó un diagnóstico de la situación de las viviendas en
el mencionado distrito a través de una muestra de 1200 viviendas seleccionadas al azar. Se registraron
las siguientes variables:
I. Tiempo de construida la vivienda (años).
II.Tipo de material usado en la construcción (1 = Cemento, 2 = Adobe, 3 = Quincha, 4: Material
prefabricado)
III. Número de habitaciones por vivienda.
52 CE86 Estadística Aplicada 1

IV. Área del terreno en donde se construyó la vivienda.

a. De acuerdo al enunciado anterior identifique la población, la muestra y unidad elemental.


b. Identifique el tipo de variable y la escala de medición de cada variable.

2. Indique el tipo de variable y la escala de medición de las características observadas al analizar una
muestra de secciones de tuberías de agua.

Variable Tipo de variable Escala de medición


Diámetro de la tubería (pulgadas)
Material de la tubería
Año de instalación
Ubicación (subterránea, aérea)
Longitud de la tubería (pies)
Estabilidad del suelo circundante (inestable,
moderadamente estable o estable)
Corrosividad del suelo circundante (corrosivo
o no corrosivo)

3. Se encuestó a 245 estudiantes de la universidad A. Se sabe que en esta universidad el 72% del
alumnado pertenece al área de Humanidades y el resto al área de Ciencias.
Después de procesar la información muestral se obtuvo que:
 56% eran mujeres,
 el 33,2% prefiere el rock como género musical,
 el 45,7% gusta de la emisora 104,7 VIVA F.M.
 la media del número de veces que un oyente llamó a la radio en el último mes fue de 2,86 llamadas
y la moda de esa misma variable fue igual a uno.
Identifique el estimador o parámetro y su valor para cada una de las variables.

4. A un grupo de compradores de auto tomados al azar, se les preguntó sobre el color de su auto. Los
resultados obtenidos fueron:
Blanc Azul
Blanco Azul Verde Verde Verde Negro Rojo Negro Rojo Verde
o
Negro Rojo Rojo Azul Azul Azul Rojo Verde Negro Azul Verde Negro
Blanc Blanc Blanc Blanc Blanc Negro
Azul Verde Rojo Rojo Azul Verde
o o o o o
Blanc Blanc Azul Blanc
Negro Rojo Negro Rojo Rojo Verde Negro Negro
o o o
a. Presente la tabla de distribución de frecuencias que resuma la información de la variable.
b. Realice un gráfico circular. ¿Qué puede observar acerca del color de auto?
5. Complete la siguiente tabla de distribución de frecuencias que representa el número de fallas
reportadas en el acabado de automóviles. Antes de salir al mercado el lote producido, se analizó una
muestra de 100 autos.

Número de fallas fi Fi hi % Hi%


1 5%
2 14% 19%
EPE 53

3 18
4 62
5 20
6 92%
7 97%
8
Total

a. Identificar la unidad de análisis, variable y su tipo.


b. Interprete los valores f3, h2%, F6, H5%
54 CE86 Estadística Aplicada 1

6. El gerente de un banco está interesado en estudiar el comportamiento del número de cuentas de


ahorros cerradas por día. La información disponible para este fin se muestra a continuación:

0 3 1 2 1 0 2 3 0 1 4 1 4 4 0 4 3 1 2 2
1 5 0 5 4 1 0 2 1 3 0 3 2 1 1 2 5 4 0 1

a. Construya la tabla de distribución de frecuencias para la variable en estudio.


b. Construya el gráfico de bastones para representar la variable en estudio.

7. Los datos corresponden a los ingresos, en cientos de soles, de una muestra de 60 clientes del banco
A.
5.25 7.22 8.53 9.27 9.54 10.21 10.32 10.45 10.52 10.76
10.85 11.25 11.56 12.42 13.27 14.65 15.72 16.85 17.22 18.56
19.32 20.56 21.72 22.85 23.12 24.32 25.65 26.72 28.72 29.65
31.42 32.71 33.55 34.28 35.21 37.45 38.32 39.65 41.22 43.28
45.72 47.32 49.45 51.27 52.38 54.75 55.81 56.27 57.45 58.22
59.32 61.45 63.75 65.72 66.85 69.32 69.54 72.30 75.81 77.42
a. Construya una tabla completa de distribución de frecuencias usando la regla de Sturges.
b. Interprete los valores de f2, h3 y H4.

8. “La Italiana” es una empresa dedicada a la


fabricación de embutidos cárnicos que enfoca su
proceso de producción en mejorar y optimizar sus
productos para qué de esta forma, puedan
cumplir con los estándares del mercado e incluso
superarlos. La empresa está interesada en
identificar los problemas principales que afectan la
elaboración de embutidos crudos curados.

Problema más importante fi


Embarrado 11 En base a la información presentada
Embutición 20 construya el diagrama de Pareto y
determine los principales problemas a ser
Nitrificación 12
atendidos con prioridad por la empresa.
Otros 10
Sabor 7
Textura 18

9. La tabla muestra la distribución del ingreso familiar diario correspondiente a 80 familias.

Ingreso familiar diario fi Fi hi


[160 – 170
170 – 180 48 60
180 – 190 0.125
190 – 200 0.075
200 – 210
Fuente: Ciudad A

a. Complete los elementos faltantes de la tabla de frecuencias.


b. Determine el número de familias que ganan hasta 190 soles.
c. Determine el porcentaje de familias que ganan más de 180 soles y hasta 190 soles.
EPE 55

d. Determine el porcentaje de familias que ganan más de 170 soles y hasta 200 soles.
e. Determine el porcentaje de familias que ganan más de 190 soles.

10. Se ha demostrado que el PH del café está relacionado con la acidez percibida del café. Un PH entre
4.5 y 5.5 es el rango preferido para una buena taza de café. A continuación, se presenta el PH de una
muestra de tazas de café instantáneo Buencafé tradición producido por la empresa:

3.0 3.1 3.3 3.5 3.8 3.9 3.9 4.2 4.3 4.4
4.4 4.5 4.5 4.5 4.6 4.7 4.7 4.8 4.9 4.9
5.0 5.1 5.1 5.2 5.3 5.3 5.3 5.4 5.4 5.5
56 CE86 Estadística Aplicada 1

5.5 5.6 5.6 5.7 5.7 5.8 5.8 5.8 5.9 5.9
5.9 5.9 6.0 6.0 6.0 6.1 6.1 6.2 6.3 6.5

a. Elabore una tabla de frecuencias para la variable involucrada.


b. Construya un histograma de frecuencias

11. DIFUNDE es una de las principales corporaciones empresariales mundiales líder en la promoción


y gestión de infraestructuras (construcción, industrial, agua y servicios) y energías renovables. Su
oferta cubre toda la cadena de valor desde el diseño y la construcción, hasta la operación y el
mantenimiento. De los últimos proyectos realizados ha registrado las principales dificultades que se
presentaron en el desarrollo de cada uno de ellos:
Problema Número de proyectos
Dificultad para importar material 60
Otros 10
Atrasos en pagos por el inversionista 8
Accesibilidad a la zona 14
Falta de profesional calificado 28
Total 120
Determine los principales problemas a los que se debe dar solución para atender a lo más el 75% de
las dificultades presentadas en los proyectos realizados.

12. Se tiene información sobre los problemas de soporte técnico encontrados durante la instalación
y configuración de VaryPlot, programa usado en ingeniería civil. Construya un gráfico apropiado para
identificar los problemas a resolver con prioridad y atender, como máximo al 82% de problemas
reportados. La información resumida se presenta a continuación.

Problema Descripción fi
A Error en la actualización 200
B Permisos insuficientes 150
C Problemas con el sistema de nombres de dominio (DNS) 70
D Forestprep o Domainprep no finalizaron correctamente 80
E Falta el contenedor de conexiones de Active Directory 20
Otros Otros problemas 40

13. Tito´s, empresa dedicada a la venta de comida rápida por delivery, desea elevar el nivel de
satisfacción de sus clientes. Para atender las quejas más relevantes, llevó a cabo una encuesta por
teléfono entre 200 clientes que realizaron pedidos durante el último mes. Las quejas manifestadas por
estos clientes se resumen a continuación:

Quejas hi
Tiempo de entrega del pedido 0,40
Calidad del producto entregado 0,15
Error en el pedido 0,20
Otros 0,10
Cordialidad del empleado 0,10
No existe variedad 0,03
Precio 0,02

Presentando un gráfico apropiado, ¿Qué recomendaría al gerente de esta empresa de venta de


comida rápida por delivery?
EPE 57

14. CBT es un distribuidor de productos de automatización eléctricos y transmisiones de potencia.


Últimamente, a pesar de la innovación en tecnología, se ha observado un constante retraso en las
entregas por lo que el gerente desea saber cuáles son los errores más frecuentes para tomar una
acción de mejora. Por tanto, diseñó un formato donde se registran los errores de cada orden que no
se entregan a tiempo. Realice un análisis de los tipos de errores que se presentan en la entrega a
destiempo de los pedidos y ayude al gerente a decidir cuáles son las causas principales de este
problema.
Tipo de error fi
Error en el producto solicitado 37
Error en la cantidad solicitada 24
La orden de compra no está en el sistema 17
58 CE86 Estadística Aplicada 1

Falta de stock 5
Dirección de envío errónea 24
Doble envío 15
Otros errores de menor frecuencia 18

15. Dream Perú S.A.C. es una empresa industrial que, entre otras cosas, se dedica a la fabricación de
colchones. En la planta de producción el jefe de control de calidad está realizando una inspección de
los defectos de fabricación y de esa manera adoptar medidas correctivas. Si el jefe de control de
calidad desea corregir hasta un 76% de los defectos. ¿cuáles se deben de corregir con prioridad?
Utilice la siguiente información:

Defectos Reportados fi

Agujeros 38

Motas 46

Resortes 54

Otros 9

Deformaciones 12

Costuras 25

Total 184

16. Perú Plast S.A. es una empresa, qué entre otras cosas fabrica bolsas plásticas. El jefe de control de
calidad está realizando una inspección de los posibles defectos de producción, para este propósito
elige una muestra aleatoria de bolsas plásticas de la producción. Es su propósito corregir a lo más el
65% de los defectos reportados. Si llegara a detectar al menos tres defectos, entonces elevaría un
informe técnico al jefe de producción recomendándole calibrar sus máquinas.
En base al análisis del caso, ¿el jefe de control de calidad elevará el informe técnico al jefe de
producción? Utilice las dimensiones del razonamiento cuantitativo para resolver el caso y la siguiente
información:
Defectos Nº de bolsas plásticas
Mucha tinta 36
Costuras endebles 55
Sin el peso adecuado 28
Otros 12
Tinta contaminante 16
Mal diseño 23
Total 170
EPE 59

Unidad 2.
LOGRO
Al finalizar la unidad 2, el estudiante interpreta resultados obtenidos de medidas descriptivas.
60 CE86 Estadística Aplicada 1

Medidas de resumen: Medidas de tendencia central, de posición y de


variación

Las medidas de resumen sirven para describir en forma resumida un conjunto de datos que constituyen
una muestra tomada de alguna población.

Podemos distinguir cuatro grupos de medidas de resumen:


EPE 61

Medidas de tendencia central


Son aquellas medidas que localizan el centro de una distribución, indicando el valor alrededor del cual
tienden a concentrarse o distribuirse las demás observaciones. El objetivo es conseguir un valor que sea
representativo del conjunto total de datos que se está analizando.
62 CE86 Estadística Aplicada 1

Los ingresos, en dólares, para un grupo de


personas son los siguientes:
2650, 2500, 2580, 2420, 2350
El ingreso promedio es $ 2500
¿Es éste un valor representativo del ingreso para
este grupo de personas?

Los ingresos, en dólares, para un grupo de


personas son los siguientes:
2650, 2500, 2580, 2420, 15200
El ingreso promedio es $ 5070
¿Es éste un valor representativo del ingreso para
este grupo de personas?

Si el promedio no es representativo, ¿qué alternativas disponemos si se quiere hallar un valor central


alrededor del cual se distribuyen los demás?

Media
La media de un conjunto de valores de una variable es la suma de dichos valores dividida entre el número
de valores. También se le denomina media aritmética o promedio.

La fórmula para calcular la media es:


N  Media muestral
 x i n
Media poblacional
 i 1
N
x i
x i 1
n

En Excel, use la función =PROMEDIO(DATOS)

Analice la siguiente información:


Ingreso promedio mensual según grupos de edad
Variación
Marzo-Abril- Marzo-Abril-
Absoluta Porcentual
Mayo 2018 Mayo 2019
  (Soles) (%)
Total 1 650,0 1 723,7 73,7 4,5
Grupos de edad
De 14 a 24 años 1 030,0 1 083,8 53,8 5,2
De 25 a 44 años 1 746,0 1 778,6 32,6 1,9
De 45 y más años 1864,6 1 955,2 90,6 4,9

Ejemplo 9.
Los siguientes datos corresponden al número de visitas al mes que una muestra de 30 estudiantes realizó a
la cafetería de la universidad.

4 2 4 2 1 3 3 1 3 3 4 1 1 4 1

Variable:
Tipo de variable:
EPE 63

Escala:
Calcule e interprete la media de la variable en estudio.

Solución
La media del número de visitas de los 30 estudiantes es de 2,6 visitas al mes.
Esto significa que el número de visitas al mes a la cafetería de la universidad está alrededor de 2,6 veces al
mes.

Ejercicio 15
64 CE86 Estadística Aplicada 1

Los siguientes datos corresponden a la estatura, en metros, de una muestra aleatoria de hombres peruanos
de 18 años.
1.73 1.73 1.84 1.71 1.61 1.50 1.78

Calcule e interprete el promedio de la variable en estudio.

Solución
El promedio de la estatura de una muestra de hombres peruanos de 18 años es …………………………………..….

Mediana
La mediana de un conjunto de datos observados de una variable es el valor que ocupa la posición central
una vez puestos los datos en orden de magnitud, es decir, ordenados de menor a mayor.
La mediana es el valor tal que aproximadamente el 50% de las observaciones son menores o iguales a su
valor. Se denota por Me.

En Excel, use la función =MEDIANA(DATOS)

Ejercicio 16
Interprete las siguientes afirmaciones.
La mediana de la edad de las peruanas que viven en Lima es 28 años.

La mediana de la edad de las peruanas que viven en Iquitos es 19 años.

19029 euros es el sueldo mediano de un español.

Características de la mediana

 Se puede calcular para variables medidas en escala de ordinal, intervalo o razón.


 La mediana es una medida robusta, es decir, no se ve afectada por valores extremos. Por eso se le
utiliza cuando hay datos inusuales o la distribución de frecuencias no es simétrica.

Ejercicio 17
Los siguientes datos corresponden al número de visitas que realizó el presente mes una muestra de
estudiantes a la cafetería de la universidad.
EPE 65

4 2 4 2 1 3 3 1 3 3 4 1 1 4 1

Calcule e interprete la mediana de la variable en estudio.

Solución
La mediana del número de visitas es igual a………. veces al mes, esto significa que ……………………… de los
estudiantes visitaron la cafetería de la universidad ……………………….…………….
66 CE86 Estadística Aplicada 1

Moda
La moda de un conjunto de datos observados de una variable es el valor que se presenta con mayor
frecuencia. Se denota por Mo.

Características de la moda

 La moda se puede calcular para cualquier escala de medición.


 El valor de la moda no se ve afectada por valores extremos.
 La moda no siempre es un valor único. Una serie de datos puede tener dos modas (bimodal) o más de
dos modas (multimodal).
 Un conjunto de datos pudiera incluso no tener moda.
 La moda es una medida menos importante que la mediana o la media debido a su ambigüedad.

En Excel, use la función =MODA.VARIOS(DATOS)

Ejercicio 18
Los siguientes datos corresponden al número de visitas que realizó el presente mes una muestra de
estudiantes a la cafetería de la universidad.

4 2 4 2 1 3 3 1 3 3 4 1 1 4 1 2 4 1 4 1
5 5 5 3 1 3 1 4 1 1 5 2 3 2 1 6 2 3 2 8

Calcule e interprete la moda de la variable en estudio.

Solución
En este caso, el resultado es igual a ……… vez al mes.

Esto significa que los estudiantes visitan con mayor frecuencia la cafetería de la universidad
………………………….. vez al mes.

Ejercicio 19
A continuación, se presenta la información de una muestra aleatoria de 15 profesionales egresados de la
carrera de Administración.

Edad (años) 15 19 21 31 21 24 30 26 22 31 31 28 31 31 24
Estatura (cm) 154 154 154 184 173 170 176 188 168 161 171 175 187 161 161

Calcule e interprete la moda de la edad y la moda de la estatura.


Solución

Propiedades de la media aritmética


 El valor de la media es sensible a los valores extremos, por lo que varía mucho con valores muy grandes
o muy pequeños con respecto a los demás.
 El promedio de una cantidad constante es la misma constante: M(K) = K
EPE 67

 Si una variable X se expresa como : Y = aX ± K,


siendo a y k constantes, entonces: M(Y) = M(aX ± K) = aM(X) ± K
 Si n1 datos tienen media x1 y n2 datos tienen media x2 , luego la media de los n1+ n2 datos es:
n1 x1  n2 x2
x
n1  n2
Ejemplo 10.
En una negociación por aumento de salarios, la gerencia de la empresa A ofrece a sus empleados dos
alternativas.
 La primera consiste en un aumento general del 5%.
 La segunda consiste en un aumento general del 2% más un bono de 150 soles.
68 CE86 Estadística Aplicada 1

Indique la alternativa que da a los empleados el mayor promedio de sueldos, si la media de los sueldos es
actualmente de 3700 soles.

Solución
Alternativa 1
X: Salario M(X) = 3700
Y: Nuevo salario Y = X + 0.05X
Y = 1.05X
M(Y) = M(1.05X)
M(Y) = 1.05M(X) = 1.05*3700 = 3885
Alternativa 2
X: Salario M(X) = 3700
Y: Nuevo salario Y = X + 0.02X + 150
Y = 1.02X + 150
M(Y) = M(1.02X+ 150)
M(Y) = 1.02M(X) + 150 = 1.02*3700 + 150 = 3924

Decisión

Ejercicio 20
Se sabe que los ingresos mensuales que perciben los trabajadores de una empresa tienen un promedio de
2800 soles, determine el nuevo ingreso promedio que se obtendría luego de realizar los siguientes
aumentos:
a. los ingresos de los trabajadores se incrementan en 250 soles.
b. los ingresos se incrementan en un 7.5%.
c. los ingresos se incrementan en un 12.5% más una bonificación de 125 soles.

Solución

Relación entre Media, Mediana y Moda


Para conocer la forma que presenta un conjunto unimodal de datos podemos cuantificar el grado de
deformación horizontal comparando las tres medidas de tendencia central.

 Si los datos se distribuyen con igual frecuencia y alejamiento por debajo y por encima de la media, se
dice que la distribución es simétrica.
 Si los datos que son menores a la media son más frecuentes que aquellos por encima de la media o
viceversa, se dice que la distribución es asimétrica.
EPE 69

Media < Mediana < Moda Media = Mediana = Moda Moda < Mediana < Media
Distribución Asimétrica Negativa Distribución Simétrica Distribución Asimétrica Positiva
70 CE86 Estadística Aplicada 1

Medidas de posición o cuantiles


Las medidas de posición o cuantiles son los valores que determinan la posición de un dato respecto a todos
los demás datos de una serie y que previamente ha sido ordenada de menor a mayor.

Los cuantiles más importantes dividen a los datos ordenados de menor a mayor en 4, 10 y 100 cantidades
iguales de datos, denominándose cuartiles, deciles y percentiles, respectivamente.
EPE 71

Percentiles
Los percentiles dividen el conjunto de datos en 100 partes porcentualmente iguales.
El percentil k, Pk, es el valor tal que aproximadamente el k% de los datos ordenados es menor o igual a ese
valor y el (100 – k)% de los datos es mayor a ese valor.
72 CE86 Estadística Aplicada 1

En Excel, use la función =PERCENTIL.EXC(datos; k/100)

Ejercicio 21
Interprete las siguientes afirmaciones.
De acuerdo con un informe publicado en agosto del 2016 por la Oficina de Presupuesto del Congreso de
EEUU, el percentil 90 del ingreso anual de las familias en ese país es 942 000 dólares.

De acuerdo con la Organización Mundial de la Salud (OMS), el percentil 15 del peso de una niña de un año
en el mundo es ocho kilos.

Ejercicio 22
Indique, en los siguientes casos, el percentil adecuado:
50% de las observaciones 50% de las observaciones
P…..

30% de las observaciones 70% de las observaciones


P…..

60% de las observaciones 40% de las observaciones


P…..

22% de las observaciones 33% de las observaciones 45% de las observaciones


P…… P……..

Ejercicio 23
A continuación, se presentan los ingresos mensuales, en soles, de un grupo de trabajadores de la empresa
A.

2548 3120 1870 2458 3000 2890 1500 4005 1900 2410 2300 2870
2710 2955 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325

a. Calcule el ingreso mensual mínimo para estar en el 15% de los trabajadores que más ganan.
b. Calcule el ingreso mensual mínimo para estar en el quinto superior de los trabajadores que más ganan.
Solución

a. Calcule el ingreso mensual mínimo para estar en el 15% de los trabajadores que más ganan.

En Excel, use la función =PERCENTIL.EXC(………………..; ………….)

b. Calcule el ingreso mensual mínimo para estar en el quinto superior de los trabajadores que más ganan.

En Excel, use la función =PERCENTIL.EXC(………………..; ………….)


EPE 73

Medidas de dispersión o variabilidad


Con las medidas de tendencia central es posible determinar el valor central de una distribución, pero no
indican qué tan cercanos o lejanos están los datos de dicho valor central.
Las medidas de dispersión o variabilidad indican cuán alejados están los valores de una variable del valor
que los representa y por lo tanto permiten evaluar la confiabilidad de ese valor central.
74 CE86 Estadística Aplicada 1

Cuando la medida de dispersión tiene un valor pequeño, los datos están concentrados alrededor de la
medida de tendencia central, en cambio si la medida de dispersión tiene un valor grande, los datos no
están concentrados alrededor de la medida de tendencia central.

Varianza
La varianza mide el grado de dispersión o variación de los valores de una variable con respecto a su media
aritmética.

Se calcula usando la siguiente fórmula:


N

Varianza poblacional  x   i
2

2  i 1
N
n

Varianza muestral  x  x
i
2

s2  i 1
n 1
En Excel, use la función =VAR.S(datos)

Desviación estándar
Se define como la raíz cuadrada positiva de la varianza.

En Excel, use la función =DESVEST.M(datos)

Características de la varianza y la desviación estándar


 La varianza y la desviación estándar son números reales no negativos.
 Se pueden calcular para variables medidas en escala de intervalo o razón.
 Se ven afectadas por valores extremos.
 La varianza es expresada en unidades cuadráticas a las unidades de los datos, mientras que la desviación
estándar es expresada en las mismas unidades de los datos.

Ejemplo 11.
Ante la pregunta sobre el número de hijos por familia, una muestra de 12 hogares marcó las respuestas
mostradas en la siguiente tabla:
2 1 2 4 1 3 2 3 2 0 5 1

Calcule la varianza y la desviación estándar de la variable en estudio.


Solución
En Excel, use la función:
 =VAR.S para calcular la varianza muestral, s2 = 1,9697 hijos2.
 =DESVEST.M para calcular la desviación estándar muestral, s = 1,4035 hijos.

Coeficiente de variación
Las medidas de dispersión estudiadas son medidas de variación absolutas, pues se expresan en las mismas
unidades que la variable, excepto la varianza que se expresa en unidades al cuadrado.
EPE 75

Es útil al comparar la variabilidad de dos o más series de datos que se expresan en distintas o iguales
unidades, pero difieren a tal punto que una comparación directa de las respectivas desviaciones estándar
no es muy útil, por ejemplo, cuando las medias están muy distantes.

Al coeficiente de variación también se le denomina una medida de dispersión relativa.


El coeficiente de variación (CV) de un conjunto de datos indica el porcentaje que es la desviación estándar
en comparación con la media.
76 CE86 Estadística Aplicada 1

Se calcula en variables medidas en escala de razón.

Cálculo del coeficiente de variación


La fórmula para su cálculo es:

Coeficiente de variación poblacional CV   100%

s
Coeficiente de variación muestral CV   100%
x
En Excel, use la función =DESVEST.M(datos)/PROMEDIO(datos)

Ejercicio 24
Usando la opción <Análisis de datos> y la función =PERCENTIL.EXC(datos; k/100) de Excel se ha obtenido la
siguiente tabla de las respuestas obtenidas del tiempo de servicio en una encuesta realizada a una muestra
de 400 empleados de la empresa A realizada el presente año.
Estadísticos Casado Soltero Divorciado
Media 141.823 143.285 135.75
Mediana 132 112 128
Moda 94 #N/A 124
Desviación estándar 46.042 65.288 45.921
Varianza de la muestra 2119.904 4262.571 2108.733
Coeficiente de asimetría 1.612 1.958 0.059
Rango 180 181 139
Mínimo 94 99 61
Máximo 274 280 200
Cuenta 170 70 160
Percentil 25 120.2 110.6 128.6
Percentil 75 186.7 198.6 187.4
a. ¿En qué estado civil el tiempo de servicio presenta mayor dispersión?
b. ¿En qué estado civil el tiempo de servicio es más disperso en el 50% central?

Solución
a. ¿En qué estado civil, el tiempo de servicio presenta mayor dispersión?
Estado civil Media Desviación estándar Coeficiente de variación
Casado
Conviviente
Divorciado

Por lo tanto, el tiempo de servicio es más disperso en el estado civil …………………………….….............


porque …………………………………………………………………………………………………………………………………………..

b. ¿En qué estado civil el tiempo de servicio es más dispersión en el 50% central?
Estado civil Q1 Q3 RIC
Casado
Soltero
Divorciado
EPE 77

Por lo tanto, el tiempo de servicio es más disperso en el 50% central de los datos es en el estado civil
…………………………….. porque ………………………………………………………………………………………….…………

Ejercicio 25
Los datos presentados a continuación corresponden a los montos y el tipo de pago realizados por una
muestra de 100 clientes de una cadena de supermercados. Los directivos de esta empresa pidieron tomar
la muestra para conocer el comportamiento de los pagos de los clientes.
Cheque
5.00 17.87 18.77 21.11 22.67 25.96 30.60 31.07 31.74 34.67
35.38 36.09 36.48 37.20 37.60 37.94 38.58 39.55 40.51 41.10
78 CE86 Estadística Aplicada 1

41.58 42.69 42.83 43.14 48.95 49.21 50.58 51.66 52.04 52.87
54.84 55.40 57.59 58.11 58.64 58.75 59.78 69.22 72.46 78.16
Efectivo
1.09 1.27 1.85 2.44 2.87 2.96 3.31 3.65 4.34 4.75
5.08 5.15 5.91 5.98 6.93 7.02 7.17 7.22 7.40 7.41
7.88 8.81 8.85 9.00 11.17 11.54 11.77 12.07 13.09 14.28
15.07 15.10 15.57 16.28 16.38 16.69 18.09 20.48
Tarjeta
14.44 19.78 22.59 25.57 26.57 26.91 27.66 27.89 33.76 44.53
46.13 46.24 48.11 50.30 52.35 52.63 53.32 54.19 55.21 57.55
69.77 94.36
a. ¿Cuál de las tres formas de pago presenta mayor homogeneidad?
b. ¿Cuál de las tres formas de pago presenta mayor homogeneidad en el 50% central?

Solución
a. ¿Cuál de las tres formas de pago presenta mayor homogeneidad?
Para calcular el coeficiente de variación use las funciones:
 =PROMEDIO(datos) para calcular la media
 =DESVEST.M(datos) para calcular la desviación estándar.
Luego, divida cada desviación estándar entre su respectiva media.
Forma de pago Media Desviación estándar Coeficiente de variación
Cheque
Efectivo
Tarjeta

Por lo tanto, la forma de pago más homogénea es…………………………………………………………….. porque


……………………………………………………………………………………………………………………………………………………..

b. ¿Cuál de las tres formas de pago presenta mayor homogeneidad en el 50% central?
Forma de pago
Cheque
Efectivo
Tarjeta

Por lo tanto, la forma de pago más homogénea en el 50% central es ……………………………….. porque
……………………………………………………………………………………………………………………………………………..

Ejemplo 12.
Los siguientes datos representan resúmenes del número de mediciones de resistencia de cierto artículo
que realizaron dos grupos de técnicos.
Grupo 1: Media = 3 y desviación estándar = 1,10 Grupo 2: Media = 5 y desviación estándar = 1,66
¿En cuál de los grupos el número de mediciones es más disperso?

Solución
Se usa como indicador el coeficiente de variación:
EPE 79

s1  1,10 
CV1   100%     100%  36,67%
x2  3 
s2  1,66 
CV2   100%     100%  33,207%
x2  5 

El número de mediciones es más disperso en el grupo 1, puesto que su coeficiente de variación es mayor.
80 CE86 Estadística Aplicada 1

Medida de asimetría
Para conocer la forma que presenta un conjunto unimodal de datos podemos cuantificar el grado de
deformación horizontal calculando el Coeficiente de Asimetría de Fisher (As)

 Si los datos se distribuyen con igual frecuencia y alejamiento por debajo y por encima de la media, se
dice que la distribución es simétrica: As = 0
 Si los datos se concentran en los valores de menor valor, se dice que la distribución es asimétrica
positiva: As > 0
 Si los datos se concentran en los valores de mayor valor, se dice que la distribución es asimétrica
negativa: As < 0.

Coeficiente de asimetría de Fisher

El coeficiente de asimetría de Fisher se define como:


3
 xi  x 
n


n
As   
 n  1 n  2 i 1  s 
Se tiene que:

En Excel, use la función =COEFICIENTE.ASIMETRIA(datos).

Ejercicio 26
Complete los siguientes textos:
 Si un grupo de datos tiene un coeficiente de asimetría negativo, esto significa que hay una
concentración de datos en los valores …………………………………………
 Si un grupo de datos tiene un coeficiente de asimetría positivo, esto significa que hay una concentración
de datos en los valores …………………………………………
 En un país como el Perú, los sueldos de las personas seguramente tienen un coeficiente de asimetría
…………………..…….., porque ………………………………..…………………………………………
 En un examen de Estadística, los tiempos que toman los alumnos en resolverlo seguramente tienen un
coeficiente de asimetría ……………………………………….………….., porque ………………………………..
…………………………………………………………………………………………………

Ejercicio 27
La empresa A desea saber si la capacitación en una tarea ha reducido el tiempo en que se fabrica un cierto
producto. Para lo cual ha tomado una muestra de productos realizados por personas capacitadas y no
capacitadas, encontrando el mismo tiempo medio de fabricación del producto para ambos grupos, sin
embargo, el coeficiente de asimetría de los tiempos de las personas capacitadas es positivo, mientras que,
el coeficiente de asimetría de los tiempos de las personas no capacitadas es negativo. ¿Parecen indicar los
datos que la capacitación sirve para reducir el tiempo de fabricación?
EPE 81

Solución

Ejercicio 28
Los datos presentados corresponden a la cantidad de dinero gastado, en soles, para comprar regalos
navideños entre un grupo de hombres y de mujeres durante el mes de diciembre pasado en Lima
Metropolitana. Calcule e interprete el coeficiente de asimetría de Fisher en ambos grupos.
82 CE86 Estadística Aplicada 1

Mujeres
460 507 575 420 568 558 581 334 400 426 434 290 468 546 419 726 364 432 519 503
470 519 430 250 514 447 504 543 350 473 614 441 630 432 417 421 531 523 321 405
450 393 553 430 421 461 320 930 290 718 361 383 477 280 385 416 398 503 431 406
407 558 313 387 585 503 527 511 383 402 453 429 499 179 600 373 459 410 850 847

Hombres
498 349 185 80 324 616 680 355 352 648 696 308 581 481 297 205 285 175 447 603
626 368 275 149 100 254 540 279 275 200 538 604 575 600 137 734 436 284 198 610
767 80 266 537 358 624 120 244 341 724 425 305 75 688 253 514 236 475 606 475
271 230 466 120 398 60 429 517 268 580 431 173 612 317 529 647 542 544 464 610

Solución
Usando la función =COEFICIENTE.ASIMETRIA(datos), tendremos los siguientes resultados.

Sexo Coeficiente de asimetría de Fisher


Femenino

Masculino

Por lo tanto,
 el gasto de las mujeres presenta asimetría ……………………………………, sus valores están concentrados en
los valores ………………………….…………………..…
 el gasto de los hombres presenta asimetría ……………………………………, sus valores están concentrados en
los valores ………………………….…………………..…

Ejercicio 29 Caso: Natural Power Nutrition

Natural Power Nutrition es una empresa peruana líder en el mercado de vitaminas y complementos
nutricionales para la salud y el deporte. Son representantes de marcas mundialmente reconocidas. El
gerente de la empresa, preocupado por la baja demanda a inicios del año, desea identificar los principales
problemas que ocasionaron la migración de sus clientes a la competencia, realizó un estudio. En dicho
estudio se encuestó a 200 clientes, a los cuales se midió las siguientes variables:
 Edad: Edad del cliente, en años.
 Tipo de suplemento: Proteína, quemador de grasa, ganador de masa, preentreno y aminoácidos.
 Sexo: Sexo del cliente (Femenino, masculino).
 Nivel de satisfacción: Nivel de satisfacción del cliente respecto a la atención (Totalmente satisfecho,
satisfecho, insatisfecho, totalmente insatisfecho).
 Problemas reportados: Los productos no llegan a tiempo, error de envío de tipo de producto, consultor
desconoce los productos del catálogo, no responden a tiempo los reclamos presentados por Facebook,
muy pocos puntos de ventas, otros
 Tipo de compra: Compra por internet, compra directa de tienda, compra directo a consultor
 Monto de compra: Monto de compra del cliente durante al mes (en soles).
 Tipo de pago: Tipo de pago que el cliente realiza en su compra (Efectivo, tarjeta de débito, tarjeta de
crédito)
 Número de productos: Número de productos que compra el cliente al mes.
 Tiempo de demora: Es el tiempo que demora en llegar el producto a su casa (minutos)
Parte de la base de datos obtenida con la información de los clientes se muestra a continuación:
Tipo de Nivel de Problema Tipo de Monto de Tipo de Número de Tiempo
ID Edad Sexo
suplemento satisfacción reportado compra compra pago productos de
EPE 83

unitario demora
1 23 Aminoácidos Femenino Satisfecho Ninguno Internet 153 Crédito 1 100
Pocos puntos de
2 21 Preentreno Femenino Insatisfecho Consultor 153 Crédito 1 50
venta
. . . . . . . . . . .
Totalmente
200 31 Ganador masa Masculino Ninguno Internet 150 Crédito 3 55
satisfecho

Parte 1: Conocimientos
1. Complete la información solicitada, indique:
Población
84 CE86 Estadística Aplicada 1

Muestra
Unidad elemental
2. Complete los espacios en la tabla considerando la información del estudio:

Nombre de la variable Tipo de variable Escala Dato Gráfico


Tipo de suplemento
Ordinal
149 soles
Cuantitativa discreta
3. Algunos resultados del estudio mostraron:
 El 37,5% de los clientes encuestados realizan su compra por Internet.
 El tiempo promedio de demora de productos al mes es de 1,2 horas.
 El 20% de los clientes realiza su pago con tarjeta de crédito.
 La edad promedio de los clientes es 22 años.
 El problema más común que los clientes manifiestan es que hay muy pocos puntos de ventas

Complete los espacios en blanco considerando los resultados del estudio.

Nombre de la variable Tipo de variable Estadístico Valor del estadístico

4. De la base de datos complete los siguientes espacios en blanco:


Cantidad total de datos
Cantidad total de observaciones
Cantidad de datos que conforman una observación
Un ejemplo de observación

Objetivo 1: Determinar el producto comprado con más preferencia por los clientes al mes.
Complete los datos faltantes en el gráfico y responda a los enunciados solicitados.

a. Responda al objetivo. ……………………………………………………………………………………………………………………


b. El número de clientes que han comprado quemador de grasa es: ………………………………….…………….
EPE 85

c. Interprete h2%...................................................................……………………………………………..……………...
d. Construya la tabla de frecuencia usando el gráfico de columnas.
Título: ……………………………………………………………………………………….

Tipo de suplemento Número de clientes hi


86 CE86 Estadística Aplicada 1

Fuente: …………………………………………

Objetivo 2: Determinar el número de productos comprados menos frecuente por los clientes al mes
Complete el valor faltante en el gráfico y responda los enunciados solicitados.

a. Responda al objetivo.
b. El número de productos mínimo comprados por la mitad de sus clientes es: …………….
c. Interpretar h3%.
d. El porcentaje de clientes que compran más de tres productos es: ………………………………
e. Interprete F2.

Objetivo 3: Determinar la distribución de los clientes respecto al tiempo de demora que llega el producto a
su casa.
El gerente ha decidido crear una tabla que permita conocer la distribución porcentual de la variable
estudiada en su objetivo. Para esto se extrajo una muestra al azar y se registró los siguientes datos:
68 76 78 83 85 86 88 90 91 94 98 100 103
105 105 106 107 109 110 110 112 112 113 113 113 113
114 114 115 116 118 118 119 121 123 125 131 134 135
137 138 142 144 146 147 149 153 155 158 159 164 168
a. Construya la tabla de distribución de frecuencias, use la regla de Sturges.
b. Interprete h2%.
c. Interprete F4.

Objetivo 4: Clasificar los montos de compras al mes de sus clientes.


a. Complete los elementos faltantes del histograma de frecuencias del monto de compra al mes.
EPE 87

Teniendo en cuenta el gráfico de frecuencia construye la tabla de frecuencias.

Objetivo 5: Identificar la concentración de los clientes respecto al tiempo de demora que llega el producto
a su casa.

El gerente ha decidido crear una tabla que permita conocer la distribución porcentual de la variable
estudiada en su objetivo. Para esto extrae una muestra al azar y registra los siguientes datos:

68 76 78 83 85 86 88 90 91 94 98 100 103
105 105 106 107 109 110 110 112 112 113 113 113 113
114 114 115 116 118 118 119 121 123 125 131 134 135
88 CE86 Estadística Aplicada 1

137 138 142 144 146 147 149 153 155 158 159 164 168

a. A partir de los datos, calcule el indicador pertinente que permita responder al objetivo.
b. Responda al objetivo.
c. La empresa contratará más motorizados si se tardan mucho en enviar sus productos, ¿deben contratar
más motorizados?

Objetivo 6: Comparar el monto de compra entre los clientes de sexo femenino y los de sexo masculino.
Los datos representan el monto de compra de los clientes por sexo.
Femenino Masculino
Media Media 153,606
Mediana 154.000 Mediana 168.000
Moda 153.000 Moda 149.000
Desviación estándar 37.527 Desviación estándar
Varianza de la muestra Varianza de la muestra 1921.955
Coeficiente de asimetría -0.609 Coeficiente de asimetría -0.612
Rango 139 Rango 165
Suma 15436 Suma
Cuenta 101 Cuenta 99
a. Encuentre los valores faltantes de los clientes, tanto de sexo masculino como femenino.
b. Encuentre el valor del coeficiente de variación.
c. Indique el sexo con los montos de compra más homogéneos.
d. La empresa emprenderá una campaña promocional al sexo que presente mayor dispersión, ¿cuál es el
sexo que debe emprender la campaña?

Parte 2: Toma de decisión


Al gerente de Natural Power Nutrition le ha llegado información que las ventas de sus productos se ha
incrementado en estos últimos meses del año por el cual estaría pensando en abrir otra tienda siempre y
cuando se verifiquen al menos dos de las siguientes tres situaciones:

Situación 1.
Si por lo menos el 35% de clientes han comprado más de tres productos al mes. (Debe realizar la respectiva
tabla de frecuencias).
Situación 2.
Si el monto promedio de compra por las mujeres es mayor respecto al de los hombres.
Situación 3.
Si los montos de compra de las mujeres son más homogéneos respecto a los montos comprados por los
hombres.

Responda usando resultados anteriores y considerando las 5 dimensiones.


EPE 89

Ejercicios propuestos

17. Todos los vehículos que circulan en Lima Metropolitana deben pasar las revisiones técnicas.
Inicialmente la empresa encargada de dichas revisiones contaba con dos plantas: Cono Norte y Cono
Sur. Se desea investigar si se necesitaba abrir más plantas, analizando el tiempo de atención por
vehículo. Los tiempos, en minutos, en ser atendidos a una muestra aleatoria de vehículos particulares
que asistieron a cada una de las plantas se presenta a continuación:

Cono Norte
90 CE86 Estadística Aplicada 1

12.6 12.6 12.6 12.8 12.9 12.9 13.1 13.1 13.5 13.5 13.7 13.8 13.8 14.1 14.1 14.3 15.1
Cono Sur
10.9 10.9 10.9 11.2 11.6 11.8 11.8 11.8 12.2 12.2 12.3 13.3 13.3 13.4 13.4 13.4 21.3

a. ¿En cuál de las plantas el tiempo medio de atención es mayor?


b. ¿En cuál de las plantas se tiene una mayor mediana? Interprete.
c. ¿Cuál es el tiempo de atención más frecuente en ambas plantas? Interprete.
d. ¿Cuál debe ser el tiempo de atención mínimo en la planta del Cono Norte para pertenecer al 25%
de los clientes que esperan más?
e. ¿Cuál debe ser el tiempo de atención máximo en la planta del Cono Sur para pertenecer al 25% de
los clientes que esperan menos?
f. ¿Se puede afirmar que el tiempo de atención es más homogéneo en el Cono Norte que en el Cono
Sur?
g. ¿Es posible afirmar que en el Cono Sur el tiempo de atención es más homogéneo en el 50% central
que en el Cono Norte?
h. Compare la simetría del tiempo que demoran en ser atendidos los vehículos particulares que
asistieron a las plantas del Cono Norte y Cono Sur usando el coeficiente de Fisher.

18. Un agente de compras puso a prueba una muestra de 20 baterías de calculadoras de bolsillo de un
fabricante. Cada batería se probó en una calculadora programada para llevar a cabo un ciclo de
cálculos ordinarios. El tiempo de vida, en horas, de las baterías se muestra a continuación:

11. 12. 12. 12. 12. 12. 12. 12. 12. 12. 12. 12. 12. 12. 12. 12. 12. 12. 12.
11.9
9 0 0 0 4 3 1 5 0 0 0 1 1 1 2 2 2 2 2
Si el agente de compras quiere encontrar un tiempo máximo para el 18% de las baterías que duran
menos y un tiempo mínimo para el 23% de los que duran más, ¿cuál serían esos tiempos de vida?
Justifique numéricamente su respuesta.

19. La siguiente información corresponde al tiempo de servicio, en meses, de una muestra de publicistas
que laboran en dos conocidas agencias de la capital.
Agencia A Agencia B
Media 18.93 Media 19.64
Mediana 14.00 Mediana 15.00
Moda 6.00 Moda 11.00
Desviación estándar 15.78 Varianza 94.2841
Muestra 15 Muestra 25
a. ¿Qué tipo de asimetría presenta la distribución del tiempo de servicio de la agencia A?
b. ¿En cuál de las agencias publicitarias el tiempo de servicio (en meses) es más homogéneo?

20. La constructora A está evaluando la posibilidad de expandir sus servicios de construcción de bloques
de departamentos en el norte (Piura, Tumbes). Para tal fin, realizó un estudio de las construcciones
realizadas por otras constructoras respecto a la ganancia obtenida en 300 departamentos construidos
en cada lugar. Asimismo, se detalló la ganancia según nivel socioeconómico del lugar. Los datos se
encuentran en miles de soles.

Cuadro 1: Resumen estadístico global


Ganancia (en miles soles) - Piura Ganancia (en miles soles) - Tumbes
Media 453.96 Media 256.22
EPE 91

Mediana 454.7 Mediana 233.57


Moda 459.1 Moda 140.4
Desviación estándar 90.01 Desviación estándar 112.45
Percentil 10 336.2 Percentil 10 100.24
Percentil 25 380.7 Percentil 25 140.96
Percentil 75 529 Percentil 75 335.74
Percentil 90 575.1 Percentil 90 480.01

Cuadro 2: Resumen estadístico por nivel socioeconómico del lugar en construcción


Nivel Ganancia - Piura Ganancia – Tumbes
92 CE86 Estadística Aplicada 1

socio-
económic Departamentos Media Desviación estándar Departamentos Media Varianza
o
A 100 556.12 30.34 60 430.25 658.95
B 120 447.54 24.52 90 315.64 927.2
C 80 335.91 50.98 150 150.96 1628.12

a. Tomando en cuenta la información presentada en el cuadro 2, ¿cuál es la ganancia media para los
niveles socioeconómicos de Piura?
b. ¿Cuál es la ganancia mínima (en miles de soles) que se obtiene para estar comprendido entre el
10% de las obras con mayores ganancias en Tumbes? Interprete.
c. ¿Cuál es la ganancia máxima (en miles de soles) que se obtiene para estar comprendido entre el
90% de las obras con menores ganancias en Piura? Interprete.
d. El jefe de finanzas, desea conocer en qué lugar deberá darle mayor prioridad en la ejecución de
obras. Ya que se busca mayor homogeneidad en el nivel de ganancias. Considerando la información
del cuadro 1, indique el estadístico que deberá utilizar el jefe de finanzas: varianza, media, rango
intercuartil, coeficiente de variación o mediana. ¿Cuál sería su valor?
e. ¿Cuál de los siguientes gráficos representa mejor la distribución de la ganancia en Tumbes?

f. Si se compara la información de clientes de los tres niveles socioeconómicos de Tumbes, ¿en cuál
nivel socioeconómico se observa que la ganancia es más heterogénea? Interprete.
EPE 93

Unidad 3.
LOGRO
Al finalizar la unidad, el estudiante aplica la teoría de la probabilidad para la toma de decisiones en
base a datos históricos y en condiciones de incertidumbre.
94 CE86 Estadística Aplicada 1

Probabilidades
Se define la probabilidad como una medida numérica de la posibilidad de que ocurra un evento. Por tanto,
las probabilidades son una medida del grado de incertidumbre asociado con cada uno de los eventos
previamente enunciados.
Los valores de probabilidad se encuentran en una escala de 0 a 1. Los valores cercanos a 0 indican que las
posibilidades de que ocurra un evento son muy bajas y los cercanos a 1 indican que es casi seguro que
ocurra un evento.
Formalmente, necesitamos conocer ¿qué es un evento? y diferenciar un experimento aleatorio de uno que
no es aleatorio.

Se deja caer un objeto desde la parte alta de un edificio Se lanza un dado y se anota el resultado de
como se indica en la figura la cara superior

Si tarda 8 segundos en caer, ¿Cómo determina la altura ¿es éste un experimento aleatorio?, ¿Qué
del edificio?, ¿estamos ante un experimento aleatorio? características tiene?

Experimento aleatorio
Es un proceso que, al ser realizado u observado repetidas veces, bajo las mismas condiciones, genera más
de un posible resultado que no puede ser determinado de antemano. Se denota por ε.

Espacio muestral
Es el conjunto de todos los posibles resultados que genera un experimento aleatorio. Se denota por Ω o S.
Cada elemento del espacio muestral se denomina punto muestral.

Evento
Es todo subconjunto de un espacio muestral. Se denota mediante letras mayúsculas, por ejemplo, A, B, C,
… o X1, X2, X3.
EPE 95

Ejercicio 30
Marque con un aspa, asignando una opción a la situación descrita de acuerdo con su posibilidad de
ocurrencia.
Igualmente
Muy poco Poco Bastante Muy
Situación probable que
probable probable probable probable
ocurra o no
Aprobaré este curso
Lanzo un dado y sale un número par
El PBI del Perú crecerá 4% este año
Perú se clasificará al Mundial 2022
96 CE86 Estadística Aplicada 1

Definición clásica de probabilidad


La definición clásica propone que, si el espacio muestral es numerable y cada punto muestral tiene la
misma posibilidad de ocurrencia, entonces la probabilidad de ocurrencia de un evento A definido sobre W
es:

n A  número de casos favorables al evento A


P A  
n   número de casos totales

Ejercicio 31

Experimento aleatorio Lanzar un dado y registrar lo que sale en la cara superior


Espacio muestral Ω = {1, 2, 3, 4, 5, 6}
Eventos A = {1}
B = {1, 2, 3}
n A 
Probabilidad P  A   =………………………..……
n  
n B 
P B   =………………………..……
n  
Ejercicio 32
Experimento aleatorio Lanzar dos monedas y registrar lo que sale en la cara superior
Espacio muestral Ω = {(……. , …….), (……. , …….), (……. , …….), (……. , …….)}
Evento A = {que salgan dos caras} = {(……., …….)}
n A 
Probabilidad P  A   =………………………..……
n  
Ejercicio 33
Experimento aleatorio Sacar una bola y anotar su color de una urna que contiene tres
bolas rojas y cuatro negras
Evento: A = {que salga una bola roja}
n A
Probabilidad P  A   =………………………..……
n  
Ejercicio 34
Sea el experimento aleatorio ε: lanzar dos dados simultáneamente y anotar el número de la cara superior
de cada dado. ¿Por qué se considera aleatorio?

Escriba el espacio muestral

Calcule la probabilidad de que los números de las caras superiores de los dados sumen más de siete.
EPE 97

Álgebra de eventos
Sea  un experimento aleatorio y Ω el espacio muestral asociado. Si A y B son dos eventos definidos en Ω,
se define:

Complemento de un evento
Para un evento A cualquiera se define su complemento A C como el evento consistente en todos los
puntos de S que no están en A.
Se tiene que P(AC) = 1 - P(A)

AC se expresa como: “El evento A no ocurre”


98 CE86 Estadística Aplicada 1

Unión de eventos
Para dos eventos A y B, la unión del evento A con el evento B (A  B) es el
evento que contienen todos los puntos de S que pertenecen a A o a B o a
ambos.

A  B se expresa como: “Al menos uno de los eventos A o B ocurre”.

Intersección de eventos
Para dos eventos A y B, la intersección de los eventos A y B (A  B) es el
evento que contienen todos los puntos de S que pertenecen tanto a A como
a B.

A  B se expresa como: “Ambos eventos, A y B ocurren a la vez”.

Axiomas de la probabilidad

Un axioma es una proposición o enunciado tan evidente


que se considera que no requiere demostración.

Sea un experimento aleatorio, Ω el espacio muestral asociado a dicho experimento aleatorio y A un evento
definido en Ω, entonces la probabilidad del evento A, denotada por P(A), es aquel número que cumple los
siguientes axiomas:
 Axioma 1: 0 £ P(A)
 Axioma 2: P(Ω) = 1
 Axioma 3: Si A y B son dos eventos mutuamente excluyentes entonces:
P(A È B) = P(A) + P(B)

Teoremas de probabilidad
 P(f) = 0, donde  es el evento imposible.
 P(AC) = 1 – P(A)
 Si A y B son eventos cualesquiera, entonces:
P(A È B) = P(A) + P(B) – P(A Ç B)

Ejemplo 13.
Una fábrica trabaja con dos máquinas procesadoras A y B. La probabilidad que la máquina procesadora A
funcione correctamente es 0,85 y que la máquina procesadora B funciones correctamente es 0,78. La
probabilidad de que al menos uno de las dos funcione correctamente es 0,92. Determine la probabilidad de
que funcione correctamente sólo una máquina.
EPE 99

Solución
Definamos los eventos:
A: Máquina procesadora A funciona correctamente. P(A)=0,85
B: Máquina procesadora B funciona correctamente. P(B)=0,78
P(AUB)=0,92 (al menos uno de las dos funcione correctamente)
Probabilidad de que funcione correctamente sólo una máquina:
Funciona correctamente solo A ó solo B
P(B∩Ac) + P(A∩Bc ) ?
Por teorema: P(B∩A ) = P(B)-P(A∩B) y P(A∩Bc) = P(A)-P(A∩B)
c

Por teorema:
P(AUB)=P(A)+P(B)-P(A∩B) despejamos P(A∩B)=0,85+0,78-0,92=0,71
100 CE86 Estadística Aplicada 1

Reemplazamos:
P(B∩Ac) = P(B)-P(A∩B) = 0,78-0,71=0,07
c
P(A∩B ) = P(A)-P(A∩B)=0,85-0,71= 0,14

Respuesta es 0,07+0,14=0,21

Ejercicio 35
Tarjeta A, es el sistema de lealtad que implementó la cadena de supermercados A, que cuenta con
sucursales en Arequipa, Ica y Trujillo. Gracias al uso de la tarjeta A, la cadena de supermercados A recibe la
información detallada de las compras de sus clientes, creando de esta manera una base de datos con sus
perfiles.
Se desea mejorar el sistema de lealtad, para lo cual se entrevistó a 170 clientes de la cadena de
supermercados A que poseen la tarjeta A. Se obtuvo la siguiente información.

Sucursal
Total
Nivel de educación Arequipa Ica Trujillo
Escolar 33 26 23 82
Superior 35 20 12 67
Posgrado 12 4 5 21
Total 80 50 40 170
Se elige un cliente al azar.
a. ¿Cuál es la probabilidad de que tenga nivel educativo superior
b. ¿Cuál es la probabilidad de que el cliente pertenezca a la sucursal de Trujillo?
c. ¿Cuál es la probabilidad de que el cliente pertenezca a la sucursal de Trujillo y tenga nivel
educativo superior?
d. ¿Cuál es la probabilidad de que sea de Arequipa o tenga posgrado?
e. ¿Cuál es la probabilidad de que tenga un nivel educativo mínimo superior?
f. ¿Cuál es la probabilidad de que tenga un nivel educativo máximo superior y pertenezca a la
sucursal de Ica?

Ejercicio 36
El 30% de los estudiantes en una universidad son limeños, el 10 % estudian ingeniería, el 1% estudian
ingeniería y son limeños. Si se selecciona al azar un estudiante:
a) ¿Cuál es la probabilidad de que sea limeño o no pertenezca a la facultada de ingeniería?
b) ¿Cuál es la probabilidad de que solo sea un estudiante de ingeniería?
c) ¿Cuál es la probabilidad de que no sea limeño?
d) ¿Cuál es la probabilidad de que no sea limeño ni estudiante de ingeniería?

Probabilidad condicional
Sea  un experimento aleatorio y W el espacio muestral asociado. Sean A, B dos eventos definidos en W. La
probabilidad de ocurrencia del evento A sabiendo que el evento B ha ocurrido se denota por P(A/B) y se
llama probabilidad condicional de A dado B:

P A  B
 
P AB 
P B
P  B  0
EPE 101

Ejercicio 37
Tarjeta A, es el sistema de lealtad que implementó la cadena de supermercados A, que cuenta con
sucursales en Arequipa, Ica y Trujillo. Gracias al uso de la tarjeta A, la cadena de supermercados A recibe la
información detallada de las compras de sus clientes, creando de esta manera una base de datos con sus
perfiles.
Se desea mejorar el sistema de lealtad, para lo cual se entrevistó a 170 clientes de la cadena de
supermercados A que poseen la tarjeta A. Se obtuvo la siguiente información.

Nivel de educación Sucursal Total


102 CE86 Estadística Aplicada 1

Arequipa Ica Trujillo


Escolar 33 26 23 82
Superior 35 20 12 67
Posgrado 12 4 5 21
Total 80 50 40 170
Se elige un cliente al azar.
a) Calcule la probabilidad de que tenga un nivel educativo superior, si se sabe que es de Trujillo.
b) Si el cliente tiene nivel superior, ¿qué porcentaje pertenecen a la ciudad de Ica?

Ejercicio 38
Se seleccionó una muestra aleatoria de trabajadores de la empresa A para determinar sus planes de
jubilación después de cumplir los 65 años de edad. Los trabajadores en la muestra se dividieron en:
ejecutivos, empleados y obreros. Los resultados obtenidos fueron:

………………………………………………………………………………………………………………………………………

Planes después de los 65 años


Trabajador Total
Se jubile (D) No se jubile (E) No ha decidido su jubilación (F)
Ejecutivo (A) 8 3 1
Empleado (B) 20 10 5
Obrero (C) 50 22 11
Total 78 35 130
Fuente: Empresa A

Se selecciona a un trabajador al azar.


a. Si se sabe que no ha decidido sobre su jubilación, calcule la probabilidad que sea obrero.
b. Si se sabe que no es ejecutivo, calcule la probabilidad que se jubile.

Ejercicio 39
En el presente ciclo académico, en la facultad de ingeniería se han matriculados 1500 estudiantes, de los
cuales 300 son del quinto superior. El 45% de los estudiantes del quinto superior son mujeres, mientras que
el 65% de los que no son del quinto superior son mujeres.
a. Si se escoge al azar el expediente de un estudiante matriculado para una entrevista personal y se
comprueba que es del quinto superior, ¿cuál es la probabilidad de que sea el expediente de una mujer?
a. Si se escoge al azar el expediente de un estudiante matriculado para una entrevista personal y es varón,
¿cuál es la probabilidad de que sea el expediente de un estudiante que está en el quinto superior?

Ejercicio 40
En la ciudad A se realizó una encuesta a personas adultas para conocer la opinión que tienen respecto a
una nueva ley del gobierno local. La siguiente tabla muestra los resultados de la encuesta. Los
entrevistados fueron clasificados según su sexo.
………………………………………………………………………………………………………………………………………………
Opinión
Total
Sexo A favor En contra Ni a favor no en contra
Masculino 110 290 90 490
Femenino 140 170 150 460
Total 250 460 240 950
Fuente: Municipalidad de la ciudad A
EPE 103

Se selecciona a una persona al azar.


a. Si se eligió a un hombre, calcule la probabilidad que esté en contra de la nueva ley
.
b. Si se eligió a una persona a favor de la nueva ley, calcule la probabilidad que sea hombre.
c. Si se eligió a una mujer, calcule la probabilidad que no esté en contra de la nueva ley
.
d. Calcule la probabilidad de que esté a favor o en contra de la nueva ley.
Ejemplo 14.

Un instituto de investigaciones académicas desea determinar si existe relación entre el interés de un


estudiante en finanzas, su habilidad en matemáticas y su género. Se selecciona una muestra de 200
104 CE86 Estadística Aplicada 1

estudiantes y mediante una prueba se mide su habilidad matemática y su interés en finanzas. Los
resultados fueron los siguientes:
Género
Interés Femenino (A1) Masculino (A2)
Total
en finanzas Habilidad en matemáticas Habilidad en matemáticas
Baja (C1) Media (C2) Alta (C3) Baja (C1) Media (C2) Alta (C3)
Bajo (B1) 25 9 6 35 6 10 91
Medio (B2) 4 22 7 11 21 3 68
Alto (B3) 2 5 15 3 7 9 41
Total 31 36 28 49 34 22 200

Se selecciona un estudiante al azar.

a. ¿Cuál es la probabilidad de seleccionar un estudiante con un interés alto en finanzas?


Sea el evento B3: Interés alto en finanzas.
41
P  B3    0 ,205
200
b. ¿Cuál es la probabilidad de que no tenga una alta habilidad en matemáticas y tenga un interés medio
en finanzas?
Sean los eventos:
C3: Habilidad alta en matemáticas
B2: Interés medio en finanzas

P C 3C  B2   4  22  11  21
200
 0,29

c. ¿Cuál es la probabilidad de que sea hombre o tenga un bajo interés en finanzas?


Sean los eventos:
A2: Masculino
B1: Interés bajo en finanzas
P  A2  B1   P  A2   P  B1   P  A2  B1 
49  34  22 91 51
P  A2  B1      0 ,725
200 200 200

Independencia de eventos
Sean dos eventos A y B. Se dice que son mutuamente independientes si la ocurrencia de un evento no
influye en la ocurrencia del otro.
Dados los eventos A y B independientes, entonces se cumple que:
P(A/B) = P(A) y P(B/A) = P(B)
Luego por el teorema de la multiplicación:
P(A  B) = P(A)xP(B

Ejercicio 41
En la fabricación de cierto producto se presenta el defecto tipo 1 con una probabilidad de 0,01 y el defecto
tipo 2 con una probabilidad de 0,05. Si las ocurrencias de los defectos en los productos son independientes,
calcule la probabilidad de que:
a. Un artículo tenga ambos defectos.
b. Un artículo solo el defecto 1
c. Un artículo contenga solo un defecto.
d. No tenga ningún defecto.

Ejercicio 42
EPE 105

Un sistema está conformado por tres componentes que funcionan independientemente.


La probabilidad de que un componente funcione correctamente es 0,70.
a. Calcule la probabilidad de que al menos un componente funcione correctamente.
b. calcule la probabilidad de que al menos un componente no funcione correctamente.

Partición de un espacio muestral


Sean E1, E2, ... , Ek eventos definidos en Ω, tales que:
Ei Ç Ej = f, para todo i ¹ j Todos los eventos disjuntos dos a dos.
E1  E2  ...  Ek   La unión de todos los eventos es el espacio
muestral.
106 CE86 Estadística Aplicada 1

Entonces,
se dice que los eventos E1, E2, ... , Ek definen una partición del espacio muestral Ω.
Gráficamente:

Diagrama de árbol

Es la representación gráfica de los resultados posibles de la realización de un experimento aleatorio. Cada


parte terminal representa un resultado posible del experimento aleatorio y las probabilidades se indican en
las ramas.

Teorema de la probabilidad total


Sea A un evento cualquiera definido sobre Ω y sea E1, E2,..., Ek una partición del espacio muestral entonces:
k
P  A   P A E  P E 
i 1
i i

Teorema de Bayes
Sea  un experimento aleatorio, A un evento cualquiera definido sobre Ω y E1, E2, ... , Ek una partición del
espacio muestral Ω, entonces:

P  A / E j P  E j 
P  E j /A   k

 P A / E P E 
para j = 1, 2,…, k
i i
i 1

Ejemplo 15.
Una empresa de manufactura recibe embarques de una determinada pieza de dos proveedores.
Actualmente el 65% de las piezas adquiridas por la empresa provienen del proveedor 1 y 35% restante del
proveedor 2. La calidad de las piezas adquiridas varía con la fuente de suministro. Con base a los datos
históricos se sabe que la probabilidad que una pieza del proveedor 1 sea defectuosa es 0,02 y la
probabilidad de que una pieza del proveedor 2 sea defectuosa es 0,05.
Si seleccionamos al azar una de las piezas adquiridas por la empresa, ¿cuál es la probabilidad de que sea
defectuosa?
EPE 107

Solución
Sean los eventos:
E1 = La pieza proviene del proveedor 1, luego se tiene que P(E1) = 0,65
E2 = La pieza proviene del proveedor 2, luego se tiene que P(E2) = 0,35
A = Pieza defectuosa.
Ac = Pieza no defectuosa.
P(A/E1) = 0,02 y consecuentemente P(Ac/E1) = 0,98.
P(A/E2) = 0,05 y consecuentemente P(Ac/E2) = 0,95.

Luego, el diagrama de árbol correspondiente es:


108 CE86 Estadística Aplicada 1

Entonces, P(A) = P(A/E1) P(E1) + P(A/E2) P(E2) = 0,02 × 0,65 + 0,05 × 0,35 = 0,0305

Ejercicio 43
Tres máquinas: A, B y C, producen el 45%, 30% y 25% respectivamente del total de las piezas producidas en
una fábrica. Los porcentajes de producción de defectuosos de estas máquinas son del 3%, 4% y 5%.
a. Si seleccionamos una pieza al azar ¿cuál es la probabilidad de que sea defectuosa?
b. Si tomamos al azar una pieza y resulta defectuosa ¿cuál es la probabilidad de que haya sido producida
por la máquina B?
c. ¿Qué máquina tiene mayor probabilidad de haber producido una pieza defectuosa?

Ejercicio 44
En un estudio, se afirma que el seguro vehicular es el más importante en términos de facturación anual en
el mercado asegurador de riesgos generales. Las participaciones de las empresas del mercado asegurador
de vehículos son: Seguros A con 40%, Seguros B con 35%; y otros seguros con 25%.
Se sabe que el porcentaje de siniestros vehiculares (S) registrados el año pasado de cada aseguradora es:
Seguros A es 5%, Seguros B es 8% y otros es 10%.
a. Calcule la probabilidad de que el seguro vehicular registre siniestro el año pasado.
b. Si se tiene un siniestro vehicular del año pasado, calcule la probabilidad de que sea de Seguros A.
c. Calcule la probabilidad de que el seguro vehicular registre siniestro el año pasado.
d. Si se tiene un siniestro vehicular del año pasado, calcule la probabilidad de que sea de Seguros A.

Ejemplo 16.
La empresa de tejidos A se dedica a la fabricación de tejidos de lana de primera calidad. Para la próxima
temporada de invierno está elaborando un producto exclusivo que se espera sea todo un éxito. La empresa
A cuenta con tres tipos de máquinas tejedoras A, B y C:
 el tipo A produce el 40% de la producción y un 3% de piezas defectuosas,
 el tipo B produce el 35% de la producción y un 1% de piezas defectuosas,
 el tipo C produce el 25% de la producción y un 2% de piezas defectuosas.
El departamento de control de calidad selecciona un artículo de toda la producción y lo analiza.
a. ¿Cuál es la probabilidad de que un artículo seleccionado al azar sea defectuoso?
b. Si el producto seleccionado no fue defectuoso, ¿cuál es la probabilidad de que no haya sido producido
por las máquinas tipo B o C?

Solución
Se definen los siguientes eventos.
A: un artículo es producido por la máquina tipo A
B: un artículo es producido por la máquina tipo B
C: un artículo es producido por la máquina tipo C
D: Un artículo es defectuoso.

Se tiene que:
P(A) = 0,40; P(B) = 0,35; P(C) = 0,25; P(D/A) = 0,03; P(D/B) = 0,01; P(D/C) = 0,02
EPE 109

a. ¿Cuál es la probabilidad de que un artículo seleccionado al azar sea defectuoso?


Por el teorema de la probabilidad total.
P(D) = P(A) P(D/A) + P(B) P(D/B) + P(C) P(D/C)
P(D) = (0,4)(0,03) + (0,35)(0,01) + (0,25) (0,02) = 0,0205
Luego, la probabilidad de que un artículo seleccionado al azar sea defectuoso es 0,0205.
b. Si el producto seleccionado no fue defectuoso, ¿cuál es la probabilidad de que no haya sido producido
por las máquinas tipo B o C?
110 CE86 Estadística Aplicada 1

P(BC ∪ CC/DC) = P(A/DC) = 



P A  DC


0 ,4  0 ,97
 0 ,39612
PD C
 
1  0 ,0205

Ejercicio 45
Una compañía de desarrollo urbano analiza la posibilidad de construir un centro comercial en un sector de
la ciudad. Un elemento vital en esta consideración es un proyecto de una autopista que une este sector con
el centro de la ciudad. Si el Consejo municipal aprueba esta autopista, hay una posibilidad del 0,90 que la
compañía construya el centro comercial; en tanto, si la autopista no es aprobada, la probabilidad que
construya el centro comercial es del 0,20. Basándose en la información disponible el presidente de la
compañía estima que hay una probabilidad de 0,60 de que se apruebe la autopista.
a. ¿Cuál es la probabilidad de que la compañía construya el centro comercial?
b. Dado que el centro comercial sea construido, ¿Cuál es la posibilidad de que la autopista sea aprobada?

Ejemplo 17.
Los clientes acostumbran evaluar en forma preliminar el diseño de sus productos. En el pasado, 95% de sus
productos de gran éxito recibieron críticas favorables, 60% de los productos con éxito moderado recibieron
críticas favorables y 10% de los productos sin mucho éxito recibieron críticas favorables. Además, 40% de
los productos han sido de gran éxito, 35% han sido de éxito moderado y 25% han sido productos sin mucho
éxito.
a. ¿Cuál es la probabilidad de que un producto obtenga una crítica favorable?
b. Si un diseño nuevo obtiene una crítica favorable, ¿cuál es la probabilidad de que sea un diseño de gran
éxito?
c. Si un producto no consigue una crítica favorable, ¿cuál es la probabilidad de que sea un producto de
gran éxito?

Solución
Se define los eventos:
G: El producto ha tenido gran éxito; M: El producto ha tenido éxito moderado
P: El producto ha tenido poco éxito; F: El producto tuvo crítica favorable

P(F  G)=0.40 x 0.95 = 0.380


)= 0.95
P(F/G
P(F C/G)=
0 .05 P(FC  G)=0.40 x 0.05 = 0.02

G )=0.
40 P(F  M)=0.35 x 0.60 = 0.210
(P(M)=0.35
P )=0.60
P(F/M

 M)=0.35 x 0.4 = 0.140


P(F C/
M)=
0.4 0 P(FC
P(P
) =0.
25
P(F  P)=0.25 x 0.10 = 0.025
0
)=0.1
P(F/P
P(Fc  P)=0.25 x 0.90 = 0.25

a. ¿Cuál es la probabilidad de que un producto obtenga una crítica favorable?

Usando el teorema de la probabilidad total, se tiene:

P(F) = 0.380 + 0.210 + 0.025 = 0.615

b. Si un diseño nuevo obtiene una crítica favorable, ¿cuál es la probabilidad de que sea un diseño de gran
éxito?
EPE 111

P  G  F  0 ,380
P G F     0 ,618
P F  0 ,615
c. Si un producto no consigue una crítica favorable, ¿cuál es la probabilidad de que sea un producto de
gran éxito?


P G FC   
P G FC

 0 ,02
 0 ,052
PF  
C
1  0 ,615
112 CE86 Estadística Aplicada 1

Ejercicios propuestos

21. La probabilidad de que la compra de un cliente esté influenciada por alguna red social es de 0,68, la
probabilidad de que la compra esté influenciada por la publicidad en televisión es de 0,50 y la
probabilidad de su compra esté influenciada por ambos factores es de 0,27.

a. ¿Cuál es la probabilidad de que alguna red social o por la publicidad en televisión?


b. ¿Qué probabilidad hay de que la próxima compra no esté influenciada por ambos factores

22. Una fábrica trabaja con dos máquinas procesadoras A y B. La probabilidad que la máquina
procesadora A funcione correctamente es 0,85 y que la máquina procesadora B funciones
correctamente es 0,78. La probabilidad de que al menos uno de las dos funcione correctamente es
0,92. Determine la probabilidad de que funcione correctamente sólo una máquina.

23. El 30% de los estudiantes en una universidad son limeños, el 10 % estudian ingeniería, el 1%
estudian ingeniería y son limeños. Si se selecciona al azar un estudiante:
a. ¿Cuál es la probabilidad de que sea limeño o no pertenezca a la facultada de ingeniería?
b. ¿Cuál es la probabilidad de que solo sea un estudiante de ingeniería?
c. ¿Cuál es la probabilidad de que no sea limeño?
d. ¿Cuál es la probabilidad de que no sea limeño ni estudiante de ingeniería?
24. En una encuesta de hogares realizada en la ciudad de Lima se entrevistó 248 hogares. La siguiente
tabla muestra los hogares clasificados según sus ingresos familiares, tenencia de auto y tenencia de
casa propia.

Hogares con ingresos de $1000 o menos Hogares con ingresos de más de $1000
Con casa propia Sin casa propia Con casa propia Sin casa propia
Con auto 37 14 37 8
Sin auto 48 40 49 15

Si elegimos un hogar encuestado al azar de esta ciudad, calcule la probabilidad de que:


a. tenga casa propia.
b. tenga un ingreso mayor a $1000.
c. tenga un ingreso máximo de $1000 y tenga auto.
d. tenga casa propia o no tenga auto.
e. tenga un ingreso máximo de $1000 y que no tenga casa propia.

25. Debido al auge de la comunicación en línea, las empresas colocan cada vez más órdenes
electrónicas. Una empresa de estudios socioeconómicos ha recopilado información acerca de las
órdenes llenadas correctamente por cuatro tipos de empresas. Los resultados obtenidos se muestran
en la siguiente tabla:

Industria
Orden llenada Farmacéutica Consumo Computadoras Telecomunicaciones
Correctamente 207 136 151 178
Incorrectamente 3 4 9 12

Si elegimos al azar una empresa de los rubros mencionados.

a. ¿Cuál es la probabilidad de que se elija una empresa de consumo y haya solicitado su orden de
manera incorrecta?
EPE 113

b. Si la empresa elegida es de telecomunicaciones, ¿cuál es la probabilidad de que la orden haya sido


llenada de manera correcta?

26. Tres máquinas: A, B y C, producen el 45%, 30% y 25% respectivamente del total de las piezas
producidas en una fábrica. Los porcentajes de producción de defectuosos de estas máquinas son del
3%, 4% y 5%.
a. Si seleccionamos una pieza al azar ¿cuál es la probabilidad de que sea defectuosa?
b. Si tomamos al azar una pieza y resulta defectuosa ¿cuál es la probabilidad de que haya sido
producida por la máquina B?
c. ¿Qué máquina tiene mayor probabilidad de haber producido una pieza defectuosa?
114 CE86 Estadística Aplicada 1

27. Una aerolínea desea analizar el comportamiento de los clientes considerando el destino de viaje, el
tipo de cliente y el modo de compra. Dentro de su proceso de creación de reportes, para ello, ha
obtenido la siguiente tabla:

Destino de viaje nacional Destino de viaje internacional


Tipo de Compra Compra por Compra Compra por Total
cliente presencial Internet presencial Internet
Premiun 12 28 38 13 91
Frecuente 8 25 12 23 68
Ocasional 7 15 9 10 41
Total 27 68 59 46 200

a. Calcule la probabilidad de que una persona elegida al azar no compre pasajes por Internet y tenga
un destino de viaje nacional.
b. Si se elige al azar a un cliente ocasional, calcule la probabilidad de que compre pasajes por Internet.

28. Una institución extranjera no gubernamental está pensando invertir en un proyecto en nuestro
país, las opciones son tres, invertir en un proyecto de agricultura en un 40%, invertir en un proyecto
minero en un 35% y el resto de probabilidad se desea invertir en un proyecto de ganadería. Se
obtendría apoyo del estado peruano en las probabilidades siguientes: 20%, 25% y 15% en los
proyectos respectivos mencionados anteriormente.
a. Si se elige un proyecto al azar ¿cuál es la probabilidad de recibir apoyo del estado?
b. Si no se recibió apoyo del estado, ¿cuál es la probabilidad que la institución no gubernamental
invirtió en un proyecto minero?

29. A lo largo de los últimos cuatro años, se ha determinado que el 20% de las compras se han
realizado en Econo A, el 30% en Plaza B y el 25% en Tienda C. Se sabe además que el porcentaje de
clientes femeninos es del 90% si son de Econo A, 95% si son de Plaza B, 100% si son de Tienda C y 90%
si son de Todo D. Si se elige un cliente al azar y se determina que es de sexo masculino, ¿cuál es la
probabilidad que haya comprado en Plaza B?

30. En la fabricación de cierto producto se presenta el defecto tipo 1 con una probabilidad de 0,01 y el
defecto tipo 2 con una probabilidad de 0,05. Si las ocurrencias de los defectos en los productos son
independientes, calcule la probabilidad de que:
a. Un artículo tenga ambos defectos.
a. Un artículo solo el defecto 1
b. Un artículo contenga solo un defecto.
c. No tenga ningún defecto

31. Un sistema está conformado por cinco componentes que funcionan independientemente. La
probabilidad de que un componente funcione correctamente es 0,70.
a. Calcule la probabilidad de que al menos un componente funcione correctamente.
b. calcule la probabilidad de que al menos un componente no funcione correctamente.
EPE 115

Unidad 4.
LOGRO
Al finalizar la unidad 3, el estudiante aplica la teoría de la probabilidad para la toma de decisiones en
base a datos históricos y en condiciones de incertidumbre.
116 CE86 Estadística Aplicada 1

Variable aleatoria
Sea  un experimento aleatorio y W el espacio muestral asociado.
Una variable aleatoria asocia un valor numérico a cada uno de los resultados experimentales.
El valor numérico de la variable aleatoria depende del resultado del experimento.
Las variables aleatorias se designan por letras mayúsculas (X, Y, Z, etc.), y a sus valores por letras latinas
minúsculas.

Ejemplo 18.

Valores posibles para la variable


Experimento Variable aleatoria aleatoria
Realizar 100 llamadas de ventas
Número de ventas logradas 0 , 1 , 2 , … , 100

Inspeccionar un lote de 50 Número de artículos


0 , 1 , 2 , … , 50
artículos defectuosos
Tiempo requerido (en
Trasladarse de la UPC al hogar 15 ≤ Tiempo ≤ 45
minutos)
Número de clientes
Administrar un restaurante 0,1,2,…
atendidos por día

Variable aleatoria discreta


Una variable aleatoria es discreta si el conjunto de valores que puede tomar es finito o infinito numerable.
Ejemplo 19.
X: Número de fallas por m2 de plancha metálica
Rx = {0, 1, 2, … }
X: Número de productos defectuosos en una muestra de 80
Rx = {0, 1, 2, …, 80 }
X: Cantidad de bacterias por cm3 de agua
Rx = {0, 1, 2, … }

Ejemplo 20.
Sea el experimento aleatorio  : lanzar una moneda dos veces.
El espacio muestral asociado es: Ω = {C1C2, C1S2, S1C2, S1S2} y n(Ω) = 4
Definimos la variable aleatoria X: número de caras obtenidas
Luego, el rango o recorrido de la V.A.X es RX = {0, 1, 2}
Por lo tanto, X es una variable aleatoria discreta
EPE 117

Distribución de probabilidad de una variable aleatoria discreta


La distribución de probabilidad de una variable aleatoria discreta X se describe como una función de
probabilidad representada por f(x) que asigna a cada valor de la variable aleatoria, la probabilidad de que X
asuma ese valor, esto es:
f(x) = P(X = x)

Toda función de probabilidad debe cumplir que:


 f(x)  0
118 CE86 Estadística Aplicada 1
n
  fx  1
i 1
i

Ejemplo 21.
Sea el experimento aleatorio  : lanzar una moneda dos veces.
El espacio muestra es Ω = {C1C2, C1S2, S1C2, S1S2} y n(Ω) = 4
Si la v.a.x la definimos como X: número de caras obtenidas, RX = {0, 1, 2}
Podemos calcular la probabilidad de cada elemento del recorrido:
La probabilidad de obtener cero caras: f(0) = P(X = 0) = ¼ = 0,25
La probabilidad de obtener una cara: f(1) = P(X = 1) = ¼ + ¼ = 2/4 = 0,50
La probabilidad de obtener dos caras: f(2) = P(X = 2) = ¼ = 0,25
La tabla de función de probabilidad sería:
x 0 1 2
f(x) = P(X = x) 0,25 0,50 0,25

Esta tabla cumple con las siguientes condiciones:

 f(x)  0  cada probabilidad es positiva y mayor o igual que cero


n
  fx  1
i 1
i  la suma de todas las probabilidades es igual a uno

Ejemplo 22.
La distribución de probabilidad de la variable aleatoria X definida como número de defectos por cada 10
metros de una tela sintética en rollos continuos de ancho uniforme, es:

x 0 1 2 3 4
f(x) = P(X = x) 0,41 0,37 k 0,05 0,01

a. Determine la constante k.
b. Calcule las siguientes probabilidades: P(X > 3), P(X > 1 / X < 3) y P(1 < X  4)
Solución
4
a. Para hallar la constante k, usamos la condición que  fx  1
i 1
i

 f  x   f  0  f  1  f  2  f  3  f  4   1 , por lo tanto k = 0,16


i 0
i

b. Calcule las siguientes probabilidades:

P  X  3  f  4   0,01
P  X  2 f  2 0,16
P  X  1 X  3     0,1702
P  X  3) f  0   f  1  f  2  f  3 0,41  0,37  0,16
P  1  X  4   f  2  f  3  f  4   0,16  0,05  0,01  0 ,22

Ejercicio 46
La solicitud de préstamo que presentan los clientes de un banco está compuesta por cinco rubros. El
gerente de préstamos desea realizar un estudio sobre la distribución de la cantidad de rubros rechazados
por cada solicitud. La siguiente tabla muestra la distribución de probabilidad de la variable aleatoria X
definida como el número de rubros rechazados por solicitud.

X=x 0 1 2 3 4 5
EPE 119

f  x   P X  x  0,79 2k k 0,03 0,02 0,01

a. Determine la constante k y grafique la función f(x)

Si se elige una solicitud al azar:


b. Calcule la probabilidad de que tengan dos rubros rechazados.
c. Calcule la probabilidad de que tenga más de un rubro rechazado.
d. Calcule la probabilidad de que tenga menos de tres rubros rechazados.
e. Calcule la probabilidad de que tenga más de uno pero menos de cuatro rubros rechazados.

Ejercicio 47
120 CE86 Estadística Aplicada 1

Sea el experimento aleatorio  consistente en lanzar dos monedas, entonces este experimento determina
el espacio muestral Ω = {C1C2, C1S2, S1C2, S1S2}.
Si se define la variable aleatoria X como número de caras obtenidas, entonces el rango o recorrido es RX =
{0, 1, 2}

Valor esperado de una variable aleatoria discreta


El valor esperado o esperanza matemática de una variable aleatoria X o media de una distribución de
probabilidad de X se denota E(X).
 X =E  X    x f  x 
n
 X  E  X    xi f  xi   x1 f  x1  x2 f  x2   ...  xn f  xn 
i 1
Propiedades del valor esperado:
Sean a, b y k constantes numéricas y X una variable aleatoria, entonces:

 E(k) = k
 E(aX+b) = aE(X)+b

Varianza de una variable aleatoria discreta


La varianza V(X) de una variable aleatoria discreta X con distribución de probabilidad f(x) se calcula por:

 
V  X   E X 2   E  X   2 , Donde:
E  X 2    x 2 f  x 

 La varianza de la variable aleatoria X, V(X), también se denota por  X2 , o simplemente como  2 .

Propiedades de la varianza:
Sean a, b y k constantes numéricas y X una variable aleatoria, entonces:

 V(k) = 0
 V(aX+b) = a2V(X)

Desviación estándar
Se denota por s o DE(X). Sea X una variable aleatoria discreta con función de probabilidad f(x). La
desviación estándar de X es dada por la siguiente expresión:

  V( X )
Ejemplo 23.
Uno de los mayores errores cometidos por la mayoría de las empresas es la ausencia de planificación. Los
negocios han de tener en cuenta que abrir un perfil en las redes sociales no significa hablar solo de la
empresa o de sus productos y/o servicios sino que es vital la elaboración de una estrategia adecuada a las
necesidades y en la que se determine el público al que se quiere llegar mediante estos medios. En el
siguiente gráfico se muestra la distribución de la variable aleatoria X, definida como número de veces que la
empresa actualiza su perfil a la semana.
EPE 121
122 CE86 Estadística Aplicada 1

a. En base a la información mostrada en el gráfico, obtenga el valor de la constante k y complete la


tabla de distribución de probabilidades:
4
Para hallar la constante k, usamos la condición que  f  x   1 , por lo tanto, k =0,04
i 1
i

Remplazando tenemos:
X = veces que actualiza su perfil a la
1 2 3 4 5 6 7
semana
f  x   P X  x  0,04 0,12 0,2 0,24 0,14 0,16 0,10

b. Calcule las veces que se espera que las empresas actualicen su perfil a la semana. Interprete

E  X   1  0,04  2  0,12  ...  7  0,10  4 ,2 veces por semana

Si el experimento se repitiera muchas veces, en la mayoría de las veces se espera que las empresas
actualicen su perfil a la semana 4,2 veces.

Ejemplo 24.
Según un reporte histórico de ventas de la empresa Kallpa, se ha podido determinar que el número de días
transcurrido hasta la venta de un auto presenta la siguiente distribución de probabilidades:

X = número de días hasta la venta 2 3 4 5 6 7


f  x   P X  x  0,1 0,2 0,4 0,15 0,1 0,05

Cada auto vendido, le reporta a la empresa una ganancia fija de $800; sin embargo, si el tiempo para la
venta es menos de cuatro días gana adicionalmente $120, pero si el tiempo para la venta está entre 4 y 5
días gana adicionalmente $80, en otro caso no obtiene ganancia adicional.
a. Determine el tiempo esperado para la venta de un auto y su desviación estándar.

E  X   2  0,13 0 ,2  4  0,4  5  0 ,15  6  0,1  7  0,05  4 ,1 días


 
E X 2  22  0 ,1  32  0,2  42  0,4  52  0,15  62  0 ,1  72  0,05  18,4
Luego, calculamos la varianza V  X   18,4  4 ,12  1,59 días2 siendo el valor de la desviación
estándar   1,59  1,26 días.

b. Calcule la ganancia que espera obtener la empresa.


G = ganancia en dólares 800 880 920
f(G) = Probabilidad 0,15 0,55 0,30

E(G) = 800 x 0,15 + 880 x 0,55 + 920 x 0,30 = $880


Ejercicio 48
La empresa de muebles A, para garantizar la calidad y el acabado del mobiliario, decidió analizar un lote de
900 sillas giratorias y registró el número de fallas por silla giratoria. En el siguiente cuadro, se muestra la
distribución de defectos que presenta las sillas giratorias que pasaron por el control de calidad.

Número de defectos por silla 0 1 2 3 4


Número de sillas por lote 400 280 160 40 20

Sea la variable aleatoria X = número de defectos por silla.


EPE 123

a. Construya la función de distribución de probabilidad de X.


b. Calcule e interprete el valor esperado de la variable aleatoria X.
c. Determine el coeficiente de variación de X.
d. Calcule la probabilidad de que al seleccionar una silla giratoria al azar ésta presente más de tres
defectos, si se sabe que al menos tiene dos defectos por silla.

Ejercicio 49
Con la finalidad de evaluar el incremento del monto de las pólizas, las empresas aseguradoras presentan la
distribución de probabilidad de la variable X: Número total de siniestros de un titular de seguro vehicular:

X 0 1 2 3 4
124 CE86 Estadística Aplicada 1

P(x) 0.35 2a a 0.22 0.13

a. Determine el valor de “a” e indique cuál es el número de siniestros más probable que registra un
titular de seguro vehicular.
b. Cada siniestro que registra un titular de seguro vehicular le genera a la aseguradora costos
administrativos de verificación de la información por un importe de 10 dólares. Determine el costo
administrativo que espera gastar una aseguradora por siniestro que registre un titular de este servicio.

Distribuciones discretas especiales

Distribución binomial

Características:
X: Número de éxitos al realizar n ensayos
Cada ensayo tiene dos posibilidades: { éxito, fracaso }
P(éxito) = p = Constante
 Se dice entonces que la variable aleatoria X sigue una distribución binomial con parámetros n y p
 Se denota X ~ B (n, p)

Entonces, si se tiene un experimento binomial con n intentos y la probabilidad p de éxito en cualquier


intento, la probabilidad de tener x éxitos en los n intentos está dada por:

f  x   P  X  x   C xn p x  1  p n  x x = 0, 1, 2,... , n

Gráfica de la distribución de probabilidades:


EPE 125
126 CE86 Estadística Aplicada 1

Además:
 El esperado de una variable binomial es   E  X   np
 La varianza de una variable binomial es  2  V  X   np 1  p 

Ejemplo 25.
La probabilidad de obtener éxito en un negocio de exportación de productos naturales es igual a 0,4. Un
empresario está interesado en invertir en cinco sucursales de este rubro de manera independiente.

a. Defina la variable, su distribución y rango o recorrido.


b. ¿Cuál es la probabilidad que el empresario tenga éxito solo en dos sucursales?
c. ¿Cuál es la probabilidad que el empresario tenga éxito como máximo en dos sucursales?
d. ¿Cuál es la probabilidad que el empresario tenga éxito en al menos una sucursal?
e. Determine el número esperado de sucursales en el que tendrá éxito.
f. Determine la probabilidad de que no tenga éxito en al menos cuatro sucursales.
Solución
a. Defina la variable, su distribución, parámetros y rango o recorrido.
Definamos la variable aleatoria X = Número de sucursales con éxito, de n=5.
Su distribución y parámetros: X  B (n = 5, p = 0,4)
Rango o recorrido: RX = {0, 1, 2, 3, 4, 5}

b. ¿Cuál es la probabilidad que el empresario tenga éxito en al menos una sucursal?

En Excel, use la función =DISTR.BINOM.N(Núm_éxito, Ensayos, Prob_éxito, acumulado)

En la ventana que aparece realice lo siguiente:

 Núm_éxito: digite o haga clic a la celda que contiene el menor valor del rango de la variable, en este
caso A5
 Ensayos: se refiere al tamaño de muestra. Digite 5 o haga clic a la celda B2. Presione F4 para fijar la
celda.
 Prob_éxito: se refiere a la probabilidad de éxito. Digite 0.4 o haga clic a la celda B1. Presione F4 para
fijar la celda.
 Acumulado: Como vamos a obtener la tabla de función de probabilidad digitamos el valor 0.
Colocamos el valor cero porque lo que se va a obtener son probabilidades puntuales.

La probabilidad solicitada será:

P  X  1  0,2592  0,3456  0,2304  0,0768  0,0102  0,9222


EPE 127

c. Determine el número esperado de sucursales en el que tendrá éxito. E  X   n  p  5  0,4  2

d. Determine la probabilidad de que no tenga éxito en al menos cuatro sucursales.

Debemos observar que en esta pregunta la variable ha cambiado, ahora estamos interesados en las que
no tienen éxitos; por lo tanto, ha cambiado también la probabilidad de éxito.

Realice los pasos mostrados en la pregunta a. para dar respuesta a la pregunta.

Definamos la variable aleatoria Y= Número de sucursales sin éxito, de n=5


Su distribución y parámetros: Y  B (n = 5, p = 0,6)
128 CE86 Estadística Aplicada 1

Rango o recorrido: Ry ={0, 1, 2, 3, 4, 5}

La probabilidad solicitada será: P  Y  4   0,33696

Ejercicio 50
Es más frecuente que los peruanos mantengan sus ahorros fuera del sistema financiero, ya sea porque sus
ingresos no se lo permiten, por desconfianza o simplemente porque no ven ventajas en abrir una cuenta
bancaria. Según el estudio realizado por la superintendencia de Banca, Seguros y AFP (SBS) el 35.4% de los
peruanos ahorra en su hogar. Si se seleccionan 10 personas al azar y asumiendo independencia.
a. Calcule la probabilidad de que cinco personas ahorren en su hogar
b. Calcule la probabilidad de que por lo menos dos personas ahorren en su hogar
c. Calcule la probabilidad de que menos de seis personas ahorren en su hogar
d. Calcule la probabilidad de que a lo más de cuatro personas ahorren en su hogar
Solución
La variable en estudio es ………………….………………….……………..……………..

Sus parámetros son: n = ………..………. y p = …………………………….……………..


El rango de la variable X es ………………………………………, La distribución es:
a. Calcule la probabilidad de que cinco personas ahorren en su hogar

La probabilidad pedida es: ……………………… cuyo valor es: ………..…………………

b. Calcule la probabilidad de que por lo menos dos personas ahorren en su hogar

La probabilidad pedida es: ……………………..... cuyo valor es: ………..…………………

c. Calcule la probabilidad de que menos de seis personas ahorren en su hogar

La probabilidad pedida es: ……………….......... cuyo valor es: ………..…………………

d. Calcule la probabilidad de que a lo más de cuatro personas ahorren en su hogar

La probabilidad pedida es: ……………..…........ cuyo valor es: ………..…………………

Ejercicio 51
Una empresa especializada en proyectos de inversión tiene en cartera 10 proyectos elaborados y expeditos
para ser sometidos a la evaluación de concursos de licitación pública estatal. De acuerdo con su
experiencia, el gerente de la empresa sabe que el 20% de los proyectos ganan la buena pro. Suponga que
en un concurso de licitación pública se presentan estos diez proyectos.
a. Calcule la probabilidad de que dos proyectos ganen la licitación.
b. Calcule la probabilidad de que por lo menos ocho proyectos ganen la licitación.
c. Calcule la probabilidad de que a lo más cuatro proyectos no ganen la licitación.
d. Calcule la probabilidad de que más de tres pero como máximo 7 proyectos no ganen la licitación.
Solución

La variable en estudio es …………….……………………………………………………..

Sus parámetros son: n = …………………..………. y p = …………………….…………..

El rango de la variable X es ……………………………………, La distribución es:


EPE 129

a. Calcule la probabilidad de que dos proyectos ganen la licitación.

La probabilidad pedida es: ……………….…........ cuyo valor es: ………..…………………

b. Calcule la probabilidad de que por lo menos ocho proyectos ganen la licitación.

La probabilidad pedida es: …………………........ cuyo valor es: ………..…………………


130 CE86 Estadística Aplicada 1

c. Calcule la probabilidad de que a lo más cuatro proyectos no ganen la licitación.

La probabilidad pedida es: …………..………....... cuyo valor es: ………..…………………

d. Calcule la probabilidad de que más de tres pero como máximo siete proyectos no ganen la licitación.

La probabilidad pedida es: ……………….…........ cuyo valor es: ………..…………………

Ejemplo 26.
TubGal S.A. fabrica tubos de acero galvanizado para la industria. Los productos se fabrican
independientemente uno de otro y se sabe que el 4% de los productos resulta defectuoso. Se desea
determinar si se debe introducir una modificación al proceso en la siguiente campaña por lo que, cada hora
se selecciona al azar una muestra de 15 tubos, del proceso actual, y se determina si es defectuoso o no.
La regla actual sugiere detener el proceso si se encuentra a lo más dos tubos defectuosos en la muestra. Si
la probabilidad de detener el proceso supera 97,5%, se decidirá introducir una modificación al proceso en la
siguiente campaña. ¿Cuál será la decisión a tomar para la próxima campaña?
Solución:
Interpretación:
Se desea determinar si se debe introducir una modificación al proceso en la siguiente campaña.
Representación:
X: número de tubos de acero galvanizado defectuosos en una muestra de tamaño 15.
Rx= {0,1,2,3, … ,15} ; p = 0,04 (probabilidad de defectuoso)
x ~ Binomial(n = 15 , p = 0,04)
Cálculo:
P(X≤2) = P(X=0) + P(X=1) + P(X=2)
=15C0 (0,04)0 (0,96)15 + 15C1 (0,04)1 (0,96)14 + 15C2 (0,04)2 (0,96)13
= 0,9798
Análisis:
Comparamos P(X ≤ 2) con 0,975: P(X ≤ 2) = 0,9798 > 0,975.
Comunicación:
Se decide que se debe introducir una modificación al proceso en la siguiente campaña pues la
probabilidad de detener el proceso supera al 97,5%.

Distribución de Poisson
EPE 131

Características:
X: Número de ocurrencias por unidad de medida (tiempo, área, volumen, etc.)
λ denota el promedio de ocurrencias por unidad de medida
 Se dice entonces que la variable aleatoria X sigue una distribución Poisson con parámetros λ
 Se denota X ~ P(λ)

La probabilidad de tener x resultados en un intervalo dado o en una región específica es:


132 CE86 Estadística Aplicada 1

, donde RX = 0, 1, 2, 3,…

Gráfica de la distribución de probabilidades:

Además:
 Si X ~ P(λ): E(X) = λ , V(X) = λ
Ejemplo:
X: Número de autos vendidos por semana
Si X ~ P( λ = 12 ), ¿cuál es la probabilidad de vender 8 autos esta semana?
X: Número de fallas por m2 de plancha metálica
SI X ~ P( λ = 2.5 ), ¿cuál es la probabilidad de encontrar como máximo 2 fallas en 1 mt 2 de plancha
metálica?
X: Número de bacterias por cm3 de agua
SI X ~ P( λ = 10.25 ), ¿cuál es la probabilidad de encontrar menos de 10 bacterias en 1 cm 3 de agua?
X: Número de errores tipográficos por página
SI X ~ P( λ = 3.5 ), ¿cuál es la probabilidad de encontrar menos de 8 y más de 5 errores tipográficos
en una página?

Ejemplo 27.
Entre las 10:00 am. y 11:00 am. en promedio ocho personas hacen uso de un cajero automático, ubicado al
lado de la puerta de entrada de un banco. Asimismo, el número de clientes que ingresan al banco entre las
10:00 am. y 11:00 am. en promedio es 15 clientes. Considere que el número de clientes que hacen uso del
cajero es independiente del número de clientes que ingresan al banco y ambos siguen un proceso de
Poisson.
a. ¿Cuál es la probabilidad de que menos de 10 pero más de 8 usen el cajero en ese horario?
b. ¿Cuál es la probabilidad de que entre las 10:00 am y las 10:30 am, ingresen al banco menos de tres
clientes?
Solución
a. Definamos la variable aleatoria X = Número de clientes que hacen uso del cajero entre las 10 y 11 am.
X ~ P( λ = 8 )
En Excel 2010, use la función =POISSON.DIST(x, 8, 0)
La probabilidad pedida es P(8 < X < 10) = P(X = 9) = 0,1241

b. Definamos la variable aleatoria:


X = Número de clientes que ingresan al banco entre las 10 y 10:30 am.
X ~ P( λ = 7.5 )
En Excel 2010, use la función =POISSON.DIST(x, 7.5, 0)
EPE 133

La probabilidad pedida es: P(X < 3) = 0,0203

Ejercicio 52
El número de barcos que llegan a un puerto cada semana (siete días) es una variable aleatoria que tiene
distribución de Poisson con media igual a 14 barcos.
a. ¿Cuál es la probabilidad de que en tres días lleguen dos barcos?
b. ¿Cuál es la probabilidad de que en tres días lleguen a lo más de dos barcos?
c. ¿Cuál es la probabilidad de que en cinco días lleguen más de dos barcos?
Solución
La variable en estudio es ……………………………………………………………….……..
Por lo tanto, la media es ………………………………………………………..……..….
134 CE86 Estadística Aplicada 1

En Excel 2010, use la función =POISSON.DIST(…………, …..…………., …..…….)

a. ¿Cuál es la probabilidad de que en tres días lleguen dos barcos?

La probabilidad pedida es: …………....... cuyo valor es: ………………………………

b. ¿Cuál es la probabilidad de que en tres días lleguen a lo más dos barcos?

La probabilidad pedida es: …………....... cuyo valor es: ………………………………

c. ¿Cuál es la probabilidad de que en cinco días lleguen más de dos barcos?

La probabilidad pedida es: …………....... cuyo valor es: ………………………………

Ejercicio 53
El banco Credibank ha planificado abrir una agencia frente a una universidad. Asumiendo que llegan a la
agencia en promedio tres personas por minuto.
a. Calcule la probabilidad de que en dos minutos lleguen cuatro personas a la agencia
b. Calcule la probabilidad de que en dos minutos lleguen como mínimo dos y como máximo cuatro
personas a la agencia.
c. Calcule la probabilidad de que en cinco minutos lleguen más de seis personas a la agencia.
d. Calcule la probabilidad de que en cinco minutos lleguen como máximo seis personas a la agencia.
Solución
La variable en estudio es …………………………………………………….………….……..
Por lo tanto, la media es ……………………………………………………………..……..….
En Excel 2010, use la función =POISSON.DIST(……..……, ……………., …..……….)
a. Calcule la probabilidad de que en dos minutos lleguen cuatro personas a la agencia
La probabilidad pedida es: ……………....…........ cuyo valor es: …………………………
b. Calcule la probabilidad de que en dos minutos lleguen como mínimo dos y como máximo cuatro
personas a la agencia.
La probabilidad pedida es: ……………...…........ cuyo valor es: …………………………
c. Calcule la probabilidad de que en cinco minutos lleguen más de seis personas a la agencia.
La probabilidad pedida es: ………….......…........ cuyo valor es: …………………………
d. Calcule la probabilidad de que en cinco minutos lleguen como máximo seis personas a la agencia.
La probabilidad pedida es: ……………....…........ cuyo valor es: …………………………

Ejercicio 54
El emporio comercial de Gamarra es uno de los principales productores de telas en el Perú. En una tienda
de dicho emporio, el número de defectos por cada metro cuadrado de tela que produce puede modelarse
por una variable aleatoria X que tiene una distribución de Poisson, con un promedio de dos defectos por
cada metro cuadrado.
a. Calcule la probabilidad de que en cinco metros cuadrados de tela se encuentren 9 defectos.
b. Calcule la probabilidad de que en cinco metros cuadrados de tela se encuentren por lo menos 9
defectos.
c. Calcule la probabilidad de que en ocho metros cuadrados de tela se encuentren por lo menos 5 y a lo
más 11 defectos.
Solución
La variable en estudio es …………………………………………………….………….……..
Por lo tanto, la media es ……………………………………………………………..……..….
En Excel 2010, use la función =POISSON.DIST(……..……, ……………., …..……….)
a. Calcule la probabilidad de que en cinco metros cuadrados de tela se encuentren 9 defectos.
La probabilidad pedida es: …………….…........ cuyo valor es: …………………………
EPE 135

b. Calcule la probabilidad de que en cinco metros cuadrados de tela se encuentren por lo menos 9
defectos.
La probabilidad pedida es: …………….…........ cuyo valor es: …………………………
c. Calcule la probabilidad de que en ocho metros cuadrados de tela se encuentren por lo menos 5 y a lo
más 11 defectos.
La probabilidad pedida es: ……….…........ cuyo valor es: ………………………………

Ejemplo 28.
El gerente de desarrollo de la asociación de aseguradoras vehiculares plantea implementar restricciones
para la renovación del seguro vehicular si la probabilidad de que un titular de seguro vehicular tenga más
de tres siniestros en un año resulta ser mayor a 0,3. Se ha demostrado que el número de siniestros por año
136 CE86 Estadística Aplicada 1

que registra un titular de seguro vehicular ocurre con tasa promedio de siniestros de 1,2 por año, ¿los
resultados sugieren al gerente plantear la propuesta?
(Utilice las cinco dimensiones del razonamiento cuantitativo)

Ejemplo 29.
El gerente de desarrollo de la asociación de aseguradoras plantea implementar restricciones para la
renovación del seguro vehicular, si determina que la probabilidad de que un titular de seguro vehicular
tenga más de tres siniestros en un año es por lo menos 0,3. Para esto, la variable que decide analizar es el
“número de siniestros por año”, además por estudios previos, se sabe que la tasa promedio de siniestros de
este tipo es de 0,6 por cada seis meses.
¿Los resultados sugieren al gerente plantear la propuesta?
Interpretación:
Determinar si se debe proponer implementar restricciones para la renovación del seguro vehicular.
Representación:
X: Número de siniestros por año
RX={0,1,2, ….. } y X ~ Poisson( λ = 1,2)
Cálculo:
P(X > 3) = 1 – P(X ≤ 3) = 1 – 0,9662 = 0,0338
Análisis:
Comparamos P(X > 3) con 0,30: P(X > 3) = 0,0338 < 0,30.
Comunicación:
El gerente de desarrollo no deberá plantear implementar restricciones para la renovación del
seguro vehicular.

Ejercicios de aplicación

32. La empresa textil Pima sabe por experiencias previas que el porcentaje de pedidos que cumple con
la entrega en el plazo establecido con sus clientes del exterior es del 92%.
a. Si se eligen al azar cinco pedidos, calcule la probabilidad de tres pedidos se entreguen en el plazo
establecido.
b. Si se eligen al azar cinco pedidos, calcule la probabilidad de que por lo menos cuatro pedidos no se
entreguen en el plazo establecido.

33. La empresa “INDUSTRIAS SAC” realiza una encuesta a sus clientes industriales porque desea
evaluar los errores de las baterías instaladas; a continuación, se presenta la distribución de
probabilidad de la variable X: Número de errores de las baterías instaladas:

X 0 1 2 3 4 5
P(x) 0.12 0.18 0.20 3k 0.14 k

De comprobarse al menos dos de las siguientes tres situaciones; INDUSTRIAS SAC decidirá instalar
alarmas digitales para tomar conocimiento en tiempo real cuando se presente algún error.
 Si la probabilidad de que el número de errores de las baterías instaladas sea como mínimo a 4 es
superior a 21%.
 Si el gasto esperado es mayor a 340 soles. Considerar que, cada error de batería instalada genera
un gasto administrativo cuya función (en soles) está definida por:
G = 47.5X + 210
 Si se sabe que tiene a lo más 3 errores de las baterías, el porcentaje de que tenga más un error de
batería instalada es mayor al 65%.
¿Qué decisión tomará INDUSTRIAS SAC?
EPE 137

34. A una garita de peaje en promedio llegan 240 autos por hora según un proceso de Poisson. El
administrador de la garita ordena atender inicialmente solamente una caseta, pero si en el lapso de
dos minutos llegan como mínimo 10 autos (considera que se produce una congestión), entonces
ordena inmediatamente atender en otra caseta más hasta que se produzca el descongestionamiento.
¿Cuál es la probabilidad que el administrador tenga que ordenar atender en otra caseta?

35. La llegada de reclamos a una oficina reguladora sigue un proceso Poisson con media de dos
reclamos cada cuatro minutos.
c. Calcule la probabilidad que en un minuto se reciba 2 reclamos.
d. Determine la probabilidad que en 10 minutos se presenten por lo menos dos reclamos.
e. Calcule la probabilidad de que en 1 hora se reciba exactamente 28 reclamos.
138 CE86 Estadística Aplicada 1

36. Al pintar planchas de acero con cierto tipo de pintura ocurren pequeños defectos que se
distribuyen aleatoriamente en la superficie según una distribución de Poisson con un promedio de 2,5
defectos por cada 100 cm 2. Calcule la probabilidad de que presente por lo menos dos defectos en una
plancha de acero de 20 cm2.

37. Una empresa especializada en proyectos de inversión tiene en cartera 10 proyectos elaborados y
expeditos para ser sometidos a la evaluación de concursos de licitación pública estatal. De acuerdo con
su experiencia, el gerente de la empresa sabe que el 20% de los proyectos ganan la buena pro.
Suponga que en un concurso de licitación pública se presentan estos diez proyectos. Calcule la
probabilidad de que dos o tres proyectos ganen la licitación.

38. CONECTUS, es una empresa que brinda soluciones integrales de telecomunicaciones para


importantes empresas en los diferentes sectores económicos del Perú. Los servicios que ofrece son:
instalación de equipos de telecomunicación, Help Desk (soporte técnico remoto o in situ) y reparación
de equipos.
Para cada pregunta se debe definir la variable de estudio, su rango, la respectiva distribución de la
variable y los parámetros correspondientes.
1. Cada vez más las capacitaciones para el personal de la empresa en el extranjero requieren el
conocimiento del idioma inglés. Se sabe por experiencias anteriores que el porcentaje de técnicos
que aprueban el examen de inglés, para acceder a una de estas capacitaciones, es de 75%. En la
próxima capacitación a darse lugar en Australia se seleccionan a 30 técnicos al azar.
a. ¿Cuál es la probabilidad de que 10 técnicos desaprueben el examen?
b. Si se sabe que como mínimo 5 técnicos ya desaprobaron el examen ¿Cuál es la probabilidad de
que como máximo 8 técnicos desaprueben el examen?
2. La empresa en busca de nuevo personal para soluciones y servicios más rápidos está reclutando
nuevo personal. En un día en el área de Logística se recibieron 10 CV, donde 4 tenían la
documentación incompleta, por lo cual deberían ser devueltos a los postulantes. Si ese mismo día
se eligen 5 CV al azar y sin reemplazo, calcular la probabilidad de devolver más de tres CV.
3. Intrabank, cliente de Conectus S.A., solicita servicios de reparación de equipos con una frecuencia
promedio de cuatro reparaciones cada dos meses.
a. Calcule la probabilidad de que, en los próximos 3 meses, Intrabank solicite más de cinco
reparaciones de equipos.
b. Si se sabe que en un mes determinado han llegado al menos de 4 reparaciones, ¿cuál es la
probabilidad de que lleguen a lo más 6 reparaciones ese mismo mes?

39. All Security S.A. es una empresa líder en sistemas de alarmas y dispositivos de seguridad para
proteger el patrimonio de las empresas y domicilios de tecnologías de seguridad empresarial y
domiciliaria, con más de 20 años de experiencia, y presencia en 14 países (entre Europa y América).
Su liderazgo se sustenta en una eficiente combinación de un nivel de servicio de calidad mundial con las
mejores tecnologías disponibles en el mercado. Por ello, mantiene en análisis la calidad de su servicio
para mantener su posición de liderazgo.

Objetivo: Analizar el número de defectos por monitor


Dos modelos de monitores de vigilancia “A” y “B”, presentan las siguientes distribuciones de
probabilidad, respecto a la variable X: número de defectos por monitor producido

Monitor Modelo A: Monitor Modelo B:


X 1 2 3 4 X 1 2 3 4
P(x) 0.18 0.30 0.30 0.22 P(x) 0.25 0.30 0.35 0.10

a. Se elige al azar un monitor Modelo B, si la probabilidad de que dicho artículo tenga más de 2
defectos es mayor a 0.5, se decidirá rediseñar el proceso de ensamble. ¿será necesario tomar
esta medida?
EPE 139

b. Se elige al azar un monitor Modelo A y se encuentra que tiene menos de 3 defectos, ¿Cuál es la
probabilidad de que tenga más de un defecto? De comprobarse que esa probabilidad es mayor a
0.7, se debe rediseñar el proceso de ensamble de este modelo. Sustente su decisión.
c. Se sabe que, cada vez que se producen monitores defectuosos, se generan pérdidas. La función
pérdida (en soles) para los monitores Modelo A está definida como por: P = 0.6X + 1.2; donde X
representa el número de defectos por monitor. Si la pérdida esperada por monitor Modelo A es
menor a 3.0 soles, se implementará un equipo de mejora continua del proceso de ensamble. En
caso contrario, se optará por una reingeniería al proceso. Sustente su decisión.
140 CE86 Estadística Aplicada 1

Variable aleatoria continua

Función de densidad de probabilidad


Sea X una variable aleatoria continua definida en Rx. Se dice que f(x) es una función de densidad de
probabilidad si cumple las siguientes condiciones:

i. f(x) ³ 0, para todo x de RX

ii.  f (x)dx  1
RX

Esta función no asigna probabilidades en un punto como si lo hace la función de probabilidad de una
variable aleatoria discreta. Para determinar probabilidades en un intervalo [a, b] contenido en el rango de
X se usa:
b
P a  X  b   f (x)dx
a

A = área debajo de la curva entre “a” y “b”

Valor esperado de una variable aleatoria continua

El valor esperado de una variable aleatoria continua definida en RX está dado por:

E X    x f  x  dx
RX

Varianza de una variable aleatoria continua


La varianza para una variable aleatoria continua definida en RX está dada por:

    x
V  X   E X 2   E  X   2 , donde E X 
2 2
f ( x ) dx
RX

Ejercicio 55
La producción diaria en el mes de abril de una compañía fundidora de metales, es una variable aleatoria,
expresada miles de kilogramos, cuya función de densidad es la siguiente:

a. Calcule la probabilidad de que en un día la fundidora tenga una producción superior a 1000 kilogramos.
b. Si la producción en un día es superior a 900 kilogramos, ¿cuál es la probabilidad de que no sobrepase
los 1 500 kilogramos?

Ejercicio 56
Sea X la variable aleatoria que denota la vida útil en horas de cierto dispositivo electrónico. La función
densidad de probabilidad es:
EPE 141

 20000
 ; x  100
f ( x)   x3
0; en cualquier otro caso

a. ¿Cuál es la probabilidad de que la vida útil de un dispositivo sea más de 200 horas?
b. ¿Cuál es la vida útil esperada del dispositivo?
142 CE86 Estadística Aplicada 1

Distribuciones especiales continuas


Distribución Exponencial
Sea X una variable aleatoria continua definida en [0, ∞ >. Se dice que la variable aleatoria X tiene
distribución exponencial con parámetro β si su función densidad de probabilidad está dada por:
x
1 
f  x  e β
; x0
β
Gráficamente:

Se denota por: X  Exp(β)

Si X  Exp(β):
Valor esperado: E(X) = β
Varianza: V(X) = β2
x

Función de distribución: F x   1  e β

Ejercicio 57
El tiempo hasta que falle por primera vez la batería de un celular se distribuyen según un modelo
exponencial, con un tiempo promedio de vida útil es de 500 horas.
a) Calcule la probabilidad de una batería funcione por más de 600 horas.
b) ¿Cuál es el tiempo máximo que funcionan la batería para estar en el 15% de las baterías que menos
duran?

Ejercicio 58
Un motor turboeje es un motor de turbina de gas que entrega su potencia a través de un eje. Estos
motores son utilizados principalmente en helicópteros y en unidades de energía auxiliar. El tiempo de
revisión de un motor turboeje sigue una distribución exponencial con media 60 minutos.
a) ¿Qué porcentaje de motores de este tipo pueden ser revisados a lo más en 50 minutos?
b) ¿Cuál es el tiempo de revisión de un motor turboeje superado por el 10% de los tiempos de revisión?
c) El costo de revisión para este tipo de motor es de $50 al que se le suma $10 por cada minuto que dure
la revisión. Encontrar el coeficiente de variación del costo.

Ejercicio 59
Se ha comprobado que el tiempo de vida promedio de cierto tipo de marcapasos es de 16 años y que la
variable considerada sigue una distribución exponencial. ¿Cuál es la probabilidad de que a una persona que
se le haya implantado este marcapasos se le deba reimplantar otro entre los 15 y los 20 años?

Distribución Normal

Es la distribución más importante de probabilidad para describir una variable aleatoria continua.
Esta tiene una gran variedad de aplicaciones prácticas en las que las variables aleatorias son altura y peso
de personas, puntuaciones de exámenes, mediciones científicas, etc.

La distribución normal fue desarrollada por primera vez por el matemático francés Abraham de Moivre en
un artículo del año 1733 y sus resultados fueron ampliados por Laplace (1812). Algunos autores atribuyen
un descubrimiento independiente al matemático alemán Gauss.

Función de densidad
EPE 143

2
1  x  
1   
f  x  e 2  
 2

Características
La variable aleatoria X sigue una distribución normal con parámetros: media  y varianza 2.
Se denota X  N (, 2)

La función de densidad tiene forma de campana y es simétrica, por lo que las medidas de tendencia central
coinciden.
144 CE86 Estadística Aplicada 1

El rango de la variable normal es toda la recta real, esto es, de – a + .

En Excel, use las siguientes funciones:


 P(X ≤ x) =DISTR.NORM.N(x; media; desviación estándar; acumulado)
 k = INV.NORM(α, media, desviación estándar), tal que P(X ≤ k) = α
Por ejemplo, si X  N ( = 50, 2 = 400)
 P(X ≤ 60) =DISTR.NORM.N(60; 50; 20; 1) = 0,69146
 Calcular k tal que P(X ≤ k) = 0,95. k = INV.NORM(0.95; 50; 20) = 82,897

Estandarización
Se toma como referencia una distribución normal estándar (  = 0 y 2 = 1).
Se trabaja con la distancia entre x y  en función de la desviación estándar, tal como se muestra.
X 
Z

EPE 145

Ejercicio 60
El consumo mensual de energía eléctrica, en kilowatts, de una ciudad tiene distribución normal con media
de 140 kW, con una varianza de 400 kW 2.

Solución
La variable en estudio es …...……………………………………………………………………………………………………….……..

Sus parámetros son:  = …………………………..………. y 2 = ……………………………………..…….

a. ¿Cuál es la probabilidad que un hogar tenga un consumo menor de 150 kW?


146 CE86 Estadística Aplicada 1

P(X < ……….……………) = …………………………………………………..

En Excel, use la función =DISTR.NORM.N(……..…...., ………….., …………..., ……..…...)

b. ¿Cuál es la probabilidad que un hogar tenga un consumo mayor a 130 kW?

P(X > ……….……………) = …………………………………………………..

En Excel, use la función =DISTR.NORM.N(……..…...., ………….., …………..., ……..…...)

c. ¿Qué porcentaje de hogares registran un consumo entre 115 y 160 kW?

P(……….……….……………) = …………………………………………………..

En Excel, use la función =DISTR.NORM.N(……..…...., ………….., …………..., ……..…...) y =DISTR.NORM.N(……..


…...., ………….., …………..., ……..…...)

d. Calcule el consumo mínimo de energía eléctrica para pertenecer al 15% de los mayores consumidores.

El percentil a calcular es ……………. cuyo valor es ……………………

k = INV.NORM(…….……..…, …….……..…, …….……..…)

e. Calcule el consumo máximo de energía eléctrica para pertenecer al 25% de los menores consumidores.

El percentil a calcular es ……………. cuyo valor es ……………………

k = INV.NORM(…….……..…, …….……..…, …….……..…)


EPE 147

Ejercicio 61
La cantidad de dinero destinada al ahorro mensual de los clientes de un banco es una variable aleatoria
que tiene una distribución normal con una media igual a 460 soles y una desviación estándar igual a 50
soles.

Solución

La variable en estudio es …...…………………………………………………………………….……..


La distribución de X  N(m = ……………………… ; s 2 = ……………………….)
148 CE86 Estadística Aplicada 1

a. Calcule la probabilidad de que un cliente ahorre menos de 480 soles en un mes.

b. Calcule la probabilidad de que un cliente ahorre más de 500 soles mensuales.

c. Calcule la probabilidad que el ahorro mensual de un cliente esté entre 460 y 520 soles.

d. Si se sabe que una persona está en el grupo de los que ahorró más de 450, calc ule la probabilidad que
su ahorro mensual sea menor a 600 soles.

e. ¿Cuál es el ahorro mínimo para estar en el 10% de los clientes que más ahorran?

f. ¿Cuál es el ahorro máximo para estar en el 25% de los clientes que menos ahorran?
EPE 149

Ejemplo 30.
Una máquina que expende bebidas ligeras está regulada de modo que descarga un promedio de 200 ml por
vaso. Si la cantidad descargada por esta máquina tiene distribución normal con desviación estándar 15 ml.

Sea X:= cantidad descargada por la máquina de bebidas (en ml), entonces:
X ~ N    200 ;  2  152 

a. ¿Qué porcentaje de los vasos servidos contendrá más de 224 ml?


P  X  224   1  P  X  224  =1 - 0,9452 = 0,0548. El 5,48% de los vasos contendrá más de 224 ml.
150 CE86 Estadística Aplicada 1

b. ¿Cuál es la probabilidad que un vaso contenga entre 191 y 209 ml?


P  191  X  209  P  X  209   P  X  191 = 0,7257 – 0,2743 = 0,4515

c. ¿Cuál es la cantidad máxima descargada por esta máquina en un vaso para poder considerarlo dentro
del grupo del 30% con menores contenidos?
P(X ≤ k) = 0,30, entonces k = 192,13 ml

Propiedad reproductiva de la distribución normal


Si X1, X2, ... , Xk son variables aleatorias independientes tales que Xi  N(i ,i2) entonces la variable aleatoria

Ejemplo 31.
El peso de las personas de una ciudad se considera distribuido normalmente con promedio 75 kg y
desviación estándar 10 kg. Si un ascensor tiene capacidad máxima de 650 kg, ¿cuál es la probabilidad de
que 8 personas no superen la capacidad máxima?

Ejemplo 32.
Una empresa fabricante de detergentes tiene asignada una máquina especial para el llenado y sellado de
las bolsas del detergente Enigma Limón. Se sabe que el peso de detergente que la máquina deposita en las
bolsas sigue una distribución normal con media de 87,5 gramos y desviación estándar de 0,5 gramos; se
sabe también que las bolsas vacías utilizadas en el embolsado de Enigma Limón tienen un peso que sigue
una distribución normal con media 21,5 gramos y una desviación estándar de 1,2 gramos.
¿Cuál es la probabilidad de que una bolsa llena de detergente, escogida al azar a la salida del
proceso de embolsado, tenga un peso mayor a 110 gramos?
EPE 151

TABLA DE LA DISTRIBUCION NORMAL

Área bajo la curva normal: P(Z ≤ z) = α

Z -0.09 -0.08 -0.07 -0.06 -0.05 -0.04 -0.03 -0.02 -0.01 -0.00
-3.90.0000330.0000340.0000360.0000370.000039 0.000041 0.0000420.0000440.0000460.000048
-3.80.0000500.0000520.0000540.0000570.000059 0.000062 0.0000640.0000670.0000690.000072
-3.70.0000750.0000780.0000820.0000850.000088 0.000092 0.0000960.0001000.0001040.000108
152 CE86 Estadística Aplicada 1

-3.60.0001120.0001170.0001210.0001260.000131 0.000136 0.0001420.0001470.0001530.000159


-3.50.0001650.0001720.0001780.0001850.000193 0.000200 0.0002080.0002160.0002240.000233
-3.40.0002420.0002510.0002600.0002700.000280 0.000291 0.0003020.0003130.0003250.000337
-3.30.0003490.0003620.0003760.0003900.000404 0.000419 0.0004340.0004500.0004660.000483
-3.20.0005010.0005190.0005380.0005570.000577 0.000598 0.0006190.0006410.0006640.000687
-3.10.0007110.0007360.0007620.0007890.000816 0.000845 0.0008740.0009040.0009350.000968
-3.00.0010010.0010350.0010700.0011070.001144 0.001183 0.0012230.0012640.0013060.001350
                     
-2.9 0.00139 0.00144 0.00149 0.00154 0.00159 0.00164 0.00169 0.00175 0.00181 0.00187
-2.8 0.00193 0.00199 0.00205 0.00212 0.00219 0.00226 0.00233 0.00240 0.00248 0.00256
-2.7 0.00264 0.00272 0.00280 0.00289 0.00298 0.00307 0.00317 0.00326 0.00336 0.00347
-2.6 0.00357 0.00368 0.00379 0.00391 0.00402 0.00415 0.00427 0.00440 0.00453 0.00466
-2.5 0.00480 0.00494 0.00508 0.00523 0.00539 0.00554 0.00570 0.00587 0.00604 0.00621
-2.4 0.00639 0.00657 0.00676 0.00695 0.00714 0.00734 0.00755 0.00776 0.00798 0.00820
-2.3 0.00842 0.00866 0.00889 0.00914 0.00939 0.00964 0.00990 0.01017 0.01044 0.01072
-2.2 0.01101 0.01130 0.01160 0.01191 0.01222 0.01255 0.01287 0.01321 0.01355 0.01390
-2.1 0.01426 0.01463 0.01500 0.01539 0.01578 0.01618 0.01659 0.01700 0.01743 0.01786
-2.0 0.01831 0.01876 0.01923 0.01970 0.02018 0.02068 0.02118 0.02169 0.02222 0.02275
                     
-1.9 0.02330 0.02385 0.02442 0.02500 0.02559 0.02619 0.02680 0.02743 0.02807 0.02872
-1.8 0.02938 0.03005 0.03074 0.03144 0.03216 0.03288 0.03362 0.03438 0.03515 0.03593
-1.7 0.03673 0.03754 0.03836 0.03920 0.04006 0.04093 0.04182 0.04272 0.04363 0.04457
-1.6 0.04551 0.04648 0.04746 0.04846 0.04947 0.05050 0.05155 0.05262 0.05370 0.05480
-1.5 0.05592 0.05705 0.05821 0.05938 0.06057 0.06178 0.06301 0.06426 0.06552 0.06681
-1.4 0.06811 0.06944 0.07078 0.07215 0.07353 0.07493 0.07636 0.07780 0.07927 0.08076
-1.3 0.08226 0.08379 0.08534 0.08691 0.08851 0.09012 0.09176 0.09342 0.09510 0.09680
-1.2 0.09853 0.10027 0.10204 0.10383 0.10565 0.10749 0.10935 0.11123 0.11314 0.11507
-1.1 0.11702 0.11900 0.12100 0.12302 0.12507 0.12714 0.12924 0.13136 0.13350 0.13567
-1.0 0.13786 0.14007 0.14231 0.14457 0.14686 0.14917 0.15151 0.15386 0.15625 0.15866
                     
-0.9 0.16109 0.16354 0.16602 0.16853 0.17106 0.17361 0.17619 0.17879 0.18141 0.18406
-0.8 0.18673 0.18943 0.19215 0.19489 0.19766 0.20045 0.20327 0.20611 0.20897 0.21186
-0.7 0.21476 0.21770 0.22065 0.22363 0.22663 0.22965 0.23270 0.23576 0.23885 0.24196
-0.6 0.24510 0.24825 0.25143 0.25463 0.25785 0.26109 0.26435 0.26763 0.27093 0.27425
-0.5 0.27760 0.28096 0.28434 0.28774 0.29116 0.29460 0.29806 0.30153 0.30503 0.30854
-0.4 0.31207 0.31561 0.31918 0.32276 0.32636 0.32997 0.33360 0.33724 0.34090 0.34458
-0.3 0.34827 0.35197 0.35569 0.35942 0.36317 0.36693 0.37070 0.37448 0.37828 0.38209
-0.2 0.38591 0.38974 0.39358 0.39743 0.40129 0.40517 0.40905 0.41294 0.41683 0.42074
-0.1 0.42465 0.42858 0.43251 0.43644 0.44038 0.44433 0.44828 0.45224 0.45620 0.46017
-0.0 0.46414 0.46812 0.47210 0.47608 0.48006 0.48405 0.48803 0.49202 0.49601 0.50000
EPE 153

TABLA DE LA DISTRIBUCION NORMAL

Área bajo la curva normal: P(Z ≤ z) = α

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.50000 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.52790 0.53188 0.53586
0.1 0.53983 0.54380 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57535
154 CE86 Estadística Aplicada 1

0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 0.60257 0.60642 0.61026 0.61409
0.3 0.61791 0.62172 0.62552 0.62930 0.63307 0.63683 0.64058 0.64431 0.64803 0.65173
0.4 0.65542 0.65910 0.66276 0.66640 0.67003 0.67364 0.67724 0.68082 0.68439 0.68793
0.5 0.69146 0.69497 0.69847 0.70194 0.70540 0.70884 0.71226 0.71566 0.71904 0.72240
0.6 0.72575 0.72907 0.73237 0.73565 0.73891 0.74215 0.74537 0.74857 0.75175 0.75490
0.7 0.75804 0.76115 0.76424 0.76730 0.77035 0.77337 0.77637 0.77935 0.78230 0.78524
0.8 0.78814 0.79103 0.79389 0.79673 0.79955 0.80234 0.80511 0.80785 0.81057 0.81327
0.9 0.81594 0.81859 0.82121 0.82381 0.82639 0.82894 0.83147 0.83398 0.83646 0.83891
                     
1.0 0.84134 0.84375 0.84614 0.84849 0.85083 0.85314 0.85543 0.85769 0.85993 0.86214
1.1 0.86433 0.86650 0.86864 0.87076 0.87286 0.87493 0.87698 0.87900 0.88100 0.88298
1.2 0.88493 0.88686 0.88877 0.89065 0.89251 0.89435 0.89617 0.89796 0.89973 0.90147
1.3 0.90320 0.90490 0.90658 0.90824 0.90988 0.91149 0.91309 0.91466 0.91621 0.91774
1.4 0.91924 0.92073 0.92220 0.92364 0.92507 0.92647 0.92785 0.92922 0.93056 0.93189
1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408
1.6 0.94520 0.94630 0.94738 0.94845 0.94950 0.95053 0.95154 0.95254 0.95352 0.95449
1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.96080 0.96164 0.96246 0.96327
1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670
                     
2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169
2.1 0.98214 0.98257 0.98300 0.98341 0.98382 0.98422 0.98461 0.98500 0.98537 0.98574
2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158
2.4 0.99180 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361
2.5 0.99379 0.99396 0.99413 0.99430 0.99446 0.99461 0.99477 0.99492 0.99506 0.99520
2.6 0.99534 0.99547 0.99560 0.99573 0.99585 0.99598 0.99609 0.99621 0.99632 0.99643
2.7 0.99653 0.99664 0.99674 0.99683 0.99693 0.99702 0.99711 0.99720 0.99728 0.99736
2.8 0.99744 0.99752 0.99760 0.99767 0.99774 0.99781 0.99788 0.99795 0.99801 0.99807
2.9 0.99813 0.99819 0.99825 0.99831 0.99836 0.99841 0.99846 0.99851 0.99856 0.99861
                     
3.00.9986500.9986940.9987360.998777 0.998817 0.9988560.9988930.9989300.9989650.998999
3.10.9990320.9990650.9990960.999126 0.999155 0.9991840.9992110.9992380.9992640.999289
3.20.9993130.9993360.9993590.999381 0.999402 0.9994230.9994430.9994620.9994810.999499
3.30.9995170.9995340.9995500.999566 0.999581 0.9995960.9996100.9996240.9996380.999651
3.40.9996630.9996750.9996870.999698 0.999709 0.9997200.9997300.9997400.9997490.999758
3.50.9997670.9997760.9997840.999792 0.999800 0.9998070.9998150.9998220.9998280.999835
3.60.9998410.9998470.9998530.999858 0.999864 0.9998690.9998740.9998790.9998830.999888
3.70.9998920.9998960.9999000.999904 0.999908 0.9999120.9999150.9999180.9999220.999925
3.80.9999280.9999310.9999330.999936 0.999938 0.9999410.9999430.9999460.9999480.999950
3.90.9999520.9999540.9999560.999958 0.999959 0.9999610.9999630.9999640.9999660.999967
EPE 155

Ejercicios propuestos

40. Una importante empresa constructora está financiando la venta de departamentos en una zona
exclusiva de Asia, el 46% de los futuros propietarios solicitaron los servicios de gimnasio y el 54% los
servicios de sauna y el 30% ambos servicios. Con la finalidad de realizar una planificación para la
provisión de los servicios demandados por los clientes.
a. ¿Cuál es la probabilidad de que un propietario haya solicitado los servicios de gimnasio o sauna?
b. ¿Cuál es la probabilidad de que un propietario no haya solicitado ni servicio de gimnasio ni servicio
de sauna?
156 CE86 Estadística Aplicada 1

c. ¿Cuál es la probabilidad de que un propietario haya solicitado solo el servicio de gimnasio?

41. Una empresa de insumos informáticos recibe semanalmente pedidos de uno de sus clientes más
importantes. Se dispone de la siguiente información acerca del tipo de productos que solicita: el 55%
de las veces incluye en su pedido el producto A, el 40% de las veces el producto B y en el 30% de los
pedidos se solicitan los dos productos. Calcular la probabilidad de que la semana próxima este cliente
solicite:
a. El producto A o el producto B.
b. El producto A y no el B.

42. En una muestra de 2000 hogares de Lima Metropolitana se registró el nivel educativo alcanzado
por el jefe de hogar y el nivel socioeconómico al cual pertenece.

Si se selecciona un hogar al azar, determine la probabilidad de que el jefe de hogar:


a. pertenezca al NSE A o D
b. tenga como mínimo un nivel educativo primario.
c. tenga un nivel educativo secundario y no sea de NSE C.
d. tenga un nivel educativo primario o pertenezca al NSE D.

43. En una empresa el 25% son mujeres y el 75% son hombres. Un día ha llegado tarde a trabajar el 3%
de las mujeres y el 5% de los hombres. Si se elige, al azar, a un trabajador que ha llegado tarde, calcule
la probabilidad de que sea elegida una mujer.

44. La investigación de mercados es el proceso de recopilación, procesamiento y análisis de


información, respecto a temas relacionados con el marketing, como: clientes, competidores y
mercado. En una compañía hay dos bases de datos sobre clientes, en la primera el 4,1% de los datos
están equivocados, mientras que en la segunda el 3,4% de los datos están equivocados. De la primera
base de datos, se saca el 75% de los datos de los clientes y el 25% restante viene de la segunda. Si se
elige un cliente al azar y sus datos están equivocados, calcule la probabilidad de que provengan de la
segunda base de datos.

45. Una empresa necesita aportaciones de sus socios para dos proyectos. La probabilidad de que sus
socios aporten para el proyecto de pago anticipado de deuda es 0,3 y que aporten para el proyecto de
expansión de la capacidad productiva es de 0,6; la probabilidad de que aporten para ambos proyectos
es de 0,08.
a. ¿Cuál es la probabilidad de que los socios solamente aporten para uno de los proyectos?
b. ¿Cuál es la probabilidad de que los socios aporten para la expansión, si no aportaron para el pago
anticipado de deuda?

46. Una institución extranjera no gubernamental está pensando invertir en un proyecto en nuestro
país, las opciones son tres, invertir en un proyecto de agricultura en un 40%, invertir en un proyecto
minero en un 35% y el resto de probabilidad se desea invertir en un proyecto de ganadería. Se
obtendría apoyo del estado peruano en las probabilidades siguientes: 20%, 25% y 15% en los
proyectos respectivos mencionados anteriormente.
a. Si se elige un proyecto al azar ¿cuál es la probabilidad de recibir apoyo del estado?
EPE 157

b. Si no se recibió apoyo del estado, ¿cuál es la probabilidad que la institución no gubernamental


invirtió en un proyecto minero?

47. A lo largo de los últimos cuatro años, se ha determinado que el 20% de las compras se han
realizado en Econo A, el 30% en Plaza B y el 25% en Tienda C. Se sabe además que el porcentaje de
clientes femeninos es del 90% si son de Econo A, 95% si son de Plaza B, 100% si son de Tienda C y 90%
si son de Todo D. Si se elige un cliente al azar y se determina que es de sexo masculino, ¿cuál es la
probabilidad que haya comprado en Plaza B?
158 CE86 Estadística Aplicada 1

48. Una aerolínea desea analizar el comportamiento de los clientes considerando el destino de viaje, el
tipo de cliente y el modo de compra. Dentro de su proceso de creación de reportes, para ello, ha
obtenido la siguiente tabla:

Destino de viaje nacional Destino de viaje internacional


Tipo de Compra Compra por Compra Compra por Total
cliente presencial Internet presencial Internet
Premiun 12 28 38 13 91
Frecuente 8 25 12 23 68
Ocasional 7 15 9 10 41
Total 27 68 59 46 200

a. Calcule la probabilidad de que una persona elegida al azar no compre pasajes por Internet y tenga
un destino de viaje nacional.
b. Si se elige al azar a un cliente ocasional, calcule la probabilidad de que compre pasajes por Internet.

49. Una máquina llena recipientes con determinado producto. Se sabe que la media y desviación
estándar para los pesos de llenado, de acuerdo con datos históricos, son 18,123 onzas y 0,6 onzas. El
peso de llenado se modelo mediante una variable aleatoria normal.
a. Si se selecciona un recipiente al azar, ¿cuál es la probabilidad que su peso sea mayor a 16 onzas
pero menor o igual que 20 onzas?
b. ¿Cuál es el peso máximo de un recipiente para estar considerado dentro del 25% de los recipientes
menos pesados?

50. El tiempo necesario para que una ambulancia llegue a un centro deportivo se distribuye
normalmente con una media de 17 minutos y desviación estándar de tres minutos.
a. Calcule la probabilidad que el tiempo de llegada esté comprendido entre 13 y 21 minutos.
b. ¿Para qué valor t, la probabilidad de que la ambulancia emplee más de t minutos en llegar es el 5
%?

51. Una compañía telefónica ha determinado que el tiempo total de duración de las llamadas
realizadas mensualmente por sus clientes menores de 35 años, medidos en minutos, sigue una
distribución normal de media 100 y desviación estándar 25.
a. Calcula la probabilidad de que un cliente facture menos de dos horas en llamadas.
b. ¿Cuál es la probabilidad de que un cliente facture entre 80 y 110 minutos?
c. La empresa decide iniciar una campaña para premiar a aquellos clientes que acumulen en
llamadas más del doble de los minutos esperados. ¿Qué porcentaje de los usuarios se beneficiarán
en dicha campaña?
d. Para los clientes que facturan poco, se piensa en incentivarlos con un sistema de
retribuciones. Si se quiere incluir en ese programa al 1% de los clientes, ¿cuál es la duración total en
minutos que debe acumular como máximo un cliente para ser incluido en la promoción?

52. La distribución de la demanda (en número de unidades por unidad de tiempo) de un producto a
menudo puede aproximarse con una distribución de probabilidad Normal. Por ejemplo, una compañía
de comunicación por cable ha determinado que el número de interruptores terminales de botón
solicitados diariamente tiene una distribución Normal, con una media de 200 y una desviación
estándar de 50.
a. ¿En qué porcentaje de los días la demanda será de menos de 90 interruptores?
b. ¿En qué porcentaje de los días la demanda estará entre 225 y 275 interruptores?
c. La compañía ha determinado que su mejor estrategia consiste en producir una cantidad de
interruptores suficiente para atender plenamente la demanda en 94% de todos los días. ¿Cuantos
interruptores terminales deberá producir la compañía cada día?
EPE 159

53. En un proceso fotográfico, el tiempo de revelado de las impresiones de las fotos puede
considerarse una variable aleatoria con distribución normal con media 16,28 segundos y desviación
estándar de 0,12 segundos. Si se elige una impresión al azar:
a. Calcule la probabilidad de que el tiempo de revelado sea menor de 16,55 segundos.
b. Calcule la probabilidad de que el tiempo de revelado sea menor de 15,96 segundos.
c. Calcule la probabilidad de que el tiempo de revelado sea mayor de 16 segundos.
d. Calcule la probabilidad de que el tiempo de revelado sea mayor de 16,12 segundos.
e. Calcule la probabilidad de que el tiempo de revelado se encuentre comprendido entre 15,96 y
16,55 segundos.
160 CE86 Estadística Aplicada 1

f. Calcule el tiempo máximo de impresión para ser considerada en el grupo del 10% con los menores
tiempos de revelados.
EPE 161

Unidad 5.
LOGRO
Al finalizar la unidad 3, el estudiante aplica la teoría de la probabilidad para la toma de decisiones en
base a datos históricos y en condiciones de incertidumbre.
162 CE86 Estadística Aplicada 1

Muestreo
Un objetivo de la Estadística es hacer inferencias acerca de una población con base en información en una
muestra. Esto motiva el estudio del problema del muestreo.
Muchos estudios estadísticos se inician con la selección de una muestra. Este proceso recibe el nombre de
muestreo el cual comprende:

 Definición de la población objetivo y búsqueda del marco muestral.


 Determinación del tamaño de la muestra.
 Elección del tipo de muestreo y selección de las unidades.
 Registro de las observaciones.

Por ejemplo, la Asociación Peruana de Empresas de Investigación realizaba una encuesta para determinar
el nivel socioeconómico de una persona. Hoy en día, ya no realiza una encuesta, sino más bien usa la
información obtenida de la Encuesta Nacional de Hogares (ENAHO) realizada por el Instituto Nacional de
Estadística e Informática (INEI).

Niveles socioeconómicos en Lima Metropolitana y Callao

Ficha técnica

Universo de estudio
 Se consideró como universo de estudio a todos los hogares pertenecientes a
Lima Metropolitana entendida como los distritos de Lima ubicados en el
núcleo urbano (sin considerar balnearios) y la Provincia Constitucional del
Callao. Se definió como hogar, al conjunto de personas que, habitando en la
misma vivienda, preparan y consumen sus alimentos en común.

 La persona informante fue el jefe de familia, definido como aquella persona que más
aporta económicamente en el hogar.

Marco muestral
Para el desarrollo de la investigación se consideró como marco muestral:
 La base de datos de viviendas del Instituto Nacional de Estadística e Informática (INEI).
 Actualización mediante aplicación de rastreo de campo efectuada por APEIM en las zonas de mayor
crecimiento de la ciudad (conos)

Tamaño de la muestra
 Se entrevistó a un total de 3598 hogares distribuidos en 41 distritos.
 El margen de error máximo probable con un nivel de confianza del 95.1 % y considerando el máximo de
dispersión (p = q = 50%) fue de ± 1.63%.
 Dentro de esta muestra se realizaron 200 entrevistas en Distritos con predominio de los N.S.E. Muy
Alto/Alto con el propósito de obtener una submuestra estadísticamente significativa para este
segmento.
 El total de entrevistas fue desagregado proporcionalmente a la distribución poblacional de cada uno de
los distritos de Lima Metropolitana.

Selección de la muestra
EPE 163

 Determinada la cantidad de entrevistas a aplicar por distrito, se procedió a sortear tantas manzanas
como entrevistas se requerían.

 Dentro de cada manzana se seleccionó por un sistema


aleatorio simple cinco viviendas: una vivienda titular y
cuatro viviendas suplentes. Los hogares titulares fueron
visitados hasta en tres oportunidades antes de proceder al
reemplazo. Se controló que la tasa de reemplazo no excediera el 10% del total de entrevistas
originalmente sorteadas.
164 CE86 Estadística Aplicada 1

Conceptos importantes
a. Unidad elemental: Es el objeto sobre el cual se hace la medición. También llamada unidad de
observación, unidad de análisis, unidad estadística o elemento. Por ejemplo, en estudios de poblaciones
humanas, con frecuencia ocurre que la unidad elemental es cada individuo. También podría ser por
ejemplo una empresa, un colegio o un día, dependiendo de los objetivos y de la información que se
quiere recolectar.

b. Población muestreada: Es el conjunto de todas las unidades elementales posibles que podrían extraerse
en una muestra; es decir, es la población de donde se extrae la muestra.

c. Unidad de muestreo: Es la unidad donde realizamos la muestra.


Por ejemplo, podríamos querer estudiar a las personas, pero no tenemos una lista de todos los
individuos que pertenecen a la población objetivo. En vez de eso, la unidad de muestreo es cada familia
y la unidad elemental es cada individuo que vive en una familia.

d. Marco muestral: Es una lista de las unidades de muestreo que están disponibles para elección.
Generalmente la unidad elemental es la unidad de muestreo, pero no siempre.

e. Muestreo no probabilístico: El muestreo no probabilístico es una técnica de muestreo donde las


muestras se recogen en un proceso que no brinda a todos los individuos de la población iguales
oportunidades de ser seleccionados. A diferencia del muestreo probabilístico, no es un producto de un
proceso de selección aleatoria. Los sujetos en una muestra no probabilística generalmente son
seleccionados en función de su accesibilidad o a criterio personal e intencional del investigador.
La desventaja es que esta muestra no es representativa. Por lo tanto, los resultados de la investigación
no pueden ser utilizados en generalizaciones respecto de toda la población.

f. Muestreo probabilístico: Los métodos de muestreo probabilísticos son aquellos que se basan en el
principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma
probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles
muestras de tamaño n tienen la misma probabilidad de ser seleccionadas.

Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra


extraída y son, por tanto, los más recomendables ya que con este tipo de muestreos se pueden realizar
inferencias o generalizaciones sobre la población.

Tipos de muestreo probabilístico


Dentro de los métodos de muestreo probabilísticos encontramos los siguientes tipos:
EPE 165
166 CE86 Estadística Aplicada 1

Muestreo aleatorio simple


Es el procedimiento por el cual se selecciona una muestra en forma aleatoria y sin reemplazo a n unidades
de muestreo de una población que contiene un total de N unidades.

Se garantiza que cada una de las muestras posibles tiene la misma probabilidad de ser elegida.

Pasos a seguir para seleccionar una muestra simple aleatoria

1. Enumere las unidades del marco muestral con números sucesivos.

2. Seleccione tantos elementos del marco muestral como sea el tamaño requerido de la muestra, usando
una tabla de números aleatorios, tomando la cantidad de columnas igual a la cantidad de dígitos de n.
La selección de las unidades se realiza sin reemplazo (no se repiten las unidades)

El muestreo aleatorio simple presenta dos propiedades:

 Equiprobable: Cada unidad tiene las mismas posibilidades de ser elegida.

 Independencia: La selección de una unidad no influye en la selección de otras unidades.

Pero en el mundo real es difícil encontrar muestras completamente independientes y representativas.

Uso de la Tabla de números aleatorios


Si por ejemplo queremos seleccionar una muestra aleatoria simple de 5 clientes y tenemos en el marco
muestral, la lista enumerada del total de clientes de la empresa (población) de 350 clientes, el marco
muestral será:
Marco Muestral
Nº Cliente
001 Carlos Torres
EPE 167

002 Manuel Benavides


003 Ricardo Montoya
004 Rosario Castro
· ·
· ·
349 Julia Martín
N= 350 Renato Alvarado

Y la tabla de números aleatorios que se utilizará está formada por con 20 columnas con números generados
en forma aleatoria como se muestra a continuación:
168 CE86 Estadística Aplicada 1

TABLA DE NÚMEROS ALEATORIOS

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
EPE 169

Vemos que se debe seleccionar 5 números del 1 al 350 sin reemplazo, es decir sin que se repitan. El número
máximo a seleccionar es 350 que tiene 3 dígitos, entonces tomaremos de la tabla de números aleatorios 3
columnas consecutivas. Si por ejemplo en este caso para la selección se consideran las columnas C6, C15 y
C4, para iniciar la selección se tomarán 3 columnas consecutivas hacia la derecha a partir de C6, esto es: C6
C7 C8.
170 CE86 Estadística Aplicada 1

Los números deben estar comprendidos entre 1 y 350, entonces los números seleccionados serán: 084,
040, 124, 245 y 332.

Ejercicio 62
El gerente de una empresa automotriz que tiene un total de 150 empleados, requiere seleccionar a 12
empleados al azar para que conformen un equipo de prueba, utilizando un nuevo método de transporte y
para estimar el ingreso mensual.
A continuación se muestra el número o código del colaborador y su ingreso quincenal en soles:
Trabajadores registrados (Marco muestral)
Ingreso Ingreso Ingreso Ingreso
Nº quincenal Nº quincenal Nº quincenal Nº quincenal
1 2300 39 2600 77 1800 115 1700
2 2800 40 2700 78 1700 116 2600
3 2400 41 2100 79 1700 117 1600
4 2500 42 2300 80 1700 118 1800
5 2300 43 1700 81 1700 119 2100
6 2100 44 2200 82 2100 120 1700
7 1700 45 2900 83 2600 121 2400
8 2000 46 1800 84 2400 122 2600
9 2200 47 2100 85 2600 123 2100
10 2100 48 2000 86 1900 124 2100
11 1700 49 2000 87 1600 125 2400
12 2500 50 2900 88 1900 126 1700
13 2800 51 2100 89 2100 127 2600
14 2400 52 2100 90 1700 128 2400
15 1700 53 1800 91 2100 129 2700
16 2400 54 2000 92 1700 130 2100
17 2200 55 2100 93 2300 131 1600
18 2200 56 1900 94 2500 132 2100
19 2300 57 2000 95 2600 133 1900
20 2800 58 2300 96 1900 134 2100
21 2100 59 2000 97 2500 135 2200
22 1700 60 1700 98 1800 136 2400
23 2500 61 1900 99 1700 137 1800
24 2400 62 2000 100 2000 138 2600
25 2700 63 2400 101 2400 139 2700
26 1700 64 1700 102 1700 140 2500
27 1600 65 1700 103 2500 141 2500
28 2600 66 2400 104 1700 142 1900
29 2500 67 2500 105 2400 143 2100
EPE 171

30 2500 68 2600 106 2400 144 1700


31 2700 69 2100 107 1900 145 1500
32 1700 70 1900 108 1700 146 1800
33 1600 71 2000 109 2100 147 2100
34 2400 72 1800 110 2000 148 2700
35 1900 73 2100 111 2000 149 1800
36 1800 74 2300 112 2500 150 2100
37 1800 75 2700 113 1700
38 2400 76 2800 114 2500
172 CE86 Estadística Aplicada 1

a. Seleccione una muestra de 12 trabajadores usando muestreo aleatorio simple. Elabore un listado con el
número o código seleccionado y el valor del ingreso quincenal. Considere las columnas C4, C8, C11 y C15
de la tabla de números aleatorios para la selección. ¿A qué colaboradores seleccionará para conformar
el equipo de prueba?

Seleccionaremos ……………….. elementos del marco muestral. Como el marco muestral tiene ……………….
elementos y este valor tiene …………….. cifras o dígitos, entonces se utilizarán ………..columnas
consecutivas para seleccionar los elementos, se iniciará la selección con las columnas
………………………………….
Número Ingreso quincenal Número Ingreso quincenal

b. Con la muestra obtenida estime el ingreso promedio mensual.

Ejercicio 63
El director de una empresa tiene la lista de todo su personal y desea obtener una muestra aleatoria de los
colaboradores para conocer el grado de satisfacción que estos tienen en su centro de trabajo y estimar el
tiempo promedio de servicio. El siguiente cuadro presenta el número o código del colaborador, el tiempo
de servicio en meses y la edad en años.
Trabajadores registrados (Marco muestral)

N° Tiempo de servicio Edad N° Tiempo de servicio Edad N° Tiempo de servicio Edad


1 73 23 41 106 45 81 99 49
2 96 46 42 99 49 82 131 32
3 110 67 43 94 35 83 131 32
4 105 60 44 98 30 84 93 42
5 91 43 45 98 30 85 104 53
6 90 36 46 99 49 86 81 29
7 129 46 47 98 30 87 124 56
8 129 46 48 98 30 88 98 56
9 91 43 49 73 23 89 98 56
10 96 46 50 73 23 90 106 45
11 110 67 51 95 33 91 129 46
12 129 46 52 95 33 92 106 45
13 100 35 53 96 46 93 129 46
14 99 49 54 96 46 94 124 56
EPE 173

15 113 55 55 110 67 95 98 56
16 101 39 56 124 56 96 98 56
17 86 45 57 90 36 97 104 53
18 104 42 58 90 36 98 106 45
19 126 57 59 101 35 99 129 46
20 98 30 60 101 35 100 124 56
21 126 58 61 124 56 101 98 56
22 98 30 62 95 33 102 117 30
23 101 39 63 95 33 103 99 49
24 86 40 64 96 42 104 104 33
25 104 42 65 96 46 105 94 35
26 99 49 66 110 67 106 101 39
174 CE86 Estadística Aplicada 1

27 113 55 67 124 56 107 123 44


28 98 30 68 99 49 108 98 30
29 126 57 69 131 32 109 88 60
30 98 31 70 131 333 110 123 40
31 104 53 71 113 55 111 98 30
32 104 53 72 94 35 112 88 59
33 81 29 73 93 42 113 101 39
34 124 56 74 91 47 114 117 30
35 91 43 75 91 47 115 90 36
36 106 45 76 86 41 116 98 30
37 106 45 77 93 42 117 88 59
38 91 43 78 91 47 118 123 40
39 104 63 79 91 47 119 98 30
40 104 53 80 86 45 120 88 59

a. Seleccione una muestra de 10 trabajadores aplicando el muestreo aleatorio simple. Elabore un listado
con el número o código seleccionado y el valor de su tiempo de servicio. Considere para la selección, las
columnas: C9; C2; C10; C15 y C1 de la tabla de números aleatorios . ¿A qué colaboradores se le aplicará
la encuesta sobre el nivel de satisfacción con respecto a su centro laboral?

Como el marco muestral tiene ………. elementos o unidades elementales, iniciaremos la selección con las
columnas ……………………. para elegir números de …………….…. cifras o dígitos.

Número Tiempo de servicio

b. Con la muestra seleccionada, estime el tiempo promedio de servicio de los colaboradores.


EPE 175

Muestreo estratificado
El muestreo estratificado es una técnica de muestreo  probabilístico en donde el investigador divide a toda
la población en diferentes grupos mutuamente excluyentes llamados estratos. Luego, selecciona
aleatoriamente a los elementos finales de los diferentes estratos en forma proporcional al tamaño de cada
estrato. De esta forma hay seguridad de que la composición de la muestra es igual al de la población, pero
en menor escala.
La característica del estrato es que dentro del él los elementos son homogéneos pero heterogéneos entre
sí.
176 CE86 Estadística Aplicada 1

Los estratos más comunes utilizados en el muestreo aleatorio estratificado son la edad, el género, el nivel
socioeconómico, la religión, la nacionalidad y el nivel de estudios alcanzado.

Pasos a seguir para seleccionar una muestra estratificada

1. Divida a la población en estratos que sean mutuamente excluyentes. Esto es, que incluyan a todos los
elementos de la población y que cada elemento pertenezca solamente a un estrato.

2. Una vez conocido el tamaño de muestra a seleccionar, calcule la cantidad de elementos a seleccionar en
cada estrato de manera proporcional al tamaño de cada estrato. El tamaño de muestra para cada
estrato se obtiene mediante la siguiente fórmula:

Nh
nh  n
N

Donde:
nh : es el tamaño de muestra a seleccionar del estrato h
Nh : es el tamaño del estrato h

3. Seleccione muestras aleatorias simples para cada uno de los estratos.

Recomendaciones para el uso de muestras estratificadas


 Si se tiene que usar más de una variable para formar los estratos, cuidar que estas no estén relacionadas
entre sí.
 No se deben considerar la formación de muchos estratos, generalmente se usan entre tres y ocho
estratos.
 Los estratos pequeños no contribuyen mucho a la reducción del error, por lo tanto pueden no ser
considerados.
 La variable de estratificación la suele sugerir el investigador o el estadístico.

Ejercicio 64
En total son 14 personas en la población (N = 14), 8 personas en el estrato 1 (N 1 = 8), 6 personas en el
estrato 2 (N2 = 6) y se extrae una muestra de tamaño 3 (n = 3). Considere la columna C7 para el estrato 1 y
C3 para el estrato 2, de la tabla de números aleatorios.

Lo que se quiere determinar es el tamaño de muestra a seleccionar en cada estrato, es decir, conocer a
cuántas personas se seleccionarán del estrato 1 y a cuántas del estrato 2, de manera proporcional,
redondeando al entero más cercano y se sabe que la suma debe ser n = 3.

Cantidad de elementos a
Cantidad de elementos seleccionar en el estrato
Posiciones
Estrato en el estrato
(desde – hasta) Nh
Nh nh  n
N
Estrato 1 8 1-8 n1 = (8/14)*3 = 1,7  2
Estrato 2 6 9 - 14 n2 = (6/14)*3 = 1,3  1
Total N = 14 n=3
EPE 177

Luego se extraen los elementos de cada estrato con el muestreo aleatorio simple, considerando las
columnas indicadas para cada estrato, de la tabla de números aleatorios.
178 CE86 Estadística Aplicada 1

el m. estratificado.
EPE 179

Ejercicio 65
La empresa de telecomunicaciones RV tiene 120 empleados de los cuales tiene información de las
variables: ingreso en soles, nivel de educación y años en la empresa.
Marco Muestral
Nivel de Nivel de Nivel de
Nº Ingreso Años Nº Ingreso Años Nº Ingreso Años
educación educación educación
1 2300 Secundaria 5 41 2100 Técnica 13 81 2000 Superior 3
2 2800 Secundaria 11 42 2100 Técnica 9 82 2500 Superior 13
3 2400 Secundaria 4 43 1800 Técnica 1 83 1700 Superior 0
4 2500 Secundaria 2 44 2000 Técnica 9 84 2500 Superior 19
180 CE86 Estadística Aplicada 1

5 2300 Secundaria 3 45 2100 Técnica 10 85 1700 Superior 3


6 2100 Secundaria 2 46 1900 Técnica 4 86 2600 Superior 19
7 1700 Secundaria 2 47 2000 Técnica 10 87 1600 Superior 1
8 2000 Secundaria 0 48 2300 Técnica 11 88 1800 Superior 6
9 2200 Secundaria 7 49 2000 Técnica 7 89 2100 Superior 10
10 2100 Secundaria 4 50 1700 Técnica 1 90 1700 Superior 0
11 1700 Secundaria 0 51 1700 Técnica 1 91 2400 Superior 16
12 2500 Secundaria 2 52 2100 Técnica 6 92 2600 Superior 17
13 2800 Secundaria 13 53 2600 Técnica 17 93 2100 Superior 10
14 2400 Secundaria 9 54 2400 Técnica 9 94 2100 Superior 8
15 1700 Secundaria 1 55 2600 Técnica 19 95 2400 Superior 17
16 2400 Secundaria 9 56 1900 Técnica 7 96 1700 Superior 1
17 2200 Secundaria 10 57 1600 Técnica 0 97 2600 Superior 20
18 2200 Secundaria 4 58 1900 Técnica 3 98 2400 Superior 16
19 2300 Secundaria 10 59 2100 Técnica 14 99 2700 Superior 17
20 2800 Secundaria 11 60 1700 Técnica 0 100 2100 Superior 12
21 2100 Secundaria 7 61 2100 Técnica 15 101 1600 Superior 0
22 1700 Secundaria 1 62 1700 Técnica 1 102 2100 Superior 15
23 2500 Secundaria 6 63 2300 Técnica 14 103 1900 Superior 5
24 2400 Secundaria 9 64 2500 Técnica 16 104 2100 Superior 12
25 2700 Secundaria 17 65 2600 Técnica 18 105 2200 Superior 12
26 1700 Secundaria 0 66 1900 Técnica 3 106 2400 Superior 13
27 1600 Secundaria 2 67 2500 Técnica 19 107 1800 Superior 4
28 2600 Secundaria 17 68 1800 Técnica 6 108 2600 Superior 17
29 2500 Secundaria 13 69 1700 Técnica 2 109 2700 Superior 20
30 2500 Secundaria 16 70 2000 Técnica 10 110 2500 Superior 16
31 2100 Técnica 11 71 2400 Técnica 16 111 2500 Superior 16
32 2300 Técnica 14 72 1700 Técnica 0 112 1900 Superior 6
33 1700 Técnica 0 73 2500 Técnica 12 113 2100 Superior 15
34 2200 Técnica 13 74 1700 Técnica 3 114 1700 Superior 9
35 2900 Técnica 20 75 2400 Técnica 17 115 1500 Superior 0
36 1800 Técnica 5 76 2400 Técnica 16 116 1800 Superior 18
37 2100 Técnica 16 77 1900 Técnica 7 117 2100 Superior 10
38 2000 Técnica 12 78 1700 Técnica 1 118 2700 Superior 19
39 2000 Técnica 12 79 2100 Técnica 6 119 1800 Superior 9
40 2900 Técnica 20 80 2000 Técnica 5 120 2100 Superior 15
a. Aplique el muestreo estratificado para seleccionar una muestra de 16 empleados. Use como variable de
estratificación el nivel de educación. Elabore un listado identificando el número seleccionado y el valor
respectivo de los años cumplidos en la empresa. Para el estrato 1 use las columnas C1, C3 y C5, para el
estrato 2 use las columnas C8, C9, C10 y C11 y para el estrato 3 use C4, C3, C5 y C7.

Se divide a la población en estratos que sean mutuamente excluyentes, luego los estratos 1, 2 y 3 son:
secundaria, técnica y superior, respectivamente. Para cada uno de los estratos, seleccionamos muestras
aleatorias simples. El siguiente cuadro nos ayudará a determinar a cuántos elementos seleccionaremos de
cada estrato.

Cantidad de elementos a seleccionar


Cantidad de por estrato
Posiciones
Estrato elementos en el
(desde – hasta) Nh
estrato Nh nh  n
N
N1 30
Secundaria N1 = 30 1 – 30 n1  n   16  4
N 120
EPE 181

N2 50
Técnica N2 = 50 31 – 80 n2  n   16  6,67  7
N 120
N 40
Superior N3 = 40 81 – 120 n3  3  n   16  5,33  5
N 120
Total N = 120 n = 16

Para el estrato Secundaria, se seleccionará 4 elementos utilizando el muestreo aleatorio simple, se


consideran las columnas C1, C3 y C5. Observemos que las posiciones de los primeros elementos a elegir
están entre 1 y 30. El número más alto es 30, con 2 dígitos, entonces se toman 2 columnas consecutivas a
partir de C1, estas son las columnas C1 y C2.
182 CE86 Estadística Aplicada 1

TABLA DE NÚMEROS ALEATORIOS


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8

Luego, el cuadro con los elementos seleccionados para el estrato Secundaria es:
Secundaria
Años en la
Número
empresa
02 11
16 9
29 13
13 13

Para el estrato Técnica, realizamos un muestreo aleatorio simple, seleccionamos 7 elementos considerando
las columnas C8, C9, C10 y C11. Observemos que las posiciones de los elementos a elegir están entre 31 y
80. También 80 tiene 2 dígitos, entonces se toman 2 columnas consecutivas a partir de C8.

TABLA DE NÚMEROS ALEATORIOS


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7

Luego, el cuadro con los datos elementos seleccionados para el estrato Técnica es:
Estrato Técnica
Años en la
Número
empresa
54 9
62 1
66 3
77 7
48 11
67 19
44 9

Para el estrato Superior, realizamos un muestreo aleatorio simple usando las columnas C4, C3, C5 y C7.
Observemos que las posiciones de los elementos a elegir están entre 81 y 120. Aquí vemos que 120
tiene 3 dígitos, entonces se tomará 3 columnas a partir de C4.
TABLA DE NÚMEROS ALEATORIOS
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
EPE 183

4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8

Luego, el cuadro con los datos elementos seleccionados para el estrato Superior es:
Estrato Superior
184 CE86 Estadística Aplicada 1

Años en la
Posición
empresa
114 9
81 3
97 20
105 12
83 0

b. Con la muestra obtenida calcule la proporción de empleados que tienen más de 12 años en la empresa.

Luego, con los elementos seleccionados se tiene que la proporción de empleados con más de 12 años en
la empresa es igual a 4/16 = 0,25.
EPE 185

Ejercicio 66
La siguiente tabla muestra la lista de los nuevos clientes del último año de la empresa H&G, dedicada a la
venta de productos para el hogar. Están clasificados según la segmentación de clientes ABC, donde la clase
A es el tipo de cliente con mayor porcentaje de compras de los productos de la empresa. Se dispone
también del monto de la última compra en cientos de soles.
Marco Muestral
Nº Clase Monto Nº Clase Monto Nº Clase Monto Nº Clase Monto
1 Clase A 126.5 29 Clase A 121.6 57 Clase B 42.1 85 Clase B 47.2
2 Clase A 137.2 30 Clase A 245.4 58 Clase B 57.9 86 Clase B 67.7
186 CE86 Estadística Aplicada 1

3 Clase A 168.1 31 Clase A 132.7 59 Clase B 66.1 87 Clase B 59.9


4 Clase A 80.0 32 Clase A 116.0 60 Clase B 68.8 88 Clase B 62.6
5 Clase A 165.4 33 Clase A 90.6 61 Clase B 54.9 89 Clase B 57.2
6 Clase A 183.3 34 Clase A 188.5 62 Clase B 63.8 90 Clase B 58.1
7 Clase A 95.0 35 Clase B 45.1 63 Clase B 55.2 91 Clase B 59.7
8 Clase A 98.6 36 Clase B 39.3 64 Clase B 57.7 92 Clase B 50.1
9 Clase A 174.1 37 Clase B 60.8 65 Clase B 73.4 93 Clase C 15.0
10 Clase A 125.8 38 Clase B 66.6 66 Clase B 59.5 94 Clase C 36.2
11 Clase A 95.3 39 Clase B 44.2 67 Clase B 56.3 95 Clase C 33.2
12 Clase A 274.5 40 Clase B 60.5 68 Clase B 74.0 96 Clase C 30.5
13 Clase A 137.0 41 Clase B 66.9 69 Clase B 55.4 97 Clase C 36.4
14 Clase A 99.4 42 Clase B 62.4 70 Clase B 66.1 98 Clase C 31.3
15 Clase A 78.6 43 Clase B 62.3 71 Clase B 69.7 99 Clase C 29.3
16 Clase A 163.5 44 Clase B 57.0 72 Clase B 59.6 100 Clase C 34.3
17 Clase A 194.7 45 Clase B 53.7 73 Clase B 67.8 101 Clase C 27.8
18 Clase A 118.2 46 Clase B 53.1 74 Clase B 53.7 102 Clase C 30.7
19 Clase A 111.6 47 Clase B 67.7 75 Clase B 66.9 103 Clase C 25.2
20 Clase A 118.3 48 Clase B 64.4 76 Clase B 75.7 104 Clase C 35.4
21 Clase A 89.5 49 Clase B 46.7 77 Clase B 71.1 105 Clase C 28.6
22 Clase A 101.9 50 Clase B 57.0 78 Clase B 59.0 106 Clase C 19.6
23 Clase A 82.5 51 Clase B 61.8 79 Clase B 71.3 107 Clase C 40.4
24 Clase A 121.6 52 Clase B 60.8 80 Clase B 69.6 108 Clase C 30.6
25 Clase A 153.1 53 Clase B 48.6 81 Clase B 66.5 109 Clase C 36.7
26 Clase A 132.7 54 Clase B 56.6 82 Clase B 53.6 110 Clase C 37.3
27 Clase A 116.7 55 Clase B 56.7 83 Clase B 70.0 111 Clase C 25.8
28 Clase A 290.6 56 Clase B 47.2 84 Clase B 46.4 112 Clase C 36.0

a. Seleccione una muestra aleatoria de tamaño 13 mediante el muestreo estratificado. Use la variable
Clase como variable de estratificación. Elabore un listado con el número de cliente seleccionado y el
monto de la última compra.
Para el estrato 1 use las columnas C6, C4 y C2, para el estrato 2 use las columnas C15, C10, C2 , C11, C14
y C8 y para el estrato 3 use C6, C17, C12, C1, y C7.

Posición Nh
Estrato Nh nh  n
(desde – hasta) N
1. N1= n1=

2. N2= n2=
3. N3= n3=

Total
Estrato 1: Clase A Estrato 2: Clase B Estrato 3: Clase C
Número Monto Número Monto Número Monto
EPE 187

a. Con la muestra obtenida calcule el promedio del monto de la última compra de los clientes.

Entonces, con los elementos seleccionados se tiene que el promedio muestral del monto de la última
compra de los clientes es ………………………………………………

Tamaño de muestra
Al iniciar un trabajo de investigación o tesis, la pregunta que surge es:
 ¿Cuántas unidades debo seleccionar?
188 CE86 Estadística Aplicada 1

 ¿Bastará con aplicar un cuestionario a 100 personas o mejor a 500 personas?


 ¿Cómo podemos determinar el tamaño óptimo de una muestra?
 ¿Si la población es muy grande se tendrá que seleccionar también una muestra grande, o el tamaño
dependerá de la variabilidad de los resultados?
 ¿Qué margen de error tendrán los resultados hallados en la encuesta?

Para determinar el tamaño de la muestra se debe tener en cuenta lo siguiente:


 el parámetro a estimar: media o proporción.
 el nivel de confianza.
 la desviación estándar S o la proporción muestral, según lo que se quiere estimar.
 el margen de error o error de estimación o error máximo permisible.
Nivel de confianza
Es la probabilidad de que el intervalo construido en torno a un estadístico contenga al verdadero valor del
parámetro. El nivel de confianza lo fija el investigador, lo más usual es 95%.
Con este nivel de confianza se obtiene el valor Z, usando la función =INV.NORM.ESTAND ( probabilidad) que
corresponde a un percentil de una distribución Normal Estándar.

Ejemplo:
Si el nivel de confianza es 90% = 0.90.
El 90% va en la parte central de la distribución
Normal

Z =INV.NORM.ESTAND ( 0,95 ) = 1,64


(se sugiere redondear a dos decimales)
Obtenga el valor de Z en la siguiente tabla:

Confianza Z
90% 0.90 =INV.NORM.ESTAND(0.95) 1.64
95% 0.95 =INV.NORM.ESTAND(0.975) 1.96
98% 0.98 =INV.NORM.ESTAND(0.99) 2.33
94%
99%
93%

Variabilidad
Cuando una población es más homogénea la varianza es menor y el número de entrevistas necesarias será
más pequeño. Generalmente es un valor desconocido y hay que estimarlo a partir de datos de estudios
previos, muestra piloto o estudios anteriores similares.

Margen de error
Es la diferencia entre un estadístico y el parámetro correspondiente.
Nos da una idea clara de hasta dónde y con qué probabilidad una estimación basada en una muestra se
aleja del valor que se hubiera obtenido por medio de un censo completo. Un estadístico será más preciso
cuando su error sea más pequeño. Este margen de error lo fija el investigador.

Si el objetivo del estudio es estimar la media o promedio (µ) de una población

2
Z s Cuando no se conoce el tamaño de la población N, (es un
n  valor muy grande) se asume población infinita, No se
 e 
incluye N en la fórmula.
EPE 189

 n: es el tamaño de muestra que se obtendrá redondeando al entero superior.


 Z: el valor de Z se encuentra con la distribución Normal Estándar, teniendo en cuenta el nivel de
confianza que crea conveniente el investigador. Este nivel de confianza en porcentaje se coloca en la
parte central de la distribución Normal Estándar. Z debe ser redondeado a dos decimales.
 S: es la desviación estándar de la variable que debe ser cuantitativa.
 e: el margen de error lo fija el investigador y está en las mismas unidades de los datos. Por ejemplo si la
variable es ingresos las unidades serán soles o dólares, si la variable es el tiempo en realizar una
actividad las unidades estarán dadas en horas, minutos o segundos, según sea el caso.
190 CE86 Estadística Aplicada 1

Si se conoce N (población finita)


Cuando se conoce el tamaño de la población N (es un valor no muy grande) se asume población finita y se
realiza un ajuste al valor del tamaño de muestra obtenido con la fórmula anterior y se corrige n con la
siguiente fórmula:
nc: tamaño de muestra corregido
El valor de n obtenido en la fórmula anterior debe ser ingresada con dos decimales.
El valor final nc se redondea al entero superior.
n
nc 
n
1
N

Ejercicio 67
Un estudiante realiza una tesis para conocer el ingreso familiar promedio y la asignación de estos ingresos
en cada rubro como alimentación, educación, salud y otros, en la ciudad de Lima. ¿A cuántas familias
deberá considerar en el estudio si se desea tener un nivel de confianza del 95%, un error máximo de 500
soles, y mediante una muestra piloto se obtuvo una desviación estándar del ingreso familiar de 3600 soles?

Solución
Se quiere estimar el ingreso familiar promedio (soles)

- Nivel de confianza 95% (va al centro) 


Z =INV.NORM.ESTAND ( 0,975 ) = 1,96
- e = 500
- S = 3600
n=?

2 2
Z s  1,96 (3600) 
n  n   199,14
 e   500 

Como no se conoce el tamaño de la población N, no es necesario corregir el valor de n obtenido.


Respuesta: Se deberá considerar una muestra de 200 familias.

Ejercicio 68
Universal es una nueva emisora de carácter político y a una semana de estar al aire cuenta ya con 3000
radioescuchas. El gerente de Universal desea realizar un estudio para estimar el tiempo de conexión
promedio de los oyentes.
¿Cuál debe ser el tamaño de muestra de oyentes que se necesita si desea tener un error de estimación de
0,15 horas con un nivel de confianza del 94%?
Al seleccionar una muestra piloto se obtuvieron los siguientes resultados, en horas:
3.2 4.8 5.3 9.1 6.3 8.2 6.5 9.6 10.3 8.6
6.3 7.9 8.2 7.9 6.9 9.3 8.6 6.8 10.1 9.0

Solución

Se quiere estimar: el tiempo de conexión promedio


Variable: tiempo de conexión (horas)
Tipo de variable: cuantitativa continúa

- El margen de error es e = 0,15


- La desviación estándar muestral es s = 1,8597
EPE 191

- El tamaño de la población es N = 3000


- El valor de Z con 94% de confianza es Z(0,97) = INV.NORM.ESTAND(0,97) = 1.88
192 CE86 Estadística Aplicada 1

El tamaño de la muestra se obtiene con la siguiente fórmula:

Como el tamaño de la población es conocida (población finita) se debe corregir la muestra:

Respuesta: Se necesitará entrevistar a una muestra de 460 radioescuchas.

Ejercicio 69
¿Cuál debe ser el tamaño de muestra si se desea estimar el tiempo promedio, en horas, que demoran los
estudiantes en llegar a la universidad, de un total de 6400 estudiantes, si se considera un nivel de confianza
del 96% y un error de estimación de 0,1 horas? Una muestra piloto de 8 alumnos arrojó los siguientes
resultados:

2.0 1.5 0.45 1.45 1.0 0.30 1.20 1.30

Se quiere estimar : …………………………………………………


Variable: ……………………………………………………….. tipo de variable: ……………………………………………….

Margen de error e = …………………


Desviación estándar s = ……………..…..
Valor de Z con 96% de confianza Z = …………………..

Como se conoce el tamaño de la población N = ……………………… se debe corregir el n obtenido, utilizando la


fórmula de nc .

Luego, se debe encuestar a ……………………………………………….

Ejercicio 70
Infodata, una empresa privada que asesora en temas informáticos al Ministerio de Educación, quiere
realizar un estudio sobre el tiempo que llevan los usuarios de la Biblioteca Nacional en las salas de
búsqueda computarizada. Para realizar dicho estudio tomó una muestra piloto de 20 usuarios de la BN,
obteniéndose los siguientes tiempos en minutos.

5.4 4.6 10.1 8.0 6.6 7.0 4.6 9.9 4.0 12.1
9.8 5.5 4.5 6.7 7.8 4.9 5.0 6.4 4.4 5.9
EPE 193

¿Cuál es el tamaño de muestra que se debe seleccionar para hacer una encuesta, si se desea tener un
margen de error de medio minuto con un nivel de confianza del 98%?
194 CE86 Estadística Aplicada 1

Si el objetivo del estudio es estimar la proporción (p) de una población

 Z 2 pˆ (1  pˆ )  Cuando no se conoce el tamaño de la población N, (es


n    un valor muy grande) se asume población infinita, no se
 e2  incluye N en la fórmula.
 n: es el tamaño de muestra que se obtendrá redondeando al entero superior.
 Z: el valor de Z se encuentra con la distribución Normal Estándar, teniendo en cuenta el nivel de
confianza que crea conveniente el investigador. Este nivel de confianza en porcentaje se coloca en la
parte central de la distribución Normal Estándar. Z debe ser redondeado a dos decimales.
 : generalmente es un valor desconocido porque recién se hará el estudio, pero es necesario conocer la
proporción muestral para reemplazar en la fórmula:

- Si se conoce : se puede estimar de estudios anteriores o similares, o también de una muestra


preliminar o piloto.
- Si no se conoce : se asume un valor intermedio, se asume que es 0,5.

 e: el margen de error lo fija el investigador en porcentaje o en unidades de proporción.


Por ejemplo si el margen de error es 3,5% se considera e = 0,035 al reemplazar los valores en la fórmula,
el valor en porcentaje se divide entre 100.

Si se conoce N (población finita)


Cuando se conoce el tamaño de la población N (es un valor no muy grande) se asume población finita y se
realiza un ajuste al valor del tamaño de muestra obtenido con la fórmula anterior y se corrige n con la
siguiente fórmula:
n
nc 
n
1
N

nc: tamaño de muestra corregido


El valor de n obtenido en la fórmula anterior debe ser ingresada con dos decimales.
El valor final nc se redondea al entero superior.

Usted trabaja en una compañía de investigación de mercado y le han encargado estimar el porcentaje de
hogares que tienen Internet en casa, ¿cuántos hogares debe considerarse en el estudio si desea tener una
confianza del 95% de que el porcentaje muestral difiera del poblacional a lo más en 4,5%?

Solución
Se quiere estimar una proporción, la proporción de hogares con internet.
Variable: tenencia de internet Tipo de variable: cualitativa

 Nivel de confianza 95%


entonces Z = INV.NORM.ESTAND(0.975) = 1,96
 Margen de error = 4,5% , e = 0,045
 no se conoce, entonces se asume = 0,5
EPE 195

 1,96 2 0,5(1  0,5) 


n     474,27  475
 0,0452  Respuesta: Se debe considerar a 475 hogares

Ejercicio 71
El alcalde de un distrito desea estimar la proporción de residentes que conocen la propuesta respecto al
uso de fondos municipales para mejorar la limpieza del distrito. En una muestra piloto de 120 residentes,
75 no conocen dicha propuesta.
¿Qué tamaño de muestra necesita seleccionar si requiere una confianza del 98% y un error máximo de
estimación de 0,10?

Se quiere estimar …………………………………………………………………….……


196 CE86 Estadística Aplicada 1

Margen de error e = …………………………


Nivel de confianza ………………………………… valor de Z = …………………
Proporción muestral = ……………………

Ejercicio 72
Para estimar el porcentaje de electores a favor de un candidato, una encuestadora debe determinar el
tamaño de la muestra de una población de 10 000 electores.
¿Qué tan grande debe ser la muestra si se quiere tener una confianza del 97% y un error de estimación no
superior al 4,8%?

Solución
Se quiere estimar ……………………………………….

Como N = …………………………., entonces el valor de la muestra corregida será:

Finalmente, el tamaño de muestra para las condiciones dadas será igual a …………………

RESUMEN DE TAMAÑO DE MUESTRA


EPE 197
198 CE86 Estadística Aplicada 1

Ejemplo para hallar el valor de Z

Con un nivel de confianza del 90%


El 90% va en la parte central de la distribución Normal
Función en Excel: =INV.NORM.ESTAND ( probabilidad )

Z =INV.NORM.ESTAND ( 0,95 ) = 1,645

También podría gustarte