Está en la página 1de 256

MA444 Estadística

Civil

Electrónica

Mecatrónica

Cuaderno de trabajo
Área de Ciencias
agosto 2022
UPC MA444 Estadística 2
UPC MA444 Estadística 3
Tabla de contenido

Unidad 1. Estadística Descriptiva ....................................................................................... 5


Estadística ........................................................................................................................................................ 6
Estadística descriptiva ......................................................................................................................................... 6
Estadística inferencial.......................................................................................................................................... 6
Conceptos básicos ............................................................................................................................................ 7
Variables .............................................................................................................................................................. 9
Escalas de medición .......................................................................................................................................... 11
Dato ................................................................................................................................................................... 17
Observación ...................................................................................................................................................... 17
Parámetro ......................................................................................................................................................... 18
Estadístico ......................................................................................................................................................... 18
Organización de datos cualitativos ................................................................................................................. 19
Tabla de distribución de frecuencias ................................................................................................................. 19
Gráficos de una variable cualitativa .................................................................................................................. 20
Organización de datos cuantitativos discretos ............................................................................................... 24
Tabla de distribución de frecuencias ................................................................................................................. 24
Gráfico de bastones o líneas ............................................................................................................................. 24
Organización de datos cuantitativos continuos .............................................................................................. 30
Tabla de distribución de frecuencias ................................................................................................................. 30
Gráficos de una variable cuantitativa continua................................................................................................. 36
Medidas de resumen...................................................................................................................................... 42
Definiciones ....................................................................................................................................................... 42
Medidas de tendencia central ........................................................................................................................... 43
Medidas de posición o cuantiles ....................................................................................................................... 50
Medidas de variabilidad o dispersión................................................................................................................ 54
Medida de asimetría ......................................................................................................................................... 63

Unidad 2. Probabilidad y variable aleatoria ..................................................................... 69


Definiciones ................................................................................................................................................... 70
Experimento aleatorio....................................................................................................................................... 70
Espacio muestral ............................................................................................................................................... 70
Evento ............................................................................................................................................................... 70
Operaciones con eventos ............................................................................................................................... 71
Probabilidad................................................................................................................................................... 74
Regla aditiva de la probabilidad ........................................................................................................................ 76
Principios fundamentales de conteo ................................................................................................................. 81
Probabilidad condicional ................................................................................................................................ 87
Ley multiplicativa de probabilidad ................................................................................................................. 90
Eventos independientes ................................................................................................................................. 91
Aplicación al sistema de componentes: Confiabilidad de sistemas .................................................................. 95
Probabilidad total y el teorema de Bayes ....................................................................................................... 98
Probabilidad total .............................................................................................................................................. 98
Teorema de Bayes ............................................................................................................................................. 98
Variable aleatoria......................................................................................................................................... 107
Distribuciones discretas especiales .............................................................................................................. 115
UPC MA444 Estadística 4
Distribución binomial ...................................................................................................................................... 115
Distribución Poisson ........................................................................................................................................ 121
Variables aleatorias continuas ..................................................................................................................... 129
Función de densidad de una variable continua............................................................................................... 129
Función de distribución acumulada ................................................................................................................ 131
Principales distribuciones de variables aleatorias continuas ........................................................................ 134
Distribución exponencial ................................................................................................................................. 134
Distribución normal ......................................................................................................................................... 138

Unidad 3. Inferencia estadística ..................................................................................... 148


Tamaño de muestra para estimar la media de una población ...................................................................... 149
Margen de error .............................................................................................................................................. 149
Nivel de confianza ........................................................................................................................................... 149
Varianza poblacional ....................................................................................................................................... 149
Conceptos básicos ........................................................................................................................................ 154
Unidad elemental ............................................................................................................................................ 154
Muestreo probabilístico ............................................................................................................................... 160
Muestreo simple aleatorio .............................................................................................................................. 160
Uso de la tabla de números aleatorios............................................................................................................ 161
Prueba de hipótesis...................................................................................................................................... 171
Contraste de hipótesis .................................................................................................................................... 171
Tipos de errores .............................................................................................................................................. 171
Pasos para realizar una prueba de hipótesis ................................................................................................... 172
Prueba de hipótesis para una media con varianza poblacional desconocida ................................................. 173
Prueba de hipótesis para una proporción poblacional ................................................................................... 182
Prueba de hipótesis para la razón de varianzas poblacionales ....................................................................... 189
Prueba de hipótesis para la diferencia de medias poblacionales ................................................................... 192
Caso 1: Varianzas poblacionales desconocidas y homogéneas....................................................................... 192
Diseño de experimentos .............................................................................................................................. 204
Conceptos generales ....................................................................................................................................... 205
Diseño completamente al azar........................................................................................................................ 207
Análisis de la varianza .................................................................................................................................. 210
Método de comparaciones múltiples: Prueba de Tukey - Kramer .................................................................. 215
Regresión lineal simple ................................................................................................................................ 224
Diagrama de dispersión o gráfico del plot....................................................................................................... 226
Método de los mínimos cuadrados ................................................................................................................. 226
Recta o ecuación de regresión ........................................................................................................................ 227
Validación del modelo de regresión lineal ...................................................................................................... 230
Coeficiente de determinación ......................................................................................................................... 232
Coeficiente de correlación .............................................................................................................................. 232
Tablas estadísticas ....................................................................................................................................... 247
Tabla de la distribución normal estándar ........................................................................................................ 247
Tabla de la distribución t - Student ................................................................................................................. 249
Tabla de la distribución F ................................................................................................................................ 251
UPC MA444 Estadística 5

Unidad 1. Estadística Descriptiva

Logro

Al término de la unidad, el estudiante entiende claramente la información presentada en tablas y


gráficas. Asimismo, calcula resúmenes obtenidos a partir de un conjunto de datos y los utiliza para dar
solución a un problema dentro de un contexto real o de su especialidad.

Temario
• La Estadística. Conceptos básicos.
• Organización de datos cualitativos y cuantitativos
• Medidas de tendencia central: media, mediana, moda, media ponderada
• Medidas de posición: cuartiles, deciles y percentiles
• Medidas de dispersión: varianza, desviación estándar y coeficiente de variación
• Coeficiente de asimetría

Bibliografía

• Introducción a la Probabilidad y Estadística/ Mendenhall, Beaver, Beaver. Capítulo 1.1 (pág. 7-11)
• Introducción a la Probabilidad y Estadística/ Mendenhall, Beaver, Beaver. Capítulo 1.3 (pág. 11-17)
• Introducción a la Probabilidad y Estadística/ Mendenhall, Beaver, Beaver. Capítulo 1.5 (pág. 24-57)
UPC MA444 Estadística 6
Estadística
Es la ciencia de los datos. Implica la recolección de datos, clasificación, organización, análisis e
interpretación de resultados.

Estadística descriptiva
Es la rama de la Estadística que se dedica al análisis, descripción y representación de un conjunto de
datos obtenidos a partir de una muestra. Las conclusiones son válidas sobre las características de dicho
conjunto de datos.

Estadística inferencial
Es la rama de la Estadística que desarrolla los procesos de estimación, análisis y pruebas de hipótesis
de un conjunto de datos extraídos de una muestra, con el propósito de llegar a conclusiones acerca de
una población.

Estadística descriptiva
Se obtienen conclusiones sobre el conjunto de datos sin
incertidumbre. No realiza proyecciones
•Recolección de datos
•Clasiicación de datos
•Organización de datos
•Analisis e interpretación

Estadística inferencial
Se obtienen conclusiones respecto a la población bajo
incertidumbre. Realiza proyecciones
•Toma de decisiones a partir de una muestra
UPC MA444 Estadística 7
Conceptos básicos
Población
Es un conjunto de elementos (personas, objetos, etc.) que tienen una o más características observables
que se pueden medir en ellos. Se denota por la letra N mayúscula.

Ejemplo 1
Para conocer la opinión que tienen los estudiantes de ingeniería sobre el servicio que ofrece el Centro
de Información, se puede considerar como población a todos los estudiantes de ingeniería de la UPC
matriculados en el semestre anterior.

Muestra
Se denomina muestra a una parte de la población. El tamaño de la muestra se denota con la letra n
minúscula.

Ejemplo 2
Para conocer la opinión que tienen los estudiantes de ingeniería, sobre el servicio que ofrece el Centro
de Información, se puede considerar como muestra a un subconjunto de estudiantes de ingeniería de
la UPC matriculados en el semestre anterior.

Elemento o unidad elemental


Es cada una de las entidades acerca de las cuales se reúnen los datos.

Población Todos los trabajadores del área de marketing de la inmobiliaria Nexo


Muestra Algunos
Elemento Un

Población Todos
Muestra Un subconjunto
Elemento Un
UPC MA444 Estadística 8
Ejemplo 3
El gobierno está preocupado por la ocurrencia de un sismo de alta intensidad
en el departamento de Lima y las consecuencias que éste podría generar en el
Cercado de Lima. Por esta razón, Defensa Civil ha decidido realizar un
diagnóstico de la situación de las viviendas en este distrito encuestando a 1200
viviendas seleccionadas al azar. Parte de la encuesta se presenta a
continuación.

Encuesta de vivienda
1. Tiempo de antigüedad de la vivienda
• Menos de 10 años
• Entre 10 y 20 años
• Más de 20 años
2. Material de construcción de la vivienda:
• Cemento
• Adobe
• Quincha
• Prefabricado
3. Número de habitaciones: ____________
4. Área de terreno: __________ m2
5. La vivienda se encuentra en:
• Buen estado de conservación
• Regular estado de conservación
• Mal estado de conservación

Complete la siguiente ficha técnica:


Fecha: Del 02 al 15 de marzo del 2020
Población: …
Muestra: …
Unidad elemental: …

Con 95% de confianza y 3% de margen de error.

Ejemplo 4
Se realizó un estudio para determinar la cantidad promedio diario de residuos de construcción y
demolición en la ciudad de Lima durante los meses de enero, febrero y marzo del presente año.
Determine la población, muestra y elemento.

Población

Muestra

Elemento
UPC MA444 Estadística 9
Variables

Una variable es la característica de interés de los elementos. Se representan con las letras mayúsculas
de nuestro alfabeto; por lo general, X, Y, Z.

Tipo de variables

Variable cualitativa
Es la característica cuyos valores no son numéricos. Por ejemplo, carrera universitaria, material de
construcción y tipo de resistencia.

Variable cuantitativa
Es la característica cuyos valores son numéricos. Se dividen en discretas y continuas.

Variable cuantitativa discreta


Es aquella variable cuyo resultado sólo puede tomar un número finito o infinito numerable de valores.
Estos valores surgen de un proceso de conteo.

Variable cuantitativa continua


Es aquella variable cuyo resultado puede tomar infinitos valores entre dos valores cualesquiera. Estos
valores surgen de un proceso de medición.

Ejemplo 1
Son variables cuantitativas discretas:
• Número de artículos defectuosos producidos diariamente
• Número de defectos por barra de acero

Son variables cuantitativas continuas:


• Temperatura (°C)
• Longitud de las barras de acero (cm)

Son variables cualitativas:


• Grado de instrucción
• Opinión sobre la calidad del servicio

Ejemplo 2
Si formulamos la siguiente pregunta al elemento: ¿Cuál es tu programa de televisión preferido?, la
variable en estudio la representamos con una letra mayúscula, por ejemplo, X= Programa de televisión
preferido.

Pregunta Variable en estudio Tipo de variable


¿Cuál es tu programa de televisión X = programa de televisión
Cualitativa
preferido preferido
UPC MA444 Estadística 10
Ejemplo 3
En cada caso, identifique la variable en estudio y su tipo.

Pregunta Variable en estudio Tipo de variable

¿Cuál es su grado de
instrucción?

¿Cuál es su ingreso
mensual, en soles?

¿Cuántos hermanos
tiene?

¿Cuál es tu año de
nacimiento?
UPC MA444 Estadística 11
Escalas de medición

Las escalas de medición de las variables permiten determinar la cantidad de información que
contienen los datos e indica el resumen de estos y el análisis estadístico más apropiado.

Las escalas de medida de una variable cualitativa son las siguientes:

Nominal
Una variable está medida en escala nominal cuando los datos son etiquetas o nombres que se emplean
para definir un atributo del elemento. Por ejemplo: el género de las personas, el estado civil, el número
telefónico, etc.

Ordinal
Una variable está medida en escala ordinal cuando pueden ordenarse de acuerdo con algún criterio.
Se pueden ordenar en forma ascendente o descendente. También, pueden registrarse por medio de
un código numérico. Por ejemplo: el orden de mérito de los alumnos en el curso de estadística, el grado
de instrucción de los clientes de un banco, nivel socioeconómico de los alumnos de la universidad.

Las escalas de medida de una variable cuantitativa son las siguientes:

Intervalo
Una variable está medida en escala de intervalo si el cero es relativo, es decir, no indica la ausencia de
la característica medida. Por ejemplo: las temperaturas en grados Celsius o en grados Fahrenheit.

Razón
Una variable está medida en escala de razón si el cero indica la ausencia de característica de la medida.
Por ejemplo: el sueldo de los empleados de una empresa, el peso de los trabajadores.

Ejemplo 1

Indique en cada caso la variable, su tipo y escala de medida:

a. ¿Cuál es tu programa de TV preferido?


Y=
Tipo de variable: Escala de medida:

b. ¿Cuánto es la temperatura hoy, en grados centígrados?


Y=
Tipo de variable: Escala de medida:

c. ¿Cuál es su año de nacimiento?


Y=
Tipo de variable: Escala de medida:
UPC MA444 Estadística 12

d. ¿Cuántos hermanos tiene?


Y=
Tipo de variable: Escala de medida:

Ejemplo 2

La Corporación Aceros Perú es una empresa que se dedica a la industria del acero. Actualmente, la
empresa está fabricando hierro esponja, palanquillas de acero, barras helicoidales, alambrón y barras
de construcción y tiene una capacidad de 680,000 toneladas al año. Uno de los mercados a los que
más se orientan los productos es el mercado de la construcción de Lima.

El departamento de Control de Calidad está encargado de realizar un estudio sobre las varillas
devueltas a la fábrica. Al seleccionar una muestra aleatoria de 80 barras de aceros de la sección de
devoluciones del almacén, se midieron algunas características de acuerdo con la siguiente ficha
técnica:

Número de barra: ___________


1. Tipo de barra de acero:
• Corrugado ASTM
• Corrugado Grado60
• Corrugado NBR7480
• Corrugado 4,7 mm
2. El destino de uso de la barra de acero
• Columnas
• Vigas
• Cimentación
• Concreto armado
3. Resistencia a la tracción: ________________ kg/cm2

4. Número de protuberancias: ________________


5. Categoría del límite a afluencia
• Alta
• Regular
• Baja
6. Tipo de defecto
• Escamas • Marcas mecánicas • Corrosión
• Pliegues • Fisuras
• Grietas • Porosidad
UPC MA444 Estadística 13

A partir de la información, complete el siguiente cuadro.

Indique la población

Indique la muestra

Identifique las características e


indique el tipo de variable y la
escala de medida.
UPC MA444 Estadística 14
Ejercicios propuestos

1. Corporación Domar S.A.C. es una empresa peruana ubicada en la ciudad de Lima con más de ocho
años de experiencia en el sector Industrial. La empresa ejecuta proyectos de instalación de sistemas
mecánicos y electrónicos, además brinda un servicio industrial de mantenimiento especializado de
maquinarias y laboratorios en todas las especialidades de ingeniería. El gerente del área de servicios
quiere convertir a la corporación en una de las empresas con mayor representatividad, a nivel
nacional, en el rubro industrial, por lo que desea evaluar los servicios brindados durante el último
trimestre. Se seleccionaron al azar 22 registros de los servicios realizados durante el último
trimestre. Algunas de las variables registradas se presentan a continuación:

• Precio neto por el servicio (en miles de soles)


• Rubro de la empresa cliente (Construcción, Industria Manufacturera, Salud, Educación)
• Número de ingenieros necesarios para realizar el servicio
• Tipo de servicio (Mantenimiento preventivo, mantenimiento correctivo, instalación de
laboratorios, instalación de máquinas industriales)
• Cantidad de días de ejecución del servicio

a. Identifique la población y clasifique las variables según su tipo y escala de medida.

Población

Variable Tipo de variable Escala de medida

Precio neto por el servicio

Rubro de la empresa cliente


Número de ingenieros necesarios
para realizar el servicio

Tipo de servicio

Cantidad de días de ejecución del


servicio

2. El gobierno peruano está preocupado por la ocurrencia de un sismo de alta intensidad en el


departamento de Lima y por las consecuencias que esto podría generar, especialmente en algunos
distritos como el Cercado de Lima. Por esta razón, Defensa Civil realizó un diagnóstico de la
situación de las viviendas en el mencionado distrito a través de una muestra de 1200 viviendas
seleccionadas al azar.

Se registraron las siguientes variables:


• Tiempo de construida la vivienda, en años
• Material de construcción de la vivienda (cemento, adobe, quincha, material prefabricado)
• Número de habitaciones por vivienda
• Área del terreno en donde se construyó la vivienda.
UPC MA444 Estadística 15
De acuerdo con el enunciado, identifique:

Población

Muestra

Variable Tipo de variable Escala de medida


Tiempo de construida la
vivienda, en años
Material de construcción de
la vivienda
Número de habitaciones por
vivienda
Área del terreno en donde se
construyó la vivienda

3. Computer es una compañía dedicada a brindar servicios informáticos a empresas que desean tener
una presencia firme y contundente en la red. Esta compañía se dedica al tendido de redes LAN,
instalación de equipos, servidores y toda una gama de productos tecnológicos que puedan resultar
imprescindibles para una empresa.

Como parte de un estudio realizado por Computer se analizó la información correspondiente a una
muestra de 30 empresas en la ciudad de Lima a las que se les brindó los servicios informáticos.

Identifique el tipo y escala de medición de las variables consideradas en dicho estudio.

Variable Tipo de variable Escala de medida


Lenguajes de programación (Cobol,
Java, etc.)
Cantidad de servidores por
empresa
Costo de las licencias de software
(en dólares)
Año de instalación del software

4. La empresa de investigación de mercados Alpha S.A. realizó un estudio para evaluar el efecto de la
caída de la bolsa de valores de Lima (BVL) en las administradoras de fondos de pensiones (AFP). En
este estudio se tomó una muestra de 300 afiliados entre 25 y 35 años en Lima seleccionados al azar.

Se registraron las siguientes variables:


• AFP a la que pertenece el afiliado
• Monto del fondo del afiliado (en soles)
• Edad del afiliado (en años)
• Tipo de fondo según riesgo (bajo, moderado, alto).
UPC MA444 Estadística 16

De acuerdo con el enunciado, identifique:

Población

Muestra

Variable Tipo de variable Escala de medida


AFP a la que pertenece el
afiliado
Monto del fondo del
afiliado (en soles)

Edad del afiliado (en años)

Tipo de fondo según riesgo

5. Indique el tipo y la escala de medición de las características observadas en una muestra de


secciones de tuberías de agua.

Variable Tipo de variable Escala de medición

Diámetro de la tubería (pulgadas)

Material de la tubería

Año de instalación

Ubicación (subterránea, aérea)

Longitud de la tubería (pies)


Estabilidad del suelo circundante (inestable,
moderadamente estable o estable)
Corrosividad del suelo circundante (corrosivo o
no corrosivo)
UPC MA444 Estadística 17
Dato
Es la respuesta que se tiene, por variable, de cada unidad elemental. Los datos pueden ser numéricos
o no numéricos.

Observación
Es el conjunto de datos que se tiene por unidad elemental. Existirán tantas observaciones como
elementos se tengan.

Ejemplo 1

La siguiente base de datos contiene información de una muestra de 10 usuarios de Internet de un


determinado distrito de la ciudad capital.

Principales problemas con Número de PC Tiempo de navegación


Usuario Marca de PC
Internet con Internet diaria (min)
1 HP Saturación de la red 1 194,00
2 Dell Lentitud para subir información 1 274,45
3 IBM Saturación de la red 3 104,89
4 HP Lentitud para ver videos 3 125,53
5 Dell Lentitud para ver videos 3 123,97
6 HP Calidad y durabilidad del modem 4 134,66
7 Otra marca Baja velocidad en la señal 2 256,33
8 HP Otros 2 195,32
9 HP Baja velocidad en la señal 2 121,90
10 Lenovo Lentitud para ver videos 2 378,27

Identifique y complete:

Indique la unidad elemental

¿Cuántos datos hay por unidad elemental?

¿Cuántas observaciones hay?

¿Cuántas características se están evaluando?

¿Cuántos datos hay en total?


Proporcione un ejemplo de dato cuantitativo
discreto
Proporcione un ejemplo de dato cuantitativo
continuo
Proporcione un ejemplo de observación
UPC MA444 Estadística 18
Parámetro
Un parámetro resume una característica de la población. Para obtener su valor se hace necesario
contar con toda la información que brindan los elementos de una población.

Estadístico
Un estadístico resume una característica de la muestra, para obtener su valor se utiliza la información
muestral. El valor obtenido de un estimador se conoce como estimación. Al estimador se le llama
estadígrafo o estadístico.

Algunos parámetros y estadísticos:

Nombre de la medida de resumen Notación del parámetro Notación del estadístico


∑𝑁
𝑖=1 𝑥𝑖 ∑𝑁
𝑖=1 𝑥𝑖
Promedio 𝜇= 𝑥̅ =
𝑁 𝑛

Moda Mo mo

𝐴 𝑎
Proporción 𝑝= 𝑝̂ =
𝑁 𝑛

Ejemplo 1

Se tiene una población de 30 alumnos del curso de estadística de la sección CI3A. A cada alumno se le
preguntó su edad. Con estos 30 datos se calculó la media y se obtuvo un valor de 19,7 años.

Complete el siguiente cuadro:

Indique si la medida de resumen corresponde


a un parámetro o a un estadístico

Indique el valor de la medida de resumen

Indique la notación de la medida de resumen


UPC MA444 Estadística 19
Organización de datos cualitativos

La organización se presenta a través de una tabla y de gráficos.

Tabla de distribución de frecuencias

Distribución de < elementos> según <variable>


Variable Frecuencia absoluta fi Frecuencia relativa hi Frecuencia porcentual pi
𝑓1
Categoría 1 𝑓1 ℎ1 = 𝑝1 = ℎ1 × 100%
𝑛
𝑓2
Categoría 2 𝑓2 ℎ2 = 𝑝2 = ℎ2 × 100%
𝑛
⋮ ⋮ ⋮ ⋮
𝑓𝑘
Categoría k 𝑓𝑘 ℎ𝑘 = 𝑝𝑘 = ℎ𝑘 × 100%
𝑛
F : ……………………………………..

Los elementos de la tabla de frecuencias se describen a continuación:

Frecuencia absoluta (fi)


La frecuencia absoluta (fi) de una categoría, está dada por el número de repeticiones en las
observaciones que presenta esta categoría.

Frecuencia relativa (hi)


La frecuencia relativa (hi) de una categoría está dada por la proporción del número total de
observaciones que caen en esa categoría.

Frecuencia relativa acumulada (Hi)


La frecuencia relativa acumulada de una categoría está dada por la proporción del número total de
observaciones que caen hasta esa categoría.

Elementos de la tabla de frecuencias

Título
El título de la tabla debe tener la siguiente estructura:

Distribución de <elementos> según <variable en estudio>

Fuente
Se refiere de dónde se recolectaron los datos para posteriormente ser organizados. Se ubica siempre
en la parte inferior de la tabla.
UPC MA444 Estadística 20
Ejemplo 1
La siguiente información muestra la distribución de una muestra de viviendas de un determinado
distrito de Lima según material con el cual fue construido.

Distribución de viviendas según material de construcción


Material de construcción fi hi = fi/n pi = hi x 100%
Cemento 48 0,160
Adobe 100 0,333
Quincha 108 0,360
Material prefabricado 44 0,147
Total 300 1,000
Fuente: Municipalidad distrital

Indique la unidad elemental, variable en estudio, su tipo y escala de medición.

Unidad elemental

Variable en estudio Tipo de variable Escala de medición

Interprete el valor de las siguientes frecuencias:

f3 = …

p3 = …

Gráficos de una variable cualitativa

Barras y sector circular


• Para organizar gráficamente la variable cualitativa se utiliza el gráfico de barras o el gráfico de sector
circular.
• En caso la variable cualitativa sea de escala ordinal, se recomienda usar el gráfico de barras, donde
en el eje X se muestre la jerarquía de las categorías. Si trabajamos con variables cualitativas de
escala nominal, las categorías pueden ser colocadas en cualquier orden.
• En el gráfico de barras es posible usar las frecuencias absolutas o porcentuales, pero se prefieren
las frecuencias porcentuales.
• Para el caso del gráfico circular sólo es posible usar las frecuencias porcentuales.
• El título del gráfico es el mismo que se ha colocado a la tabla de frecuencias.
• En ambos tipos de gráfico, barras o sector circular, colocar la fuente y las etiquetas.
UPC MA444 Estadística 21
Ejemplo 1
La empresa PC Review – Perú está interesada en conocer cuál es el programa de Microsoft Office que
más utilizan los empleados de las empresas de la ciudad de Lima. Por tal motivo seleccionó al azar una
muestra de 500 empleados y se les pidió que indicaran el programa que más usaban diariamente. La
información se presenta a continuación:

Distribución de empleados según tipo de programa de Microsoft que usan diariamente


Programa de Microsoft Número de empleados fi hi pi% = hi x 100%
Access 50
MS Excel 101
MS Power Point 90
MS Word 113
Outlook 101
Otros 45
Total 500
Fuente: PC-Review-Perú

Complete los elementos que faltan en cada uno de los gráficos y comente:

Título del gráfico


120 113
101 101
100 90

80
Título del eje

60 50
45
40

20

0
Access MS Excel MS Power Point MS Word Outlook Otros
Título del eje

Fuente: PC-Review-Perú

Comente el gráfico
UPC MA444 Estadística 22

Título del gráfico


Otros Access
9% 10%

Outlook
MS Excel
20%
20%

MS Word MS Power Point


23% 18%
Fuente: PC-Review-Perú

Comente el gráfico
UPC MA444 Estadística 23
Caso: Corporación Domar S.A.C.

Domar, es una empresa peruana ubicada en la ciudad de Lima y ejecuta


proyectos de instalación de sistemas mecánicos y electrónicos.
Además, brinda servicio de mantenimiento especializado de
maquinarias y laboratorios. Últimamente, se han presentado ciertos
inconvenientes con las empresas que solicitan sus servicios. Por esta
razón, el jefe del área desea realizar una evaluación seleccionando al
azar 32 registros de los servicios que se realizaron el primer trimestre
del presente año.

Complete la siguiente tabla:

Variable Tipo de variable Escala de medición


Costo por servicio (en miles de soles)

Número de técnicos especializados


necesarios para realizar el servicio

Principal queja presentada por la empresa


que recibió un servicio

Tiempo en horas para realizar el servicio

Calificación por el servicio (1 al 10)

El jefe del Área de Servicios impulsará paquetes si más del 25% de los clientes que solicitaron un
servicio pertenecen a este rubro.

Rubro de la empresa cliente de una muestra de 32 registros


Salud Servicios Manufacturera Manufacturera
Construcción Salud Salud Salud
Servicios Servicios Manufacturera Educación
Construcción Servicios Manufacturera Manufacturera
Manufacturera Construcción Educación Manufacturera
Salud Manufacturera Manufacturera Educación
Servicios Manufacturera Manufacturera Servicios
Servicios Manufacturera Salud Educación

Interpretación Representación Cálculo Análisis Argumentación


El estudiante El estudiante indica El estudiante El estudiante El estudiante redacta
redacta el la variable y que muestra los indica conque la decisión que
problema, con un herramienta cálculos realizados valor calculado tomará a partir del
lenguaje sencillo, estadística utilizará para dar respuesta responde el resultado de su
como pregunta u en la solución del al problema. problema. análisis.
objetivo. problema.
UPC MA444 Estadística 24
Organización de datos cuantitativos discretos

La variable cuantitativa discreta, además de presentar las frecuencias absolutas y relativas, presenta
dos frecuencias acumuladas. La frecuencia acumulada absoluta representada por Fi y la frecuencia
acumulada relativa representada por Hi.

Tabla de distribución de frecuencias

Frecuencia acumulada absoluta (Fi)


Representa el número de observaciones que caen hasta esa categoría.

Frecuencia porcentual (pi)


Representa el valor porcentual de la frecuencia relativa.

Distribución de < elementos> según <variable>


Variable fi hi Fi Hi pi
0 𝑓1 ℎ1 𝐹1 𝐻1 𝑝1
1 𝑓2 ℎ2 𝐹2 𝐻2 𝑝2
2 𝑓3 ℎ3 𝐹3 𝐻3 𝑝3
… … … … … …

𝑘 𝑓𝑘 ℎ𝑘 𝑛 1 𝑝𝑘
Total 𝑛 1
F : ………

Gráfico de bastones o líneas

Es un gráfico para variable cuantitativa discreta donde se representan los valores de la variable y sus
respectivas frecuencias absolutas, relativas o porcentuales. Como todo gráfico debe tener su título
principal, títulos en los ejes, X e Y, las etiquetas, y la fuente.

Elementos de la tabla de frecuencias

Título
El título de la tabla debe tener la siguiente estructura:

Distribución de <elementos> según <variable en estudio>

Fuente
Se refiere de dónde se recolectaron los datos para posteriormente ser organizados. Se ubica siempre
en la parte inferior de la tabla.
UPC MA444 Estadística 25
Ejemplo 1
Corporación Domar S.A.C. es una empresa peruana ubicada en la ciudad de Lima. El gerente de
servicios desea evaluar el servicio brindado durante el primer trimestre del año, para ello seleccionó
al azar 22 registros de servicios realizados en dicho periodo. Para lograr una mayor representatividad,
se requiere que el número de ingenieros necesarios para realizar un servicio debe ser como máximo
6, esto es por criterio de optimización del personal especializado. Si más del 15% de los servicios se
realizaron con más de 6 ingenieros, entonces el gerente sancionará al jefe de personal. ¿Qué decisión
tomará? La data se presenta a continuación:

Número de Precio neto del servicio


Servicio Tipo de servicio
ingenieros (en miles de soles)
1 5 23.3 Mantenimiento preventivo
2 4 27.5 Instalación de laboratorios
3 7 23 Mantenimiento preventivo
4 3 28.1 Mantenimiento correctivo
5 4 34.5 Instalación de laboratorios
6 7 38.4 Instalación de máquinas industriales
7 5 28.1 Mantenimiento correctivo
8 5 30.7 Instalación de laboratorios
9 3 31.9 Mantenimiento correctivo
10 3 30.7 Mantenimiento preventivo
11 3 26.5 Mantenimiento preventivo
12 4 36.9 Instalación de máquinas industriales
13 6 30.7 Instalación de laboratorios
14 3 29 Instalación de máquinas industriales
15 3 38.1 Mantenimiento correctivo
16 5 31.2 Instalación de laboratorios
17 4 35.8 Instalación de laboratorios
18 7 34 Instalación de máquinas industriales
19 5 35 Mantenimiento correctivo
20 6 30 Mantenimiento correctivo
21 6 31.2 Instalación de máquinas industriales
22 5 28.2 Mantenimiento preventivo

a. Identifique la variable, su tipo y escala de medida.


b. Identifique la herramienta a usar para dar respuesta a la consulta del gerente.
c. ¿Qué decisión tomará el gerente de servicio?

Solución

a. Identifique la variable, su tipo y escala de medida.

• Variable: Número de ingenieros necesarios para realizar el servicio


• Tipo: cuantitativa discreta
• Escala: razón
UPC MA444 Estadística 26
b. Identifique la herramienta a usar para dar respuesta a la consulta del gerente.

Se pide determinar el porcentaje de servicios con más de 6 ingenieros. Por lo tanto, se


debe realizar la tabla de distribución de frecuencias y adicionalmente el gráfico de
bastones.

Distribución de servicios según número de ingenieros


Número de ingenieros fi hi Fi Hi
3 6 0.273 6 0.273
4 4 0.182 10 0.455
5 6 0.273 16 0.727
6 3 0.136 19 0.864
7 3 0.136 22 1.000
Total 22 1.000
Fuente: Corporación Domar S.A.C.

Distribución de servicios según número de ingenieros

30% 27.3% 27.3%

25%
porcentaje de ingenoeros

18.2%
20%
13.6% 13.6%
15%

10%

5%

0%
0 1 2 3 4 5 6 7 8
Fuente: Corporación Domar Número de ingenieros
S.A.C.

c. ¿Qué decisión tomará el gerente de servicio?

Se observa que en el 13,6% de los servicios realizados participaron más de 6 ingenieros y de acuerdo
a la condición, el gerente del área de servicios no sancionará al jefe de personal.
UPC MA444 Estadística 27
Ejemplo 2
A continuación, se presenta el gráfico de bastones para la variable <número de capacitaciones
realizadas durante el último semestre del año>, obtenida a partir de una muestra de trabajadores de
una determinada empresa de cemento ubicada en la ciudad de Lima. En base al siguiente gráfico
identifique:
Distribución de empleados según número de capacitaciones

60 54 52
49
50
Número de empleados

40
30
16
20
8 6
10
0
0 1 2 3 4 5 6
Fuente: Empresa de Cemento A Número de capacitaciones

Identifique la unidad elemental.

Indique el tamaño de muestra.

Indique la variable en estudio.

Interprete el gráfico
UPC MA444 Estadística 28
Ejercicios propuestos

6. El jefe de recursos humanos de la empresa A desea determinar la distribución de la cantidad de


faltas que han tenido los trabajadores el mes anterior. Por tal motivo, seleccionó al azar 30
trabajadores y registró el número de faltas. Los datos se presentan a continuación:

0 0 0 0 1 1 1 1 1 1 1 1 2 2 2
2 2 2 2 2 2 2 3 3 3 3 3 3 4 4

a. Con la información anterior, indique:

Variable en estudio

Escala de medida de la variable

Unidad elemental

Interprete un dato

b. Complete la tabla y llene los espacios en blanco.

Distribución de ……
Número de faltas fi hi Fi Hi
0 4 4
1 8 12
2 10 22
3 28
4 30
Total
Fuente: Empresa A

c. Indique el porcentaje de trabajadores que no presentaron faltas el mes anterior.


d. Indique el número de trabajadores que tuvieron a lo más dos faltas.
e. Los trabajadores con problemas son aquellos con tres o más faltas. Indique el porcentaje de
trabajadores que tienen problemas.
f. Interprete la primera frecuencia absoluta.
g. Interprete la tercera frecuencia relativa.
h. Interprete la cuarta frecuencia acumulada absoluta.
i. Presente el gráfico adecuado para la variable en estudio. Interprete.

7. La siguiente información muestra el número de ladrillos defectuosos fabricados diariamente en una


de las plantas de la empresa Rex. En una muestra aleatoria de 50 días se obtuvo la siguiente
información:
UPC MA444 Estadística 29
Distribución de días según número de ladrillos defectuosos
Número de ladrillos defectuosos fi hi Fi Hi
0 12
1 0,32
2 0,10
3 9
4 8 0,16
Total 50 1,00
Fuente: Rex S.A.

Si el gerente de Rex encuentra al menos un ladrillo defectuoso, en más de 40 días, deberá revisar
su sistema de fabricación.

8. El gerente de la empresa Líder S.A. solicita al jefe del Departamento de Ingeniería realizar una
investigación de las obras que fueron atendidas por la empresa el periodo anterior. Para la
realización del estudio, seleccionó aleatoriamente una muestra de 160 obras de construcción
atendidas el año pasado. La gerencia decidirá adquirir más camiones mezcladores, para las obras
de construcción, si el porcentaje de obras en el que se utiliza mínimo tres camiones para el traslado
del concreto armado premezclado supera el 55%. Indique lo que hará la empresa.

Distribución de obras según número de camiones


60 55

50 45
Cantidad de obras

40
30 25

20 15
10 10
10
0
0 1 2 3 4 5 6 7

Fuente: Empresa Líder S.A. Número de camiones

9. Investigadores del Massachussets Institute of Technology (MIT) estudiaron las propiedades


espectroscópicas de asteroides de la franja principal, con un diámetro menor a los 100 kilómetros.
Los asteroides se observaron con el telescopio Hiltner del observatorio de MIT; se registró el
número de exposiciones de imagen espectral independiente para cada observación. Aquí se
presentan los datos de 40 observaciones de asteroides obtenidas de Science.

3 4 3 3 1 4 1 3 2 3
1 1 4 2 3 3 2 6 1 1
3 3 2 2 2 2 1 3 2 1
6 3 1 2 2 3 2 2 4 2

Construir un gráfico de bastones para el número de exposiciones de imagen espectral.


UPC MA444 Estadística 30
Organización de datos cuantitativos continuos
Los datos se agruparán de intervalo (también llamados clases, categorías o grupos) cuando la variable
tiene gran variabilidad.

Tabla de distribución de frecuencias

Distribución de <unidades elementales> según <variable>


Frecuencia Frecuencia Frecuencia Frecuencia
Intervalos ´
Marca de clase 𝑥1 absoluta relativa absoluta relativa
(clases)
𝑓𝑖 ℎ𝑖 acumulada 𝐹𝑖 acumulada 𝐻𝑖
𝐿𝑖1 + 𝐿𝑠1 𝑓1
[𝐿𝑖1 − 𝐿𝑠1 ] 𝑥1´ = 𝑓1 ℎ1 = 𝐹1 = 𝑓1 𝐻1 = ℎ1
2 𝑛
𝐿𝑖2 + 𝐿𝑠2 𝑓2
]𝐿𝑖2 − 𝐿𝑠2 ] 𝑥2´ = 𝑓2 ℎ2 = 𝐹2 = 𝑓2 + 𝐹1 𝐻2 = ℎ2 + 𝐻1
2 𝑛
⋮ ⋮ ⋮ ⋮ ⋮ ⋮
𝐿𝑖𝑘 + 𝐿𝑠𝑘 𝑓𝑘
]𝐿𝑖𝑘 − 𝐿𝑠𝑘 ] 𝑥𝑘´ = 𝑓𝑘 ℎ𝑘 = 𝐹𝑘 = 𝑓𝑘 + 𝐹𝑘−1 𝐻𝑘 = ℎ𝑘 + 𝐻𝑘−1
2 𝑛
Total 𝒏 1,00
Fuente:

Pasos para elaborar la tabla de distribución de frecuencias


• Obtener el rango (𝑅) o recorrido, usando la siguiente fórmula:

𝑅 = 𝑑𝑎𝑡𝑜 𝑚á𝑥𝑖𝑚𝑜 − 𝑑𝑎𝑡𝑜 𝑚í𝑛𝑖𝑚𝑜

• Calcular el número de intervalos, usando la regla de Sturges:

𝑘 = 1 + 3,322 𝑙𝑜𝑔10 𝑛

El valor de 𝑘 debe ser un valor entero y se redondea por redondeo simple.

• Calcular la amplitud del intervalo, usando la siguiente fórmula:

𝑅
𝑤=
𝑘

El valor de 𝑤 debe tener el mismo número de cifras decimales que tienen los datos y se redondea
por exceso.

Si los datos son enteros Si w = 12,7207; entonces 𝑤 =

Si los datos tienen una cifra decimal Si w = 2,0205; entonces 𝑤 =

Si los datos tienen dos cifras decimales Si w = 165,33033; entonces 𝑤 =


UPC MA444 Estadística 31

• Calcular las frecuencias absolutas y relativas con sus respectivas frecuencias acumuladas.

• Calcular la marca de clase a través de la siguiente fórmula:

límite 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟𝑖 + límite 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟𝑖


𝑥𝑖´ =
2

Ejemplo 1
Corporación Domar S.A.C. es una empresa peruana ubicada en la ciudad de Lima. El gerente de
servicios desea evaluar el servicio brindado durante el primer trimestre del año, para ello seleccionó
al azar 22 registros de servicios realizados en dicho periodo. La data se presenta a continuación:

Número de Precio neto del servicio


Servicio Tipo de servicio
ingenieros (en miles de soles)
1 5 23.3 Mantenimiento preventivo
2 4 27.5 Instalación de laboratorios
3 7 23 Mantenimiento preventivo
4 3 28.1 Mantenimiento correctivo
5 4 34.5 Instalación de laboratorios
6 7 38.4 Instalación de máquinas industriales
7 5 28.1 Mantenimiento correctivo
8 5 30.7 Instalación de laboratorios
9 3 31.9 Mantenimiento correctivo
10 3 30.7 Mantenimiento preventivo
11 3 26.5 Mantenimiento preventivo
12 4 36.9 Instalación de máquinas industriales
13 6 30.7 Instalación de laboratorios
14 3 29 Instalación de máquinas industriales
15 3 38.1 Mantenimiento correctivo
16 5 31.2 Instalación de laboratorios
17 4 35.8 Instalación de laboratorios
18 7 34 Instalación de máquinas industriales
19 5 35 Mantenimiento correctivo
20 6 30 Mantenimiento correctivo
21 6 31.2 Instalación de máquinas industriales
22 5 28.2 Mantenimiento preventivo

La meta del gerente del área de servicios es que menos del 38% de los servicios tengan precios
netos hasta 29200 soles. De llegar a cumplirse la meta, el gerente será reconocido con una
bonificación especial por parte del directorio.

a. Identifique la variable, su tipo y escala de medida.


b. Identifique la herramienta a usar para dar respuesta a la consulta del gerente.
c. ¿El gerente recibirá la bonificación especial?
UPC MA444 Estadística 32
Solución

a. Identifique la variable, su tipo y escala de medida.

• Variable: Precio neto por el servicio, en soles


• Tipo: cuantitativa continua
• Escala: razón

b. Identifique la herramienta a usar para dar respuesta a la consulta del gerente.

Se pide determinar el porcentaje de servicios realizados cuyos precios netos sean como
máximo 29200 soles; por lo tanto, se debe realizar la tabla de distribución de frecuencias y
adicionalmente el histograma.

Para construir la tabla de frecuencias seguir los siguientes pasos:

• Calcule el rango (R) o recorrido.

𝑅 = 𝑑𝑎𝑡𝑜 𝑚á𝑥𝑖𝑚𝑜 − 𝑑𝑎𝑡𝑜 𝑚í𝑛𝑖𝑚𝑜 = 38,4 – 23 =15,4

• Determine el número de intervalos (𝑘).

𝑘 = 1 + 3,322 𝑙𝑜𝑔10 (22) = 5,46

Como 𝑘 debe ser un número entero, por redondeo simple 𝑘 = 5

• Determine el tamaño del intervalo de clase (𝑤).

15,4
𝑤= = 3,08
5

Los datos tienen dos decimales; por lo tanto, 𝑤 se redondea por exceso a un decimal, luego, el
valor de 𝑤 es 3,1

Distribución de servicios según precio neto


i Intervalo X´i fi hi Fi Hi
1 [23,0 26,1] 24,6 2 0,091 2 0,091
2 ]26,1 29,2] 27,7 6 0,273 8 0,364
3 ]29,2 32,3] 30,8 7 0,318 15 0,682
4 ]32,3 35,4] 33,9 3 0,136 18 0,818
5 ]35,4 38,5] 37,0 4 0,182 22 1,000
22 1
UPC MA444 Estadística 33

Distribución de servicios según precio neto


35% 31.80%
30% 27.30%

porcentaje de servicios
25%

20% 18.20%

15% 13.60%
9.10%
10%

5%

0%
[23.0-26.1] ]26.1-29.2] ]29.2-32.3] ]32.3-35.4] ]35.4-38.5]
precio neto
Fuente: Corporación Domar S.A.C.

c. ¿El gerente recibirá la bonificación especial?

Se observa que el 36,4% de los servicios tienen precios netos menores o iguales a 29200 soles.
Por lo tanto, el gerente será reconocido con una bonificación especial por parte del directorio
de la Corporación Domar S.A.C.

Ejemplo 2
Se ha llevado a cabo un estudio para evaluar el tiempo, en horas, que utiliza cada trabajador de una
planta hidroeléctrica para verificar el normal funcionamiento de la tubería de presión y las válvulas de
control. Para ello se eligieron al azar 30 de ellos.

0,08 0,15 0,19 0,71 0,75 0,82 0,84 0,92 0,96 1,16 1,17 1,19 1,23 1,4 1,47
1,59 1,61 2,01 2,16 2,38 2,42 3,07 3,22 3,53 3,76 3,94 4,5 4,59 4,75 5,41

Para construir la tabla de frecuencias deberá seguir los siguientes pasos:

• Calcule el rango (R) o recorrido.

• Determine el número de intervalos (𝑘).

• Determine el tamaño del intervalo de clase (𝑤).


UPC MA444 Estadística 34
Complete la siguiente tabla:

Título: …
i Intervalo X´i fi hi Fi Hi
1 [0,08 – 0,97]
2 ]0,97 – 1,86]
3 ]1,86 – 2,75]
4 ]2,75- 3,64]
5 ]3,64 – 4,53]
6 ]4,53 – 5,42]

F : ……………………

Interprete los valores de las siguientes frecuencias.

f2

h2(%)

F4

H4(%)

Ejemplo 3
Use la regla de Sturges para construir la tabla de distribución de frecuencias del monto de venta diario,
en cientos de soles, del último año de la empresa Beta Systems S.A.

52,0 94,7 95,1 97,5 102,5 104,1 106,0 125,2 125,6 146,0
146,8 158,6 158,7 162,6 166,2 166,2 166,2 166,2 168,2 169,7
196,0 204,9 204,9 204,9 204,9 208,3 215,2 217,5 218,1 218,1
218,1 218,1 220,9 226,2 235,0 239,7 242,2 259,6 261,6 277,2
286,5 287,0 297,8 313,9 315,0 316,2 338,6 359,9 363,1 398,3

Identifique.

Elemento

Variable en estudio

Tipo de variable y escala


UPC MA444 Estadística 35
Complete la siguiente tabla:

Título: …
Intervalo X´i fi hi Fi Hi

Fuente: …

Interprete los valores de las siguientes frecuencias.

f2

h3(%)

F4

H2(%)
UPC MA444 Estadística 36
Gráficos de una variable cuantitativa continua
Son gráficas que representan las observaciones obtenidas de la variable cuantitativa continua. Se
pueden realizar con las fi o pi. Como todo gráfico los elementos son: el título principal, título de los ejes
X e Y, etiquetas y fuente.

Los siguientes gráficos se han obtenido con los datos del ejemplo 2 y usando el software MINITAB.

Histograma

Es una gráfica de barras cuyos valores del eje X son los intervalos de clase. Además, la altura de las
barras está determinada por las frecuencias relativas de los intervalos de clase. Según el interés del
estudio se pueden considerar también, las frecuencias absolutas.

Polígono
Es una gráfica donde los valores del eje X son las marcas de clase.

Para cerrar el polígono se debe aplicar el siguiente artificio: restar a la primera marca de clase el valor
de la amplitud y sumar a la última marca de clase el valor de la amplitud.

Según sea el interés del estudio se pueden considerar las frecuencias absolutas o porcentuales.
UPC MA444 Estadística 37
Ojiva
Es una gráfica donde los valores del eje X son los límites superiores.

Es una gráfica creciente a la que debe aplicarse el siguiente artificio: El primer valor del eje X es el dato
más pequeño del conjunto de datos o valor mínimo o valor del primer límite inferior.

Según el interés del estudio se pueden considerar las frecuencias absolutas o relativas.
UPC MA444 Estadística 38
Ejercicios propuestos

10.El jefe del Área de Operaciones de Tricon S.A. aplicará una mejora continua en la distribución del
concreto premezclado a las obras, debido a las constantes quejas de los clientes respecto al tiempo
de llegada de los camiones a la obra desde la planta de Los Olivos. Tomará tal decisión si más del
30% de los camiones llegan después de los 39,5 minutos a la obra.

19,1 20,0 23,9 26,1 26,5 27,9 30,1 30,8 32,9 34,7
36,1 36,5 36,6 37,5 38,4 39,3 43,7 44,2 44,6 45,1
46,1 46,3 48,8 51,3 52,7 52,9 53,0 55,0 57,3 59,6

¿Recomendaría usted aplicar la mejora continua en la distribución del concreto premezclado?

11.Corporación Domar es una empresa peruana ubicada en la ciudad de Lima con más de ocho años
de experiencia en el sector Industrial. La empresa ejecuta proyectos de instalación de sistemas
mecánicos y electrónicos, además brinda un servicio industrial de mantenimiento especializado de
maquinarias y laboratorios en todas las especialidades de ingeniería. Debido a las expectativas de
las utilidades del último trimestre, la meta del gerente del área de servicios es que por lo menos el
40% de servicios tengan precios netos por el servicio mayores a 33 900 soles. De llegar a cumplir la
meta, el gerente será reconocido con una bonificación por parte del directorio. ¿Cuál será la
decisión del directorio? Los registros del último trimestre se presentan a continuación:

N° de Número de Precio neto del servicio


Tipo de servicio
servicio ingenieros (en miles de soles)
1 5 23,3 Mantenimiento preventivo
2 4 27,5 Instalación de laboratorios
3 7 23,0 Mantenimiento preventivo
4 3 28,1 Mantenimiento correctivo
5 4 34,5 Instalación de laboratorios
6 7 38,4 Instalación de máquinas industriales
7 5 28,1 Mantenimiento correctivo
8 5 30,7 Instalación de laboratorios
9 3 31,9 Mantenimiento correctivo
10 3 30,7 Mantenimiento preventivo
11 3 26,5 Mantenimiento preventivo
12 4 36,9 Instalación de máquinas industriales
13 6 30,7 Instalación de laboratorios
14 3 29,0 Instalación de máquinas industriales
15 3 38,1 Mantenimiento correctivo
16 5 31,2 Instalación de laboratorios
17 4 35,8 Instalación de laboratorios
18 7 34,0 Instalación de máquinas industriales
19 5 35,0 Mantenimiento correctivo
20 3 28,0 Mantenimiento correctivo
21 6 31,2 Instalación de máquinas industriales
22 5 28,2 Mantenimiento preventivo
UPC MA444 Estadística 39
12.En la producción de las piezas electrónicas, el tiempo de fabricación es muy importante, de tal
manera que el jefe de producción debería calibrar su maquinaria si verifica que hay por lo menos
30% de piezas electrónicas cuyo tiempo de fabricación es más de 10,55 minutos. ¿Deberá el jefe de
producción calibrar su maquinaria? Se cuenta con la siguiente información del tiempo de
fabricación en una muestra de 30 piezas electrónicas.

Distribución de piezas electrónicas según tiempo de fabricación


Tiempo de fabricación X´i fi hi Fi Hi
4,71 0,100
7,63 2
8
5 0,167
11,28 7

Fuente: Empresa A
UPC MA444 Estadística 40
Caso: Riesgo de construcción de viviendas

El crecimiento demográfico en Lima se ha incrementado de


manera exponencial. Este problema ha conllevado a ocupar
espacios con riesgos y vulnerabilidad a desastres por
construcción, debido a una mala técnica, mal manejo de
materiales, tipo de suelo, tipo de cimentación o altitud de la
construcción.

Para tomar decisiones, la gerencia de gestión del riesgo de desastres de la Municipalidad de Lima
realizó el mes pasado un estudio de riesgo de construcción de viviendas, para ello se seleccionaron
200 viviendas ubicadas en las laderas de los cerros de Lima Metropolitana.

En el estudio se presentaron las siguientes situaciones:

Situación 1
Determinar si se brindará asistencia técnica a las viviendas.

La Gerencia de Gestión del Riesgo de Desastres de la Municipalidad de Lima brindará asistencia técnica
a las viviendas ubicadas en la zona alta de Lima con riesgo de cimientos siempre y cuando más del 30%
de ellas tengan al menos cuatro pisos.

Para ello se evaluaron 24 viviendas seleccionadas al azar con dichas características. La información
obtenida se muestra a continuación:

Distribución de viviendas según número de pisos


7 6 6 6
6
Número de viviendas

5 4
4
3 2
2
1
0
0 1 2 3 4 5 6
Fuente: Municipalidad de Lima Número de pisos

¿Qué decisión tomará la gerencia de gestión del riesgo de desastres de la Municipalidad de Lima?

Cálculo Análisis Argumentación


El estudiante muestra los cálculos El estudiante indica con que valor El estudiante redacta la
realizados para dar respuesta al calculado responde el problema. decisión que tomará a partir
problema. del resultado del análisis.
UPC MA444 Estadística 41
Situación 2
Realizar un estudio de materia orgánica en las laderas.

El analista del departamento de gestión del riesgo de desastres de la Municipalidad de Lima desea
realizar un estudio completo de materia orgánica en las laderas de los cerros que tienen suelo arenoso.
Para ello es importante evaluar la capacidad de intercambio catiónico (CIC). Para el estudio se tomó
información del CIC de una muestra de 80 viviendas con suelo arenoso. El analista decidirá realizar el
estudio completo, si más del 18% de estas viviendas registran un CIC mayor a 41,48 meq/100 gr. A
continuación, se presenta la siguiente información:

Distribución de …………… según ……………


Intervalos Marca de clase fi hi Fi Hi
[18,36 24,14] 21,25 12 0,1500 12 0,15
]24,14 29,92] 27,03 0,1875 27 0,3375
]29,92 35,70] 32,81 20 0,2500 47 0,5875
]35,70 38,59 18 0,2250 65 0,8125
47,26] 44,37 10 75 0,9375
]47,26 53,04] 50,15 5 0,0625 80 1,00
Fuente: Municipalidad de Lima

¿El analista del departamento de gestión de riesgos de desastres realizará el estudio completo?

Interpretación Representación Cálculo Análisis Argumentación


El estudiante El estudiante indica El estudiante El estudiante El estudiante
redacta el la variable y que muestra los indica con que redacta la decisión
problema con un herramienta cálculos realizados valor calculado que tomará a
lenguaje sencillo, estadística utilizará para dar respuesta responde el partir del resultado
como pregunta u en la solución del al problema. problema. del análisis.
objetivo. problema.
UPC MA444 Estadística 42
Medidas de resumen

Definiciones

Parámetro
Es una medida de resumen que caracteriza a la población. Para obtener su valor se hace necesario
contar con toda la información que brinda los elementos de una población. Por ejemplo, la media
poblacional 𝜇, varianza poblacional 𝜎 2 .

Estadístico
Es una medida de resumen que caracteriza a la muestra. Para obtener su valor se utiliza la información
muestral. A los valores obtenidos de un estimador se conoce como estimación.

Por ejemplo: la media muestral (𝑥̅ ), varianza muestral (𝑠 2 ).

Los parámetros y estadísticos de mayor uso son:

Nombre de la medida de resumen Parámetro Estadístico

∑𝑁
𝑖=1 𝑥𝑖 ∑𝑁
𝑖=1 𝑥𝑖
Media 𝜇= 𝑥̅ =
𝑁 𝑛

∑𝑁
𝑖=1(𝑥𝑖 − 𝜇)
2 ∑𝑁
𝑖=1(𝑥𝑖 − 𝑥̅ )
2
Varianza 2
𝜎 = 2
𝑠 =
𝑁 𝑛−1

Desviación estándar 𝜎 𝑠

𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 é𝑥𝑖𝑡𝑜𝑠 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 é𝑥𝑖𝑡𝑜𝑠


Proporción 𝑝= 𝑝̂ =
𝑁 𝑛
UPC MA444 Estadística 43
Medidas de tendencia central
q q z “ ” , v
a concentrarse o distribuirse las demás observaciones. Lo que se persigue es conseguir un valor que
sea representativo del conjunto de datos que se está analizando.

Media aritmética
La media llamada también promedio, se define como el cociente de la suma de los valores observados
de la variable en estudio y el número de observaciones.

Características de la media
• Se puede calcular para variables de escala intervalo o razón.
• La mayor desventaja es que se ve afectado por valores extremos; es decir si hay valores muy
pequeños o grandes, la media no los representaría adecuadamente.

Cálculo de la media

La media poblacional es un parámetro y se calcula con:


∑𝑁
𝑖=1 𝑥𝑖
𝜇=
𝑁

Para datos simples (no agrupados) se calcula por:


∑𝑁
𝑖=1 𝑥𝑖
𝑥̅ =
𝑛

Para datos discretos (agrupados) se calcula por:


∑𝑘𝑖=1 𝑓𝑖 𝑥𝑖
𝑥̅ =
𝑛

Para datos continuos (agrupados) se calcula por:


∑𝑘𝑖=1 𝑓𝑖 𝑥𝑖´
𝑥̅ =
𝑛

Cálculo del promedio usando una calculadora Casio


Para conocer cómo calcular la media en una calculadora científica Casio mire el
v : “C ,v z y v á CA IO
fx-570E ”.
https://www.youtube.com/watch?v=Ds4vXpZ5jOw

Ejemplo 1
Los siguientes datos son medidas de la resistencia al rompimiento (en onzas) de una muestra de hilos
de lino.

15,2 15,8 16,2 18,5 19,4 20,6 21,2 21,9 25,4 27,3 28,3 29,5 32,5 33,7 36,9
UPC MA444 Estadística 44
Solución

∑𝑁
𝑖=1 𝑥𝑖
La fórmula es: 𝑥̅ = 𝑛

Ingresando estos valores a la calculadora resulta: 𝑥̅ = 24,16

Interpretación

La resistencia al rompimiento de los hilos está alrededor de 24,16 onzas.


La resistencia al rompimiento de los hilos está próximo a 24,16 onzas.

Ejemplo 2
Calcule e interprete la media para el número de hijos obtenida a partir de una muestra de 35 familias.

Número de hijos Número de familias


0 13
1 6
2 8
3 6
4 2

Ejemplo 3
Calcule el tiempo promedio de verificación, en horas, para una muestra de trabajadores e interprete.

Tiempo de verificación fi X ’i
[0,02 - 0,81] 6
]0,81 - 1,60] 13
]1,60 - 2,39] 4
]2,39 - 3,18] 3
]3,18 - 3,97] 2
]3,97 - 4,76] 2
UPC MA444 Estadística 45
Caso: Riesgo de construcción de viviendas

El crecimiento demográfico en Lima se ha incrementado de


manera exponencial. Este problema ha conllevado a ocupar
espacios con riesgos y vulnerabilidad a desastres por
construcción, debido a una mala técnica, mal manejo de
materiales, tipo de suelo, tipo de cimentación o altitud de la
construcción.

Situación 1
Para tomar decisiones, la gerencia de Gestión del riesgo de desastres de la Municipalidad de Lima
realizó, el mes pasado, un estudio para brindar asistencia técnica a las viviendas ubicadas en la zona
alta de Lima con riesgo de cimientos, siempre y cuando el número promedio de pisos por vivienda sea
mayor a dos. Para ello se evaluaron 24 viviendas seleccionadas al azar con dichas características. La
información obtenida se muestra a continuación:

Distribución de viviendas con riesgo de cimientos según número de pisos


7 6 6 6
Número de viviendas

6
5 4
4
3 2
2
1
0
0 1 2 3 4 5 6

Fuente: Municipalidad de Lima Número de pisos

¿Qué decisión tomara la gerencia de gestión del riesgo de desastres de la Municipalidad de Lima?

Cálculo Análisis Argumentación


El estudiante muestra los cálculos El estudiante indica con que El estudiante redacta la
realizados para dar respuesta al valor calculado responde el decisión que tomará a partir
problema. problema. del resultado del análisis.
UPC MA444 Estadística 46
Situación 2
El analista del Departamento de gestión del riesgo de desastres de la Municipalidad de Lima desea
realizar un estudio completo de materia orgánica en las laderas de los cerros que tienen suelo arenoso.
Para ello es importante evaluar la capacidad de intercambio catiónico (CIC).

Para el estudio se tomó información del CIC de una muestra de 80 viviendas con suelo arenoso. El
analista decidirá realizar un estudio completo, siempre y cuando el CIC promedio supera el valor de 25
meq/100 gr. A continuación, se presenta la siguiente información:

Distribución de ………
Intervalos Marca de clase fi hi Fi Hi
18,36 24,14 21,25 12 0,1500 12 0,1500
24,14 29,92 27,03 0,1875 27 0,3375
29,92 35,70 32,81 20 0,2500 47 0,5875
35,70 38,59 18 0,2250 65 0,8125
47,26 44,37 10 75 0,9375
47,26 53,04 50,15 5 0,0625 80 1,0000
Fuente: Municipalidad de Lima

¿El analista del Departamento de gestión de riesgo de desastres realizará el estudio completo?

Interpretación Representación Cálculo Análisis Argumentación


El estudiante El estudiante indica El estudiante El estudiante El estudiante redacta
redacta el problema la variable y que muestra los indica con que la decisión que
con un lenguaje herramienta cálculos valor calculado tomará a partir del
sencillo, como estadística utilizará realizados para responde el resultado del
pregunta u en la solución del dar respuesta problema. análisis.
objetivo. problema. al problema.
UPC MA444 Estadística 47
Mediana
Es el valor que ocupa el lugar central de un conjunto de datos ordenados. Por tanto, es el valor que
divide en dos partes a dicho conjunto de datos.

Características de la mediana

Se puede calcular para variables medidas en escala intervalo o razón.


La mediana no se ve afectada por valores extremos (mínimo y máximo).

Cálculo de la mediana para datos no agrupados

Si denotamos las observaciones ordenadas por 𝑥[1] , 𝑥[2] , 𝑥[3] , … , 𝑥[𝑛] , la mediana calcularse por:

• Si 𝑛 es impar, la mediana es:


𝑚𝑒 = 𝑥 𝑛+1
[ ]
2
• Si 𝑛 es par, la mediana es:
𝑥[𝑛] + 𝑥[𝑛+1]
2 2
𝑚𝑒 =
2
𝑛 𝑛
Es decir, 𝑛 es par, la media es el promedio de los datos que se encuentran en la posición [2 ] y [2 + 1].

Ejemplo 1
Los siguientes datos corresponden a una muestra de baterías cuyas lecturas de voltaje (en voltios) se
muestran a continuación:

10,00 10,05 10,12 10,26 25,00 9,84 9,96 9,98 9,99 10,00

Calcule e interprete el valor de la mediana.

Solución
Primero ordenamos los datos.

9,84 9,96 9,98 9,99 10,00 10,00 10,05 10,12 10,26 25,00

Como 𝑛 = 10, el cual es un número par, la mediana se calcula con:

𝑥[𝑛] + 𝑥[𝑛+1]
2 2
𝑚𝑒 =
2
Reemplazando los valores.

𝑥10 + 𝑥10
2 2
+1 𝑥5 + 𝑥6 10 + 10
𝑚𝑒 = = = = 10
2 2 2

Interpretación: El 50% de las baterías tienen una lectura máxima de 10 voltios.


UPC MA444 Estadística 48
Ejemplo 2
Los siguientes datos corresponden a la distribución del número de piezas defectuosas producidas en
una muestra de 150 días. Calcule e interprete el valor de la mediana.

Número de piezas de defectuosas Número de días fi Fi


0 50
1 60
2 25
3 10
4 5
UPC MA444 Estadística 49
Moda
La moda de un conjunto de datos es aquel valor que se repite con mayor frecuencia.

Características de la moda

• La moda se puede calcular para cualquier escala de medición.


• El valor de la moda no se ve afectada por valores extremos.
• Si un conjunto de datos tiene una moda, se dice que es unimodal, si tiene dos modas se dice que
es bimodal y si tiene más de dos modas se dice que es polimodal.
• Se puede dar el caso en que un conjunto de datos no tenga moda.

Ejemplo 1
Los siguientes datos corresponden a una muestra de baterías cuyas lecturas de voltaje se presentan a
continuación:

9,84 9,89 9,98 9,99 10,00 10,00 10,05 10,12 10,26 25,00

Moda = 10, pues es el valor que más se repite.

Interpretación
La lectura de voltaje más frecuente es de 10 voltios.
La lectura de voltaje que se repite con mayor frecuencia es 10 voltios.

Ejemplo 2
Renacer S.A. es una empresa que fabrica hornos microondas. La gerencia encargó al jefe de control de
calidad informar cuál es el problema más frecuente encontrado en la fabricación de estos aparatos.
Para dar respuesta a la consulta, se tomó una muestra de equipos del área de reparaciones. Los
resultados se presentan en la siguiente tabla:

Problemas Número de hornos fi


Capacidad de descongelación 6
Velocidad de calentamiento 14
Cable de alimentación 3
Fuga de la microondas 8
Frecuencia de la microondas (MHz) 9
Potencia de microondas (kilowatts) 10

Con la información presentada, ¿qué problema se presenta con mayor frecuencia?


UPC MA444 Estadística 50
Medidas de posición o cuantiles

Se define así a un número real que divide a un conjunto de datos en dos partes con porcentajes
especificados debajo y sobre este valor. Para su cálculo, los datos deben estar previamente ordenados.

Cuartil
Divide al conjunto de datos en cuatro partes porcentualmente iguales. Se denotan Q1, Q2 y Q3 que son
los correspondientes percentiles 𝑃25 , 𝑃50 y 𝑃75 .

Decil
Divide al conjunto de datos en diez partes porcentualmente iguales. Hay nueve deciles D1, D2, …, D9
que son los correspondientes percentiles 𝑃10 , 𝑃20 , …, y 𝑃90 .

Percentil
Divide un conjunto de datos en 100 partes porcentualmente iguales. Dado un percentil Pk, este divide
el conjunto de datos en dos partes, la inferior que contiene el k% de datos y la superior que contiene
el (100 – k)% de datos.

El k% de las unidades elementales presentan El (100 – k)% de las unidades elementales


valores menores o iguales o al percentil k presentan valores mayores al percentil k

𝑃𝑘

Cálculo del percentil para datos no agrupados

Primero debe ordenarse los datos en orden creciente.

Luego, para hallar el percentil 𝑃𝑘 se sigue los siguientes pasos:

Calcular el valor de la posición que ocupa el percentil 𝑃𝑘 en la lista de datos ordenados que está
determinada por la siguiente expresión:

𝑘(𝑛 + 1)
𝑖= = 𝐸, 𝑑
100

Donde 𝐸 es la parte entera y 𝑑 es la parte decimal.

Luego,
𝑃𝑘 = 𝑋[𝐸] + 0, 𝑑(𝑋[𝐸+1] − 𝑋[𝐸] )
UPC MA444 Estadística 51
Ejemplo 1
Suponga que los promedios ponderados de una muestra de 12 ingenieros civiles egresados se
muestran a continuación:

14,5 15,5 15,5 16,1 16,2 16,4 16,5 17,0 17,1 17,3 17,5 17,6

a. Calcule e interprete el valor del D4.

b. Si se desea contratar a un egresado que pertenezca al quinto superior, ¿qué percentil debe calcular
y cuál es la nota mínima que debería de tener?
UPC MA444 Estadística 52
Ejemplo 2
Una muestra de 30 trabajadores de una plataforma petrolera marina formó parte de un ejercicio de
escape del área. Para ello se registraron los tiempos, en minutos, empleados en la evacuación.

31,5 32,5 32,5 33,4 33,9 34,0 35,6 35,6 35,9 35,9
36,3 36,4 36,9 37,0 37,3 37,3 37,4 37,5 38,0 38,9
39,2 39,3 39,4 39,7 40,2 40,3 41,5 42,4 42,8 44,5

a. ¿Cuál es el tiempo mínimo registrado por el 18% de trabajadores que emplearon más tiempo en
la evacuación de la plataforma?

b. ¿Cuál es tiempo máximo empleado por el 28% de trabajadores que emplearon menos tiempo en
la evacuación de la plataforma?
UPC MA444 Estadística 53
Ejemplo 3
Investigadores del Massachussets Institute of Technology (MIT) realizaron el 9 de abril de 1993 un
estudio sobre asteroides. Al observar 39 de estos asteroides con el telescopio Hiltner del observatorio
de MIT; se registró el número de exposiciones de imagen espectral.
Número de exposiciones de imagen espectral
1 1 1 1 1 1 1 1 1 2 2 2 2
2 2 2 2 2 2 2 2 2 3 3 3 3
3 3 3 3 3 3 3 3 4 4 4 4 6

a. A partir de los datos, elabore la tabla de frecuencias.

Título: ……………………………………………………………………………………………………………………………..
Número de exposiciones fi hi Fi Hi
1
2
3
4
6
Total

b. Indique el mínimo número de exposiciones obtenidos en el 15% de los asteroides con mayores
exposiciones. Además, indique a qué percentil corresponde.

c. Se desea categorizar a los asteroides según su número de exposiciones en categorías baja, media
y alta. ¿Cuáles serán los límites de las categorías si la categoría media contiene al 50% central de
la cantidad de asteroides?
UPC MA444 Estadística 54
Medidas de variabilidad o dispersión

Son aquellas que cuantifican que tan dispersos o concentrados se encuentran los datos respecto de
una medida de tendencia central. Los datos que están relativamente cercanos entre sí tienen bajas
medidas de variabilidad, mientras que los que están más alejados entre sí tienen medidas de variación
más grandes.

Varianza
• Es una medida del grado de dispersión o variación de los valores de una variable con respecto a su
media aritmética.
• Las unidades en las que queda expresada la varianza son unidades al cuadrado.
• Esta medida no tiene interpretación.
• La notación de la varianza de una muestra es 𝑠 2 , mientras que la de una población es 𝜎 2 .

Cálculo de la varianza

Varianza poblacional para datos simples

∑𝑁
𝑖=1(𝑥𝑖 − 𝜇)
2
𝜎2 =
𝑁

Varianza muestral para datos simples

∑𝑁
2𝑖=1(𝑥𝑖 − 𝑥̅ )
2
𝑠 =
𝑛−1

Varianza muestral para datos agrupados discretos

∑𝑘𝑖=1 𝑓𝑖 (𝑥𝑖 − 𝑥̅ )2
𝑠2 =
𝑛−1

Varianza muestral para datos agrupados continuos

2
∑𝑘𝑖=1 𝑓𝑖 (𝑥𝑖′ − 𝑥̅ )2
𝑠 =
𝑛−1

Desviación estándar
• La desviación estándar es la raíz cuadrada positiva de la varianza
• Se denota por  si la desviación estándar es poblacional (parámetro) y por s si la desviación estándar
es muestral (estadístico).
• Las unidades de la desviación estándar son las mismas unidades de la variable. Por ejemplo, si la
variable tiene unidades centímetros, entonces, la desviación estándar tendrá como unidades
centímetros.

Cálculo de la desviación estándar

Desviación estándar poblacional


UPC MA444 Estadística 55

∑𝑁 (𝑥𝑖 − 𝜇)2
𝜎 = √ 𝑖=1
𝑁

Desviación estándar muestral para datos simples

∑𝑛 (𝑥𝑖 − 𝑥̅ )2
𝑠 = √ 𝑖=1
𝑛−1

Desviación estándar muestral para datos agrupados discretos

∑𝑛 𝑓𝑖 (𝑥𝑖 − 𝑥̅ )2
𝑠 = √ 𝑖=1
𝑛−1

Desviación estándar muestral para datos agrupados continuos

∑𝑛 𝑓𝑖 (𝑥′𝑖 − 𝑥̅ )2
𝑠 = √ 𝑖=1
𝑛−1

Cálculo de la varianza usando una calculadora Casio


Para conocer cómo calcular la desviación estándar en una calculadora científica
Casio mire v : “C media, varianza y desviación estándar con
calculadora CASIO fx-570E ”.
https://www.youtube.com/watch?v=Ds4vXpZ5jOw

Ejemplo 1
Calcule la varianza y la desviación estándar para la cantidad de plomo en una muestra de agua potable
en miligramos por litro.

35 73 30 15 36 60 47 19 15 38 10 35 31 21 22 20
UPC MA444 Estadística 56
Ejemplo 2
Calcule la varianza y desviación estándar del número de accidentes automovilísticos en una muestra
de 100 días.

Número de accidentes automovilísticos 0 1 2 3 4


fi 10 15 30 35 10

Ejemplo 3
Calcule la varianza y desviación estándar de los tiempos de exposición, en minutos, de un metal a una
sustancia química. Los resultados de una muestra de 66 reacciones son las siguientes:

Intervalos fi Marca de clase


[15,2 – 17,2] 12
]17,2 – 19,2] 13
]19,2 – 21,2] 20
]21,2 – 23,2] 16
]23,2 – 25,2] 5
Total 66

Calcule la varianza y desviación estándar.


UPC MA444 Estadística 57
Coeficiente de variación
Las medidas de variación estudiadas son medidas de variación absolutas pues estas se expresan en las
mismas unidades que la variable original (excepto la varianza que se expresa en unidades al cuadrado).

El coeficiente de variación proporciona una estimación de la magnitud de las desviaciones con respecto
a la magnitud de la media.

El coeficiente de variación poblacional es un parámetro y se calcula por la siguiente fórmula:

𝜎
𝐶𝑉 = × 100%
𝜇

El coeficiente de variación muestral es un estadístico y se calcula por la siguiente fórmula:

𝑠
𝐶𝑉 = × 100%
𝑥̅

Características del coeficiente de variación

• Es una medida de dispersión relativa libre de unidades.


• Es útil al comparar la variabilidad de dos o más series de datos que se expresan en distintas o
iguales unidades, pero difieren a tal punto que una comparación directa de las respectivas
desviaciones estándar no es muy útil, por ejemplo, cuando las medias están muy distantes.
• El coeficiente de variación se calcula en variables medidas en escala de razón.

Ejemplo 1
A continuación, se presentan los tiempos de transmisión de un archivo, en segundos, evaluados en
una muestra de empresas que adoptaron la tecnología WAN y la tecnología LAN bajo condiciones
similares.

Tiempo de transmisión de un archivo con tecnología WAN


138 126 125 124 119 119 137 110 119 155 123 124 126 126 129

Distribución de empresas según tiempo de transmisión de un archivo con tecnología LAN


Tiempo de transmisión Frecuencia
[108 111] 3
]111 114] 35
]114 117] 66
]117 120] 57
]120 123] 29
]123 126] 16
Fuente: Consultora TEC
UPC MA444 Estadística 58
Determine para qué tipo de tecnología utilizada los tiempos de transmisión de datos son más
homogéneos. Justifique numéricamente su respuesta.

Medida de resumen WAN LAN

Promedio

Desviación estándar

Coeficiente de variación

Interpretación
La tecnología que presenta los tiempos de transmisión de datos más homogéneos es ……………
UPC MA444 Estadística 59
Ejercicios propuestos

13.Electro, empresa dedicada a la venta de artefactos electrónicos para el hogar cuenta con tres
tiendas A, B y C. Los últimos informes indican que las ventas de cierto producto electrónico han
descendido. El gerente, con el fin de enfrentar el problema, ha determinado que es necesario un
estudio estadístico de las ventas semanales de este producto, en miles de soles. A continuación, se
presentan los resultados obtenidos para cada tienda:

Distribución de semanas según ventas de cierto producto electrónico en la tienda A


Ventas semanales, en miles de soles Número de semanas
[100 – 200] 5
]200 – 300] 14
]300 – 400] 21
]400 – 500] 7
]500 – 600] 3
Total 50
Fuente: Empresa Electro

Distribución de semanas según ventas de cierto producto electrónico en la tienda B


Ventas semanales, en miles de soles Número de semanas
20 2
40 8
60 25
80 20
100 8
Total 63
Fuente: Empresa Electro

Ventas semanales, en miles de soles, de cierto producto electrónico en la tienda C


120 200 100 50 45 120 100 100 90 75 100 210 100 50 120

a. Calcule la media y la varianza de las ventas semanales en las tiendas A, B y C.

Medida de resumen Tienda A Tienda B Tienda C

Media

Desviación estándar

b. Determine en cuál de las tiendas las ventas realizadas son más homogéneas.

Tienda A Tienda B Tienda C


UPC MA444 Estadística 60
14.En el medio local hay dos plantas (planta 1 y planta 2) que se dedican a la fabricación de barras de
acero para la construcción. Las empresas proveedoras de barras de acero para la construcción, que
abastecen al mercado constructor, desean averiguar acerca de la media y la desviación estándar de
la resistencia a la tracción.

Para ello, se tomaron muestras aleatorias en ambas plantas y la información registrada acerca de
la resistencia a la tracción (en kg/cm2) se muestra en las siguientes tablas:

Distribución de barras de acero según resistencia a la tracción – Planta 1


Resistencia a la tracción – Planta 1 fi
[69,220 – 70,436] 14
]70,436 – 71,652] 5
]71,652 – 72,868] 6
]72,868 – 74,084] 8
]74,084 – 75,300] 7
]75,300 – 76,516] 17
]76,516 – 77,732] 5
Total 62
Fuente: Estudio de barras de acero de planta 1 y 2

Estadísticas descriptivas: Resistencia a la tracción – Planta 2


Tamaño de muestra 62
Media muestral 64,52
Desviación estándar muestral 2,983

Realice el análisis adecuado para la dispersión y responda ¿qué planta es más heterogénea en las
resistencias a la tracción? Sustente su respuesta estadísticamente.

Medida de resumen Planta 1 Planta 2

Promedio

Desviación estándar

Coeficiente de variación

15.En una reciente entrevista, el presidente de la Confederación Nacional de Instituciones


Empresariales Privadas (Confiep), sostuvo que, en el país y a largo plazo, la mejor forma de prevenir
los desastres naturales es la construcción de represas y reservorios.

Debido a la previsión de falta de agua, la Confiep ha encargado realizar un nuevo estudio de


prefactibilidad a cargo de profesionales de ingeniería civil, en zonas cercanas a los ríos de la costa
norte del país, Tumbes, Piura, y Lambayeque, para decidir la construcción de una represa.

La información recogida se presenta a continuación:


UPC MA444 Estadística 61
Zonas Tipo de estructura Ríos Caudal del río (m3/segundo)
1 Cimientos Tumbes 13,3
2 Cimientos Tumbes 20,9
3 Cimientos Tumbes 35,7
4 Cimientos Tumbes 41,9
5 Cimientos Tumbes 42,2
6 Cimientos Tumbes 48,0
7 Cimientos Tumbes 49,7
8 Cimientos Tumbes 52,4
9 Cimientos Tumbes 52,4
10 Cimientos Tumbes 56,3
11 Cimientos Tumbes 62,5
12 Cimientos Piura 38,1
13 Cimientos Piura 40,3
14 Cimientos Piura 49,8
15 Excavaciones Piura 56,2
16 Excavaciones Piura 57,2
17 Excavaciones Piura 61,3
18 Excavaciones Piura 61,3
19 Excavaciones Piura 71,1
20 Excavaciones Piura 77,5
21 Excavaciones Lambayeque 34,4
22 Excavaciones Lambayeque 42,8
23 Excavaciones Lambayeque 42,8
24 Terraplenes Lambayeque 44,5
25 Terraplenes Lambayeque 48,1
26 Terraplenes Lambayeque 49,4
27 Terraplenes Lambayeque 54,3

a. Según los especialistas un punto muy importante a considerar al momento de diseñar la


ubicación de las represas es evaluar el caudal (m3/segundo) en cada uno de los ríos (Tumbes,
Piura y Lambayeque), porque si el caudal es muy bajo la represa no almacenaría la cantidad de
agua esperada para su posterior distribución. Por ello, el gerente de la empresa decidirá
construir la represa en aquella zona, que concentre los caudales del río en los valores más
altos. Según los resultados, ¿Cuál sería la recomendación de ustedes al gerente de la empresa?

b. Ingenieros especialistas indicaron, que se debe realizar la construcción de la represa en aquella


zona que presente menor variabilidad posible en el caudal del río. Según la información
analizada, ¿en cuál de los ríos es más propicia la construcción de la represa?

16.Las represas constituyen una de las principales causas directas e indirectas de contaminación
ambiental. Una de estas causas es la filtración de sustancias contaminantes originando el
debilitamiento de la densidad de la superficie en la cual está construida la represa. Los resultados
que Andino S.A. obtuvo sobre las densidades de los terrenos, en gr/cm3 en represas calificadas con
impacto ambiental regular y en represas con impacto ambiental fuerte se presentan a continuación:

Densidad del terreno, en gr/cm3, en represas con impacto ambiental regular


15,2 20,7 16,6 22,7 35,6 17,1 25,2 26,6 10,4 23,6
UPC MA444 Estadística 62

Distribución de represas con impacto ambiental fuerte según


densidad del terreno, en gr/cm3
12
10
Cantidad de represas 10

8 7 7

6 5

4 3
2
2 1

0
5.5 9.8 14.1 18.4 22.7 27 31.3 35.6

Fuente: Andino S.A. Densidad del terreno

Para que una represa siga funcionando, la Confiep establece el cumplimiento de dos condiciones:

• Condición 1: La densidad promedio del terreno con impacto ambiental (regular o fuerte) donde
se ubica la represa debe ser por lo menos 17,5 gr/cm3 para que ésta no se derrumbe.

• Condición 2: La densidad del terreno donde se ubica la represa con impacto ambiental (regular
o fuerte) debe tener una variabilidad relativa de a lo más 34%.

Verifique las condiciones de tal manera que pueda presentar un informe que ayude a identificar
qué tipo de represa (con impacto ambiental fuerte o regular) está habilitada para su normal
funcionamiento.
UPC MA444 Estadística 63
Medida de asimetría

Coeficiente de asimetría de Pearson

Mide si los datos aparecen ubicados simétricamente o no respecto de la media. El coeficiente de


asimetría para datos simples o agrupados se calcula con la siguiente fórmula:

𝑥̄ − 𝑀𝑒𝑑𝑖𝑎𝑛𝑎
𝐴𝑠 = 3 ( )
𝑠

Si el coeficiente de simetría As es:

Ejemplo 1

Complete los siguientes textos:

• Si un grupo de datos tiene un coeficiente de asimetría negativo, esto significa que hay una
v ………

• Si un grupo de datos tiene un coeficiente de asimetría positivo, esto significa que hay una
v ………

• En un país como el Perú, los sueldos de las personas seguramente tienen un coeficiente de
í …………, q …………

• En un examen de Estadística, los tiempos que toman los alumnos en resolverlo seguramente tienen
f í ……………, q …………………

Ejemplo 2
UPC MA444 Estadística 64
Comasa es una empresa que produce artículos pesados de acero y dispone de un equipo especializado
de operarios que se capacitan constantemente. El último año se ha observado un aumento en el
número de accidentes, incrementándose así el costo de atención inmediata. Con el propósito de
implementar estrategias de prevención de accidentes, se analizarán los costos de la planta de
producción de Lima Sur. A continuación, se presenta la información, en miles de soles:

8 9 10 11 11 12 12 13 13 13 13 14
14 15 15 16 17 17 18 18 19 19 20 21
22 23 24 25 25 26 27 28 28 29 30

a. ¿Qué forma presenta la distribución de esta variable? Presente la gráfica.

b. Analizando la forma de la distribución, ¿es preocupante para la empresa?


UPC MA444 Estadística 65
Ejercicios propuestos

17.Covisa es una empresa de construcción civil que compra ladrillos al proveedor Fax S.A. Para
continuar con el proveedor o cambiarlo, ha decidido realizar un análisis de la resistencia transversal
de los ladrillos, en Mn/m2.

A continuación, se presentan los resultados de una muestra de 40 ladrillos fabricados por el


proveedor:

3 4 4 4 5 5 6 6 6 7
8 8 8 8 8 9 9 9 10 11
11 11 11 11 11 12 12 12 12 13
13 13 14 15 15 17 17 18 19 20

¿Qué forma presenta la distribución de esta variable? Presente la gráfica.

18.Zinder y Crisis (1990), presentaron un algoritmo híbrido para resolver un problema de


programación matemática polinomial cero-uno. El algoritmo incorpora una combinación de
conceptos pseudo booleanos y procedimientos de enumeración implícitos probados y
comprobados.

Se resolvieron 52 problemas al azar utilizando el algoritmo híbrido; los tiempos de resolución


(tiempos de CPU en segundos) se listan en la siguiente tabla.

0,045 0,036 0,045 0,049 0,064 0,07 0,079 0,088 0,091 0,118 0,13 0,136
0,136 0,136 0,145 0,179 0,182 0,182 0,194 0,209 0,209 0,227 0,242 0,258
0,258 0,258 0,291 0,327 0,333 0,336 0,361 0,379 0,394 0,412 0,445 0,506
0,554 0,567 0,579 0,600 0,67 0,912 1,055 1,07 1,267 1,639 1,894 3,046
3,888 3,985 4,170 8,788

Se desea categorizar a los problemas según sus tiempos de resolución en categorías normal, media
y alta ¿Cuáles serán los límites de cada una de ellas si la categoría media contiene al 50% central de
la cantidad de problemas?

19.Los ingresos mensuales de una muestra de pequeños comerciantes se tabularon en una distribución
de frecuencias simétrica de cinco intervalos de igual amplitud resultando que el ingreso mínimo es
de 125 dólares y la marca de clase del cuarto intervalo es de 300 dólares. Si el 8% de los ingresos
son menores que 175 dólares y el 70% de los ingresos son menores a 275 dólares.

a. Determine las frecuencias relativas de cada intervalo.


b. ¿Qué porcentaje de ingresos son superiores a 285 dólares?

20.A continuación, se presenta al número de camiones que atendió la planta de Lurín en cada obra
con el objetivo de evaluar indicadores en las atenciones que realiza la planta de Lurín.
UPC MA444 Estadística 66

Distribución del número de obras según número de camiones enviados


15
16
14
11
12
Número de obras
9
10
7
8 6
6 4
3
4
2
0
0 1 2 3 4 5 6 7 8
Número de camiones
Fuente: Planta de Lurín

a. Calcule las medidas de tendencia central e interprete los resultados.


b. ¿Qué forma presenta la distribución de esta variable?

21.Cuando se diseña un puente los ingenieros deben determinar la tensión que el concreto puede
soportar. En lugar de probar cada pulgada cúbica de concreto para determinar su capacidad de
resistencia, los ingenieros toman una muestra, la prueban y llegan a la conclusión sobre qué tanta
tensión, en promedio, puede resistir este tipo de concreto. A continuación, se presenta la tensión
(en kg/cm2) obtenidos de una muestra de 30 bloques de concreto que se utilizarán para construir
un puente.

1,2 2,1 2,2 2,2 2,5 2,5 2,6 2,6 2,7 2,8
3,0 3,0 3,2 3,2 3,2 3,4 3,4 3,5 3,5 3,6
3,6 3,6 3,6 3,7 3,8 3,9 3,9 4,0 4,0 4,0

a. Calcule e interprete el valor de las siguientes medidas de posición: P35, D8 y Q3


b. Calcule las medidas de tendencia central e interprete los resultados.
c. ¿Qué forma presenta la distribución de esta variable? Presente la gráfica.
UPC MA444 Estadística 67
Caso: Industria alimentaria

Multi Cereales S.R.L. es una empresa dedicada a la elaboración de cereales para


desayunos. La empresa ha adquirido una nueva máquina, la que permitirá
elevar la producción de 1200 a 1500 cajas por hora. Según las especificaciones
técnicas del producto, esta caja debe tener un peso promedio de 500 gramos.
Para monitorear el proceso de llenado, el inspector seleccionó una muestra
aleatoria de 20 cajas de avena en hojuelas del almacén cuyos pesos (en gramos)
se muestran a continuación:

471,13 472,19 476,25 477,32 478,52 481,02 490,65 496,66 497,66 498,40
502,77 504,44 503,78 506,14 512,88 515,06 516,23 516,89 523,45 523,78

Situación 1
Determinar si la nueva máquina llena las cajas de avena en hojuelas de acuerdo con la especificación
técnica.

La especificación técnica indica que el 90% central de las cajas de avena en hojuelas deben tener un
peso entre 480 y 520 gramos. El gerente de control de calidad sospecha que el peso de la caja no está
cumpliendo con la especificación técnica, y de ser así, significaría que la nueva máquina, al momento
de ser instalada, no fue calibrada correctamente.

¿La nueva máquina deberá ser recalibrada?


¿Dónde se concentran los pesos de las cajas de avena en hojuelas, en valores altos o en valores bajos?

Cálculo Análisis Argumentación


El estudiante muestra los El estudiante indica con que El estudiante redacta la decisión
cálculos realizados para dar valor calculado responde el que tomará a partir del resultado
respuesta al problema. problema. del análisis.

Situación 2
Determinar qué proceso de producción tiene mayor variabilidad.

Una de las razones de la falta de calidad en un proceso productivo es la alta variabilidad en el


cumplimiento de las especificaciones técnicas, por lo que el gerente de control de calidad desea
comparar la variabilidad del proceso de llenado de las cajas de avena en hojuelas con la variabilidad
del porcentaje de grasa que deben tener las hojuelas de avena. El gerente ordenará una revisión
completa de aquel proceso que presente mayor variabilidad. ¿Cuál de los dos procesos deberá ser
revisado completamente?

Nota: Para el caso del proceso de llenado de la caja utilice los cálculos hechos para la situación 1.

Con los datos de la situación 1, el gerente obtuvo el siguiente gráfico:


UPC MA444 Estadística 68

Distribución de cajas de avena en hojuelas según porcentaje de grasa


8
7
7
6
5
Número de cajas
5
4
3
3
2 2
2
1
1
0
1.89 3.37 4.85 6.33 7.81 9.29 10.77 12.25 13.73 15.21
Porcentaje de grasa
Fuente: Multi Cereales S.R.L.

Interpretación Representación Cálculo Análisis Argumentación


El estudiante El estudiante indica El estudiante El estudiante El estudiante redacta
redacta el la variable y que muestra los indica con que la decisión que
problema con un herramienta cálculos valor calculado tomará a partir del
lenguaje sencillo, estadística utilizará realizados para responde el resultado del análisis.
como pregunta u en la solución del dar respuesta problema.
objetivo. problema. al problema.
UPC MA444 Estadística 69

Unidad 2. Probabilidad y variable aleatoria

Logro
Al terminar la unidad, el estudiante utiliza las distribuciones de probabilidad para modelar variables
dentro de situaciones de incertidumbre en contextos reales

Temario
• Probabilidad: concepto. Experimento aleatorio, espacio muestral y evento
• Operaciones con eventos
• Probabilidad condicional
• Probabilidad total. Teorema de Bayes.
• Eventos independientes
• Variable aleatoria. Valor esperado y desviación estándar
• Distribución de probabilidad de una variable discreta: binomial y Poisson
• Distribución de densidad de una variable continua: normal y exponencial

Bibliografía
• Introducción a la Probabilidad y Estadística/Mendenhall, Beaver, Beaver. Capítulo 4.1 (pág. 124-
126) Capítulo 4.5 (pág. 139-143)
• Introducción a la Probabilidad y Estadística/Mendenhall, Beaver, Beaver. Capítulo 4.7 (pág. 152-
166)
• Introducción a la Probabilidad y Estadística/Mendenhall, Beaver, Beaver. Capítulo 6.1 (pág. 211)
• Introducción a la Probabilidad y Estadística/Mendenhall, Beaver, Beaver. Capítulo 6.1 (pág. 213)
UPC MA444 Estadística 70
Definiciones

Experimento aleatorio
Es una operación cuyo resultado no se puede predecir con certeza y que se realiza bajo las siguientes
condiciones:

• Se puede repetir indefinidamente donde los resultados dependen del azar, por lo que no se pueden
predecir con certeza.
• Se puede describir el conjunto de todos los resultados posibles.
• Cuando se repite un gran número de veces, aparece un modelo definido de regularidad.

Un experimento aleatorio se denota por .

Ejemplo 1

1: Lanzar un dado.


2 : Se lanzan dos monedas y se registra el resultado obtenido.
3 : Seleccionar un dispositivo electrónico y registrar si es defectuoso o no.
4 : Observar el tiempo de vida de un artefacto eléctrico.

Espacio muestral
Es el conjunto de todos los posibles resultados de un experimento aleatorio. Cada elemento de este
conjunto se le denomina punto muestral y se le denota con 𝑤.

Un espacio muestral se denota por .

Ejemplo 2

1 = {1, 2, 3, 4, 5, 6}
2 = {𝑐𝑐, 𝑐𝑠, 𝑠𝑐, 𝑠𝑠}
3 = {𝑑𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑜, 𝑛𝑜 𝑑𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑜}
4 = {𝑡/𝑡 ≥ 0}

Evento
Es todo subconjunto del espacio muestral y representa cierta característica de ella. Se denotan
mediante las letras mayúscula de nuestro alfabeto, como por ejemplo A, B o C.

Evento simple
Es un evento formado por un solo punto muestral. No se puede descomponer.

Ejemplo 3

Si 1 = {1, 2, 3, 4, 5, 6}, entonces {1}, {2}, {3}, {4},{ 5}, {6} son eventos simples.
Si 2 = {cc, cs, sc, ss}, entonces {cc}, {cs}, {sc}, {ss} son eventos simples.
Si 3 = {defectuoso, no defectuoso}, entonces {defectuoso} y {no defectuoso} son eventos simples.
UPC MA444 Estadística 71
Evento compuesto
Es un evento formado por dos o más puntos muestrales.

Ejemplo 4

Si 1= {1, 2, 3, 4, 5, 6}, entonces A = {1, 3, 5} o A= obtener un número impar es un evento compuesto.

Si 2= {cc, cs, sc, ss}, entonces B= {cs, sc} o B= obtener valores diferentes en las caras superiores de las
dos monedas es un evento compuesto.

Operaciones con eventos


Intersección
La intersección de dos eventos A y B es el evento que ocurre si tanto A como B ocurren en una sola
realización del experimento.

La intersección de los eventos A y B se denota mediante el símbolo 𝐴 ∩ 𝐵.

Unión
La unión de dos eventos 𝐴 y 𝐵 es el evento que ocurre si A o B, o ambos ocurren en una sola realización
del experimento.

La unión de dichos eventos se denota mediante el símbolo 𝐴 ∪ 𝐵

Eventos mutuamente excluyentes


Son aquellos eventos donde la ocurrencia de uno de ellos excluye la ocurrencia del otro. Esto es, no
pueden ocurrir los dos a la vez.

Ejemplo 1

En el experimento : lanzamiento de un dado.

Sean los eventos:

𝐴: = Resulta un número menor que 5


𝐵: = Resulta un número par

a. Obtenga la intersección y la unión de los eventos 𝐴 y 𝐵.


b. ¿Son los eventos 𝐴 y 𝐵 mutuamente excluyentes?

Solución

a. Obtenga la intersección y la unión de los eventos 𝐴 y 𝐵.


UPC MA444 Estadística 72
Solución
El espacio muestral  es:
 = {1, 2, 3, 4, 5, 6}
Los eventos 𝐴 y 𝐵 son:

𝐴 = {1, 2, 3, 4}

𝐵 = {2, 4, 6}

La intersección de los eventos es:


𝐴 ∩ 𝐵 = {2,4}

La unión de los eventos es:


𝐴 ∪ 𝐵 = {1, 2, 3, 4, 6}

b. ¿Son los eventos A y B mutuamente excluyentes?

Solución

Como 𝐴 ∩ 𝐵 ≠ ∅, los eventos no son mutuamente excluyentes.

Ejemplo 2

Sea el experimento : lanzamiento de dos dados

El espacio muestral es:

 = {(1,1), (1,2)(1,3), … , (6,1), (6,2), (6,3), (6,4), (6,5), (6,6)}

Se definen los eventos necesarios:

𝐴: = obtener una suma de seis.

𝐴: = {(1,5), (5,1), (2,4), (4,2), (3,3)}

𝐵: = obtener una suma de cinco.

𝐵 = {(1,4), (4,1), (2,3), (3,2)}

Estos eventos A y B son mutuamente excluyentes porque 𝐴 ∩ 𝐵 = ∅; es decir, la intersección de los


eventos no tiene elementos comunes.
UPC MA444 Estadística 73
Ejemplo 3

Se realiza el siguiente experimento aleatorio : lanzamiento de dos dados de seis caras.

a. Determine el espacio muestral.

b. Sean los eventos: A: suma de los dados es ocho; B: suma de los dados mayor a seis y C: suma de
los dados menor a nueve. Determine los elementos de los eventos.

c. Obtenga la intersección de los eventos A y B, la unión de los eventos B y C ¿Son los eventos A y C
mutuamente excluyentes?
UPC MA444 Estadística 74
Probabilidad
Sea  un experimento aleatorio,  el espacio muestral asociado y sea 𝐴 un evento definido en el
espacio muestral .

La probabilidad del evento 𝐴 es la medida del grado de posibilidad de ocurrencia del evento 𝐴 cuando
se realiza una vez el experimento.

La probabilidad de un evento 𝐴 es un valor numérico y se denota por 𝑃(𝐴).

Axiomas de probabilidad

• 0 ≤ 𝑃(𝐴) ≤ 1
• 𝑃() = 1
• Sean los eventos {𝐴𝑖 }, 𝐴𝑖 ∈ , 𝑖 = 1, 2, 3, … , 𝑛 una sucesión de eventos mutuamente excluyentes,
entonces:
𝑛

𝑃(𝐴1 ∪ 𝐴2 ∪ 𝐴3 ∪ … ∪ 𝐴𝑛 ) = ∑ 𝑃(𝐴𝑖 )
𝑖=1

Además,

• Si 𝑃(𝐴) tiende a 0 es poco probable que el evento 𝐴 ocurra.


• Si 𝑃(𝐴) tiende a 1 es un muy probable que el evento 𝐴 ocurra.
• En un espacio muestral finito, la suma de las probabilidades de todos los eventos simples 𝐸𝑖 es igual
a 1.
𝑛

∑ 𝑃(𝐸𝑖 ) = 1,  𝑖 = 1, 2, 3, … , 𝑘
𝑖=1

Definición clásica de la probabilidad de un evento

Sea un experimento aleatorio cuyo correspondiente espacio muestral  está formado por un número
n finito de posibles resultados distintos y con la misma probabilidad de ocurrir, entonces definimos la
probabilidad de un evento 𝐴 como sigue:

𝑛(𝐴) 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑎𝑙 𝑒𝑣𝑒𝑛𝑡𝑜 𝐴


𝑃(𝐴) = =
𝑛() 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑜𝑠 𝑡𝑜𝑡𝑎𝑙𝑒𝑠
UPC MA444 Estadística 75
Ejemplo 1

Complete el siguiente cuadro.

Experimento aleatorio Espacio muestral Evento Probabilidad


Se lanza un dado, calcule la
probabilidad de que salga 3 ó 5.

𝑛(𝐴)
 = {1, 2, 3, 4, 5, 6} A = 3, 5 𝑃(𝐴) = =
𝑛()

Se lanzan dos dados, calcule la


probabilidad de que la suma sea
mayor a 7.

 = {(1,1); (1,2); 𝑛(𝐴)


A={ } 𝑃(𝐴) = =
(1,3); ….; (6,6)} 𝑛()

Se saca una bola de una urna con


tres bojas rojas y cuatro negras,
calcule la probabilidad de que sea
roja.
𝑛(𝐴)
={ } A={ } 𝑃(𝐴) = =
𝑛()
UPC MA444 Estadística 76
Eventos complementarios

El complemento de un evento A es el evento en el que A no ocurre, es decir, el evento formado por


todos los eventos simples que no están en el evento A. El complemento del evento A se denota
mediante el símbolo Ac.

𝐴 ∪ 𝐴𝑐 = 

Ac
A

La suma de las probabilidades complementarias es igual a 1.

𝑃(𝐴) + 𝑃(𝐴𝑐 ) = 1

Regla aditiva de la probabilidad

La probabilidad de la unión de los eventos A y B es la suma de las probabilidades de los eventos A y B


menos la probabilidad de la intersección de los eventos A y B:

𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵)

A B

A∩Bc A∩B Ac∩B

AC∩BC

Regla aditiva para eventos mutuamente excluyentes

Si dos eventos A y B son mutuamente excluyentes, la probabilidad de la unión de A y B es igual a la


suma de las probabilidades de A y B.

𝑃 (𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵)

Ejemplo 1
UPC MA444 Estadística 77
MEC, es una organización orientada a suministrar productos, servicios y desarrollo de soluciones de
ingeniería aplicada. El gerente de esta organización considera que la probabilidad de que los accidentes
en transmisiones y ejes hayan sido ocasionados por las conexiones eléctricas es 0,24, por falla
mecánica es 0,18 y por conexiones eléctricas o falla mecánica es 0,39. Si se selecciona al azar un
accidente producido en transmisiones y ejes.

a. Determine la probabilidad que se haya producido por ambos tipos de falla.

Solución

Definamos los eventos necesarios.

𝐸: = {Accidentes por conexiones eléctricas} 𝑃(𝐸) = 0,24


𝑀: = {Accidentes por falla mecánica} 𝑃(𝑀) = 0,18

Además, se sabe que:


𝑃(𝐸 ∪ 𝑀) = 0,39

Usando la regla aditiva de la probabilidad, se tiene que:

𝑃(𝐸 ∪ 𝑀) = 𝑃(𝐸) + 𝑃(𝑀) − 𝑃(𝐸 ∩ 𝑀)

Reemplazando valores:

0,39 = 0,24 + 0,18 − 𝑃(𝐸𝑀)

𝑃(𝐸 ∩ 𝑀) = 0,03

E M

0,21 0,03 0,15

0,61

La probabilidad que se haya producido por ambos tipos de falla es 𝑃(𝐸 ∩ 𝑀) = 0,03.

b. ¿Cuál es la probabilidad de que el accidente se haya producido por un solo tipo de falla?

Solución

La probabilidad pedida es:

𝑃(𝐸 ∩ 𝑀𝑐 ) = 𝑃(𝐸) − 𝑃(𝐸 ∩ 𝑀) = 0,24 − 0,03 = 0,21

𝑃(𝐸 𝑐 ∩ 𝑀) = 𝑃(𝑀) − 𝑃(𝐸 ∩ 𝑀) = 0,18 − 0,03 = 0,15


UPC MA444 Estadística 78
𝑐 𝑐
𝑃(𝐸 ∩ 𝑀 ) + 𝑃(𝐸 ∩ 𝑀) = 0,21 + 0,15 = 0,36

E M

0,21 0,03 0,15

0,61

Ejemplo 2

Dos vendedores de seguros trabajan en la empresa Pacifico. La probabilidad de que el vendedor más
viejo llegue tarde cierto día es 0,20, de que el vendedor más joven llegue tarde cierto día es 0,15 y que
ambos lleguen tarde es 0,09.

a. Determine la probabilidad de que al menos un vendedor llegue tarde al trabajo cierto día.

Solución

Definamos los eventos necesarios:

𝐴: = el vendedor más viejo llega tarde cierto día 𝑃(𝐴) = 0,20


𝐵: = el vendedor más joven llega tarde cierto día 𝑃(𝐵) = 0,15

La probabilidad de que ambos lleguen tarde cierto día es 0,09, luego:

𝑃(𝐴 ∩ 𝐵) = 0,09

A B

0,11 0,09 0,06

0,74
6
La probabilidad de que al menos uno llegue tarde cierto día es la probabilidad de la unión de A con
B, por lo tanto:
𝑃(𝐴 ∪ 𝐵) = 0,20 + 0,15 − 0,09 = 0,26

b. Determine la probabilidad que solo un vendedor llegue tarde al trabajo cierto día.
UPC MA444 Estadística 79

Solución
La probabilidad pedida es:
𝑃((𝐴 ∩ 𝐵𝑐 ) ∪ (𝐴𝑐 ∩ 𝐵))

A B

0,11 0,09 0,06

Como los eventos 𝐴 ∩ 𝐵𝑐 y 𝐴𝑐 ∩ 𝐵 son mutuamente excluyentes, entonces:

𝑃((𝐴 ∩ 𝐵𝑐 ) ∪ (𝐴𝑐 ∩ 𝐵)) = 𝑃(𝐴 ∩ 𝐵𝑐 ) + 𝑃(𝐴𝑐 ∩ 𝐵) = 0,11 + 0,06 = 0,17

c. Determine la probabilidad que ninguno llegue tarde al trabajo cierto día.


Solución
La probabilidad pedida es:

𝑃(𝐴𝑐 ∩ 𝐵𝑐 ) = 1 − 𝑃(𝐴 ∩ 𝐵) = 1 − 0,09 = 0,91

A B

0,11 0,09 0,06

Ejemplo 3

Después de una política de mejora de la calidad de la producción de Latex, tanto en el área de llenado
como el de sellado, los trabajadores fueron sensibilizados para realizar sus labores de producción de
la mejor manera y así disminuir los productos defectuosos en la producción. Para corroborarlo se toma
una muestra de 80 productos, encontrándose que 25 presentan defectos en el llenado, 32 presentan
defectos en el sellado y 30 no presentaban defectos. Si se selecciona un producto al azar.

a. Determine la probabilidad de que se hayan producido ambos tipos de defectos.


UPC MA444 Estadística 80

b. ¿Cuál es la probabilidad de que se haya producido solo uno de los tipos de defectos?

c. ¿Los eventos defecto en el sellado y defecto en llenado son mutuamente excluyentes?


UPC MA444 Estadística 81
Principios fundamentales de conteo

Comprende un conjunto de procedimientos que permiten determinar el número de resultados de un


suceso o experimento sin necesidad de utilizar una enumeración e identificación directa de todos los
posibles resultados de dicho suceso o experimento.

Analicemos los siguientes experimentos aleatorios:

1: lanzar un dado y registrar el número de la cara superior.

1 = {1, 2, 3, 4, 5, 6}

Observamos que es fácil listar y contar los posibles resultados.

2: números pares de tres cifras que se pueden formar con los dígitos 1, 2, 3, 4, 5, 6, 7, 8, 9

2 = {174, 148, 184, 198, 194, 144, … }

Observamos que ya no es fácil listar y contar los posibles resultados, ante esta situación es necesario
utilizar técnicas que nos faciliten el conteo de estos posibles resultados.

Principio de la multiplicación
Si un procedimiento A puede realizarse de 𝑚 maneras y otro procedimiento B puede realizarse de 𝑛
maneras, entonces los dos procedimientos A y B (uno seguido del otro) ocurren de 𝑚 × 𝑛 maneras o
formas.

Ejemplo 1

Un ensamblador de computadoras tiene cuatro microprocesadores de diferentes marcas y tres


memorias de diferentes marcas ¿de cuántas maneras posibles puede ensamblar una computadora?
UPC MA444 Estadística 82
Principio de la adición
Si un procedimiento A puede realizarse de 𝑚 maneras y otro procedimiento B puede realizarse de 𝑛
maneras, y si no es posible que ambos se realicen en forma simultánea entonces los dos
procedimientos A o B ocurren de 𝑚 + 𝑛 maneras o formas.

Ejemplo 1

La biblioteca de la UPC tiene en uno de sus estantes 40 libros de Cálculo y 50 de Estadística. Si un


estudiante desea estudiar uno de estos dos temas. ¿De cuántas formas puede realizar la elección de
los libros?

Solución
Definamos los eventos:

𝐶: = elegir un libro de Cálculo 𝑛(𝐶) = 40


𝐸: = elegir un libro de Estadística 𝑛(𝐸) = 50
𝐿: = elegir un libro

Por la regla de la adición:

𝑛(𝐿) = 𝑛(𝐶) + 𝑛(𝐸) = 40 + 50 = 90

Se puede realizar la elección de los libros de 90 maneras diferentes.

Ejemplo 2

Un ingeniero de telecomunicaciones está proyectando un viaje a una provincia para instalar una
antena parabólica, debe decidir el viaje por bus o por tren. Si hay tres rutas para el bus y dos para el
tren ¿de cuántas maneras posibles puede realizar el viaje?
UPC MA444 Estadística 83
Técnica de conteo: Combinación

Es una técnica que permite contar el número de maneras de seleccionar o elegir aleatoriamente 𝑟
elementos de un total de 𝑛, sin considerar el orden de selección. Está dado por:

𝑛!
𝐶𝑟𝑛 =
𝑟! (𝑛 − 𝑟)!

Ejemplo 1

Una empresa ha decidido que, para el trabajo remoto de su personal, tres de los 15 trabajadores del
área de Recursos Humanos deben asistir de manera presencial a la empresa, ¿de cuántas maneras
puede seleccionar al grupo?

Solución
Definamos el evento necesario:

𝐶: = elegir tres de los de los 15 trabajadores del área de Recursos Humanos para que asistan de manera
presencial a la empresa.

Como no implica orden, entonces:

15!
𝑛(𝐶) = 𝐶315 = = 455
3! (15 − 3)!

Se puede realizar la elección de los libros de 90 maneras diferentes.

Ejemplo 2

Una planta de producción emplea 20 trabajadores en el turno mañana, 15 trabajadores en el turno


tarde y 10 en el turno de noche. Un consultor de control de calidad selecciona a seis trabajadores de
un turno para ser entrevistados. ¿De cuántas formas se puede realizar la selección?

Solución

Definamos el evento necesario:

𝐴: = elegir seis trabajadores de un turno para ser entrevistados.

Como no implica orden, entonces:

𝑛(𝐴) = 𝐶620 + 𝐶615 + 𝐶610 = 43 975

Ejemplo 2

Una empresa fabricante de electrodomésticos cuenta en su almacén de productos terminados con un


lote de diez refrigeradoras, de las cuales tres de ellas presentan imperfecciones en la pintura. Un
comerciante compra tres de ellas, la empresa hace la elección de las refrigeradoras en forma aleatoria,
se pide determinar lo siguiente:
UPC MA444 Estadística 84

a. Indique el espacio muestral.


b. Calcule la probabilidad de que las tres refrigeradoras compradas por el comerciante no presenten
imperfecciones de pintura.
c. Calcule la probabilidad de que en la compra realizada por el comerciante se encuentre al menos
una refrigeradora con imperfecciones de pintura.

Solución

a. Indique el espacio muestral.


Definamos el evento 𝐼: = que una refrigeradora tenga imperfecciones en la pintura.

Ω = {(𝐼, 𝐼, 𝐼); (𝐼 𝑐 , 𝐼, 𝐼); (𝐼, 𝐼 𝑐 , 𝐼); (𝐼, 𝐼, 𝐼 𝑐 ); ( 𝐼, 𝐼 𝑐 , 𝐼 𝑐 ); ; ( 𝐼 𝑐 , 𝐼, 𝐼 𝑐 ); (𝐼 𝑐 , 𝐼 𝑐 , 𝐼); (𝐼 𝑐 , 𝐼 𝑐 , 𝐼 𝑐 )}

b. Calcule la probabilidad de que las tres refrigeradoras compradas por el comerciante no presenten
imperfecciones de pintura.

Definamos el evento necesario.

𝐵: = las tres refrigeradoras compradas por el comerciante no presenten imperfecciones de pintura


La probabilidad pedida es:

𝐶37 × 𝐶03
𝑃(𝐵) = = 0,2917
𝐶310

c. Calcule la probabilidad de que en la compra realizada por el comerciante se encuentre al menos


una refrigeradora con imperfecciones de pintura.

Definamos el evento necesario.

𝐶: = se seleccione al menos una refrigeradora con imperfecciones de pintura.

La probabilidad pedida es:

𝑃(𝐶) = 1 − 𝑃(𝐶 𝑐 ) = 1 − 0,2917 = 0,7083

Ejemplo 3

La empresa System S.A. se dedicada a la venta de computadoras de diferentes marcas. En estos


momentos está ofertando cinco modelos diferentes de la marca A, seis modelos diferentes de la marca
B y cuatro modelos diferentes de la marca C. Una empresa de servicios ha decidido comprar tres
computadoras a dicha empresa.

a. Determine la probabilidad de seleccionar tres computadoras de marcas diferentes.

Definamos los eventos necesarios.


UPC MA444 Estadística 85
𝐴: = seleccionar una computadora de la marca de A 𝑛(𝐴) = 5
𝐵: = seleccionar una computadora de la marca de B 𝑛(𝐵) = 6
𝐶: = seleccionar una computadora de la marca de C 𝑛(𝐶) = 4

5A
6B
4C

N = 15 n=3

𝐹: = seleccionar una computadora de la marca A, una de la marca B y una de la marca C.

La probabilidad pedida es:

𝐶15 × 𝐶16 × 𝐶14


𝑃(𝐹) = = 0,2637
𝐶315

b. Determine la probabilidad de seleccionar dos de la marca A y una de la marca B.

Definamos el evento necesario.


𝐷: = seleccionar dos de la marca A y una de la marca B

La probabilidad pedida es:

𝐶25 × 𝐶16 × 𝐶04


𝑃(𝐷) = = 0,1319
𝐶315

c. Determine la probabilidad de seleccionar al menos una computadora de la marca B.

Definamos el evento necesario.

𝐸: = al menos una computadora es de la marca B

La probabilidad pedida es:

𝐶06 × 𝐶39
𝑃(𝐸) = 1 − 𝑃(𝐸 𝑐 ) = = 0,8154
𝐶315
UPC MA444 Estadística 86
Ejemplo 4

Un grupo de 20 ingenieros civiles igualmente capacitados forman la plantilla de una empresa


constructora. Si se eligen al azar a tres de ellos para participar en un proyecto, ¿de cuántas maneras
posibles se pueden seleccionar a estos tres ingenieros?

Ejemplo 5

De un grupo de ocho pequeñas empresas se sabe que dos no cumplen con sus obligaciones tributarias.
Si al seleccionar tres pequeñas empresas la probabilidad de que por lo menos una no cumple con sus
obligaciones tributarias es mayor a 0,62, la SUNAT revisará el cumplimiento de los tributos de todas
las pequeñas empresas ¿Qué decisión tomará?
UPC MA444 Estadística 87
Probabilidad condicional
Si 𝐴 y 𝐵 v Ω, , q
el evento 𝐴 dado 𝐵 se determina por:

𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴⁄𝐵) = , 𝑃(𝐵) > 0
𝑃(𝐵)

Ejemplo 1

Para ocupar un puesto de trabajo en el departamento de diseño de ingeniería de una compañía


constructora de barcos, se han presentado postulantes, cuyas principales características se resumen
en el siguiente cuadro:

Egresado de ingeniería
No egresado de
Mecánica Industrial Total
universidad (N)
Años de experiencia (M) (I)
Al menos tres años de experiencia (A) 14 4 9 27
Menos de tres años de experiencia (B) 25 11 27 63
Total 39 15 36 90

El orden en que el gerente de la estación entrevista a los aspirantes es aleatorio. Calcule la probabilidad
de que el primer entrevistado por el gerente:

a. No sea egresado de universidad si se sabe que tiene menos de tres años de experiencia.
b. Sea egresado de ingeniería mecánica o tenga al menos tres años de experiencia.
c. No sea egresado de universidad si se sabe que tiene menos de tres años de experiencia.
d. Tenga al menos tres años de experiencia dado que es egresado de ingeniería industrial.

Solución

a. No sea egresado de universidad si se sabe que tiene menos de tres años de experiencia.

Definamos los eventos necesarios:

𝐵: = que el postulante tenga menos de tres años de experiencia


𝑀: = que el postulante sea egresado de mecánica

La probabilidad pedida es:

25
𝑃(𝐵 ∩ 𝑀) = = 0,278
90

b. Sea egresado de ingeniería mecánica o tenga al menos tres años de experiencia.

Definamos los eventos necesarios:


UPC MA444 Estadística 88
𝐴: = que el postulante tenga al menos tres años de experiencia
𝑀: = que el postulante sea egresado de mecánica

La probabilidad pedida es:

39 27 14
𝑃(𝑀 ∪ 𝐴) = 𝑃(𝑀) + 𝑃(𝐴) − 𝑃(𝑀 ∩ 𝐴) = + − = 0,578
90 90 90

c. No sea egresado de universidad si se sabe que tiene menos de tres años de experiencia.

Definamos los eventos necesarios:

𝐵: = que el postulante tenga menos de tres años de experiencia


𝑁: = que el postulante no sea egresado de universidad

La probabilidad pedida es:

27
𝑃(𝑁 ∩ 𝐵) 90 27
𝑃(𝑁⁄𝐵) = = = = 0,429
𝑃(𝐵) 63 63
90

d. Tenga al menos tres años de experiencia dado que es egresado de ingeniería industrial.

Definamos los eventos necesarios:

𝐴: = que el postulante tenga al menos de tres años de experiencia


𝐼: = que el postulante sea egresado de ingeniería industrial

La probabilidad pedida es:

4
𝑃(𝐴 ∩ 𝐼) 90 4
𝑃(𝐴⁄𝐼 ) = = = = 0,267
𝑃(𝐼) 15 15
90
Ejemplo 2

Un estudio de mejoramiento de la producción de un fabricante de semiconductores proporcionó datos


para una muestra de 530 placas de silicio. La siguiente tabla presenta el resumen de las respuestas a
dos interrogantes: ¿se encontraron partículas en el troquel que produjo la placa de silicio? y ¿la placa
es regular, buena o mala?

Condición del troquel


Sin partículas Cantidad media de Gran cantidad de Total
Calidad de la placa (S) partículas (P) partículas (G)
Buena (B) 35 80 70 185
Regular (R) 40 125 30 195
Mala (M) 25 65 60 150
Total 100 270 160 530
UPC MA444 Estadística 89
Se selecciona al azar una placa de silicio.

a. ¿Cuál es la probabilidad que sea de calidad regular y tenga gran cantidad de partículas?
b. ¿Cuál es la probabilidad que tenga una cantidad media de partículas o sea de mala calidad?
c. ¿Cuál es la probabilidad de que la placa haya sido producida por un troquel con una cantidad
media de partículas o por un troquel con gran cantidad de partículas si la placa no es buena?
d. Dado que la placa de silicio es producida con un troquel que no tiene gran cantidad de partículas,
¿cuál es la probabilidad que sea de buena calidad?

Solución

a. ¿Cuál es la probabilidad que sea de calidad regular y tenga gran cantidad de partículas?

Definamos los eventos necesarios:

𝑅: = que la placa sea de calidad regular


𝐺: = que el troquel tenga gran cantidad de partículas

La probabilidad pedida es:

30
𝑃(𝑅 ∩ 𝐺) = = 0,0566
530

b. ¿Cuál es la probabilidad que tenga una cantidad media de partículas o sea de mala calidad?

Definamos los eventos necesarios:

𝑀: = que la placa sea de mala calidad


𝑃: = que el troquel tenga una cantidad media de partículas

La probabilidad pedida es:

𝑃(𝑃 ∪ 𝑀) = 𝑃(𝑃) + 𝑃(𝑀) − 𝑃(𝑃 ∩ 𝑀)

270 150 65
= + − = 0,6698
530 530 530

c. ¿Cuál es la probabilidad de que la placa haya sido producida por un troquel con una cantidad media
de partículas o por un troquel con gran cantidad de partículas si la placa no es buena?

Definamos los eventos necesarios:

𝐺: = que el troquel tenga gran cantidad de partículas


𝑃: = que el troquel tenga una cantidad media de partículas
𝐵: = que la placa sea de buena calidad

La probabilidad pedida es:

𝑃(𝑃 ∪ 𝐺 ⁄𝐵𝑐 ) = 𝑃(𝑃⁄𝐵𝑐 ) + 𝑃(𝐺 ⁄𝐵𝑐 )– 𝑃(𝑃 ∩ 𝐺 ⁄𝐵𝑐 )


UPC MA444 Estadística 90
190 90 0
= + − = 0,8116
345 345 345

d. Dado que la placa de silicio es producida con un troquel que no tiene gran cantidad de partículas,
¿cuál es la probabilidad que sea de buena calidad?

Definamos los eventos necesarios:

𝐺: = que el troquel tenga gran cantidad de partículas


𝐵: = que la placa sea de buena calidad

La probabilidad pedida es:

𝑃(𝐵 ∩ 𝐺 𝑐 ) 80 + 35
𝑃(𝐵/𝐺 𝑐 ) = = = 0,3108
𝑃(𝐺 𝑐 ) 370

Ley multiplicativa de probabilidad

De la definición de probabilidad condicional, obtenemos la fórmula para hallar la probabilidad de la


intersección (o producto) de los eventos 𝐴 y 𝐵, esto es, de:

𝑃 (𝐴 ∩ 𝐵) = 𝑃 (𝐴/𝐵)𝑃 (𝐵) = 𝑃 (𝐵/𝐴)𝑃 (𝐴)

Ejemplo 1

Sean 𝐴 y 𝐵 son eventos tales que 𝑃(𝐴) = 0,4; 𝑃(𝐵) = 0,2 y 𝑃(𝐴/𝐵) = 0,5.

Calcule 𝑃(𝐴 ∪ 𝐵).

Calcule 𝑃(𝐴𝑐 ∩ 𝐵).


UPC MA444 Estadística 91
Eventos independientes

Los eventos A y B son independientes si la ocurrencia de B no altera la probabilidad de que haya


ocurrido A, es decir, los eventos A y B son independientes si:

𝑃(𝐴⁄𝐵) = 𝑃(𝐴)

Si dos eventos no son independientes, se dice que son dependientes.

Regla multiplicativa para eventos independientes

Si los eventos A y B son independientes, la probabilidad de la intersección de A y B es igual al producto


de las probabilidades de A y B, es decir,

𝑃 (𝐴 ∩ 𝐵) = 𝑃 (𝐴)𝑃(𝐵)

Generalizando para los eventos independientes 𝐸1 , 𝐸2 , … , 𝐸𝑘 .

𝑃( 𝐸1 ∩ 𝐸2 ∩. . . 𝐸𝑘 ) = 𝑃( 𝐸1 ) 𝑃( 𝐸2 ) ⋯ 𝑃( 𝐸𝑘 )

Propiedades

Si los eventos 𝐴 y 𝐵 son independientes, entonces también son independientes:

• 𝐴𝑐 y 𝐵𝑐 ; entonces:
𝑃(𝐴𝑐 ∩ 𝐵𝑐 ) = 𝑃(𝐴𝑐 )𝑃(𝐵𝑐 )
• 𝐴 y 𝐵; entonces:
𝑐

𝑃(𝐴𝑐 ∩ 𝐵) = 𝑃(𝐴𝑐 )𝑃(𝐵)


• 𝐴 y 𝐵 ; entonces:
𝑐

𝑃(𝐴 ∩ 𝐵𝑐 ) = 𝑃(𝐴)𝑃(𝐵𝑐 )

Esta propiedad se puede generalizar para más de dos eventos.

Leyes de Morgan

• 𝑃((𝐴 ∩ 𝐵)𝑐 ) = 𝑃(𝐴𝑐 ∪ 𝐵𝑐 )


• 𝑃((𝐴 ∪ 𝐵)𝑐 ) = 𝑃(𝐴𝑐 ∩ 𝐵𝑐 )

Estas leyes se pueden generalizar para más de dos eventos.


UPC MA444 Estadística 92
Ejemplo 1

Un sistema electrónico está compuesto por tres subsistemas A, B y C, de tal manera que las
probabilidades de fallar de cada uno son 0,15; 0,20 y 0,35. Si los subsistemas funcionan de manera
independiente, calcular:

a. Calcular la probabilidad de que al menos uno de los subsistemas falle.


b. Calcular la probabilidad de solo dos de los subsistemas funcione.

Solución

Definamos los eventos necesarios.

𝐴: = el subsistema A falle 𝑃(𝐴) = 0,15 𝑃(𝐴𝑐 ) = 0,85


𝐵: = el subsistema B falle 𝑃(𝐵) = 0,20 𝑃(𝐵𝑐 ) = 0,80
𝐶: = el subsistema C falle 𝑃(𝐶) = 0,35 𝑃(𝐶 𝑐 ) = 0,65

a. Calcular la probabilidad de que al menos uno de los subsistemas falle.

Definamos los eventos necesarios.

𝑆: = al menos uno de los sistemas falle


𝑆 𝑐 : = ninguno de los sistemas falle

𝑃(𝑆) = 1 − 𝑃(𝑆 𝑐 )

Para que ninguno de los sistemas falle, no debe fallar ninguno de los sistemas 𝐴, 𝐵 y 𝐶.

𝑃(𝑆) = 1 − 𝑃(𝐴𝑐 ∩ 𝐵𝑐 ∩ 𝐶 𝑐 )

Como los eventos 𝐴, 𝐵 y 𝐶 son independientes:

𝑃(𝑆) = 1 − 𝑃(𝐴𝑐 )𝑃(𝐵𝑐 )𝑃(𝐶 𝑐 )

𝑃(𝑆) = 1 − 0,85 × 0,80 × 0,65 = 0,558

b. La probabilidad de solo dos de los subsistemas funcione.

Definamos los eventos necesarios.

𝑆2 : = solo dos de los sistemas funcionen.

Para que solo dos de los sistemas funcionen, deben funcionar A y C pero no B; B y C pero no A; A y
B pero no C. Por lo tanto:

𝑃(𝑆2 ) = 𝑃(𝐴𝑐 ∩ 𝐵 ∩ 𝐶 𝑐 ) + 𝑃(𝐴 ∩ 𝐵𝑐 ∩ 𝐶 𝑐 ) + 𝑃(𝐴𝑐 ∩ 𝐵𝑐 ∩ 𝐶)

Como los eventos 𝐴, 𝐵 y 𝐶 son independientes:

𝑃(𝑆2 ) = 𝑃(𝐴𝑐 )𝑃(𝐵)𝑃(𝐶 𝑐 ) + 𝑃(𝐴)𝑃(𝐵𝑐 )𝑃(𝐶 𝑐 ) + 𝑃(𝐴𝑐 )𝑃(𝐵𝑐 )𝑃(𝐶)


UPC MA444 Estadística 93

Reemplazando los valores, tendremos:

𝑃(𝑆2 ) = 0,85 × 0,20 × 0,65 + 0,15 × 0,80 × 0,65 + 0,85 × 0,80 × 0,35 = 0,4265

Ejemplo 2

Una empresa produce piezas en tres máquinas, M1, M2 y M3, que pueden presentar desajustes de
manera independiente, con probabilidades 0,02; 0,01 y 0,06 respectivamente. Al inicio de un día de
operación se realiza una prueba en cada máquina. Si se observan desajustes en una máquina, ésta
debe pasar el día en revisión técnica. Para cumplir el nivel mínimo de producción diaria se necesita que
al menos dos de las tres máquinas funcionen.

a. ¿Cuál es la probabilidad de que una de las tres máquinas deba pasar el día en revisión técnica?
b. ¿Cuál es la probabilidad de cumplir con el nivel mínimo de producción diaria?

Solución

Definamos los eventos necesarios.

𝐴: = la máquina M1 presenta desajustes 𝑃(𝐴) = 0,02 𝑃(𝐴𝑐 ) = 0,98


𝐵: = la máquina M2 presenta desajustes 𝑃(𝐵) = 0,01 𝑃(𝐵𝑐 ) = 0,99
𝐶: = la máquina M3 presenta desajustes 𝑃(𝐶) = 0,06 𝑃(𝐶 𝑐 ) = 0,94

a. ¿Cuál es la probabilidad de que una de las tres máquinas deba pasar el día en revisión técnica?

Se define el evento necesario:

𝑅: = una de las tres máquinas presenta desajustes

Para que solo una de las máquinas presente desajustes, deben presentarlos M1 pero no M2 y M3;
M2 pero no M1 y M3; M3 pero no M1 y M2.

Por lo tanto:

𝑃(𝑅) = 𝑃(𝐴 ∩ 𝐵𝑐 ∩ 𝐶 𝑐 ) + 𝑃(𝐴𝑐 ∩ 𝐵 ∩ 𝐶 𝑐 ) + 𝑃(𝐴𝑐 ∩ 𝐵𝑐 ∩ 𝐶)

Como los eventos 𝐴, 𝐵 y 𝐶 son independientes:

𝑃(𝑅) = 𝑃(𝐴)𝑃(𝐵𝑐 )𝑃(𝐶 𝑐 ) + 𝑃(𝐴𝑐 )𝑃(𝐵)𝑃(𝐶 𝑐 ) + 𝑃(𝐴𝑐 )𝑃(𝐵𝑐 )𝑃(𝐶)

Reemplazando los valores, tendremos:

𝑃(𝑅) = 0,02 × 0,99 × 0,94 + 0,98 × 0,01 × 0,94 + 0,98 × 0,99 × 0,06 = 0,086

b. ¿Cuál es la probabilidad de cumplir con el nivel mínimo de producción diaria?

Se define el evento necesario:

𝑁: = cumplir con el nivel mínimo de producción


UPC MA444 Estadística 94

Para cumplir el nivel mínimo de producción diaria se necesita que al menos dos de las tres máquinas
funcionen, es decir, funcionen dos de las máquinas o las tres.

𝑃(𝑁) = 𝑃(𝐴𝑐 ∩ 𝐵𝑐 ∩ 𝐶) + 𝑃(𝐴𝑐 ∩ 𝐵 ∩ 𝐶 𝑐 ) + 𝑃(𝐴𝑐 ∩ 𝐵𝑐 ∩ 𝐶) + 𝑃(𝐴𝑐 ∩ 𝐵𝑐 ∩ 𝐶 𝑐 )

Como los eventos 𝐴, 𝐵 y 𝐶 son independientes:

𝑃(𝑁) = 𝑃(𝐴𝑐 )𝑃(𝐵𝑐 )𝑃(𝐶) + 𝑃(𝐴𝑐 )𝑃(𝐵)𝑃(𝐶 𝑐 ) + 𝑃(𝐴𝑐 )𝑃(𝐵𝑐 )𝑃(𝐶) + 𝑃(𝐴𝑐 )𝑃(𝐵𝑐 )𝑃(𝐶 𝑐 )

Reemplazando los valores, tendremos:

𝑃(𝑁) = 0,98 × 0,99 × 0,06 + 0,98 × 0,01 × 0,94 + 0,02 × 0,99 × 0,94 + 0,98 × 0,99 × 0,94

𝑃(𝑁) = 0,9980
UPC MA444 Estadística 95
Aplicación al sistema de componentes: Confiabilidad de sistemas

Podemos aplicar el concepto de la independencia de eventos al caso en que se tenga un sistema de


componentes electrónicos acoplados en serie o en paralelo.

Sistema en serie
Un sistema de componentes acopladas en serie funciona si todos sus componentes funcionan.

Sean los eventos:


𝐴 ≔ el componente A funcione
𝐵 ≔ el componente B funcione
𝑆 ≔ el sistema funcione

Para que el sistema funcione 𝑆, ambos componentes, A y B, deben funcionar. Se asume que cada
componente funciona de forma independiente.

A B

𝑃(S) = 𝑃(𝐴 ∩ 𝐵)

Cada componente funciona de forma independiente, entonces:

𝑃(𝑆) = 𝑃(𝐴)𝑃(𝐵)

Ejemplo 1

El sistema funcionará sólo si ambos componentes funcionan. El componente A funciona con una
probabilidad de 0,98 y el componente B funciona con una probabilidad de 0,95. Suponga que A y B
funcionan de manera independiente. Determine la probabilidad que el sistema funcione.

Solución
Sean los eventos:

𝐴 ≔ el componente A funcione
𝐵 ≔ el componente B funcione
𝑆 ≔ el sistema funcione

A B

La probabilidad de que funcione el sistema es:

𝑃(𝑆) = 𝑃(𝐴 ∩ 𝐵)

Cada componente funciona de forma independiente, entonces:

𝑃(𝑆) = 𝑃(𝐴)𝑃(𝐵) = 0,98 × 0,95 = 0,931


UPC MA444 Estadística 96
Sistema en paralelo
Un sistema de componentes acoplada en paralelo funciona, si al menos una de sus componentes
funciona. El sistema funcionará si alguno de los componentes, A o B, funciona.

𝑃(𝑆) = 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵)

Se asume que cada componente funciona de forma independiente.

𝑃(𝑆) = 𝑃(𝐴 ∪ 𝐵) = 1 − 𝑃((𝐴 ∪ 𝐵)𝑐 )

Usando las leyes de De Morgan

𝑃(𝑆) = 𝑃(𝐴 ∪ 𝐵) = 1 − 𝑃(𝐴𝑐 ∩ 𝐵𝐶 )

Cada componente funciona de forma independiente, entonces la probabilidad de que el sistema


funcione es:

𝑃(𝑆) = 1 − 𝑃(𝐴𝑐 )𝑃(𝐵𝑐 )

Ejemplo 2

Los componentes A y B funcionan con una probabilidad de 0,90 y 0,85 respectivamente. Suponga que
los componentes A y B funcionan de manera independiente. Determine la probabilidad de que el
sistema funcione.

B
Solución

La probabilidad de que el sistema funcione es:

𝑃(𝑆) = 1 − 𝑃(𝐴𝑐 )𝑃(𝐵𝑐 ) = 1 − (0,10 × 0,15) = 0,985


UPC MA444 Estadística 97
Ejemplo 3

Un sistema eléctrico consta de cuatro componentes. El sistema funciona si los componentes A y B


funcionan, y si funciona cualquiera de los componentes C o D. La confiabilidad (probabilidad de que
funcionen) de cada uno de los componentes también se muestra en la figura. Suponga que los cuatro
componentes funcionan de manera independiente.

0,8
C
0,9 0,8
A B
0,8
D
a. Calcule la probabilidad de que el sistema completo funcione.

b. Calcule la probabilidad de que el componente C no funcione dado que el sistema completo


funciona.
UPC MA444 Estadística 98
Probabilidad total y el teorema de Bayes

Probabilidad total

Sean los eventos 𝐴1 , 𝐴2 , . . . , 𝐴𝑘 , los cuales forman una partición del espacio muestral  mutuamente
excluyentes y exhaustivos y sea 𝐸 otro evento cualquiera de , se cumple:

𝐴1 𝐴2 𝐴𝑘

𝑃(𝐸) = 𝑃(𝐴1 )𝑃(𝐸 ⁄𝐴1 ) + 𝑃(𝐴2 )𝑃(𝐸 ⁄𝐴2 ) + ⋯ + 𝑃(𝐴𝑘 )𝑃(𝐸 ⁄𝐴𝑙 )

Donde a 𝑃(𝐸) se le conoce como la probabilidad total.

Teorema de Bayes

Si los eventos 𝐴1 , 𝐴2 , . . . , 𝐴𝑘 constituyen una partición del espacio muestral , entonces para cualquier
evento 𝐸 de , se cumple que:

𝑃(𝐴𝑖 ∩ 𝐸)
𝑃(𝐴𝑖 ⁄𝐸 ) = 𝑖 = 1, 2, … , 𝑘
𝑃(𝐸)

𝑃(𝐴𝑖 )𝑃(𝐸 ⁄𝐴𝑖 )


𝑃(𝐴𝑖 ⁄𝐸 ) =
𝑃(𝐴1 )𝑃(𝐸 ⁄𝐴1 ) + 𝑃(𝐴2 )𝑃(𝐸 ⁄𝐴2 ) + ⋯ + 𝑃(𝐴𝑘 )𝑃(𝐸 ⁄𝐴𝑘 )
UPC MA444 Estadística 99
Ejemplo 1

Una cadena de tiendas de suministros de construcción vende tres marcas diferentes de teodolitos. De
sus ventas de teodolitos, 50% son de la marca 1 (la menos cara), 30% son de la marca 2 y 20% son de
la marca 3 (la más cara).

Cada fabricante ofrece un año de garantía en las partes y mano de obra. Se sabe que 25% de los
teodolitos de la marca 1 requieren trabajo de reparación dentro del periodo de garantía, mientras que
los porcentajes correspondientes de las marcas 2 y 3 son 20% y 10%, respectivamente.

Determine:
a. ¿Cuál es la probabilidad de que un comprador seleccionado al azar haya adquirido un teodolito de
la marca 1 y que necesitará reparación mientras se encuentra dentro de garantía?
b. ¿Cuál es la probabilidad de que un comprador seleccionado al azar haya comprado un teodolito
que necesite reparación mientras se encuentra dentro de la garantía?
c. Si un cliente regresa a la tienda con un teodolito que necesita reparación dentro de garantía, ¿cuál
es la probabilidad de que sea un teodolito de la marca 1?

Solución

Primero, definimos los eventos y a continuación elaboramos el diagrama del árbol.

𝐴: = que un comprador haya adquirido un teodolito de la marca A1


𝐵: = que un comprador haya adquirido un teodolito de la marca A2
𝐶: = que un comprador haya adquirido un teodolito de la marca A3
𝑁: = necesita reparación mientras se encuentra dentro de la garantía

𝑃(𝑁⁄𝐴) = 0,25 𝑃(𝐴 ∩ 𝑁)


𝑃(𝐴) = 0,50
𝑃(𝑁 𝑐 ⁄𝐴) = 0,75 𝑃(𝐴 ∩ 𝑁 𝑐 )

𝑃(𝑁⁄𝐵) = 0,20 𝑃(𝐵 ∩ 𝑁)


𝑃(𝐵) = 0,30
𝑃(𝑁 𝑐 ⁄𝐵) = 0,80 𝑃(𝐵 ∩ 𝑁 𝑐 )

𝑃(𝑁⁄𝐶 ) = 0,10 𝑃(𝐶 ∩ 𝑁)


𝑃(𝐶) = 0,20
𝑃(𝑁 𝑐 ⁄𝐶 ) = 0,90 𝑃(𝐶 ∩ 𝑁 𝑐 )

a. ¿Cuál es la probabilidad de que un comprador seleccionado al azar haya adquirido un teodolito de


la marca 1 y que necesitará reparación mientras se encuentra dentro de garantía?

La probabilidad pedida es:

𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐵⁄𝐴)𝑃(𝐴) = 0,125


UPC MA444 Estadística 100

b. ¿Cuál es la probabilidad de que un comprador seleccionado al azar haya comprado un teodolito


que necesite reparación mientras se encuentra dentro de la garantía?

La probabilidad pedida es:

𝑃(𝑁) = 𝑃(𝐴 ∩ 𝑁) + 𝑃(𝐵 ∩ 𝑁) + 𝑃(𝐶 ∩ 𝑁)

Usando el teorema de la probabilidad total.

𝑃(𝑁) = 𝑃(𝑁⁄𝐴)𝑃(𝐴) + 𝑃(𝑁⁄𝐵)𝑃(𝐵) + 𝑃(𝑁⁄𝐶 )𝑃(𝐶)

= 0,5 × 0,25 + 0,30 × 0,20 + 0,20 × 0,10 = 0,205

= 0,125 + 0,06 + 0,02 = 0,205

c. Si un cliente regresa a la tienda con un teodolito que necesita reparación dentro de la garantía,
¿cuál es la probabilidad de que sea un teodolito de la marca 1?

La probabilidad pedida es:

𝑃(𝐴 ∩ 𝑁) 0,5 × 0,25


𝑃(𝐴⁄𝑁) = = = 0,6098
𝑃(𝑁) 0,205

Ejemplo 2

Tres máquinas A, B y C, producen el 45%, 30% y 25% respectivamente del total de las piezas producidas
en una fábrica. El porcentaje de producción de piezas defectuosas de estas máquinas son del 3%, 4%
y 5% respectivamente.

a. Si seleccionamos una pieza al azar ¿cuál es la probabilidad de que sea defectuosa?


b. Si tomamos al azar una pieza y resulta defectuosa ¿cuál es la probabilidad de que haya sido
producida por la máquina B?
c. ¿Qué máquina tiene mayor probabilidad de haber producido una pieza defectuosa?

Solución

Primero, definimos los eventos y a continuación elaboramos el diagrama del árbol:

𝐴: = que la pieza sea producida por la máquina A 𝑃(𝐴) = 0,45


𝐵: = que la pieza sea producida por la máquina B 𝑃(𝐵) = 0,30
𝐶: = que la pieza sea producida por la máquina C 𝑃(𝐶) = 0,25
𝐷: = que se elija una pieza defectuosa
UPC MA444 Estadística 101

𝑃(𝐷⁄𝐴) = 0,03 𝑃(𝐴 ∩ 𝐷)


𝑃(𝐴) = 0,45
𝑃(𝐷 𝑐 ⁄𝐴) = 0,97 𝑃(𝐴 ∩ 𝐷 𝑐 )

𝑃(𝐷⁄𝐵) = 0,04 𝑃(𝐵 ∩ 𝐷)


𝑃(𝐵) = 0,30
𝑃(𝐷 𝑐 ⁄𝐵) = 0,96 𝑃(𝐵 ∩ 𝐷 𝑐 )

𝑃(𝐷⁄𝐶 ) = 0,05 𝑃(𝐶 ∩ 𝐷)


𝑃(𝐶) = 0,25
𝑃(𝐷 𝑐 ⁄𝐶 ) = 0,95 𝑃(𝐶 ∩ 𝐷 𝑐 )

a. Si seleccionamos una pieza al azar ¿cuál es la probabilidad de que sea defectuosa?

La probabilidad pedida es:

𝑃(𝐷) = 0,45 × 0,03 + 0,30 × 0,04 + 0,25 × 0,05 = 0,038

b. Si tomamos al azar una pieza y resulta defectuosa ¿cuál es la probabilidad de que haya sido
producida por la máquina B?

La probabilidad pedida es:

𝑃(𝐷/𝐵)𝑃(𝐵) 0,04 × 0,30


𝑃(𝐵/𝐷) = = = 0,3158
𝑃(𝐷) 0,038

c. ¿Qué máquina tiene mayor probabilidad de haber producido una pieza defectuosa?

Las probabilidades pedidas son:

𝑃(𝐷/𝐴)𝑃(𝐴) 0,03 × 0,45


𝑃(𝐴/𝐷) = = = 0,3553
𝑃(𝐷) 0,038

𝑃(𝐷/𝐵)𝑃(𝐵) 0,04 × 0,30


𝑃(𝐵/𝐷) = = = 0,3158
𝑃(𝐷) 0,038

𝑃(𝐷/𝐶)𝑃(𝐶) 0,05 × 0,25


𝑃(𝐶/𝐷) = = = 0,3289
𝑃(𝐷) 0,038

La máquina con mayor probabilidad de haber producido la pieza defectuosa es la máquina A.


UPC MA444 Estadística 102
Ejemplo 3

Una empresa se encuentra estudiando la posibilidad de importar para el próximo año un nuevo
modelo de celular de última generación. Al estudiar la situación económica del próximo año se
contemplan tres posibilidades: inflación, estabilidad o crecimiento, estimando dichas alternativas con
las siguientes probabilidades: 0,55; 0,35 y 0,10 respectivamente. La probabilidad de importar el nuevo
modelo de celular es 0,25 si existiera inflación; 0,40 si existiera estabilidad y 0,65 si existiera
crecimiento.

a. Defina los eventos y presente el diagrama del árbol.

b. Calcule la probabilidad de importar el nuevo modelo de celular para el próximo año.

c. Asumiendo que la empresa decidió importar el nuevo modelo de celular, ¿cuál es la probabilidad
que existiera inflación en la economía?
UPC MA444 Estadística 103
Ejemplo 4
17
La probabilidad que la construcción de un edificio termine a tiempo es 20, la probabilidad que no haya
3 14
huelga es 4 y la probabilidad que la construcción se termine a tiempo dado que no hubo huelga es 15 ;
1
la probabilidad que haya huelga y no se termine la construcción a tiempo es .
10

a. Calcule la probabilidad de que la construcción se termine a tiempo y no haya huelga.

b. No haya huelga dado que la construcción se terminó a tiempo.

c. La construcción no se termine a tiempo si hubo huelga.

d. La construcción no se termine a tiempo si no hubo huelga.


UPC MA444 Estadística 104
Ejercicios propuestos

22.Una empresa constructora emplea a tres ingenieros de ventas. El ingeniero 1 hace el trabajo de
estimar costos en 60% de las cotizaciones solicitadas a la empresa, el ingeniero 2 hace lo mismo en
30% de las cotizaciones y el ingeniero 3 en el resto. Se sabe que la tasa de error para el ingeniero 1
es tal que la probabilidad de encontrar un error en su trabajo es 0,02; la probabilidad de encontrar
un error en el trabajo del ingeniero 2 es 0,04 y la probabilidad de encontrar un error en el ingeniero
3 es de 0,03.

Suponga que al revisar una solicitud de cotización se encuentra un error grave en la estimación de
los costos. ¿Qué ingeniero supondría usted que hizo los cálculos?

23.Consideremos que tres máquinas Alpha, Beta y Gamma producen respectivamente el 50%, el 30%
y el 20% del número total de artículos de una fábrica. Si la proporción de artículos defectuosos que
produce cada una de estas máquinas es 0,03; 0,04 y 0,05 respectivamente y se selecciona un
artículo aleatoriamente.

a. Calcule la probabilidad de que el artículo sea defectuoso.


b. Calcule la probabilidad de que el artículo seleccionado al azar haya sido producido por la
máquina Alpha si se sabe que es defectuoso.
c. Calcule la probabilidad de que el artículo seleccionado al azar haya sido producido por la
máquina Alpha o la máquina Beta, si se sabe que es defectuoso.

24.Una empresa vende tres tipos de maquinaria pesada para la industria textil A, B y C. El 70% de las
máquinas son del tipo A, el 20% del tipo B y el 10% son del tipo C. Las máquinas A tienen una
probabilidad de 0,10 de producir una pieza defectuosa a lo largo de un año, las máquinas B tienen
una probabilidad de 0,30 y las máquinas C tienen una probabilidad 0,60 de producir una de tales
piezas defectuosas a lo largo de un año.

Una de estas máquinas ha estado funcionando durante un año de prueba y ha producido una pieza
defectuosa. ¿De cuál tipo de máquina es más probable que provenga la pieza defectuosa?

25.Una de las etapas de producción de drones es el ensamblado de la cubierta del casco para
exteriores. Se programan diariamente 1400 cascos utilizando a tres especialistas A, B y C. El
especialista A atiende 170 cascos, el especialista B atiende 500 cascos y el especialista C atiende los
restantes.

Cabe la posibilidad de que el ensamblado del casco no sea el correcto; por lo tanto, el casco
ensamblado sería defectuoso. La siguiente tabla muestra como varía la proporción del ensamblado
defectuoso del casco para cada especialista.

Especialista Proporción de cascos ensamblados defectuosos


A 0,02
B 0,04
C 0,03

Si se selecciona al azar un dron con casco ensamblado defectuoso, ¿cuál es la probabilidad de que
lo haya ensamblado el especialista B?
UPC MA444 Estadística 105
3
26.Una de las medidas que se consideran para regular el volumen de agua en m en las represas, es
abrir las compuertas para que las represas no rebalsen. Las compuertas operan en forma
independiente de acuerdo con dos tipos de sistemas. Estos sistemas operan solo si hay una
trayectoria de dispositivos funcionales de izquierda a derecha. Su funcionamiento es muy
importante por lo que el ingeniero de mantenimiento recomendará utilizar aquel sistema que
presente mayor probabilidad de flujo de funcionamiento continuo.

Sistema 1 Sistema 2

¿Cuál de los dos sistemas deberá elegir para ser instalado en una compuerta? Suponga que cada
dispositivo funciona de manera independiente con una probabilidad de 0,85.

27.Considere el sistema de componentes electrónicos conectados como se muestra en la figura. Los


componentes funcionan de manera independiente uno del otro, y la probabilidad de que cada
componente funcione es 0,90; ¿cuál es la probabilidad de que el sistema electrónico funcione?

1 3 4

2 5 6

28.Si la probabilidad de que cada llave esté cerrada dejando pasar corriente es 𝑝 = 0,6 y las llaves se
cierran y se abren en forma independiente, calcular la probabilidad de que pase corriente de I hacia
O en el siguiente circuito:

29.Electronic Company brinda soporte especializado en la instalación de redes con tecnología LAN o
WAN a diferentes empresas. Se sabe que el 15% de las empresas prefieren como medio físico de
transporte los cables de cobre de par trenzado, el 35% prefiere los cables coaxiales, el 40% fibras
ópticas y 10% el aire. Además, si la empresa elige los cables de cobre de par trenzado como medio
físico, la probabilidad que elija la tecnología WAN es 0,62; las empresas que eligen cables coaxiales
tienen una probabilidad de 0,45 de elegir la tecnología LAN; las empresas que eligen la fibra óptica
tienen una probabilidad de 0,55 de elegir la tecnología WAN y las empresas que eligen el aire como
medio físico de transporte tienen una probabilidad de 0,5 de elegir la tecnología LAN.

a. Calcule la probabilidad que una empresa elija para su red la tecnología LAN.
b. Si se selecciona al azar una empresa que utiliza tecnología WAN, ¿cuál es la probabilidad que
utilice como medio físico de transporte cables de cobre de par trenzado?
UPC MA444 Estadística 106
Caso: Construcción de represas

El informe de la Comisión Mundial de Represas


(ONU,2015) indica que numerosos impactos
ambientales logran dañar represas, provocando en ellas
averías muy serias; por lo tanto, la CONFIEP debe
recomendar un tipo de material antes de diseñar una
nueva represa.

Por registros anteriores se sabe que en el Perú el 55% de


las represas están construidas a base de cimientos, el
2B% con terraplenes y el resto con excavaciones. Además, se conoce que si el diseño de la estructura
de la represa es a base de cimientos esta no presenta averías en un B0%, si es a base de terraplenes
presenta averías en un 35% y si la estructura es a base de excavaciones presenta averías en un 25%.

Si se elige una represa al azar y esta presenta averías, ¿cuál es el tipo de material que debería
recomendar la CONFIEP para que no ocurran fallas estructurales?
UPC MA444 Estadística 107
Variable aleatoria

Ω . v f 𝑋 que transforma cada resultado w


del espacio muestral en un número real 𝑋(𝑤).

El rango de la variable aleatoria X es el conjunto RX de todos sus posibles valores.

Ejemplo 1
Al lanzar dos monedas para registrar los posibles resultados se obtiene el espacio muestral siguiente:

 = {cc, cs, sc, ss}

Si definimos la variable aleatoria X como número de caras que se obtiene, entonces a cada resultado
de , es posible asignarle un número real de la siguiente manera:

• cc, se le asigna el número real 2


• cs, se le asigna el número real 1
• sc, se le asigna el número real 1
• ss, se le asigna el número real 0

Clasificación de variables aleatorias

Una variable es discreta si su rango es un conjunto finito o infinito numerable.

Por ejemplo: número de circuitos electrónicos producidos por una empresa que cumplen con las
especificaciones técnicas, número de llamadas que recibe una central telefónica.

Una variable es continua si su rango es un conjunto infinito no numerable.

Por ejemplo: resistencia a la ruptura de un material plástico (onzas por pulgada cuadrada), resistencia
transversal de los ladrillos fabricados por una empresa (MN/m2).
UPC MA444 Estadística 108
Variable aleatoria discreta

Sea 𝑋 una variable aleatoria discreta. La función de probabilidad de una variable aleatoria discreta
representa la probabilidad de que la variable aleatoria tome un valor genérico igual a x y se denotará
de la siguiente manera:

𝑓(𝑥) = 𝑃(𝑋 = 𝑥)

La función de probabilidad de 𝑋 debe cumplir las siguientes condiciones:

𝑓(𝑥) ≥ 0

∑ 𝑓(𝑥) = 1
𝑅𝑎𝑛𝑔𝑜 𝑋

Ejemplo 1
El ingeniero de producción de la empresa Tecnotronics S.A. ha determinado que la distribución de
probabilidades del número de artículos defectuosos por lote es la siguiente:

Número de artículos defectuosos 0 1 2 3 4


f(x) = P(X = x) 0,25 a 0,10 0,25 0,25

a. Calcule el valor de la constante a para que la distribución sea de probabilidad.


b. Calcule la probabilidad de encontrar menos de dos artículos defectuosos por lote.
c. Si el lote tiene dos o más artículos defectuosos, es considerado malo; calcule la probabilidad que el
lote sea malo.
d. Si el número de artículos defectuosos por lote es al menos uno, calcule la probabilidad de que el
número de artículos defectuosos sea menor a tres.

Solución

a. Calcule el valor de la constante 𝑎 para que la distribución sea de probabilidad.

Solución

Para hallar el valor de la constante usaremos la siguiente condición:

∑ 𝑓(𝑥) = 1
𝑅𝑎𝑛𝑔𝑜 𝑋

𝑓(0) + 𝑓(1) + 𝑓(2) + 𝑓(3) + 𝑓(4) = 1

0,25 + 𝑎 + 0,10 + 0,25 + 0,25 = 1

Despejando se tiene que 𝑎 = 0,15


UPC MA444 Estadística 109
b. Calcule la probabilidad de encontrar menos de dos artículos defectuosos por lote.

Solución

La probabilidad pedida es:

𝑃(𝑋 < 2) = 𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) = 0,25 + 0,15 = 0,40

c. Si el lote tiene dos o más artículos defectuosos, es considerado malo; calcule la probabilidad que el
lote sea malo.

Solución

Sea el evento 𝐴: = el lote sea malo

El lote será malo si tiene dos o más artículos defectuosos, por lo tanto, la probabilidad pedida es:

𝑃(𝐴) = 𝑃(𝑋 ≥ 2) = 1– 𝑃(𝑋 < 2) = 1– 0,40 = 0,60

d. Si se sabe que el número de artículos defectuosos por lote es al menos uno, calcule la probabilidad
de que el número de artículos defectuosos sea menor a tres.

Solución

La probabilidad pedida es:

𝑃(𝑋 < 3⁄𝑋 ≥ 1)

𝑃(𝑋 < 3 ∩ 𝑋 ≥ 1)
=
𝑃(𝑋 ≥ 1)

𝑃(𝑋 = 1) + 𝑃(𝑋 = 2)
=
1 − 𝑃(𝑋 = 0)

𝑓(1) + 𝑓(2)
=
1 − 𝑓(0)

0,15 + 0,10
= = 0,3333
1 − 0,25
UPC MA444 Estadística 110
Ejemplo 2

El departamento de control de calidad de una empresa selecciona al azar diariamente tres bombillas
de un lote que contiene 20 bombillas, para decidir si acepta el lote y los pasa al departamento de
producción o rechaza el lote y los devuelve al proveedor.

a. Construya la distribución de probabilidad del número de bombillas defectuosas que se encuentra


en la muestra, si el muestreo es sin reposición y bajo la suposición que el lote contiene dos
bombillas defectuosas.

Identificamos la variable 𝑋: = número de bombillas defectuosas encontradas en la muestra.

Los valores del rango de la variable son 𝑅𝑋 = { }

Definamos los eventos necesarios:

𝐷: = bombilla defectuosa 𝑃(𝐷) =


𝐷 𝑐 : = bombilla no defectuosa 𝑃(𝐷 𝑐 ) =

𝑃(𝑋 = 0) =
𝑃(𝑋 = 1) =
𝑃(𝑋 = 2) =

Finalmente, colocamos los resultados en la tabla de función de probabilidades.

Numero de bombillas defectuosas 0 1 2


f(x) = P(X = x)

b. Si la regla de decisión es rechazar el lote si en la muestra se encuentra más de un artículo


defectuoso. ¿Cuál es la probabilidad de rechazar un lote?

c. En relación con la regla planteada en (b), si el lote es aceptado, ¿cuál es la probabilidad que la
muestra contenga un defectuoso?
UPC MA444 Estadística 111
Esperado de una variable aleatoria discreta

Sea X una variable aleatoria discreta con función de probabilidad f(x). Entonces el valor esperado o
media de X es:

𝜇 = 𝐸(𝑋) = ∑ 𝑥 𝑓(𝑥)
𝑅𝑎𝑛𝑔𝑜 𝑋

Varianza de una variable aleatoria

Sea 𝑋 una variable discreta con función de probabilidad f(x). Entonces, la varianza de X es:

𝜎 2 = 𝑉(𝑋) = 𝐸((𝑋 − 𝜇)2 )

La fórmula abreviada para el cálculo de la varianza es:

𝑉(𝑋) = 𝐸(𝑋 2 )– [𝐸(𝑋)]2

donde:
𝐸(𝑋 2 ) = ∑ 𝑥 2 𝑓(𝑥)
𝑅𝑎𝑛𝑔𝑜 𝑋

Desviación estándar de una variable aleatoria

La desviación estándar de 𝑋 es la raíz cuadrada positiva de la varianza de 𝑋.

𝜎 = √𝜎 2

Ejemplo 1

El número de fallas de energía eléctrica que afectan a cierta región en cualquier año dado se considera
una variable aleatoria que tiene la siguiente función de probabilidad:

x 0 1 2 3
P(X = x) 0,38 0,24 k 0,08

a. Calcule e interprete el valor esperado de 𝑋.


b. Calcule la desviación estándar y el coeficiente de variación de X.
UPC MA444 Estadística 112
Solución

a. Calcule e interprete el valor esperado de 𝑋.

Solución
En primer lugar, hallaremos el valor de k para que la distribución sea función de probabilidad:

0,38 + 0,24 + 𝑘 + 0,08 = 1

Despejando, el valor de 𝑘 = 0,3.

El valor esperado de 𝑋 se calcula con la siguiente fórmula:

𝜇 = 𝐸(𝑋) = ∑ 𝑥 𝑓(𝑥)
𝑅𝑎𝑛𝑔𝑜 𝑋

Reemplazando:

𝜇 = 𝐸(𝑋) = 0 × 𝑓(0) + 1 × 𝑓(1) + 2 × 𝑓(2) + 3 × 𝑓(3)

= 0 × 0,38 + 1 × 0,24 + 2 × 0,3 + 3 × 0,08 = 1,08

Interpretación
Si el experimento se repitiera muchas veces, en promedio el número de fallas de energía eléctrica
que afectan a cierta región en cualquier año dado sería de 1,08.

b. Calcule la desviación estándar y el coeficiente de variación de X.

Solución
Primero, calculamos la varianza y usaremos la fórmula:

𝑉(𝑋) = 𝐸(𝑋 2 )– [𝐸(𝑋)]2

Donde:

𝐸(𝑋 2 ) = 02 × 0,38 + 12 × 0,24 + 22 × 0,3 + 32 × 0,08 = 2,16

Reemplazando:

𝑉(𝑋) = 2,16 − 1,082 = 0,9936


Finalmente,

la desviación estándar de 𝑋 es:


𝜎 = 𝐷𝑆(𝑋) = √𝑉(𝑋) =

el coeficiente de variación de X es:


𝐷𝑆(𝑋)
𝐶𝑉(𝑋) = = =
𝐸(𝑋)
UPC MA444 Estadística 113
Ejemplo 2
Un ingeniero civil del departamento de obras muestra la distribución de probabilidad de la variable
aleatoria 𝑋: = número de habitaciones a construir en edificios residenciales.

x 4 5 7 8 9
f(x) 0,20 0,25 0,10 0,15 0,30

a. Si la gerencia del departamento de obras le impone que construya menos de ocho habitaciones y
suponiendo que se cumple con este requerimiento, ¿cuál es la probabilidad que construya por lo
menos cinco habitaciones?
b. Si el costo de una vivienda, en dólares, está en función del número de habitaciones de acuerdo con
la siguiente ecuación 𝐶(𝑋) = 14000𝑋 + 5000. Indique la media del costo de una vivienda.

Solución

a. Si la gerencia del departamento de obras le impone que construya menos de ocho habitaciones y
suponiendo que se cumple con este requerimiento, ¿cuál es la probabilidad que construya por lo
menos cinco habitaciones?

Solución

Se trata de una probabilidad condicional. Aplicando la fórmula se tiene que:

𝑃((5 ≥ 𝑋) ∩ (𝑋 < 8)) 𝑃(5 ≤ 𝑋 < 8) 𝑓(5) + 𝑓(7)


𝑃(𝑋 ≥ 5⁄𝑋 < 8) = = =
𝑃(𝑋 < 8) 𝑃(𝑋 < 8) 𝑓(4) + 𝑓(5) + 𝑓(7)

0,25 + 0,10 0,35


= = = 0,6364
0,20 + 0,25 + 0,10 0,55

b. ¿Cuánto esperaría pagar un cliente por una vivienda?

Solución

Usando la fórmula se tiene que:

𝜇 = 𝐸(𝑋) = ∑ 𝑥𝑓(𝑥) = 4 × 0,20 + 5 × 0,25 + 7 × 0,10 + 8 × 0,15 + 9 × 0,30


𝑥=4

𝐸(𝑋) = 6,65 habitaciones

El valor esperado o media del costo será:

𝐸(𝐶(𝑋)) = 𝐸(14000𝑋 + 5000) = 14000 𝐸(𝑋) + 5000

Por lo tanto, la media del costo de una vivienda es de 89100 dólares.


UPC MA444 Estadística 114
Ejercicios propuestos

30.Según el departamento de control de calidad de la empresa Construye S.A., el número de fallas


superficiales en la elaboración de cables de luz en su presentación de rollos de 20 metros
corresponde a una variable aleatoria X, la misma que presenta la siguiente función de probabilidad:

Número de fallas superficiales 0 1 2 3 4


Probabilidad a 0,27 0,16 b 0,01

Si el valor esperado de X es 1,71 fallas por cable, ¿cuál es la probabilidad de que un cable presente
a lo más dos fallas?

31.Según el departamento de control de calidad de una empresa fabricante de tornillos, el número de


fallas superficiales en los tornillos corresponde a una variable aleatoria 𝑋 con 𝐸(𝑋) = 0,88 por
tornillo. Además, se sabe que la función de probabilidad está dada por:

x 0 1 2 3 4
f(x) a 0,37 0,16 b 0,01

a. Calcule la probabilidad de que un tornillo presente al menos dos fallas.


b. Calcule la varianza y el coeficiente de variación de X.

32.Una librería necesita hacer el pedido semanal de una revista especializada de ingeniería. Por
registros históricos, se sabe que las frecuencias relativas de vender una cantidad de ejemplares es
la siguiente:

Demanda de ejemplares 1 2 3 4 5 6
Frecuencia relativa 1/15 2/15 3/15 4/15 3/15 2/15

Calcule la media y varianza de la demanda de ejemplares.

33.En un almacén de aparatos electrónicos se almacenan 10 tostadoras para su distribución, cuatro de


la marca A y el resto de las marcas menos conocidas. Si un empleado selecciona al azar cinco
tostadoras para llevarlas por encargo a una tienda para su comercialización, calcular la probabilidad
de que en las cinco tostadoras seleccionadas:

a. Calcule la probabilidad de que en las cinco tostadoras seleccionadas existan exactamente dos
de la marca A.
b. Calcule la probabilidad de que en las cinco tostadoras seleccionadas, a lo sumo, haya una
tostadora de las marcas menos conocidas.
UPC MA444 Estadística 115
Distribuciones discretas especiales

Distribución binomial

El experimento consiste en 𝑛 pruebas idénticas de Bernoulli. Cada prueba tiene únicamente dos
resultados: éxito o fracaso. 𝑃(é𝑥𝑖𝑡𝑜) = 𝑝 y 𝑃(𝑓𝑟𝑎𝑐𝑎𝑠𝑜) = 1 − 𝑝 se mantiene constante a lo largo de
todas las pruebas.

Las pruebas son independientes.

La probabilidad del evento considerado como éxito es constante en cada prueba y se denota por 𝑝.

La variable aleatoria binomial se define como:

𝑋: = número de éxitos que ocurren en los 𝑛 ensayos o pruebas

La función de probabilidad de 𝑋 es:

𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 𝐶𝑥𝑛 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥 , 𝑥 = 0,1, 2, . . . , 𝑛

donde:

𝑛: = número de ensayos o pruebas


𝑝: = probabilidad de éxito en cada ensayo
1 – 𝑝: = probabilidad de fracaso

Notación
Si la variable aleatoria 𝑋 sigue una distribución binomial con parámetros 𝑛 y 𝑝 se denota 𝑋~𝐵(𝑛, 𝑝).

Media
 = 𝐸(𝑋) = 𝑛𝑝

Varianza
2 = 𝑉(𝑋) = 𝑛𝑝(1 − 𝑝)

Para el cálculo de probabilidades de una distribución binomial en Excel se usa la función:


=DISTR.BINOM.N(𝑥; 𝑛 = número de repeticiones; 𝑝 = probabilidad de éxito; acumulado = 1).
UPC MA444 Estadística 116
Ejemplo 1

La probabilidad de que el comprador de un osciloscopio haga uso del servicio dentro del plazo de
garantía es 0,20. Para los cinco osciloscopios que cierta empresa ha vendido independientemente a
cinco compradores este mes.

a. ¿Cuál es la probabilidad de que exactamente tres compradores hagan uso de la garantía?


b. ¿Cuál es la probabilidad que máximo un comprador haga uso de la garantía?
c. ¿Cuál es la probabilidad de que tres o más compradores hagan uso de la garantía?

Solución

𝑋: = número de compradores de osciloscopios que hagan uso de la garantía

𝑋~𝐵(𝑛 = 5, 𝑝 = 0,20)

El rango de 𝑋 es 0, 1, 2, …, 5

La función de probabilidad 𝑓(𝑥) es:

𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 𝐶𝑥5 0,20𝑥 (1 − 0,20)5−𝑥 , 𝑥 = 0, 1, 2, . . . ,5

a. ¿Cuál es la probabilidad de que exactamente tres compradores hagan uso de la garantía?

Solución

La probabilidad pedida es:

𝑃(𝑋 = 3) = 𝑓(3) = 𝐶35 0,203 (1 − 0,20)2 = 0,0512

b. ¿Cuál es la probabilidad que máximo un comprador haga uso de la garantía?

Solución

La probabilidad pedida es:

𝑃(𝑋 ≤ 1) = 𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) = 𝑓(0) + 𝑓(1)

𝑃(𝑋 ≤ 1) = 𝐶05 0,200 (1 − 0,20)5 + 𝐶15 0,201 (1 − 0,20)4 = 0,73728

c. ¿Cuál es la probabilidad de que tres o más compradores hagan uso de la garantía?

Solución

La probabilidad pedida es:

𝑃(𝑋 ≥ 3) = 1 − 𝑃(𝑋 < 3)


UPC MA444 Estadística 117

= 1 − [𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2)]

= 1 − [𝐶05 0,200 (1 − 0,20)5 + 𝐶15 0,21 (1 − 0,2)4 + 𝐶25 0,22 (1 − 0,2)3 ]

𝑃(𝑋 ≥ 3) = 1 − 0,94208 = 0,05792

Ejemplo 2

El supervisor de una obra ha determinado que un proveedor entrega los pedidos a tiempo alrededor
del 94% de las veces. Para su última obra, el supervisor seleccionó una muestra de 12 pedidos.

a. Calcule la probabilidad de que el proveedor entregue 11 pedidos a tiempo.


b. Calcule el valor esperado del número de pedidos entregados a tiempo.

Sea 𝑋: = número de pedidos entregados a tiempo en una muestra de 12 pedidos

𝑋~𝐵(𝑛 = 12, 𝑝 = 0,94)

El rango de 𝑋 es 0, 1, 2, …, 12

La función de probabilidad 𝑓(𝑥) es:

𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 𝐶𝑥12 0,94𝑥 (1 − 0,94)12−𝑥 𝑥 = 0, 1, 2, . . . ,12

a. Calcule la probabilidad de que el proveedor entregue 11 pedidos a tiempo.

Solución

La probabilidad pedida es:

12
𝑃(𝑋 = 11) = 𝐶11 0,9411 (1 − 0,94)1 = 0,3645

c. Calcule el valor esperado del número de pedidos entregados a tiempo.

Solución

El valor esperado es:

𝐸(𝑋) = 𝑛𝑝 = 11,28
UPC MA444 Estadística 118
Ejemplo 3

En un proceso de fabricación se produce unidades precoladas con un 1% de unidades defectuosas.


Todos los días se someten a prueba 10 unidades seleccionadas al azar de la producción diaria. Si existen
fallas en una o más de estas unidades se detiene el proceso de producción.

La variable aleatoria 𝑋 se define 𝑋: =

𝑋~

El rango de 𝑋 es 0, 1, 2, …,

𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 𝐶𝑥𝑛 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥 𝑥 = 0, 1, 2, . . . , 𝑛

a. ¿Cuál es la probabilidad de encontrar dos unidades defectuosas?

b. ¿Cuál es la probabilidad de encontrar al menos dos unidades defectuosas?

c. ¿Cuál es la probabilidad de detener el proceso?

d. Calcule el valor esperado y el coeficiente de variabilidad del número de unidades no defectuosas.


UPC MA444 Estadística 119
Ejercicios propuestos

34.Un cierto sistema mecánico contiene componentes y se han seleccionado al azar 10. Suponga que
la probabilidad de que cualquier componente individual falle es de 0,07 y que los componentes
fallan independientes unos de otros.

a. Calcule la probabilidad de que falle al menos uno de los componentes.


b. Calcule la probabilidad de que fallen exactamente dos componentes.
c. Calcule la probabilidad de que fallen entre dos y cinco componentes.
d. Obtenga los valores de 𝐸(𝑋) y 𝑉(𝑋).
UPC MA444 Estadística 120
Caso: Ferrosa

Ferrosa es una empresa dedica a la venta al por mayor y menor


de artículos de ferretería. Actualmente, la gerencia de
comercialización ha detectado determinados problemas que
están afectando las ventas de la empresa, por lo que, encargó a
un grupo de profesionales realizar un estudio para identificar
dichos los problemas. Analizando la información, se
identificaron los siguientes problemas:

Problema 1
En el área de ventas de la empresa se han detectado reclamos por parte de los clientes que adquirieron
equipos de protección fallados y que serán devueltos. Si la probabilidad que se devuelvan dos o más
equipos en una semana es mayor a 0,35; se recomendará a la gerencia de comercialización cambiar de
proveedor. A continuación, se muestra la siguiente información:

Cantidad de equipos de protección fallados devueltos por semana 1 2 3 4 5


f(x) = P(X = x) 2k 0,42 k 0,20 0,08

¿Qué decisión deberá tomar el gerente de comercialización?

Interpretación Representación Cálculo Análisis Argumentación


Habilidad para Habilidad para identificar Habilidad para Habilidad para Habilidad de
identificar el la variable(s) y elegir las determinar los analizar, comunicar y
problema a herramientas valores de las entender e sustentar la decisión
resolver estadísticas que usará probabilidades interpretar los final en base a los
para resolver el resultados resultados y el
problema análisis

Problema 2
Debido a la globalización y al desarrollo constante de las comunicaciones, los pedidos por internet se
han incrementado últimamente. Un grupo de profesionales de la empresa ha observado que el 25%
de sus clientes realiza sus compras por Internet. Si se eligen al azar 10 clientes y se obtiene que la
probabilidad de que más de tres de ellos realizaron sus compras por Internet supera el 0,2, entonces
se recomendará a la gerencia implementar la promoción de envió de pedidos a domicilio sin ningún
costo.

Interpretación Representación Cálculo Análisis Argumentación


Habilidad para Habilidad para Habilidad para Habilidad para Habilidad de comunicar
identificar el identificar la variable(s) determinar los analizar, y sustentar la decisión
problema a y elegir las herramientas valores de las entender e final en base a los
resolver estadísticas que usará probabilidades interpretar los resultados y el análisis
para resolver el resultados
problema
UPC MA444 Estadística 121
Distribución Poisson

El experimento consiste en realizar el conteo del número X de veces que ocurre un evento en particular
durante una unidad de tiempo, área, volumen, peso, distancia o cualquier otra unidad de medida dada.

La probabilidad de que un evento ocurra en una unidad dada de tiempo, área, etc.; es la misma para
todas las unidades.

El número de eventos que ocurren en una unidad de tiempo, área, volumen es independiente del
número de los que ocurren en otras unidades.

La variable aleatoria Poisson se define como:

𝑋: = número de veces que ocurre un evento durante un intervalo definido

La función de probabilidad 𝑓(𝑥) de 𝑋 es:

𝑒 −𝜇 𝜇 𝑥
𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 𝑥 = 0, 1, 2, 3, …
𝑥!

donde:

𝑒: = base del sistema de logaritmos neperianos


: = razón promedio de ocurrencia
𝑡: = periodo de evaluación

Notación
La variable aleatoria X sigue una distribución Poisson con parámetro 𝜇 y se denota por 𝑋~𝑃(𝜇), donde
𝜇 = 𝑡

Media
𝜇 = 𝐸(𝑋) = 𝜆𝑡

Varianza
𝜎 2 = 𝑉(𝑋) = 𝜆𝑡

Para el cálculo de probabilidades de una distribución Poisson en Excel se usa la función:


=POISSON.DIST(x; media = lambda; acumulado = 0).
UPC MA444 Estadística 122
Ejemplo 3
En la inspección del pavimento y asfalto de una carretera recién construida se ha detectado que hay,
en promedio 1,25 baches o fisuras cada cuatro kilómetros. Asumiendo una distribución de Poisson,
determine:

a. La probabilidad de que en el siguiente kilómetro se encuentre dos baches o fisuras.

Solución

Sea 𝑋: = número de baches o fisuras cada kilómetro

Calculemos la media 𝜇 = 𝑡.

 = 1,25 𝑏𝑎𝑐ℎ𝑒𝑠 𝑐𝑎𝑑𝑎 4 𝑘𝑚

𝑡 = 1 𝑘𝑚

Por lo tanto,
1,25 𝑏𝑎𝑐ℎ𝑒𝑠
𝜇 = 𝑡 = × 1 𝑘𝑚 = 0,3125
4 𝑘𝑚

𝑋~𝑃(𝜇 = 0,3125)

La función de distribución de la variable Poisson es:

𝑒 −0,3125 0,3125𝑥
𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 𝑥 = 0, 1, 2, 3, …
𝑥!

La probabilidad pedida es:


𝑒 −0,3125 0,31252
𝑓(2) = 𝑃(𝑋 = 2) = = 0,03572
2!

b. La probabilidad de que en los siguientes dos kilómetros se encuentre a lo más tres baches o fisuras.

Solución

Sea 𝑌: = número de baches o fisuras cada dos kilómetros

Calculemos la media 𝜇 = 𝑡.

 = 1,25 𝑏𝑎𝑐ℎ𝑒𝑠 𝑐𝑎𝑑𝑎 4 𝑘𝑚

𝑡 = 2 𝑘𝑚

Por lo tanto,
1,25 𝑏𝑎𝑐ℎ𝑒𝑠
𝜇 = 𝑡 = × 2 𝑘𝑚 = 0,625
4 𝑘𝑚
UPC MA444 Estadística 123

𝑌~𝑃(𝜇 = 0,625)

La función de distribución de la variable Poisson es:

𝑒 −0,625 0,625𝑦
𝑓(𝑦) = 𝑃(𝑌 = 𝑦) = 𝑦 = 0, 1, 2, 3, …
𝑦!

La probabilidad pedida es:

𝑃(𝑋 ≤ 3) = 𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2) + 𝑃(𝑋 = 3)

= 𝑓(0) + 𝑓(1) + 𝑓(2) + 𝑓(3)

𝑒 −0,3125 0,31250 𝑒 −0,3125 0,31251 𝑒 −0,3125 0,31252 𝑒 −0,3125 0,31253


= + +
0! 1! 2! 3!

= 0,5353 + 0,3345 + 0,1045 + 0,0218 = 0,9961

c. El costo de reparación de estos defectos es de 35 dólares por cada bache o fisura detectada.
Calcule el costo esperado al inspeccionar 80 km de esta carretera.

Solución

Sea 𝑊: = número de baches o fisuras en 80 kilómetros

Calculemos la media 𝜇 = 𝑡.

 = 1,25 𝑏𝑎𝑐ℎ𝑒𝑠 𝑐𝑎𝑑𝑎 4 𝑘𝑚

𝑡 = 80 𝑘𝑚

Por lo tanto,
1,25 𝑏𝑎𝑐ℎ𝑒𝑠
𝜇 = 𝑡 = × 80 𝑘𝑚 = 25
4 𝑘𝑚

𝑊~𝑃(𝜇 = 25)

Definamos la variable costo 𝐶(𝑋).

𝐶(𝑋) = 35𝑋

Calculemos el esperado de la variable costo 𝐶(𝑋).

𝐸(𝐶(𝑋)) = 𝐸(35𝑋) = 35𝐸(𝑋) = 35 × 25 = 875

Luego, el costo esperado al inspeccionar 80 km de esta carretera es 875 dólares.


UPC MA444 Estadística 124
Ejemplo 3
En un estudio del tránsito en cierta intersección, se determinó que el número de automóviles que
llegan a un óvalo tiene distribución de Poisson con media igual a tres automóviles por segundo.

a. Calcule la probabilidad de que en dos segundos lleguen al óvalo exactamente dos automóviles.
b. Calcule la probabilidad de que en dos segundos lleguen al óvalo menos de tres automóviles.
c. Calcule la probabilidad de que en los siguientes tres segundos lleguen al óvalo por lo menos dos
automóviles.

Solución

a. Calcule la probabilidad de que en dos segundos lleguen al óvalo exactamente dos automóviles.

Solución

Sea 𝑋: = número de automóviles que llegan a un óvalo en dos segundos

Calculemos la media 𝜇 = 𝑡.

 = 3 𝑎𝑢𝑡𝑜𝑠 𝑐𝑎𝑑𝑎 𝑠𝑒𝑔𝑢𝑛𝑑𝑜

𝑡 = 2 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠

Por lo tanto:

3 𝑎𝑢𝑡𝑜𝑠
𝜇 = 𝑡 = × 2 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠 = 6
1 𝑠𝑒𝑔𝑢𝑛𝑑𝑜

𝑋~𝑃(𝜇 = 6)

La probabilidad pedida es:

62 × 𝑒 −6
𝑃(𝑋 = 2) = = 0,0446
2!

b. Calcule la probabilidad de que en dos segundos lleguen al ovalo menos de tres automóviles.

Solución

La probabilidad pedida es:

𝑃(𝑋 < 3) = 𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2) = 𝑓(0) + 𝑓(1) + 𝑓(2)

60 𝑒 −6 61 𝑒 −6 62 𝑒 −6
𝑃(𝑋 < 3) = + +
0! 1! 2!

𝑃(𝑋 < 3) = 0,0620


UPC MA444 Estadística 125
c. Calcule la probabilidad de que en los siguientes tres segundos lleguen al óvalo por lo menos dos
automóviles.

Solución

Sea 𝑌: = número de automóviles que llegan a un óvalo en tres segundos

Calculemos la media 𝜇 = 𝑡.

 = 3 𝑎𝑢𝑡𝑜𝑠 𝑐𝑎𝑑𝑎 𝑠𝑒𝑔𝑢𝑛𝑑𝑜

𝑡 = 3 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠

Por lo tanto,
3 𝑎𝑢𝑡𝑜𝑠
𝜇 = 𝑡 = × 3 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠 = 9
1 𝑠𝑒𝑔𝑢𝑛𝑑𝑜

𝑋~𝑃(𝜇 = 9)

La probabilidad pedida es:

𝑃(𝑌 ≥ 2) = 1 − 𝑃(𝑌 < 2) = 1 − [𝑃(𝑌 = 0) + 𝑃(𝑌 = 1)]

90 × 𝑒 −9 91 × 𝑒 −9
𝑃(𝑌 ≥ 2) = 1 − ( + )
0! 1!

𝑃(𝑌 ≥ 2) = 1 − 0,00123 = 0,9988

Ejemplo 4

Con la finalidad de diseñar un nuevo sistema de control de tráfico, un ingeniero recoge información
sobre el número de automóviles que llegan a una intersección. Por histórico, se sabe que en promedio
llegan cuatro autos a la intersección cada minuto según un proceso de Poisson.

a. ¿Qué probabilidad hay de que en 30 segundos lleguen tres autos?


b. ¿Qué probabilidad hay de que entre las 5:25 pm y 5:28 pm lleguen más de dos autos?
c. Si en un minuto llegaron más de tres autos, ¿cuál es la probabilidad que como máximo sean
cinco los autos que llegaron en ese minuto?

Solución

La variable aleatoria 𝑋 se define 𝑋: =

𝑋~
El rango de 𝑋 es

La función de probabilidad 𝑓(𝑥) es:


UPC MA444 Estadística 126

a. ¿Qué probabilidad hay de que en 30 segundos lleguen tres autos?

b. ¿Qué probabilidad hay de que entre las 5:25 pm y 5:28 pm lleguen más de dos autos?

c. Si en un minuto llegaron más de tres autos, ¿cuál es la probabilidad que como máximo sean cinco
los autos que llegaron en ese minuto?

Ejemplo 5
Cierto tipo de azulejo puede tener un número X de puntos defectuosos con media de tres puntos
defectuosos por azulejo. Calcule la probabilidad de que se presenten cinco defectos en un azulejo
elegido al azar.

La variable aleatoria 𝑋 se define como 𝑋: =

𝑋~
El rango de 𝑋 es

La función de probabilidad 𝑓(𝑥) es:


UPC MA444 Estadística 127
Ejercicios propuestos

35.Debido al calentamiento global, es muy común la presencia de caracoles en las represas debido a
sus aguas estancadas, lo cual hace que se produzcan enfermedades nocivas para el hombre y su
entorno. El número de caracoles presentes en las aguas estancadas sigue una distribución Poisson
con un promedio de 16 caracoles por cinco m3 de agua.

La OMS establece que si la probabilidad de que haya más de un caracol presente en un m3 de agua
estancada es mayor a 0,75 se deberá comprar un filtro especial como norma sanitaria. ¿Se llegará
a realizar la compra de dicho filtro?

36.En un estudio del tránsito en cierta intersección, se determinó que el número de automóviles que
llegan a un óvalo tiene distribución de Poisson con media igual a cinco automóviles por segundo.

a. Calcule la probabilidad de que en un segundo lleguen al óvalo más de dos automóviles.


b. Calcule la probabilidad de que en los siguientes diez segundos lleguen al óvalo 40 automóviles.
c. Suponga que el 90% de vehículos que llegan diariamente al óvalo mencionado son de
transporte privado. Para los siguientes cinco días, calcule la probabilidad de que lleguen al
óvalo por lo menos tres vehículos de transporte privado.
UPC MA444 Estadística 128
Caso: Ferrosa

Ferrosa es una empresa dedica a la venta al por mayor y


menor de artículos de ferretería. Actualmente, la
gerencia de comercialización ha detectado algunos
problemas que están afectando las ventas de la empresa.
Los clientes manifiestan que el tiempo que esperan para
pagar los productos es demasiado y algunos optan por
retirase y dirigirse a la competencia, ocasionando
pérdidas significativas para la empresa.

El grupo encargado de la investigación ha revisado la información histórica y determinó que en


promedio llegan a la ferretería 30 clientes cada hora según un proceso de Poisson. La gerencia de
comercialización establece que; si la probabilidad de que lleguen a la ferretería por lo menos tres
clientes en un lapso de cinco minutos es mayor a 0,30; tomará la decisión de ampliar el número de
ventanillas para el pago de productos.

¿La gerencia deberá ampliar el número de ventanillas para el pago de productos?

Interpretación Representación Cálculo Análisis Argumentación


Habilidad para Habilidad para Habilidad para Habilidad para Habilidad de
identificar el identificar la variable(s) determinar los analizar, comunicar y
problema a y elegir las valores de las entender e sustentar la decisión
resolver herramientas probabilidades interpretar los final en base a los
estadísticas que usará resultados resultados y el
para resolver el análisis
problema
UPC MA444 Estadística 129
Variables aleatorias continuas
Función de densidad de una variable continua

Se denomina función de densidad 𝑓(𝑥) de una variable aleatoria continua X a la función f(x) integrable
que satisface:

Condición 1
𝑓(𝑥) ≥ 0

Condición 2
+∞

∫ 𝑓(𝑥)𝑑𝑥 = 1
−∞

Cálculo de una probabilidad usando la función de densidad

𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = ∫ 𝑓(𝑥)𝑑𝑥
𝑎
Para variables continuas se cumple:

𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = 𝑃(𝑎 < 𝑋 ≤ 𝑏) = 𝑃(𝑎 ≤ 𝑋 < 𝑏) = 𝑃(𝑎 < 𝑋 < 𝑏)

Ejemplo 1
Sea 𝑘 una constante y consideremos la función de densidad de la vida útil, en años, de cierto tipo de
computadora.

𝑘𝑥 0≤𝑥≤2
𝑓(𝑥) = {
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

a. Obtenga el valor de 𝑘, para que 𝑓(𝑥) sea función de densidad.


b. Calcule 𝑃(0,5 < 𝑋 < 1,8).
c. Calcule 𝑃(𝑋 > 1).
UPC MA444 Estadística 130
Solución

a. Obtenga el valor de 𝑘, para que 𝑓(𝑥) sea función de densidad.

Solución

Para que 𝑓(𝑥) sea función de densidad debe satisfacer las siguientes condiciones:

Condición 1
𝑓(𝑥) ≥ 0

Para el tramo 0 ≤ 𝑥 ≤ 2
𝑘𝑥≥0
Por tanto, 𝑘 debe ser positivo.

Condición 2
+∞

∫ 𝑓(𝑥)𝑑𝑥 = 1
−∞

La función tiene el valor 0, fuera del tramo 0 ≤ 𝑥 ≤ 2; por lo tanto:

∫ 𝑘𝑥 𝑑𝑥 = 1
0
Integrando:
2
𝑥2
𝑘 ( )|
2 0
Evaluando en 0 y 2. se tiene:
22 02
𝑘 −𝑘 =1
2 2

1
𝑘=
2
Reemplazando tenemos:

1
𝑓(𝑥) = {2 𝑥 0≤𝑥≤2
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

b. Calcule 𝑃(0,5 < 𝑋 < 1,8).

Solución
La probabilidad pedida es:
1,8
1
𝑃(𝑋 > 1) = ∫ 𝑥 𝑑𝑥 = 0,7475
2
0,5
UPC MA444 Estadística 131

c. Calcule 𝑃(𝑋 > 1).

Solución
La probabilidad pedida es:
2
1
𝑃(𝑋 > 1) = ∫ 𝑥 𝑑𝑥 = 0,75
2
1

Función de distribución acumulada

La función de distribución acumulativa 𝐹(𝑥) para una variable aleatoria continua 𝑋 se define:
𝑥
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = ∫ 𝑓(𝑡)𝑑𝑡
−∞

Si 𝐹(𝑥) es la función de distribución acumulativa para una variable aleatoria continua 𝑋, entonces la
función de densidad 𝑓(𝑥) para 𝑋 es:

𝑑𝐹(𝑥)
𝑓(𝑥) =
𝑑𝑥

Para la siguiente probabilidad se cumple que:

𝑃(𝑎 < 𝑋 ≤ 𝑏) = 𝐹(𝑏) − 𝐹(𝑎)

En general, para variables cuantitativas continuas se cumple:

𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = 𝑃(𝑎 < 𝑋 ≤ 𝑏) = 𝑃(𝑎 ≤ 𝑋 < 𝑏) = 𝑃(𝑎 < 𝑋 < 𝑏)


UPC MA444 Estadística 132
Ejemplo 1

El tiempo, en minutos, que un tren se retrasa es una variable aleatoria continua X con la siguiente
función de densidad:

3 2
𝑓(𝑥) = {250 (25 − 𝑥 ) 0≤𝑥≤5
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

a. Determine la función acumulada 𝐹(𝑋).


b. Calcule 𝑃(𝑋 > 2) haciendo uso de la función acumulada.
c. Calcule 𝑃(1,5 < 𝑋 < 3,5) haciendo uso de la función acumulada.

Solución
a. Determine la función acumulada 𝐹(𝑋).

Solución
Para hallar la función acumulada emplearemos la definición de la función de distribución
acumulada 𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥).

Para el tramo 0 ≤ 𝑥 < 5, se tiene:


𝑥
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = ∫ 𝑓(𝑡)𝑑𝑡
−∞

Para el tramo descrito se tiene que:


𝑥
3
𝐹(𝑥) = ∫ (25 − 𝑡 2 )𝑑𝑡
0 250

𝑥
3 𝑡3
= (25𝑡 − )|
250 3 0

75𝑥 − 𝑥 3
𝐹(𝑥) =
250

Finalmente, la función de distribución acumulada se representa de la siguiente manera:

0 𝑥<0
75𝑥 − 𝑥 3
𝐹(𝑥) = { 0≤𝑥<5
250
1 𝑥≥5
UPC MA444 Estadística 133

b. Calcule 𝑃(𝑋 > 2) haciendo uso de la función acumulada.

Solución
La probabilidad pedida es:

𝑃(𝑋 > 2) = 1 − 𝑃(𝑋 ≤ 2)

Usando la definición de función de distribución acumulada.

𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥)

𝑃(𝑋 > 2) = 1 − 𝑃(𝑋 ≤ 2) = 1 − 𝐹(2)

75𝑥− 𝑥 3
Reemplazando el valor 𝑋 = 2 en 𝐹(𝑥) = 250
.

75 × 2 − 23
=1− = 0,432
250

c. Usando la función acumulada, calcule 𝑃(1,5 < 𝑋 < 3,5).

Solución
La probabilidad pedida es:

𝑃(1,5 < 𝑋 < 3,5) = 𝐹(3,5) − 𝐹(1,5)

75 × 3,5 − 3,53 75 × 1,5 − 1,53


= − = 0,442
250 250
UPC MA444 Estadística 134
Principales distribuciones de variables aleatorias continuas
Distribución exponencial

Función de densidad

Una variable aleatoria 𝑋 es exponencial con parámetro 𝛽 > 0, si su función de densidad es:

1 −𝛽𝑥
𝑓(𝑥) = {𝛽 𝑒 𝑥≥0
0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

Notación

Si 𝑋 sigue una distribución exponencial con parámetro 𝛽 se denota por 𝑋 ~ 𝐸𝑥𝑝 ().

Media
𝜇 = 𝐸(𝑋) = 𝛽

Varianza
𝜎 2 = 𝑉(𝑋) = 𝛽 2

Función de distribución acumulada

La definición de la función de distribución acumulada es:


𝑥
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = ∫ 𝑓(𝑥) 𝑑𝑥
−∞

Como el rango de 𝑋 es de 0 a +∞.

𝑥
1 −𝛽𝑥 −
𝑥
𝐹(𝑥) = ∫ 𝑒 𝑑𝑥 = 1 − 𝑒 𝛽
0 𝛽

𝑥

𝐹(𝑥) = 1 − 𝑒 𝛽
UPC MA444 Estadística 135
Características

• La variable puede tomar valores de 0 a +, no toma valores negativos.

• La gráfica es descendente con sesgo a la derecha.

• Existe una curva para cada valor de .

• La distribución exponencial se usa para describir la vida útil de un dispositivo o tiempo de


funcionamiento hasta que falle y  es el promedio de la vida útil (vida media) del dispositivo.

Ejemplo 1

El tiempo de vida de un componente tiene la siguiente función de densidad:

1 − 𝑥
𝑓(𝑥) = 𝑒 500 𝑥≥0
500

a. ¿Cuál es la probabilidad de que un componente dure más de 800 días?


b. Calcule el valor de la mediana.

Solución

a. ¿Cuál es la probabilidad de que un componente dure más de 800 días?

Solución

La probabilidad pedida es:

𝑃(𝑋 > 800)

= 1 − 𝑃(𝑋 ≤ 800)

−800
= 1 − (1 − 𝑒 500 ) = 0,2019

b. Calcule el valor de la mediana.

Solución

Por definición de mediana.


𝑃(𝑋 ≤ 𝑀𝑒) = 0,50

𝐹(𝑀𝑒) = 0,50
𝑥

Usando la función de distribución acumulada 𝐹(𝑥) = 1 − 𝑒 𝛽 de la variable exponencial tenemos
que:
UPC MA444 Estadística 136
−𝑀𝑒
(1 − 𝑒 500 ) = 0,50

−𝑀𝑒
𝑒 500 = 0,50

Tomamos logaritmo neperiano en ambos términos de la ecuación:

−𝑀𝑒
𝑙𝑛 (𝑒 500 ) = 𝑙𝑛(0,50)

𝑀𝑒
− = 𝑙𝑛(0,50)
500

Despejando:

−𝑀𝑒 = −0,693 × 500

𝑀𝑒 = 346,5 días

El 50% de las componentes duran 346,5 días o menos.

Ejemplo 2

La duración, en miles de millas, que obtienen los dueños de automóviles con cierto tipo de neumático
es una variable aleatoria con la siguiente función de densidad:

1 −𝑥
𝑓(𝑥) = {20 𝑒 𝑥≥0
20

0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

a. Calcule la probabilidad de que un neumático dure como máximo diez mil millas.

b. Calcule la probabilidad de que un neumático dure entre 16 mil y 24 mil millas.

c. Calcule la probabilidad de que un neumático dure al menos 30 mil millas.


UPC MA444 Estadística 137
Ejercicios propuestos

37.La duración, en minutos, de una conversación telefónica de larga distancia nacional tiene
distribución exponencial con promedio de ocho minutos.

a. ¿Cuál es la probabilidad que una llamada dure entre tres y diez minutos?
b. ¿Cuál es la probabilidad que una llamada dure más de 9 minutos?
c. ¿Cuánto debe durar como mínimo una llamada para estar considerada dentro del 10% de las
de mayor duración?
d. Si la llamada dura más de cinco minutos ¿cuál es la probabilidad de que dure a lo más 8
minutos?

38.Suponga que la vida útil, en horas, de cierta marca de foco electrónico, es una variable aleatoria X
cuya función de densidad de probabilidad es:

𝑥

𝑓(𝑥) = {𝑐𝑒 8000 𝑥≥0
0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

a. Calcule el valor de la constante 𝑐 para que 𝑓(𝑥) sea función de densidad.


b. Si se selecciona un foco electrónico al azar, calcule la probabilidad de dure más de diez mil
horas.

39.La vida, en horas, de un dispositivo electrónico es una variable aleatoria que tiene la siguiente
función de densidad:

1 −𝑥
𝑓(𝑥) = {50 𝑒 𝑥≥0
50

0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

a. Calcule e interprete la mediana. Si un lote tiene 20 de estos dispositivos, ¿cuántos se esperaría


que duren más que la mediana?
b. Si el dispositivo duró 80 horas, ¿cuál es la probabilidad de que dure 25 horas más?
UPC MA444 Estadística 138
Distribución normal

Esta distribución se aproxima a las distribuciones de frecuencias observadas de muchas medidas


naturales y físicas, como es el caso de pesos, alturas, ventas, vida útil de producción, coeficiente
intelectual, etc.

La curva normal tiene forma de campana y es simétrica con respecto a su media


La media, la mediana y la moda son iguales y se encuentran en x =  y la desviación estándar es .

Función de densidad

La variable aleatoria X es normal si su función de densidad se define de la siguiente manera:

1 1 𝑥−𝜇 2
− ( )
𝑓(𝑥) = 𝑒 2 𝜎 −∞<𝑥 <∞
√2𝜋 𝜎

Notación
Si la variable aleatoria tiene distribución normal con parámetros 𝜇 y 𝜎 2 se denota:

𝑋 ~ 𝑁(, 2 ).

𝑋: = variable aleatoria de interés


𝜇 ≔ media de la distribución
𝜎 ≔ desviación estándar de la distribución

Media
𝐸(𝑋) = 

Varianza
𝑉(𝑋) = 2
UPC MA444 Estadística 139
Ejemplo 1

Si las gráficas son simétricas, ¿qué las diferencia?

Distribución normal estándar

• La distribución normal estándar es una distribución de una variable aleatoria continua, denotada
con la letra 𝑍, que tiene media 0 y desviación estándar 1.
• Una variable aleatoria con distribución normal se puede convertir en una distribución normal
estándar si se realiza la siguiente transformación, llamada de estandarización o de tipificación.

𝑋−𝜇
𝑍=
𝜎

Notación de una variable normal estándar

Si una variable es normal estándar se denota por:

𝑍 ~ 𝑁 (0,1)

Función acumulada de la normal estándar

𝐹 (𝑍) = 𝑃(𝑍 ≤ 𝑧)

La distribución de la variable 𝑍 se encuentra tabulada en la tabla estadística de la normal estándar.


UPC MA444 Estadística 140
Tabla de la distribución normal estándar

Área bajo la curva normal 𝑃(𝑍 ≤ 𝑧) = 𝛼

Z -0.09 -0.08 -0.07 -0.06 -0.05 -0.04 -0.03 -0.02 -0.01 -0.00
-3.9 0.000033 0.000034 0.000036 0.000037 0.000039 0.000041 0.000042 0.000044 0.000046 0.000048
-3.8 0.000050 0.000052 0.000054 0.000057 0.000059 0.000062 0.000064 0.000067 0.000069 0.000072
-3.7 0.000075 0.000078 0.000082 0.000085 0.000088 0.000092 0.000096 0.000100 0.000104 0.000108
-3.6 0.000112 0.000117 0.000121 0.000126 0.000131 0.000136 0.000142 0.000147 0.000153 0.000159
-3.5 0.000165 0.000172 0.000178 0.000185 0.000193 0.000200 0.000208 0.000216 0.000224 0.000233

-3.4 0.000242 0.000251 0.000260 0.000270 0.000280 0.000291 0.000302 0.000313 0.000325 0.000337
-3.3 0.000349 0.000362 0.000376 0.000390 0.000404 0.000419 0.000434 0.000450 0.000466 0.000483
-3.2 0.000501 0.000519 0.000538 0.000557 0.000577 0.000598 0.000619 0.000641 0.000664 0.000687
-3.1 0.000711 0.000736 0.000762 0.000789 0.000816 0.000845 0.000874 0.000904 0.000935 0.000968
-3.0 0.001001 0.001035 0.001070 0.001107 0.001144 0.001183 0.001223 0.001264 0.001306 0.001350

-2.9 0.00139 0.00144 0.00149 0.00154 0.00159 0.00164 0.00169 0.00175 0.00181 0.00187
-2.8 0.00193 0.00199 0.00205 0.00212 0.00219 0.00226 0.00233 0.00240 0.00248 0.00256
-2.7 0.00264 0.00272 0.00280 0.00289 0.00298 0.00307 0.00317 0.00326 0.00336 0.00347
-2.6 0.00357 0.00368 0.00379 0.00391 0.00402 0.00415 0.00427 0.00440 0.00453 0.00466
-2.5 0.00480 0.00494 0.00508 0.00523 0.00539 0.00554 0.00570 0.00587 0.00604 0.00621

-2.4 0.00639 0.00657 0.00676 0.00695 0.00714 0.00734 0.00755 0.00776 0.00798 0.00820
-2.3 0.00842 0.00866 0.00889 0.00914 0.00939 0.00964 0.00990 0.01017 0.01044 0.01072
-2.2 0.01101 0.01130 0.01160 0.01191 0.01222 0.01255 0.01287 0.01321 0.01355 0.01390
-2.1 0.01426 0.01463 0.01500 0.01539 0.01578 0.01618 0.01659 0.01700 0.01743 0.01786
-2.0 0.01831 0.01876 0.01923 0.01970 0.02018 0.02068 0.02118 0.02169 0.02222 0.02275

-1.9 0.02330 0.02385 0.02442 0.02500 0.02559 0.02619 0.02680 0.02743 0.02807 0.02872
-1.8 0.02938 0.03005 0.03074 0.03144 0.03216 0.03288 0.03362 0.03438 0.03515 0.03593
-1.7 0.03673 0.03754 0.03836 0.03920 0.04006 0.04093 0.04182 0.04272 0.04363 0.04457
-1.6 0.04551 0.04648 0.04746 0.04846 0.04947 0.05050 0.05155 0.05262 0.05370 0.05480
-1.5 0.05592 0.05705 0.05821 0.05938 0.06057 0.06178 0.06301 0.06426 0.06552 0.06681

-1.4 0.06811 0.06944 0.07078 0.07215 0.07353 0.07493 0.07636 0.07780 0.07927 0.08076
-1.3 0.08226 0.08379 0.08534 0.08691 0.08851 0.09012 0.09176 0.09342 0.09510 0.09680
-1.2 0.09853 0.10027 0.10204 0.10383 0.10565 0.10749 0.10935 0.11123 0.11314 0.11507
-1.1 0.11702 0.11900 0.12100 0.12302 0.12507 0.12714 0.12924 0.13136 0.13350 0.13567
-1.0 0.13786 0.14007 0.14231 0.14457 0.14686 0.14917 0.15151 0.15386 0.15625 0.15866

-0.9 0.16109 0.16354 0.16602 0.16853 0.17106 0.17361 0.17619 0.17879 0.18141 0.18406
-0.8 0.18673 0.18943 0.19215 0.19489 0.19766 0.20045 0.20327 0.20611 0.20897 0.21186
-0.7 0.21476 0.21770 0.22065 0.22363 0.22663 0.22965 0.23270 0.23576 0.23885 0.24196
-0.6 0.24510 0.24825 0.25143 0.25463 0.25785 0.26109 0.26435 0.26763 0.27093 0.27425
-0.5 0.27760 0.28096 0.28434 0.28774 0.29116 0.29460 0.29806 0.30153 0.30503 0.30854

-0.4 0.31207 0.31561 0.31918 0.32276 0.32636 0.32997 0.33360 0.33724 0.34090 0.34458
-0.3 0.34827 0.35197 0.35569 0.35942 0.36317 0.36693 0.37070 0.37448 0.37828 0.38209
-0.2 0.38591 0.38974 0.39358 0.39743 0.40129 0.40517 0.40905 0.41294 0.41683 0.42074
-0.1 0.42465 0.42858 0.43251 0.43644 0.44038 0.44433 0.44828 0.45224 0.45620 0.46017
-0.0 0.46414 0.46812 0.47210 0.47608 0.48006 0.48405 0.48803 0.49202 0.49601 0.50000
UPC MA444 Estadística 141
Tabla de la distribución normal estándar

Área bajo la curva normal 𝑃(𝑍 ≤ 𝑧) = 𝛼

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.50000 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.52790 0.53188 0.53586
0.1 0.53983 0.54380 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57535
0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 0.60257 0.60642 0.61026 0.61409
0.3 0.61791 0.62172 0.62552 0.62930 0.63307 0.63683 0.64058 0.64431 0.64803 0.65173
0.4 0.65542 0.65910 0.66276 0.66640 0.67003 0.67364 0.67724 0.68082 0.68439 0.68793

0.5 0.69146 0.69497 0.69847 0.70194 0.70540 0.70884 0.71226 0.71566 0.71904 0.72240
0.6 0.72575 0.72907 0.73237 0.73565 0.73891 0.74215 0.74537 0.74857 0.75175 0.75490
0.7 0.75804 0.76115 0.76424 0.76730 0.77035 0.77337 0.77637 0.77935 0.78230 0.78524
0.8 0.78814 0.79103 0.79389 0.79673 0.79955 0.80234 0.80511 0.80785 0.81057 0.81327
0.9 0.81594 0.81859 0.82121 0.82381 0.82639 0.82894 0.83147 0.83398 0.83646 0.83891

1.0 0.84134 0.84375 0.84614 0.84849 0.85083 0.85314 0.85543 0.85769 0.85993 0.86214
1.1 0.86433 0.86650 0.86864 0.87076 0.87286 0.87493 0.87698 0.87900 0.88100 0.88298
1.2 0.88493 0.88686 0.88877 0.89065 0.89251 0.89435 0.89617 0.89796 0.89973 0.90147
1.3 0.90320 0.90490 0.90658 0.90824 0.90988 0.91149 0.91309 0.91466 0.91621 0.91774
1.4 0.91924 0.92073 0.92220 0.92364 0.92507 0.92647 0.92785 0.92922 0.93056 0.93189

1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408
1.6 0.94520 0.94630 0.94738 0.94845 0.94950 0.95053 0.95154 0.95254 0.95352 0.95449
1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.96080 0.96164 0.96246 0.96327
1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670

2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169
2.1 0.98214 0.98257 0.98300 0.98341 0.98382 0.98422 0.98461 0.98500 0.98537 0.98574
2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158
2.4 0.99180 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361

2.5 0.99379 0.99396 0.99413 0.99430 0.99446 0.99461 0.99477 0.99492 0.99506 0.99520
2.6 0.99534 0.99547 0.99560 0.99573 0.99585 0.99598 0.99609 0.99621 0.99632 0.99643
2.7 0.99653 0.99664 0.99674 0.99683 0.99693 0.99702 0.99711 0.99720 0.99728 0.99736
2.8 0.99744 0.99752 0.99760 0.99767 0.99774 0.99781 0.99788 0.99795 0.99801 0.99807
2.9 0.99813 0.99819 0.99825 0.99831 0.99836 0.99841 0.99846 0.99851 0.99856 0.99861

3.0 0.998650 0.998694 0.998736 0.998777 0.998817 0.998856 0.998893 0.998930 0.998965 0.998999
3.1 0.999032 0.999065 0.999096 0.999126 0.999155 0.999184 0.999211 0.999238 0.999264 0.999289
3.2 0.999313 0.999336 0.999359 0.999381 0.999402 0.999423 0.999443 0.999462 0.999481 0.999499
3.3 0.999517 0.999534 0.999550 0.999566 0.999581 0.999596 0.999610 0.999624 0.999638 0.999651
3.4 0.999663 0.999675 0.999687 0.999698 0.999709 0.999720 0.999730 0.999740 0.999749 0.999758

3.5 0.999767 0.999776 0.999784 0.999792 0.999800 0.999807 0.999815 0.999822 0.999828 0.999835
3.6 0.999841 0.999847 0.999853 0.999858 0.999864 0.999869 0.999874 0.999879 0.999883 0.999888
3.7 0.999892 0.999896 0.999900 0.999904 0.999908 0.999912 0.999915 0.999918 0.999922 0.999925
3.8 0.999928 0.999931 0.999933 0.999936 0.999938 0.999941 0.999943 0.999946 0.999948 0.999950
3.9 0.999952 0.999954 0.999956 0.999958 0.999959 0.999961 0.999963 0.999964 0.999966 0.999967
UPC MA444 Estadística 142
La lectura en tabla presenta tres situaciones:

Situación 1 𝑃(𝑍 ≤ 𝑎)

Situación 2 𝑃(𝑍 > 𝑎) = 1 − 𝑃(𝑍 ≤ 𝑎)

Situación 3 𝑃 ≤ 𝑏 = 𝑃(𝑍 ≤ 𝑏) − 𝑃(𝑍 ≤ 𝑎)


UPC MA444 Estadística 143
Ejemplo 1

Calcule las siguientes probabilidades:

a. ¿Cuál es la probabilidad de que Z sea menor a 1,15?

b. ¿Cuál es la probabilidad de que Z sea mayor que 2,01?

c. ¿Cuál es la probabilidad de que Z esté entre –0,13 y 1,05?

d. ¿Cuál será el valor máximo de Z tal que el 15,87% de los valores son menores a Z?
UPC MA444 Estadística 144

e. ¿Cuál será el valor mínimo de Z tal que el 15,87% de los valores son mayores a Z?

Ejemplo 2
Raúl sabe que la gestión del proyecto se mide habitualmente en términos de utilidad, por lo que
analizó la utilidad, en millones de soles, de los proyectos grandes culminados el último año. Sabe,
además, que esta variable tiene distribución normal con media 111,5 millones de soles y desviación
estándar de 25 millones de soles. Si la probabilidad de que un proyecto grande culminado en el último
año genere una utilidad mayor a 112 millones de soles supera a 0,52, no tomará la decisión de
modificar los términos de referencia para invertir en más proyectos grandes caso contrario modificará
los términos de referencia. ¿Qué decisión tomará?

Solución
Definamos la variable:
𝑋: = utilidad, en millones de soles, de los grandes proyectos culminados en el último año

𝑋~𝑁(𝜇 = 111,5; 𝜎 2 = 252 )

La probabilidad pedida es:


𝑃(𝑋 > 112) = 1 − 𝑃(𝑋 ≤ 112)

Estandarizando:
112 − 111,5
= 1 − 𝑃 (𝑍 < )
25

= 1 − 𝑃(𝑍 < 0,02) = 1 − 0,50798 = 0,49202

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.50000 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.52790 0.53188 0.53586
0.1 0.53983 0.54380 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57535
0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 0.60257 0.60642 0.61026 0.61409

Como la 𝑃(𝑋 > 112) = 0,49202 < 0,52, entonces no cumple con lo establecido.

Por lo tanto, sí se tomará la decisión de modificar los términos de referencia para invertir en más
proyectos grandes.
UPC MA444 Estadística 145
Ejemplo 3
Una máquina llena recipientes con determinado producto. Se sabe que el peso de llenado de dicho
producto tiene distribución normal. Se sabe, de acuerdo con los datos históricos, que la media es 20,23
y la desviación estándar de pesos de llenado es de 0,6 onzas.

a. ¿Cuál es la probabilidad de que el peso de llenado sea menor que el promedio?

b. ¿Cuál es la probabilidad de que el peso de llenado sea mayor a 21 onzas?

c. Se dice que la máquina funciona correctamente si el peso de llenado del producto está entre 19,03
y 21,43 ¿Qué tan probable es que la máquina no funcione correctamente?

d. ¿Cuál debe ser el tiempo de llenado mínimo para pertenecer al 25% de recipientes con mayor peso
de llenado?
UPC MA444 Estadística 146
Ejercicios propuestos

40. La medición mensual de la contaminación por polvo atmosférico generado por residuos sólidos
de las construcciones y demoliciones de obras es una variable aleatoria distribuida normalmente
con media de 35 toneladas/km2 y desviación estándar de 15 toneladas/km2. Si la cantidad máxima
de contaminación aceptable según la norma ambiental es de 25 toneladas/km2 por mes, calcule
la probabilidad de que la medición del próximo mes reporte un valor no aceptable.

41. Una máquina automática para el llenado de paquetes de arroz puede regularse de modo que la
cantidad media de arroz llenado sea la que se desee. Si la cantidad de arroz depositada se
distribuye normalmente con desviación estándar igual a 10 gramos, ¿cuál debe ser la regulación
media de modo que solo el 1% de los paquetes tengan un peso neto inferior a 990 gramos?

42. En un taller de la Industria Sideromecánica se fabrican árboles de leva para darles uso en motores
de gasolina. Después de investigaciones realizadas se ha llegado a la conclusión de que la
excentricidad de estos árboles de leva es una variable aleatoria normalmente distribuida con
media de 1,02 pulgadas y desviación estándar de 0,44 pulgadas.
a. Calcule la probabilidad que un árbol de leva tenga una excentricidad menor a una pulgada.
b. Calcule la probabilidad que un árbol de leva tenga una excentricidad mayor a 1,05 pulgadas.
c. Calcule el valor máximo para estar en el 30% de los árboles de leva con menor excentricidad.
d. Calcule el valor mínimo para estar en el 20% de los árboles de leva con mayor excentricidad.

43. La duración de las llamadas telefónicas en una empresa se modela con una variable normal con
media de 130 segundos y desviación estándar de 30 segundos. Calcule la probabilidad que una
llamada dure entre 90 y 170 segundos.

44. Un foco tiene una duración distribuida normalmente con una media de 7000 horas y una
desviación estándar de 1000 horas. Un competidor ha inventado un nuevo foco LED con una
duración distribuida normalmente con una media de 7500 horas y una desviación estándar de
1200 horas. ¿Cuál foco tiene mayor probabilidad de tener una duración mayor que 9000 horas?

45. Un contratista de construcción afirma que elaborar un proyecto demora en promedio 35 horas
de trabajo y el 97,5% de los proyectos demandan como máximo 38,92 horas. Considerando que
los tiempos para completar proyectos similares se distribuyen normalmente.
a. ¿Cuál es la probabilidad de que un proyecto demande menos de 32 horas?
b. Si el contratista demora más de 48 horas deberá devolver 2% del costo de dicho proyecto; si
en cambio demora menos de 29,5 horas, recibirá un incentivo de 5% del costo del proyecto,
¿cuánto esperaría recibir de incentivo?

46. Un fabricante de televisores asegura que el tiempo medio de funcionamiento sin fallas de los
aparatos es de dos años con una desviación estándar de 0,25 años. El tiempo de vida de los
aparatos sigue una distribución normal.
a. ¿Cuál es la probabilidad de que el tiempo de buen funcionamiento sea menor que 2,5 años?
b. Determine la probabilidad de que el tiempo de funcionamiento este entre 1 año y 1,75 años.
c. El fabricante garantiza que remplazará gratis cualquier aparato de televisión cuya duración sin
fallas sea menor que k años. Calcular k de tal modo que sólo el 1% de los aparatos vendidos
tenga que ser reemplazado.
UPC MA444 Estadística 147
Caso: Cemento Tumbo

Cemento Tumbo es una empresa con más de 50 años de


experiencia y vende productos de alta calidad para el
sector de la construcción. Entre sus principales productos
tenemos el cemento tipo I, II, V, que se venden en bolsas
de papel de 42,5 kilos y a granel.

La empresa cree que es bueno brindar productos de alta


calidad para mantenerse en el sitial en que se encuentra,
por lo que desea tener la certeza de que sus productos
cumplan con las especificaciones técnicas que promocionan.

El área de producción ha decidido incorporar un insumo en la elaboración de cemento que abarataría


los costos de producción, por lo que ahora la cantidad de cemento en un m2 de concreto premezclado
de techo aligerado es una variable aleatoria que se distribuye normalmente, con media 0,31 m 3 y
desviación estándar 0,08 m3.

Enterado de esto, el jefe de control de calidad desea saber si el nuevo producto cumple con las normas
técnicas que indican que, por cada metro cuadrado de techo, la cantidad de cemento en concreto
premezclado debe tener un volumen entre 0,21 m3 y 0,41 m3 y tomará la decisión de enviar un reporte
a la gerencia general pidiendo que se detenga la producción si la probabilidad de que no se cumpla
con la norma técnica es mayor a 0,10. ¿Qué decisión tomará?

Interpretación Representación Cálculo Análisis Argumentación


Habilidad para Habilidad para identificar Habilidad para Habilidad para Habilidad de
identificar el la variable(s) y elegir las determinar los analizar, comunicar y sustentar
problema a herramientas estadísticas valores de las entender e la decisión final en
resolver que usará para resolver probabilidades interpretar los base a los resultados y
el problema resultados el análisis
UPC MA444 Estadística 148

Unidad 3. Inferencia estadística

Logro
Al terminar la unidad, el estudiante modela la relación entre dos variables para dar respuesta a un
problema en un contexto real donde implique la predicción o la generalización.

Temario
• Tamaño de muestra
• Muestreo aleatorio simple
• Prueba de hipótesis para una media y una proporción poblacional
• Prueba de hipótesis para dos varianzas
• Prueba de hipótesis para dos medias poblacionales
• Análisis de varianza de un factor
• Regresión lineal simple

Bibliografía
• Introducción a la Probabilidad y Estadística / Mendenhall, Beaver, Beaver. Capítulo 7.1 pág. 248-
250.
• Montgomery, Douglas C., and George C. Runger. Probabilidad y Estadística Aplicadas a La
Ingeniería. México, D.F: McGraw-Hill, 2005 pág. 261.
• Introducción a la Probabilidad y Estadística / Mendenhall, Beaver, Beaver. Capítulo 9 pág. 364-369.
• Montgomery, Douglas C., and George C. Runger. Probabilidad y Estadística Aplicadas a La
Ingeniería. México, D.F: McGraw-Hill, 2005 pág. 295 – 307.
• Estadística. Mario Triola. 11a. Edición. Pearson Educación, México 2013 519.5 TRIO/E 2013
capitulo 7. pág. 297.
• Introducción a la Probabilidad y Estadística / Mendenhall, Beaver, Beaver. Capítulo 10 (pág. 386-
395) Montgomery, Douglas C., and George C. Runger. Probabilidad y Estadística Aplicadas a La
Ingeniería. México, D.F: McGraw-Hill, 2005 pág. 375 – 388.
• Montgomery, Douglas C., and George C. Runger. Probabilidad y Estadística Aplicadas a La
Ingeniería. México, D.F: McGraw-Hill, 2005 pág. 375 - 388.
UPC MA444 Estadística 149
Tamaño de muestra para estimar la media de una población

Al iniciar cualquier investigación, la pregunta que surge es:

• ¿Cómo podemos determinar el tamaño óptimo de una muestra?


• ¿Bastará con aplicar un cuestionario a 100 personas?
• ¿Será necesario encuestar a 500 individuos?
• ¿Cómo influye la variabilidad de las respuestas de cada encuestado?
• ¿Qué margen de error tendrán los resultados hallados en la encuesta?

La respuesta a cada una de estas preguntas nos la da la Estadística. A la hora de determinar el tamaño
que debe alcanzar una muestra hay que tener en cuenta: el parámetro a estimar, el margen de error
o error de estimación, la varianza poblacional y el nivel de confianza.

Margen de error

Es la diferencia entre un estadístico y su parámetro correspondiente. Nos da una idea clara de hasta
dónde y con qué probabilidad una estimación basada en una muestra se aleja del valor que se hubiera
obtenido por medio de un censo completo. Un estadístico será más preciso cuando su error sea más
pequeño.

Nivel de confianza

Es la probabilidad de que el intervalo construido en torno a un estadístico contenga al verdadero valor


del parámetro.

Varianza poblacional

Cuando una población es más homogénea la varianza es menor y el número de entrevistas necesarias
será más pequeño. Cuando no se dispone del valor de la varianza de la población, ésta puede ser
estimada a partir de una muestra preliminar o piloto.

La fórmula para determinar el tamaño de muestra n es:

𝑍(1−𝛼) . 𝑠 2
2
𝑛=( )
𝑒

Si la población es finita; es decir, se conoce el tamaño de la población N, el tamaño de la muestra se


corrige con la siguiente fórmula:
𝑛
𝑛𝑐 = 𝑛
1+𝑁
UPC MA444 Estadística 150
Tabla de la distribución normal estándar

Área bajo la curva normal: 𝑃(𝑍 ≤ 𝑧) = 𝛼


Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.50000 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.52790 0.53188 0.53586
0.1 0.53983 0.54380 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57535
0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 0.60257 0.60642 0.61026 0.61409
0.3 0.61791 0.62172 0.62552 0.62930 0.63307 0.63683 0.64058 0.64431 0.64803 0.65173
0.4 0.65542 0.65910 0.66276 0.66640 0.67003 0.67364 0.67724 0.68082 0.68439 0.68793
0.5 0.69146 0.69497 0.69847 0.70194 0.70540 0.70884 0.71226 0.71566 0.71904 0.72240

0.6 0.72575 0.72907 0.73237 0.73565 0.73891 0.74215 0.74537 0.74857 0.75175 0.75490
0.7 0.75804 0.76115 0.76424 0.76730 0.77035 0.77337 0.77637 0.77935 0.78230 0.78524
0.8 0.78814 0.79103 0.79389 0.79673 0.79955 0.80234 0.80511 0.80785 0.81057 0.81327
0.9 0.81594 0.81859 0.82121 0.82381 0.82639 0.82894 0.83147 0.83398 0.83646 0.83891
1.0 0.84134 0.84375 0.84614 0.84849 0.85083 0.85314 0.85543 0.85769 0.85993 0.86214

1.1 0.86433 0.86650 0.86864 0.87076 0.87286 0.87493 0.87698 0.87900 0.88100 0.88298
1.2 0.88493 0.88686 0.88877 0.89065 0.89251 0.89435 0.89617 0.89796 0.89973 0.90147
1.3 0.90320 0.90490 0.90658 0.90824 0.90988 0.91149 0.91309 0.91466 0.91621 0.91774
1.4 0.91924 0.92073 0.92220 0.92364 0.92507 0.92647 0.92785 0.92922 0.93056 0.93189
1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408

1.6 0.94520 0.94630 0.94738 0.94845 0.94950 0.95053 0.95154 0.95254 0.95352 0.95449
1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.96080 0.96164 0.96246 0.96327
1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670
2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169

2.1 0.98214 0.98257 0.98300 0.98341 0.98382 0.98422 0.98461 0.98500 0.98537 0.98574
2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158
2.4 0.99180 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361

2.5 0.99379 0.99396 0.99413 0.99430 0.99446 0.99461 0.99477 0.99492 0.99506 0.99520
2.6 0.99534 0.99547 0.99560 0.99573 0.99585 0.99598 0.99609 0.99621 0.99632 0.99643
2.7 0.99653 0.99664 0.99674 0.99683 0.99693 0.99702 0.99711 0.99720 0.99728 0.99736
2.8 0.99744 0.99752 0.99760 0.99767 0.99774 0.99781 0.99788 0.99795 0.99801 0.99807
2.9 0.99813 0.99819 0.99825 0.99831 0.99836 0.99841 0.99846 0.99851 0.99856 0.99861

3.0 0.998650 0.998694 0.998736 0.998777 0.998817 0.998856 0.998893 0.998930 0.998965 0.998999
3.1 0.999032 0.999065 0.999096 0.999126 0.999155 0.999184 0.999211 0.999238 0.999264 0.999289
3.2 0.999313 0.999336 0.999359 0.999381 0.999402 0.999423 0.999443 0.999462 0.999481 0.999499
3.3 0.999517 0.999534 0.999550 0.999566 0.999581 0.999596 0.999610 0.999624 0.999638 0.999651
3.4 0.999663 0.999675 0.999687 0.999698 0.999709 0.999720 0.999730 0.999740 0.999749 0.999758

3.5 0.999767 0.999776 0.999784 0.999792 0.999800 0.999807 0.999815 0.999822 0.999828 0.999835
3.6 0.999841 0.999847 0.999853 0.999858 0.999864 0.999869 0.999874 0.999879 0.999883 0.999888
3.7 0.999892 0.999896 0.999900 0.999904 0.999908 0.999912 0.999915 0.999918 0.999922 0.999925
3.8 0.999928 0.999931 0.999933 0.999936 0.999938 0.999941 0.999943 0.999946 0.999948 0.999950
3.9 0.999952 0.999954 0.999956 0.999958 0.999959 0.999961 0.999963 0.999964 0.999966 0.999967
UPC MA444 Estadística 151
Ejemplo 2

El jefe de la oficina de seguridad del distrito de San Martín de Porres desea realizar una estimación de
cuánto tiempo, en promedio, estarían dispuestos a permanecer en las charlas sobre rondas vecinales
los vecinos del distrito. En estudios anteriores se estimó que el tiempo medio era de 45,25 minutos
con una varianza de 18,75 minutos2, ¿A cuántas personas se debería entrevistar si se estima un error
máximo de 1,25 minutos y un nivel de confianza del 95%? Suponga que esta variable se distribuye
normalmente.

Solución

El margen de error e es: e = 1,25 minutos

La desviación estándar muestral es: s = √18,75 = 4,33 minutos

Como el nivel de confianza es el 95% entonces (1 − 𝛼) = 0,95. Por lo tanto, 𝛼 = 0,05.

Luego, se tiene que:

𝛼 0,05
1− =1− = 0,975.
2 2

Buscamos dentro de la tabla el valor más cercano a 0,975 y desde este valor salimos a los bordes de la
tabla.

El valor de 𝑍(1−𝛼)en la tabla normal estándar es 𝑍0,975 = 1,96.


2

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670
2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169

Entonces, reemplazando en la fórmula:

𝑍(1−𝛼) × 𝑠 2
2
𝑛=( )
𝑒

1,96 × 4,33 2
𝑛=( )
1,25

𝑛 = 46,09

El valor del tamaño de muestra se redondea siempre al entero mayor, por lo tanto, se necesita
seleccionar a una muestra de 47 vecinos del distrito de San Martin de Porres.
UPC MA444 Estadística 152
Ejemplo 3

¿Cuál debe ser el tamaño de muestra si se desea estimar el tiempo promedio, en horas, que demoran
los estudiantes en llegar a la universidad con un nivel de confianza del 94% y con un error de estimación
de 0,1 horas? Una muestra piloto de 8 alumnos arrojó los siguientes resultados:

2,0 1,5 0,45 1,45 1,0 0,30 1,20 1,30

¿Qué tamaño de muestra deberá seleccionar?

Ejemplo 4

La gerencia de un diario local desea estimar el gasto promedio mensual que las familias destinan a la
compra de diarios. La gerencia desea que sus resultados tengan un nivel de confianza del 95% y un
error de estimación no mayor a tres soles. Si la desviación estándar de los gastos en compra de diarios
en una muestra piloto fue de 20 soles ¿Qué tamaño de muestra deberá seleccionar?
UPC MA444 Estadística 153
Ejercicios propuestos

47. El jefe de la oficina de seguridad del distrito de San Borja desea realizar una estimación de cuánto
tiempo, en promedio, estarían dispuestos a permanecer los vecinos escuchando charlas sobre
seguridad vecinal. En estudios anteriores se estimó que el tiempo promedio era de 45,25 minutos
con una varianza de 18,75 minutos2. ¿A cuántas personas se debería entrevistar si se estima un
error máximo de un minuto y una confianza del 95%? Suponga que esta variable se distribuye
normalmente. Rpta: 73

48. La máquina de refrescos de una universidad está ajustada de tal manera que la cantidad de líquido
despachada se distribuye aproximadamente en forma normal. ¿Qué tan grande se requiere que
sea la muestra si se desea tener una confianza de 98% de que su media muestral esté dentro de
0,05 centilitros del promedio real? Se cuenta con la siguiente información de una muestra
preliminar o piloto de tamaño 24. Rpta: 60

1,99 1,98 2,04 1,97 2,18 2,04 2,13 2,03 2,08 2,72 2,04 2,09
2,11 2,13 2,14 1,98 2,29 2,02 1,94 1,82 2,02 2,10 2,19 2,13

49. Una editorial desea evaluar la media muestral del tiempo de distribución de su último best seller
en cada uno de sus 400 puntos de venta. Para este estudio se desea tener un error de estimación
de tres minutos con un nivel de confianza del 90%. Además, se sabe que la desviación estándar
de los tiempos de distribución es de 17 minutos. ¿Qué tamaño de muestra debe emplearse para
el estudio? Rpta: 72
UPC MA444 Estadística 154
Conceptos básicos
Unidad elemental
Es el objeto sobre el cual se hace la medición. También llamada unidad de observación, unidad de
análisis, unidad estadística o elemento. Por ejemplo, en estudios de poblaciones humanas, con
frecuencia ocurre que la unidad elemental es cada individuo.

Población muestreada
Es el conjunto de todas las unidades elementales posibles que podrían extraerse en una muestra; es
decir, es la población de donde se extrae la muestra.

Unidad de muestreo
Es la unidad donde realizamos la muestra. Por ejemplo, si queremos estudiar a las personas, pero no
tenemos la lista de todos los individuos que pertenecen a la población objetivo, la unidad de muestreo
sería cada familia y la unidad elemental sería cada individuo que vive en la familia .

Marco muestral
Es una lista de las unidades de muestreo que están disponibles para elección.

Para las encuestas telefónicas el marco de muestreo podría ser una lista de todos los números
telefónicos residenciales de la ciudad; para las entrevistas personales una lista de las direcciones de
todas las calles; para una encuesta de agricultura una lista de todas las granjas o un mapa con todas
las áreas que contienen granjas.

Censo
Es una investigación estadística que consiste en el recuento de la totalidad de los elementos que
componen la población por investigar. Es necesario que se especifique el espacio y el tiempo al que se
refiere el recuento.
Por ejemplo, el 22 de octubre del 2017 se realizaron los Censos Nacionales 2017: XII de Población, VII
de Vivienda y III de Comunidades Indígenas. Su finalidad es proveer información sobre la composición,
distribución geográfica y crecimiento de la población, los patrones de la concentración urbana y rural,
las características y servicios básicos de la vivienda para la ejecución de las políticas públicas.

Muestreo
Cuando se opta por una investigación usando una muestra en vez de la población, el estudio estadístico
comprende por lo menos cuatro etapas:

1. Definición de la población objetivo y búsqueda del marco muestral.


2. Determinación del tamaño de la muestra.
3. Selección de las unidades.
4. Registro de las observaciones.

En el curso trabajaremos las dos últimas.


• La selección de las unidades y
• El registro de las observaciones
UPC MA444 Estadística 155
Por ejemplo, la Asociación Peruana de Empresas de Investigación realizaba una encuesta para
determinar el nivel socioeconómico de una persona. Hoy en día, ya no encuesta, sino más bien usa la
Encuesta Nacional de Hogares (ENAHO) realizada por el Instituto Nacional de Estadística e Informática
(INEI).

Niveles socioeconómicos en Lima Metropolitana y Callao


Ficha técnica
Universo de estudio
• Se consideró como universo de estudio a todos los hogares pertenecientes a
Lima Metropolitana entendida como los distritos de Lima ubicados en el
núcleo urbano (sin considerar balnearios) y la Provincia Constitucional del
Callao. Se definió como hogar, al conjunto de personas que, habitando en la
misma vivienda, preparan y consumen sus alimentos en común.
• La persona informante fue el jefe de familia, definido como aquella persona que más
aporta económicamente en el hogar.

Marco muestral
Para el desarrollo de la investigación se consideró como marco muestral:
• La base de datos de viviendas del Instituto Nacional de Estadística e Informática (INEI).
• Actualización mediante aplicación de rastreo de campo efectuada por APEIM en las zonas de mayor
crecimiento de la ciudad (conos)
Tamaño de la muestra
• Se entrevistó a un total de 3 598 hogares distribuidos en 41 distritos.
• El margen de error máximo probable con un nivel de confianza del 95,1% y considerando el máximo
de dispersión (p = q = 0,5) fue de ± 1,63%.
• Dentro de esta muestra se realizaron 200 entrevistas en Distritos con predominio de los N.S.E. Muy
Alto/Alto con el propósito de obtener una submuestra estadísticamente significativa para este
segmento.
• El total de entrevistas fue desagregado proporcionalmente a la distribución poblacional de cada
uno de los distritos de Lima Metropolitana.
Selección de la muestra
• Determinada la cantidad de entrevistas a aplicar por distrito, se
procedió a sortear tantas manzanas como entrevistas se requerían.
• Dentro de cada manzana se seleccionó por un sistema aleatorio
simple cinco viviendas: una vivienda titular y cuatro viviendas suplentes. Los hogares titulares
fueron visitados hasta en tres oportunidades antes de proceder al reemplazo. Se controló que la
tasa de reemplazo no excediera el 10% del total de entrevistas originalmente sorteadas.

El muestreo se ilustrará con el siguiente esquema:


UPC MA444 Estadística 156

Se tiene una población de tamaño N

Marco muestral: N trabajadores registrados

Se registran las N unidades elementales en el


marco muestral.

Para realizar la estimación del promedio, es necesario determinar, en primer lugar, ¿a cuántas
unidades elementales debemos entrevistar?

Si se conoce el tamaño de la población N, el tamaño


Establecemos un nivel de confianza, un de la muestra se corrige con la siguiente fórmula:
margen de error y estimamos la desviación 𝑛
estándar de la variable en estudio. La 𝑛𝑐 = 𝑛
fórmula es la siguiente: 1+
𝑁
𝑧(1−𝛼) × 𝑠 2
2
𝑛=( )
𝑒

Para seleccionar a las n unidades elementales usaremos muestreo aleatorio simple. La tabla de números
aleatorios nos permitirá seleccionar a estos elementos.
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4

Una vez obtenida la muestra, realizar la


estimación
UPC MA444 Estadística 157
Ejemplo 1

Se tiene una población de 108 trabajadores de una empresa y se desea estimar el tiempo promedio
de servicio a partir de una muestra aleatoria.

N = 108 trabajadores

Si queremos estimar el tiempo promedio,


en años, que tienen los trabajadores en la
empresa, ¿a cuántos trabajadores
debemos entrevistar?

𝑧(1−/2) ×𝑠 2
𝑛=( ) = 9,18 = … j
𝑒

n=…

Para seleccionar la muestra de trabajadores


mediante muestreo aleatorio simple, usar
las columnas: C12, C5, C10 de la tabla de
números aleatorios

Una vez obtenida la muestra,


¿qué le preguntaremos a cada
unidad elemental?

Posición
Trabajador (en la tabla de números X= …
aleatorios)
1
2
3
4
5
6
7
8
9
10
Promedio
UPC MA444 Estadística 158
Marco muestral: Trabajadores registrados

Nº Ingreso Tiempo Nº Ingreso Tiempo Nº Ingreso Tiempo


1 2300 5 37 2600 16 73 1800 3
2 2800 11 38 2700 18 74 1700 5
3 2400 4 39 2100 11 75 1700 4
4 2500 2 40 2300 14 76 1700 0
5 2300 3 41 1700 0 77 1700 1
6 2100 2 42 2200 13 78 2100 6
7 1700 2 43 2900 20 79 2600 17
8 2000 0 44 1800 5 80 2400 9
9 2200 7 45 2100 16 81 2600 19
10 2100 4 46 2000 12 82 1900 7
11 1700 0 47 2000 12 83 1600 0
12 2500 2 48 2900 20 84 1900 3
13 2800 13 49 2100 13 85 2100 14
14 2400 9 50 2100 9 86 1700 0
15 1700 1 51 1800 1 87 2100 15
16 2400 9 52 2000 9 88 1700 1
17 2200 10 53 2100 10 89 2300 14
18 2200 4 54 1900 4 90 2500 16
19 2300 10 55 2000 10 91 2600 18
20 2800 11 56 2300 11 92 1900 3
21 2100 7 57 2000 7 93 2500 19
22 1700 1 58 1700 1 94 1800 6
23 2500 6 59 1900 6 95 1700 2
24 2400 9 60 2000 9 96 2000 10
25 2700 17 61 2400 17 97 2400 16
26 1700 0 62 1700 0 98 1700 0
27 1600 2 63 1700 2 99 2500 12
28 2600 17 64 2400 17 100 1700 3
29 2500 13 65 2500 13 101 2400 17
30 2500 16 66 2600 16 102 2400 16
31 2700 17 67 2100 14 103 1900 7
32 1700 1 68 1900 7 104 1700 1
33 1600 1 69 2000 9 105 2100 6
34 2400 11 70 1800 7 106 2000 5
35 1900 3 71 2100 10 107 2000 3
36 1800 5 72 2300 12 108 2500 13
UPC MA444 Estadística 159
Tabla de números aleatorios
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
UPC MA444 Estadística 160
Muestreo probabilístico
Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de
equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de
ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de
tamaño n tienen la misma probabilidad de ser seleccionadas.

Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra


extraída y son, por tanto, los más recomendables.

Dentro de los métodos de muestreo probabilísticos encontramos al muestreo simple aleatorio:

Muestreo simple aleatorio

El procedimiento consiste en seleccionar una muestra de tamaño n en forma aleatoria y sin reemplazo
de una población que contiene un total de N unidades elementales.

Los pasos son los siguientes:

• Enumere las unidades del marco muestral con números sucesivos.


• Seleccione tantos elementos del marco muestral como sea el tamaño requerido de la muestra.
• La selección de las unidades se realiza sin reemplazo.
• Para elegir a los elementos de la población, que formarán parte de la muestra, se hará uso de una
tabla llamada tabla de números aleatorios.
• Elegir una primera columna de arranque de la tabla de números aleatorios
• Agregar a esta columna de arranque tantas columnas hasta completar la cantidad de dígitos que
tiene la población.
• Los números que se elijan deben estar comprendidos entre 1 y N inclusive.
• Seleccione hasta completar el tamaño de muestra requerido
• Use tantas columnas de arranque hasta completar la muestra requrida.

El muestreo aleatorio simple presenta dos propiedades:

• Equiprobable: Cada unidad tiene las mismas posibilidades de ser elegida.


• Independencia: La selección de una unidad no influye en la selección de otras unidades.

Pero en el mundo real es difícil encontrar muestras completamente independientes y representativas.


Por ejemplo, hacer una encuesta a los votantes marcando números de teléfono al azar es un método
no representativo pues no tiene en cuenta a los votantes que no disponen de teléfono o cuenta varias
veces a los que tienen varios números telefónicos.
UPC MA444 Estadística 161
Uso de la tabla de números aleatorios

Para usar la tabla de números aleatorios:

• Los números se eligen de arriba hacia abajo en las columnas seleccionadas.


• Las columnas se usan en el orden dado, no se reordenan.
• No es necesario usar todas las columnas.
• Las columnas que se usarán serán las necesarias hasta completar el tamaño de muestra requerido.

Ejemplo 1

Por ejemplo, en un problema nos dicen que elijamos las columnas C10, C7, C5 y C16.

• Si el tamaño de la población N = 87, esto implica que el número mayor 87 tiene dos cifras
significativas.

La primera columna elegida será C10 y usaremos una columna adicional a la derecha para completar
la cantidad de dígitos que tiene la población. Es decir, usaremos C10C11 para elegir números del 1
al 87 inclusive sin reemplazo.

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6

• Si el tamaño de la población N = 550, esto implica que el número mayor 550 tiene tres cifras
significativas.

La primera columna elegida será C10 y usaremos dos columnas adicionales a la derecha para
completar la cantidad de dígitos que tiene la población. Es decir, usaremos C10C11C12 y elegir
números del 1 al 550 inclusive sin reemplazo.

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
UPC MA444 Estadística 162

Tabla de números aleatorios


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
UPC MA444 Estadística 163
Ejemplo 2

Una empresa de tiene un total de 150 empleados y ha registrado información acerca de las variables:
ingreso mensual, en soles (Ingreso) y años cumplidos en la empresa (Años).

Marco muestral: Trabajadores registrados


ID Ingreso Años ID Ingreso Años ID Ingreso Años ID Ingreso Años
1 2300 5 39 2600 16 77 1800 3 115 1700 3
2 2800 11 40 2700 18 78 1700 5 116 2600 19
3 2400 4 41 2100 11 79 1700 4 117 1600 1
4 2500 2 42 2300 14 80 1700 0 118 1800 6
5 2300 3 43 1700 0 81 1700 1 119 2100 10
6 2100 2 44 2200 13 82 2100 6 120 1700 0
7 1700 2 45 2900 20 83 2600 17 121 2400 16
8 2000 0 46 1800 5 84 2400 9 122 2600 17
9 2200 7 47 2100 16 85 2600 19 123 2100 10
10 2100 4 48 2000 12 86 1900 7 124 2100 8
11 1700 0 49 2000 12 87 1600 0 125 2400 17
12 2500 2 50 2900 20 88 1900 3 126 1700 1
13 2800 13 51 2100 13 89 2100 14 127 2600 20
14 2400 9 52 2100 9 90 1700 0 128 2400 16
15 1700 1 53 1800 1 91 2100 15 129 2700 17
16 2400 9 54 2000 9 92 1700 1 130 2100 12
17 2200 10 55 2100 10 93 2300 14 131 1600 0
18 2200 4 56 1900 4 94 2500 16 132 2100 15
19 2300 10 57 2000 10 95 2600 18 133 1900 5
20 2800 11 58 2300 11 96 1900 3 134 2100 12
21 2100 7 59 2000 7 97 2500 19 135 2200 12
22 1700 1 60 1700 1 98 1800 6 136 2400 13
23 2500 6 61 1900 6 99 1700 2 137 1800 4
24 2400 9 62 2000 9 100 2000 10 138 2600 17
25 2700 17 63 2400 17 101 2400 16 139 2700 20
26 1700 0 64 1700 0 102 1700 0 140 2500 16
27 1600 2 65 1700 2 103 2500 12 141 2500 16
28 2600 17 66 2400 17 104 1700 3 142 1900 6
29 2500 13 67 2500 13 105 2400 17 143 2100 15
30 2500 16 68 2600 16 106 2400 16 144 1700 9
31 2700 17 69 2100 14 107 1900 7 145 1500 0
32 1700 1 70 1900 7 108 1700 1 146 1800 18
33 1600 1 71 2000 9 109 2100 6 147 2100 10
34 2400 11 72 1800 7 110 2000 5 148 2700 19
35 1900 3 73 2100 10 111 2000 3 149 1800 9
36 1800 5 74 2300 12 112 2500 13 150 2100 15
37 1800 3 75 2700 20 113 1700 0
38 2400 14 76 2800 20 114 2500 19

a. Seleccione una muestra de 16 trabajadores usando muestreo simple aleatorio. Elabore un listado
con el número seleccionado y el valor del ingreso mensual y años en la empresa. Use las columnas
C2, C7, C11 y C9 de la tabla de números aleatorios.
b. Con la muestra, estime e interprete las medidas de tendencia central para el ingreso mensual.
c. Con la muestra, estime e interprete el cuartil 1 para la variable años en la empresa.
UPC MA444 Estadística 164
Solución

a. Elabore un listado con el número seleccionado y el valor del ingreso mensual y años en la empresa:

Posición
Ingreso mensual
Años en la empresa

Posición
Ingreso mensual
Años en la empresa

b. Con la muestra obtenida estime e interprete las medidas de tendencia central para la variable
ingreso mensual.

Medidas Valor Interpretación

Media

Mediana

Moda

c. Con la muestra obtenida estime e interprete los cuartiles para la variable años en la empresa.

Medidas Valor Interpretación

Cuartil 1

Cuartil 2

Cuartil 3

Ejemplo 3
El siguiente marco muestral muestra la información del total de usuarios de internet de una
determinada zona de un distrito de la ciudad capital. Las variables analizadas fueron las siguientes:
• Marca de computadora portátil
• Principales problemas con Internet
• Número de computadoras con Internet en casa
• Tiempo de navegación diaria en Internet (en minutos)
UPC MA444 Estadística 165
Marca de Número de Tiempo de navegación
Usuario Principales problemas
computadora computadoras diaria (min)
1 HP Saturación de la red 1 94,00
2 Dell Saturación de la red 1 74,45
3 IBM Saturación de la red 3 104,89
4 HP Saturación de la red 3 125,53
5 Dell Saturación de la red 3 123,97
6 HP Saturación de la red 4 134,66
7 Otra marca Saturación de la red 2 56,33
8 HP Saturación de la red 2 95,32
9 HP Saturación de la red 2 121,90
10 Lenovo Saturación de la red 2 78,27
11 Lenovo Saturación de la red 2 86,20
12 Apple Saturación de la red 2 66,19
13 Lenovo Saturación de la red 2 63,06
14 Dell Saturación de la red 1 80,45
15 Dell Saturación de la red 1 84,53
16 Apple Saturación de la red 1 57,64
17 HP Saturación de la red 1 88,64
18 HP Saturación de la red 3 91,92
19 Apple Saturación de la red 3 102,7
20 Apple Baja velocidad en la señal 3 92,69
21 Lenovo Baja velocidad en la señal 3 93,46
22 HP Baja velocidad en la señal 3 92,60
23 Dell Baja velocidad en la señal 4 126,85
24 HP Baja velocidad en la señal 2 98,29
25 Lenovo Baja velocidad en la señal 2 96,28
26 Apple Baja velocidad en la señal 1 89,74
27 Apple Baja velocidad en la señal 1 139,44
28 HP Baja velocidad en la señal 1 117,31
29 HP Baja velocidad en la señal 1 147,51
30 Otra marca Baja velocidad en la señal 3 86,90
31 Otra marca Baja velocidad en la señal 3 133,23
32 IBM Baja velocidad en la señal 4 67,75
33 Apple Baja velocidad en la señal 2 110,78
34 Apple Baja velocidad en la señal 2 118,04
35 Dell Baja velocidad en la señal 4 138,38
36 Dell Baja velocidad en la señal 2 98,31
37 Apple Baja velocidad en la señal 1 89,52
38 IBM Baja velocidad en la señal 1 113,50
39 HP Baja velocidad en la señal 1 92,37
40 Otra marca Baja velocidad en la señal 1 115,15
41 HP Baja velocidad en la señal 1 131,22
42 HP Calidad y durabilidad del modem 2 125,81
43 HP Calidad y durabilidad del modem 2 130,02
44 HP Calidad y durabilidad del modem 3 83,74
45 IBM Calidad y durabilidad del modem 2 133,69
46 IBM Calidad y durabilidad del modem 1 129,39
47 Lenovo Calidad y durabilidad del modem 1 111,01
48 Lenovo Lentitud para subir información 1 103,69
49 Lenovo Lentitud para subir información 1 121,70
50 Apple Lentitud para subir información 2 151,81
51 Apple Lentitud para subir información 2 125,43
52 Apple Lentitud para subir información 2 116,00
53 Dell Lentitud para subir información 3 139,41
54 Dell Lentitud para subir información 2 129,52
55 Dell Lentitud para subir información 1 127,74
56 Dell Lentitud para subir información 2 120,89
UPC MA444 Estadística 166
57 Dell Lentitud para subir información 3 126,33
58 Otra marca Lentitud para subir información 3 118,44
59 Otra marca Otros 1 113,04
60 Otra marca Otros 2 114,44
61 Lenovo Otros 1 119,66
62 Dell Otros 1 145,52

a. Se desea seleccionar una muestra de 10 usuarios de internet usando muestreo simple aleatorio.
Use las columnas C15, C1 y C8 de la tabla de números aleatorios para indicar la posición del elemento
seleccionado. Indique, además, el principal problema del usuario con Internet y el tiempo diario
de navegación, en minutos.

Posición

Problema

Tiempo (min.)

b. Con la muestra obtenida, estime el porcentaje de usuarios cuyo principal problema de Internet es
la baja velocidad en la señal.

c. Con la muestra obtenida, estime e interprete las medidas de tendencia central para el tiempo
diario de navegación.
UPC MA444 Estadística 167
Ejemplo 4

Telecom es una empresa que brinda soluciones integrales en infraestructura de telecomunicaciones.


Cuenta con más de 12 años de experiencia y ha participado en diferentes proyectos con los principales
operadores y fabricantes de equipos del sector. El listado de todos sus trabajadores se muestra a
continuación:

Marco muestral
Número Permanencia Remuneración
ID Sexo Grado de instrucción Motivo de cese
de hijos (meses) bruta (soles)
1 M 0 26 Titulado 5000 Renuncia voluntaria
2 M 1 10 Titulado 12075 Renuncia voluntaria
3 M 0 11 Titulado 3000 Renuncia voluntaria
4 F 0 3 Titulado 1500 Renuncia voluntaria
5 M 0 2 Titulado 800 Renuncia voluntaria
6 M 0 28 Titulado 3000 Renuncia voluntaria
7 F 1 12 Post grado 5575 Renuncia voluntaria
8 F 1 32 Técnico completa 2000 Renuncia voluntaria
9 F 0 1 Técnico completa 2700 Renuncia voluntaria
10 F 0 0 Técnico completa 2575 Renuncia voluntaria
11 M 0 52 Titulado 12000 Renuncia voluntaria
12 F 0 0 Titulado 2000 Renuncia voluntaria
13 F 1 1 Titulado 3575 Renuncia voluntaria
14 M 0 15 Titulado 1500 Renuncia voluntaria
15 F 2 55 Post grado 5000 Renuncia voluntaria
16 F 0 2 Post grado 7500 Renuncia voluntaria
17 F 0 7 Titulado 2500 Renuncia voluntaria
18 F 1 1 Técnico completa 1500 Renuncia voluntaria
19 F 2 1 Post grado 4400 Renuncia voluntaria
20 F 2 10 Técnico completa 1985 Renuncia voluntaria
21 F 0 1 Titulado 3000 Renuncia voluntaria
22 F 0 5 Técnico completa 2200 Renuncia voluntaria
23 F 2 3 Técnico completa 2300 Renuncia voluntaria
24 F 0 20 Titulado 3085 Renuncia voluntaria
25 F 0 2 Técnico completa 1885 Renuncia voluntaria
26 F 2 23 Post grado 15085 Renuncia voluntaria
27 F 0 20 Titulado 3085 Renuncia voluntaria
28 F 0 2 Técnico completa 1885 Renuncia voluntaria
29 F 0 1 Técnico completa 1500 Renuncia voluntaria
30 F 0 1 Técnico completa 1500 Renuncia voluntaria
31 F 0 2 Técnico completa 1800 Renuncia voluntaria
32 F 0 2 Técnico completa 1800 Renuncia voluntaria
33 F 0 2 Titulado 2585 Renuncia voluntaria
34 F 0 3 Técnico completa 3000 Renuncia voluntaria
35 F 2 49 Post grado 6085 Renuncia voluntaria
36 M 0 33 Titulado 1800 Renuncia voluntaria
37 F 0 3 Técnico completa 950 Renuncia voluntaria
38 F 0 0 Técnico completa 1700 Renuncia voluntaria
39 F 0 0 Titulado 850 Renuncia voluntaria
40 F 0 6 Titulado 2800 Renuncia voluntaria
41 M 0 58 Titulado 2200 Renuncia voluntaria
42 F 1 26 Post grado 7000 Renuncia voluntaria
43 F 0 18 Titulado 1500 Renuncia voluntaria
44 M 0 7 Titulado 2000 Renuncia voluntaria
45 F 2 9 Titulado 3885 Renuncia voluntaria
46 F 1 9 Post grado 4585 Renuncia voluntaria
UPC MA444 Estadística 168
47 M 0 22 Titulado 1800 Renuncia voluntaria
48 F 0 41 Titulado 3300 Renuncia voluntaria
49 F 1 1 Titulado 2085 Renuncia voluntaria
50 F 1 3 Post grado 8085 Renuncia voluntaria
51 M 0 16 Post grado 1500 Renuncia voluntaria
52 F 0 2 Técnico completa 1200 Renuncia voluntaria
53 F 0 6 Titulado 2085 Renuncia voluntaria
54 F 0 5 Post grado 20000 Renuncia voluntaria
55 F 0 46 Técnico completa 2300 Renuncia voluntaria
56 M 0 10 Técnico completa 2000 Renuncia voluntaria
57 F 0 8 Técnico completa 2000 Término de contrato
58 F 0 1 Técnico completa 1500 Término de contrato
59 F 0 4 Técnico completa 1585 Término de contrato
60 F 0 7 Técnico completa 2300 Término de contrato
61 F 0 16 Técnico completa 1700 Término de contrato
62 F 0 7 Titulado 3000 Término de contrato
63 F 0 18 Titulado 1500 Término de contrato
64 M 0 19 Titulado 1500 Término de contrato
65 F 0 1 Técnico completa 2200 Término de contrato
66 F 1 1 Técnico completa 2500 Término de contrato
67 M 0 1 Técnico completa 2000 Término de contrato
68 F 0 14 Técnico completa 1200 Término de contrato
69 F 2 1 Titulado 2875 Término de contrato
70 M 0 1 Titulado 2000 Término de contrato
71 F 2 15 Titulado 2800 Término de contrato
72 F 1 2 Técnico completa 1600 Término de contrato
73 F 0 16 Técnico completa 2200 Término de contrato
74 F 0 25 Técnico completa 2800 Término de contrato
75 F 0 8 Titulado 3500 Término de contrato
76 F 1 4 Titulado 2300 Término de contrato
77 F 0 3 Titulado 4085 Término de contrato
78 F 0 16 Titulado 1585 Término de contrato
79 F 0 1 Técnico completa 1500 Término de contrato
80 F 2 4 Técnico completa 2000 Término de contrato
81 F 2 4 Técnico completa 2500 Término de contrato
82 F 2 38 Titulado 2500 Término de contrato
83 F 2 19 Titulado 2000 Término de contrato
84 F 2 59 Post grado 4085 Término de contrato
85 F 2 9 Titulado 2500 Término de contrato

a. Se desea seleccionar una muestra de 11 trabajadores usando muestreo simple aleatorio. Use las
columnas C13, C14 y C5 de la tabla de números aleatorios para indicar la posición del elemento
seleccionado. Indique, además, el motivo del cese y el número de hijos de cada trabajador.

Posición
Motivo
Número de hijos
Remuneración bruta
UPC MA444 Estadística 169

b. Con la muestra obtenida, estime el porcentaje de trabajadores cuyo motivo de cese fue por
renuncia voluntaria y el porcentaje de trabajadores que tienen hijos.

c. Con la muestra obtenida, estime e interprete el valor del cuartil 3 para la variable remuneración
bruta, en soles.

d. Con la muestra obtenida, estime e interprete el valor de las medidas de tendencia central para la
variable remuneración bruta, en soles.
UPC MA444 Estadística 170
Caso: Cemento Tumbo

La empresa Cemento Tumbo considera que el tiempo de


secado del cemento tipo II es un factor muy importante en las
grandes edificaciones como puentes, túneles, represas, etc. El
encargado de control de calidad desea estimar el tiempo
promedio de secado del cemento tipo II.

Asumiendo un margen de error de 1,5 minutos y un nivel de


confianza de 95%, ¿cuántas bolsas de cemento deberá seleccionar para llevar a cabo dicha estimación?

Para obtener la desviación estándar tomará una muestra piloto de ocho bolsas del almacén mediante
muestreo simple aleatorio.

Use las columnas C7, C11, C15 de la tabla de números aleatorios.

Considere que el marco muestral es el siguiente:

N° Tiempo N° Tiempo N° Tiempo N° Tiempo


1 40 8 43 15 41 22 35
2 47 9 36 16 44 23 42
3 47 10 38 17 42 24 42
4 40 11 47 18 47 25 45
5 38 12 39 19 43 26 37
6 37 13 50 20 41 27 49
7 37 14 50 21 38 28 43
UPC MA444 Estadística 171
Prueba de hipótesis
La prueba de hipótesis involucra una suposición acerca de un parámetro de la población. Después se
toma una muestra para ver si la hipótesis podría ser correcta. La hipótesis que contrastamos se llama
hipótesis nula (𝐻0 ). La hipótesis nula se contrasta con la hipótesis alternativa (𝐻1 ).

Luego, a partir de los resultados obtenidos de la muestra, o bien rechazamos la hipótesis nula a favor
de la alternativa, o bien no rechazamos la hipótesis nula y suponemos que nuestra estimación inicial
del parámetro poblacional podría ser correcta.

El hecho de no rechazar la hipótesis nula no implica que ésta sea cierta. Significa simplemente que los
datos de la muestra son insuficientes para inducir un rechazo de la hipótesis nula.

Contraste de hipótesis
La hipótesis que se contrasta es rechazada o no en función de la información muestral. La hipótesis
alternativa se especifica como opción posible si se rechaza la nula.

Tipos de errores

Información muestral
No rechazar H0 Rechazar H0
H0 es cierta No hay error Error tipo I
La realidad
H0 es falsa Error tipo II No hay error

Error tipo I
Ocurre cuando se rechaza una hipótesis H0 que es verdadera. La probabilidad de cometer error tipo I
viene a ser la probabilidad de rechazar H0 cuando ésta es cierta.

𝑃(Cometer error tipo 𝐼) = 𝑃(Rechazar Ho⁄Ho es cierta) = 𝛼

El valor  es fijado por la persona que realiza la investigación. Por lo general, 1%, 5% o 10%

Error tipo II
Ocurre cuando se acepta una hipótesis H0 que es falsa, la probabilidad de cometer error tipo II es la
probabilidad de no rechazar H0 cuando ésta es falsa.

𝑃(Cometer error tipo II) = 𝑃(No rechazar Ho⁄Ho es falsa) = 𝛽

Debido a que el valor real del parámetro es desconocido este error no puede ser fijado.
UPC MA444 Estadística 172
Pasos para realizar una prueba de hipótesis

Paso 1

• Plantear las hipótesis: la hipótesis nula, Ho y la hipótesis alterna, H1

Paso 2

• Fijar el nivel de significancia, 

Paso 3

• Calcular el estadístico de la prueba o valor calculado

Paso 4

• Presentar la gráfica y obtener los valores críticos

Paso 5

• Aplicar los criterios de decisión

Paso 6

• Concluir
UPC MA444 Estadística 173
Prueba de hipótesis para una media con varianza poblacional desconocida

1. Plantear las hipótesis nula y alterna

Prueba unilateral izquierda Prueba bilateral Prueba unilateral derecha


𝐻0 : 𝜇 ≥ 𝜇0 𝐻0 : 𝜇 = 𝜇0 𝐻0 : 𝜇 ≤ 𝜇0
𝐻1 : 𝜇 < 𝜇0 𝐻1 : 𝜇 ≠ 𝜇0 𝐻1 : 𝜇 > 𝜇0

2. Fijar el nivel de significación .


3. Establecer el estadístico de la prueba.

𝑋̅ − 𝜇0
𝑇= ~𝑡𝑛−1 𝑔𝑙
𝑆
√𝑛
El estadístico tiene una distribución t – Student con (n – 1) grados de libertad.
4. Graficar las regiones críticas.

𝐻1 : 𝜇 < 𝜇0
Unilateral izquierda

Bilateral 𝐻1 : 𝜇 ≠ 𝜇0

Unilateral derecha 𝐻1 : 𝜇 > 𝜇0

5. Decidir: Rechazar H0 o no rechazar H0.


6. Concluir
UPC MA444 Estadística 174
Ejemplo 1

Para la siguiente prueba de hipótesis determine los puntos críticos.

1. Plantear las hipótesis.


𝐻0 : 𝜇 = 5
𝐻1 : 𝜇 ≠ 5

2. Fijar el nivel de significación .


 = 0,05

3. Estadístico de la prueba: Distribución t Student

Tamaño de muestra: 𝑛 = 10

La tabla t Student necesita los siguientes datos: probabilidad y grados de libertad (𝑔𝑙)

t(probabilidad, 𝑔𝑙) = t(…………. , ……..…..) = ……………………… (con todos los decimales)

• Probabilidad (cola):

• Grados de libertad: (𝑔𝑙 = 𝑛 − 1)

Bilateral 𝐻1 : 𝜇 ≠ 𝜇0
UPC MA444 Estadística 175
Ejemplo 2

La lucha contra el COVID-19 también se lleva a cabo con el uso de la tecnología. Esta vez, se ve
desarrollada en robots que ayudan a desinfectar habitaciones de hospitales y centros médicos. Este
robot usa lámparas germicidas de irradiación ultravioleta (UVGI). La clave de este robot para que
funcione de manera autónoma está en el software que registra la máquina vía wifi en el servidor del
centro médico. Con el uso de este robot, todas las estancias hospitalarias quedan libres de cualquier
virus, pues con este método destruye tanto el ADN como el ARN que es donde justamente se
encuentra la programación genética de los virus y bacterias.

La clínica El Porvenir desea adquirir estos equipos para la desinfección de sus áreas. Pero el jefe de
adquisiciones sospecha que el promedio de los datos consumidos por el robot del modelo ASEPT-2X
es de 20 GB. Para confirmar esta suposición eligió una muestra de 10 robots de este modelo. Los datos
se presentan a continuación:

16 16 20 19 18 16 22 19 23 22

De confirmarse la sospecha, pedirá un lote previo de cinco robots con el fin de no congestionar la red
inalámbrica de la clínica. Use un nivel de significación es 𝛼 = 0,05.

Interpretación Representación Cálculo Análisis Argumentación


Identifica la Define la Determina Establece las regiones Presenta un informe
problemática, variable, el correctamente críticas con el (los) sobre la problemática
señalando parámetro, la el valor del valor(es) crítico(s) que se deseaba
claramente el técnica estadístico de correcto(s). Fundamenta resolver, dando
objetivo del caso. estadística y prueba. correctamente la respuesta al objetivo.
presenta las decisión estadística y la
hipótesis. conclusión.

Solución

Usemos las cinco dimensiones del razonamiento cuantitativo.

Interpretación

Determinar si se debe adquirir un lote previo de cinco robots con el fin de no congestionar la red
inalámbrica de la clínica

Representación

Definamos la variable en estudio.

𝑋 ≔cantidad de datos consumidos diariamente por el robot (en gigabytes)

Definamos el parámetro en estudio.


𝜇 ≔media poblacional

Herramienta estadística: Prueba de hipótesis para la media poblacional


UPC MA444 Estadística 176
Plantear las hipótesis.
𝐻0 : 𝜇 = 20
𝐻1 : 𝜇 ≠ 20
Fijar el nivel de significación
𝛼 = 0,05

Cálculo
El valor del estadístico de prueba es:

𝑥 − 𝜇𝑜 19,1 − 20
𝑡𝑐 = 𝑠 = = −1,076
2,644
√𝑛 √10

La prueba es bilateral pues 𝐻1 : 𝜇 ≠ 𝜇0 .

-2,26216 2,26216

 

0.4 0.3 0.2 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015 0.01 0.005
6 0.26483 0.55338 0.90570 1.13416 1.43976 1.94318 2.10431 2.31326 2.44691 2.61224 2.82893 3.14267 3.70743 6
7 0.26317 0.54911 0.89603 1.11916 1.41492 1.89458 2.04601 2.24088 2.36462 2.51675 2.71457 2.99795 3.49948 7
8 0.26192 0.54593 0.88889 1.10815 1.39682 1.85955 2.00415 2.18915 2.30600 2.44898 2.63381 2.89646 3.35539 8
9 0.26096 0.54348 0.88340 1.09972 1.38303 1.83311 1.97265 2.15038 2.26216 2.39844 2.57380 2.82144 3.24984 9
10 0.26018 0.54153 0.87906 1.09306 1.37218 1.81246 1.9481 2.12023 2.22814 2.35931 2.52748 2.76377 3.16927 10

Análisis
Como 𝑡𝑐 = −1,076 > −2,26216; entonces no se rechaza H0. Con un nivel de significación del 5%, es
posible afirmar que el consumo promedio de los datos que usan los robots es igual a 20 GB.

Argumentación
El jefe de adquisiciones sí deberá adquirir el lote previo de cinco robots del modelo ASEPT-2X.
UPC MA444 Estadística 177
Tabla de la distribución t-Student

Área bajo la curva 𝑃(𝑇 ≥ 𝑐) = 𝛼

  
0.4 0.3 0.2 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015 0.01 0.005
1 0.32492 0.72654 1.37638 1.96261 3.07768 6.31375 7.91582 10.57889 12.7062 15.89454 21.20495 31.82052 63.65674 1
2 0.28868 0.61721 1.06066 1.38621 1.88562 2.91999 3.31976 3.89643 4.30265 4.84873 5.64278 6.96456 9.92484 2
3 0.27667 0.58439 0.97847 1.24978 1.63774 2.35336 2.60543 2.95051 3.18245 3.48191 3.89605 4.54070 5.84091 3
4 0.27072 0.56865 0.94096 1.18957 1.53321 2.13185 2.33287 2.60076 2.77645 2.99853 3.29763 3.74695 4.60409 4
5 0.26718 0.55943 0.91954 1.15577 1.47588 2.01505 2.19096 2.42158 2.57058 2.75651 3.00287 3.36493 4.03214 5
6 0.26483 0.55338 0.90570 1.13416 1.43976 1.94318 2.10431 2.31326 2.44691 2.61224 2.82893 3.14267 3.70743 6
7 0.26317 0.54911 0.89603 1.11916 1.41492 1.89458 2.04601 2.24088 2.36462 2.51675 2.71457 2.99795 3.49948 7
8 0.26192 0.54593 0.88889 1.10815 1.39682 1.85955 2.00415 2.18915 2.30600 2.44898 2.63381 2.89646 3.35539 8
9 0.26096 0.54348 0.88340 1.09972 1.38303 1.83311 1.97265 2.15038 2.26216 2.39844 2.57380 2.82144 3.24984 9
10 0.26018 0.54153 0.87906 1.09306 1.37218 1.81246 1.9481 2.12023 2.22814 2.35931 2.52748 2.76377 3.16927 10

11 0.25956 0.53994 0.87553 1.08767 1.36343 1.79588 1.92843 2.09614 2.20099 2.32814 2.49066 2.71808 3.10581 11
12 0.25903 0.53862 0.87261 1.08321 1.35622 1.78229 1.91231 2.07644 2.17881 2.30272 2.46070 2.68100 3.05454 12
13 0.25859 0.5375 0.87015 1.07947 1.35017 1.77093 1.89887 2.06004 2.16037 2.2816 2.43585 2.65031 3.01228 13
14 0.25821 0.53655 0.86805 1.07628 1.34503 1.76131 1.8875 2.04617 2.14479 2.26378 2.4149 2.62449 2.97684 14
15 0.25789 0.53573 0.86624 1.07353 1.34061 1.75305 1.87774 2.03429 2.13145 2.24854 2.39701 2.60248 2.94671 15
16 0.25760 0.53501 0.86467 1.07114 1.33676 1.74588 1.86928 2.02400 2.11991 2.23536 2.38155 2.58349 2.92078 16
17 0.25735 0.53438 0.86328 1.06903 1.33338 1.73961 1.86187 2.01500 2.10982 2.22385 2.36805 2.56693 2.89823 17
18 0.25712 0.53382 0.86205 1.06717 1.33039 1.73406 1.85534 2.00707 2.10092 2.21370 2.35618 2.55238 2.87844 18
19 0.25692 0.53331 0.86095 1.06551 1.32773 1.72913 1.84953 2.00002 2.09302 2.20470 2.34565 2.53948 2.86093 19
20 0.25674 0.53286 0.85996 1.06402 1.32534 1.72472 1.84433 1.99371 2.08596 2.19666 2.33624 2.52798 2.84534 20

21 0.25658 0.53246 0.85907 1.06267 1.32319 1.72074 1.83965 1.98804 2.07961 2.18943 2.32779 2.51765 2.83136 21
22 0.25643 0.53208 0.85827 1.06145 1.32124 1.71714 1.83542 1.98291 2.07387 2.18289 2.32016 2.50832 2.81876 22
23 0.25630 0.53175 0.85753 1.06034 1.31946 1.71387 1.83157 1.97825 2.06866 2.17696 2.31323 2.49987 2.80734 23
24 0.25617 0.53144 0.85686 1.05932 1.31784 1.71088 1.82805 1.97399 2.0639 2.17154 2.30691 2.49216 2.79694 24
25 0.25606 0.53115 0.85624 1.05838 1.31635 1.70814 1.82483 1.97010 2.05954 2.16659 2.30113 2.48511 2.78744 25
26 0.25595 0.53089 0.85567 1.05752 1.31497 1.70562 1.82186 1.96651 2.05553 2.16203 2.29581 2.47863 2.77871 26
27 0.25586 0.53065 0.85514 1.05673 1.3137 1.70329 1.81913 1.96320 2.05183 2.15782 2.29091 2.47266 2.77068 27
28 0.25577 0.53042 0.85465 1.05599 1.31253 1.70113 1.81659 1.96014 2.04841 2.15393 2.28638 2.46714 2.76326 28
29 0.25568 0.53021 0.85419 1.0553 1.31143 1.69913 1.81424 1.95729 2.04523 2.15033 2.28217 2.46202 2.75639 29
30 0.25561 0.53002 0.85377 1.05466 1.31042 1.69726 1.81205 1.95465 2.04227 2.14697 2.27826 2.45726 2.75000 30

31 0.25553 0.52984 0.85337 1.05406 1.30946 1.69552 1.81000 1.95218 2.03951 2.14383 2.27461 2.45282 2.74404 31
32 0.25546 0.52967 0.85300 1.05350 1.30857 1.69389 1.80809 1.94987 2.03693 2.14090 2.27120 2.44868 2.73848 32
33 0.25540 0.5295 0.85265 1.05298 1.30774 1.69236 1.80629 1.9477 2.03452 2.13816 2.26801 2.44479 2.73328 33
34 0.25534 0.52935 0.85232 1.05248 1.30695 1.69092 1.80461 1.94567 2.03224 2.13558 2.26501 2.44115 2.72839 34
35 0.25528 0.52921 0.85201 1.05202 1.30621 1.68957 1.80302 1.94375 2.03011 2.13316 2.26219 2.43772 2.72381 35
36 0.25523 0.52908 0.85172 1.05158 1.30551 1.6883 1.80153 1.94195 2.02809 2.13087 2.25953 2.43449 2.71948 36
37 0.25518 0.52895 0.85144 1.05117 1.30485 1.68709 1.80012 1.94024 2.02619 2.12871 2.25702 2.43145 2.71541 37
38 0.25513 0.52883 0.85118 1.05077 1.30423 1.68595 1.79878 1.93863 2.02439 2.12667 2.25465 2.42857 2.71156 38
39 0.25508 0.52871 0.85094 1.05040 1.30364 1.68488 1.79751 1.93711 2.02269 2.12474 2.25240 2.42584 2.70791 39
40 0.25504 0.52861 0.85070 1.05005 1.30308 1.68385 1.79631 1.93566 2.02108 2.12291 2.25027 2.42326 2.70446 40
UPC MA444 Estadística 178
Ejemplo 3

Se sabe que el rendimiento promedio (en porcentaje) de un proceso químico es 12. Sin embargo,
últimamente se observa muchos valores menores. Para comprobar que efectivamente el rendimiento
promedio ha disminuido, se toma una muestra aleatoria de un lote de materia prima y se registra las
siguientes observaciones:

9,7 12,8 8,7 13,4 8,3 11,7 10,7 8,1 9,1 10,5

Suponiendo normalidad y a partir de la información muestral, verifique si efectivamente el


h . α = 0,04.
UPC MA444 Estadística 179
Ejercicios propuestos

50. Las bombillas LED poseen un rendimiento promedio luminoso superior a todas las tecnologías
existentes. La empresa Solari afirma que el rendimiento luminoso de las bombillas LED que
produce es de 70 lumens/watio. Sin embargo, debido a la competencia en el mercado, introduce
nuevos cambios en su tecnología con la finalidad de lograr un mejor rendimiento.

Para poder comprobar los nuevos resultados, toma una muestra aleatoria de 61 bombillas
actuales, sometiéndolas a pruebas rigurosas, obteniendo un promedio de 75 lumens/watio y una
desviación estándar de 6,8 lumens/watio. Con un nivel de significación del 4%, ¿Se puede afirmar
que los nuevos cambios mejoraron el rendimiento promedio luminoso de las bombillas LED?

51. Cierto fabricante de motocicletas anuncia en un comercial de televisión que su vehículo rendirá
en promedio 87 millas por galón. Los millajes (recorrido en millas) en ocho viajes prolongados
fueron:

88 82 81 87 80 78 79 89

Al nivel de significación del 5% ¿el millaje medio es menor que el anunciado?

52. La densidad de ciertos fluidos es muy volátil por lo que se requiere que la densidad promedio
sobrepase al valor de 0,031 para poder utilizarlo. La empresa 3C Ingenieros, encargada de realizar
los análisis fisicoquímicos, debe evaluar la densidad de la sustancia XP90.

Para estos fines se seleccionó aleatoriamente 10 muestras de distintos lotes de producción y se


registró la densidad. Los datos se muestran a continuación:

0,033 0,040 0,031 0,034 0,036 0,031 0,036 0,034 0,034 0,032

¿La 3C I g á XP90? α = 0,02.

53. Una de las últimas innovaciones en el campo de la iluminación es el proyector de cabeza móvil.
Este proyector está compuesto por un foco halógeno que permite variar la intensidad luminosa.
El gerente de ventas de la empresa Visual Systems ha decidido este año exportar este novedoso
proyector si la intensidad luminosa promedio de estos proyectores es superior a 2600 lúmenes.

Al seleccionar 12 proyectores y medir la intensidad luminosa de cada proyector se obtuvieron los


siguientes datos:

2600 2800 3000 2000 2400 2800 2700 2600 3000 3200 3100 2500

Suponiendo que la intensidad luminosa tiene distribución normal ¿Visual Systems deberá decidir
realizar la exportación del lote? Use un nivel de significación de 3%.

54. Según las últimas investigaciones en hidrografía, los ingenieros civiles usan actualmente
telémetros de láser manuales de bajo peso debido a su gran precisión al momento de realizar una
medición.
UPC MA444 Estadística 180
Un ingeniero civil de una importante constructora está encargado de analizar la eficiencia de una
marca de estos aparatos, por lo que decide realizar pruebas con este equipo, obteniendo los
siguientes resultados del error de lectura, en milímetros, en la localización de un objeto situado a
500 metros.

5,1 5,4 4,9 5,2 5,4 5,1 5,3 5,0 4,8

La calibración de un telemetro juega un papel muy importante en la exactitud de una medida. Si,
en promedio, los errores de lectura sobrepasan los 5 mm, estaríamos en una sobreestimación de
la lectura, por lo que debería ser devuelto al laboratorio de calibración para su ajuste. Usando la
información de la muestra ¿el telémetro debería ir al laboratorio de recalibración? Use un nivel de
significación del 4%.

55. Los drones tienen un accesorio en su fabricación llamado acelerómetro. Este accesorio registra
las variaciones de aceleración o velocidad en el aire. La norma de la Agencia Estatal de Seguridad
Aérea indica que la velocidad promedio que debe alcanzar un dron en áreas urbanas no debe
sobrepasar los 20,5 metros/segundo. Por lo tanto, ante la sospecha que no se está cumpliendo
con la norma, se seleccionaron al azar 42 drones y se realizó una prueba para medir sus
velocidades. A continuación, se presentan los resultados:

Distribución de drones probados según velocidad registrada


Velocidad (metros/segundo) Número de drones probados
[14,5 – 16,5] 7
]16,5 – 18,5] 9
]18,5 – 20,5] 14
]20,5 – 22,5] 8
]22,5 – 24,5] 4

¿Se puede afirmar que no se está cumpliendo con la norma? Use un nivel de significancia del 1%.
UPC MA444 Estadística 181
Caso: Aceros Perú

Aceros Perú es una empresa siderúrgica con más de 40 años de


experiencia, vende productos de alta calidad para los sectores de
la construcción, industria y minería. Entre sus principales
productos de producción tenemos las barras de acero corrugado
ASTM A615-grado 60 con diferentes medidas de producción.

Últimamente, se están importando productos siderúrgicos de


diferentes partes del mundo, razón por la cual el jefe del área de
Control de Calidad desea conocer el estado real de los diferentes
productos que comercializa para establecer hitos de control. Para ello, hará una investigación
minuciosa teniendo en cuenta las siguientes variables: longitud (metros), resistencia a la tracción
(kg/cm2), diámetro (cm), peso (kg).

Interpretación Representación Cálculo Análisis Argumentación


Identifica la Define la variable, Determina Grafica las regiones Presenta un informe
problemática, el parámetro, la correctamente críticas con el (los) valor sobre la
señalando técnica el valor del (es) crítico (s) correcto (s). problemática que se
claramente el estadística y estadístico de Fundamenta deseaba resolver,
objetivo del presenta las prueba. correctamente la decisión dando respuesta al
caso. hipótesis. estadística y la conclusión. objetivo.

Objetivo: Determinar si se regularán las máquinas cortadoras de acero.

El jefe de Control de calidad ordena realizar el estudio de la longitud de las barras de acero ASTM A615-
grado 60, las cuales deben tener una longitud estándar de nueve metros. Según reclamos, los clientes
manifiestan que la longitud es menor a dicho valor. De ser cierto, procederá a regular las máquinas
cortadoras de las barras de acero. Para ello, seleccionó una muestra aleatoria de 20 barras de acero
ASTM A615- grado 60. Con 5% de significación, ¿se procederá con la regulación de las máquinas
cortadoras de barras de acero? Utilice las cinco dimensiones para la solución del caso.

8,90 8,91 8,92 8,93 8,93 8,94 8,95 8,95 8,97 8,98
8,99 8,99 8,99 9,01 9,02 9,02 9,03 9,04 9,05 9,06
UPC MA444 Estadística 182
Prueba de hipótesis para una proporción poblacional

1. Plantear las hipótesis.

Prueba unilateral izquierda Prueba bilateral Prueba unilateral derecha


𝐻0 : 𝑝 ≥ 𝑝0 𝐻0 : 𝑝 = 𝑝0 𝐻0 : 𝑝 ≤ 𝑝0
𝐻1 : 𝑝 < 𝑝0 𝐻1 : 𝑝 ≠ 𝑝0 𝐻1 : 𝑝 > 𝑝0

2. Fijar el nivel de significación. 𝛼

3. Calcular el estadístico de la prueba.


𝑝̂ − 𝑝𝑜
𝑍= ~𝑍(0,1)
√𝑝𝑜 (1 − 𝑝𝑜 )
𝑛

4. Establecer las regiones críticas.

Unilateral izquierda 𝐻1 : 𝑝 < 𝑝0

Bilateral 𝐻1 : 𝑝 ≠ 𝑝0

Unilateral derecha 𝐻1 : 𝑝 > 𝑝0

5. Aplicar las reglas de decisión: Rechazar H0 o no rechazar H0.

6. Realizar la conclusión.
UPC MA444 Estadística 183
Ejemplo 1
Kubick S.A. es una empresa que fabrica y comercializa termas de uso doméstico e industrial. Debido a
los constantes reclamos presentados por los clientes sobre el mal funcionamiento de las termas a gas,
el ingeniero de planta sostiene que el porcentaje de unidades defectuosas producidas debe ser a lo
más 4%. Si esto no se cumple, se implementará un programa de capacitación a los trabajadores. A
partir de una muestra aleatoria de 150 termas a gas donde se encontró que 12 de ellas están
defectuosas. Usando un nivel de significación del 4%, ¿se llevará a cabo el programa de capacitación?

Solución
Interpretación
Determinar si se implementará un programa de capacitación para los trabajadores.

Representación
Variable: Funcionamiento de las termas a gas (buen funcionamiento, mal funcionamiento)
Parámetro: Proporción poblacional de terma a gas con mal funcionamiento
Herramienta: Prueba de hipótesis de la proporción

𝐻0 𝑝 ≤ 0,04
𝐻1 𝑝 > 0,04

El valor hipotético 𝑝0 es 0,04.

El nivel de significación es 4% es decir, α = 0,04.

Cálculo
La proporción muestral de terma a gas con mal funcionamiento es:

12
𝑝̂ = = 0,08
150

El valor del estadístico de prueba es:

𝑝̂ − 𝑝0 (0,08 − 0,04)
𝑍= = = 2,5
√𝑝0 (1 − 𝑝0 ) √0,04(1 − 0,04)
𝑛 150

La prueba es unilateral derecha pues 𝐻1 : 𝑝 > 0,04.

1,75

Análisis
Como 𝑍𝑐𝑎𝑙𝑐 = 2,5 > 𝑍𝑐𝑟í𝑡𝑖𝑐𝑜 = 1,75; se rechaza H0.
UPC MA444 Estadística 184

Conclusión
Con un nivel de significación del 4% es posible afirmar que el porcentaje de termas a gas defectuosas
es mayor al 4%.

Argumentación
Se sugiere implementar un programa de capacitación para los trabajadores de las plantas de la
empresa Kubick.

Ejemplo 2
El jefe de control de calidad de Whitney Motor está preocupado porque las máquinas de controlador
electrónico de motor (CEM), que fabrican, no se les ha dado el mantenimiento programado, y supone
que el porcentaje de CEMs con algún defecto de fabricación es superior a 20%. De ser cierta su
suposición, deberá detener el proceso de producción y realizar mantenimiento a dichas máquinas.
Para comprobarlo se seleccionó una muestra de 55 CEMs. Los resultados obtenidos del estado de
fabricación se presentan a continuación:

Distribución de CEMs según su estados de fabricación

Defectuoso
13

Normal
42

Fuente: Whitney Motor

¿Qué decisión tomará el jefe de control de calidad? Use un nivel de significación del 5%.

Solución
Interpretación

Determinar si el jefe de control de calidad no deberá detener el proceso de producción y realizar un


mantenimiento a dichas máquinas.

Representación

Variable: estado de fabricación (defectuoso, normal)


Parámetro: proporción poblacional de CEMs con algún defecto de fabricación
Herramienta: prueba de hipótesis para la proporción

𝐻0 𝑝 ≤ 0,20
𝐻1 𝑝 > 0,20
UPC MA444 Estadística 185

E v g f 4% , α = 0,04.

Cálculo

La proporción muestral de CEMs con algún defecto de fabricación es:

13
𝑝̂ = = 0,2364
55

El valor del estadístico de prueba es:

𝑝̂ − 𝑝 0,2364 − 0,20
𝑍= = = 0,6749
√𝑝(1 − 𝑝) √0,20(1 − 0,20)
𝑛 55

Análisis

La prueba es unilateral derecha, pues 𝐻1 : 𝑝 > 0,20.

1,65

Como 𝑍𝑐𝑎𝑙𝑐 = 0,6749 < 𝑍𝑐𝑟𝑖𝑡𝑖𝑐𝑜 = 1,65; no se rechaza H0. Con un nivel de significancia de 5%, no es
posible afirmar que el porcentaje de CEMs con algún defecto de fabricación es superior al 20%.

Argumentación

El jefe de control de calidad no deberá detener el proceso de producción y realizar mantenimiento a


dichas máquinas.
UPC MA444 Estadística 186
Ejemplo 3

La Municipalidad de Lima ampliará el presupuesto para fiscalizar las obras de la ciudad de Lima si más
del 30% de estas obras no cumplen o cumplen parcialmente con las normas de seguridad y acabados
en las obras de construcción civil. Al selecciona al azar una muestra de 94 obras de la ciudad se obtuvo
el siguiente gráfico:

Distribución de obras de la ciudad de Lima según el cumplimiento


de las normas de seguridad
70 64
60
Número de obras

50
40
30 22
20
8
10
0
No cumplen Cumplen parcialmente Cumplen totalemnte
Cumplimiento de las normas de seguridad
Fuente: Municipalidad de

Con un nivel de significación del 2% y asumiendo normalidad, ¿la Municipalidad de Lima ampliará el
presupuesto para fiscalizar las obras de construcción civil de la ciudad?
UPC MA444 Estadística 187
Ejemplo 4

Un fabricante sostiene que al menos el 95% de los equipos que envía a una fábrica está acorde con las
especificaciones técnicas. Una revisión de una muestra de 200 piezas reveló que 18 estaban
defectuosas. Asumiendo normalidad, pruebe la afirmación del fabricante al nivel de significancia de
1%.
UPC MA444 Estadística 188
Ejercicios propuestos

56. El fabricante de un nuevo controlador de errores de comunicación asegura que la proporción de


procesos en los que se pierden datos cuando su controlador está operando es menor de 0,10. A
fin de probar esta aseveración, se vigila el enlace de comunicación entre una terminal de gráficos
y una computadora con el controlador de errores funcionando. En una muestra de 300 elementos
se observó que en 10 de ellos sí se perdieron datos cuando el controlador del fabricante estaba
operando. ¿La información recolectada refuta la aseveración del fabricante? Use un nivel de
significancia del 3%.

57. Una encuestadora realizó una consulta a los pobladores de la urbanización Loma Linda para saber
si están de acuerdo o no con la construcción de un nuevo centro comercial en el lugar. La
construcción empezará solo si más del 30% de los ciudadanos apoyan el proyecto. Al seleccionar
una muestra de 250 pobladores de dicha urbanización, se obtuvo que 85 de ellos apoyaban la
construcción. Realice la prueba estadística respectiva a un nivel de significación del 3%.

58. Los usuarios de la sustancia XP90 indican que cuando esta sustancia no es óptima ocurre un
fenómeno conocido como licuefacción y se requiere un reproceso. La certificadora, encargada de
la realización de los análisis fisicoquímicos, asegura que la proporción de reprocesos disminuye
cuando la sustancia está certificada por lo tanto una de las metas de la empresa es tener más del
20% de sustancias certificadas. De una muestra de 120 reprocesos se identificó que 26 usaron
sustancias certificadas. En base a esta información podemos afirmar que ¿la empresa ha logrado
la meta? Use un nivel de significación del 3%.
UPC MA444 Estadística 189
Prueba de hipótesis para la razón de varianzas poblacionales

1. Plantear las hipótesis

𝐻0 : 𝜎12 = 𝜎22
𝐻1 : 𝜎12 ≠ 𝜎22

2. F j v g f :α

3. Calcular el estadístico de la prueba.

𝑆12 1
𝐹𝑐 = . 𝐹
𝑆22 𝜎22 (𝑛1 −1,𝑛2 −1)
𝜎12

4. Establecer las regiones críticas.

Donde:
1
𝐹1 =
𝐹(α⁄ )
2; 𝑛2 −1,𝑛1 −1

𝐹2 = 𝐹(α⁄2;𝑛1 −1,𝑛2 −1 )

En Excel se usa: INV.F.CD (probabilidad; grados de liberta1 ; grados de libertad2)

5. Aplicar las reglas de decisión: Rechazar H0 o no rechazar H0.

6. Realizar la conclusión.
UPC MA444 Estadística 190
Ejemplo 1

La producción de compuestos inflamables es delicada y requiere técnicas muy precisas para lograr
resultados óptimos. Actualmente, en el laboratorio se aplica la técnica A y se desea probar una nueva
técnica, B. La siguiente información muestra el resultado de los tiempos, en minutos, que utilizó cada
técnica por proceso.

Técnicas Tamaño de muestra Promedio Desviación estándar


Técnica A 16 9,97 6,56
Técnica B 11 9,27 2,05

Un ingeniero desea probar si la variabilidad entre los tiempos usados por ambas técnicas no es similar.
Use  = 0,05

1. Plantear las hipótesis

𝐻0 : 𝜎12 = 𝜎22
𝐻1 : 𝜎12 ≠ 𝜎22

2. Fijar el nivel de significación: α = 0,05

3. Calcular el valor del estadístico de la prueba.

𝑆12 6,562
𝐹𝑐 = = = 10,24
𝑆22 2,052

4. Establecer las regiones críticas.

donde:
1
𝐹1 = α
𝐹( ⁄2 ; 𝑛2 − 1, 𝑛1 − 1)

1 1
= = = 0,3268
𝐹(0,025; 10; 15) 3,06

𝐹2 = 𝐹(0,025, 15,10) = 3,52


UPC MA444 Estadística 191
Área bajo la curva: 𝑃(𝐹 ≥ 𝑐) = 𝛼
v1
𝜶 v2 1 2 3 4 5 6 7 8 9 10

0.050 15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54
0.025 6.20 4.77 4.15 3.80 3.58 3.41 3.29 3.20 3.12 3.06
0.010 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.80
0.005 10.80 7.70 6.48 5.80 5.37 5.07 4.85 4.67 4.54 4.42

v1
𝜶 v2 12 15 20 24 30 40 50 60 70 120
0.050 10 2.91 2.85 2.77 2.74 2.70 2.66 2.64 2.62 2.61 2.58
0.025 3.62 3.52 3.42 3.37 3.31 3.26 3.22 3.20 3.18 3.14
0.010 4.71 4.56 4.41 4.33 4.25 4.17 4.12 4.08 4.06 4.00
0.005 5.66 5.47 5.27 5.17 5.07 4.97 4.90 4.86 4.83 4.75

En Excel, para el caso de F2: INV.F.CD (0,025;15;10) = 3,52

En Excel, para el caso de F1: INV.F.CD (0,025;15;10) = 0,3268

5. Aplicar las reglas de decisión.

Como Fc = 10,24 > F2 = 3,52, entonces Rechazar H0.

6. Realizar la conclusión.

Con un nivel de significancia del 5%, sí es posible afirmar que la variabilidad entre los tiempos
usados por ambas técnicas no es similar.
UPC MA444 Estadística 192
Prueba de hipótesis para la diferencia de medias poblacionales

Caso 1: Varianzas poblacionales desconocidas y homogéneas

1. Plantear las hipótesis

Unilateral izquierda Bilateral Unilateral derecha

𝐻0 : 𝜇1 − 𝜇2 ≥ 𝑘 𝐻0 : 𝜇1 − 𝜇2 = 𝑘 𝐻0 : 𝜇1 − 𝜇2 ≤ 𝑘

𝐻1 : 𝜇1 − 𝜇2 < 𝑘 𝐻1 : 𝜇1 − 𝜇2 ≠ 𝑘 𝐻1 : 𝜇1 − 𝜇2 > 𝑘

2. F j v g f :α

3. Calcular el valor del estadístico de prueba.

(𝑥1 − 𝑥2 ) − (𝜇1 − 𝜇2 )
𝑡𝑐 = ~𝑡(𝑛1 +𝑛2 −2)
1 1
√𝑆𝑝2 ( + )
𝑛1 𝑛2

Calcular el valor de la varianza combinada 𝑆𝑝2 .


(𝑛1 − 1)𝑆12 + (𝑛2 − 1)𝑆22
𝑆𝑝2 =
𝑛1 + 𝑛2 − 2

4. Establecer las regiones críticas.

Unilateral izquierda 𝐻1 : 𝜇1 − 𝜇2 < 𝑘

−𝑡𝛼;𝑛1 +𝑛2 −2

Bilateral 𝐻1 : 𝜇1 − 𝜇2 ≠ 𝑘

−𝑡𝛼;𝑛 𝑡𝛼;𝑛
2 1 +𝑛2 −2 2 1 +𝑛2 −2
UPC MA444 Estadística 193

Unilateral derecha 𝐻1 : 𝜇1 − 𝜇2 > 𝑘

𝑡𝛼;𝑛1 +𝑛2 −2

5. Aplicar las reglas de decisión: Rechazar H0 o no rechazar H0.

6. Realizar la conclusión.

Caso 2: Varianzas poblacionales desconocidas y heterogéneas

1. Plantear las hipótesis.

Unilateral izquierda Bilateral Unilateral derecha

𝐻0 : 𝜇1 − 𝜇2 ≥ 𝑘 𝐻0 : 𝜇1 − 𝜇2 = 𝑘 𝐻0 : 𝜇1 − 𝜇2 ≤ 𝑘

𝐻1 : 𝜇1 − 𝜇2 < 𝑘 𝐻1 : 𝜇1 − 𝜇2 ≠ 𝑘 𝐻1 : 𝜇1 − 𝜇2 > 𝑘

2. Fijar el nivel de significación. 𝛼

3. Calcular el estadístico de prueba.

(𝑥1 − 𝑥2 ) − (𝜇1 − 𝜇2 )
𝑡𝑐 =
𝑆2 𝑆2
√ 1+ 2
𝑛1 𝑛2

Los grados de libertad se obtienen de la siguiente manera:

2
𝑆2 𝑆2
( 1 + 2)
𝑛1 𝑛2
𝜐= 2 2
𝑆2 𝑆2
(𝑛1 ) (𝑛2 )
1 2
+
(𝑛1 − 1) (𝑛2 − 1)

El valor de 𝑣 debe ser un valor entero y deberá redondearse al entero menor. Por ejemplo, si 𝑣 =
18,12608, entonces 𝑣 = 18.
UPC MA444 Estadística 194
4. Establecer las regiones críticas.

Unilateral izquierda 𝐻1 : 𝜇1 − 𝜇2 < 𝑘

−𝑡𝛼; 𝑣

Bilateral 𝐻1 : 𝜇1 − 𝜇2 ≠ 𝑘

−𝑡𝛼; 𝑣 𝑡𝛼;𝑣
2 2

Unilateral derecha 𝐻1 : 𝜇1 − 𝜇2 > 𝑘

𝑡𝛼; 𝑣

5. Aplicar las reglas de la decisión: Rechazar H0 o no rechazar H0.

6. Realizar la conclusión.

Ejemplo 1
Para determinar la concentración de partículas de nitrato en el aire en dos centros poblados, Larrea
(Pasco) y San Marcos (Ancash), cuya principal actividad económica es la minería, se tomaron 8
muestras de aire en Larrea y 6 muestras de aire en San Marcos. Los resultados se muestran a
continuación:

Centros poblados Tamaño de muestra Media (fibra/litro) Desviación estándar (fibra/litro)


Larrea (1) 8 0,04806 0,00610
San Marcos (2) 6 0,03286 0,00135

El Ministerio del Medio Ambiente, desea realizar una inspección exhaustiva de la calidad de aire que
respiran los habitantes de estos centros poblados, pero por cuestiones de presupuesto solo podrá
realizarlo en el centro poblado de Larrea, siempre y cuando se llegue a demostrar que la concentración
UPC MA444 Estadística 195
promedio de nitrato es mayor que en el centro poblado de San Marcos; caso contrario, se esperará el
próximo año para inspeccionar los dos centros poblados. Usando un nivel de significancia 5%. ¿Cuál
será la decisión que tomará el Ministerio de Medio Ambiente?

Solución
Resolviendo con las cinco dimensiones:

Interpretación
Determinar si el Ministerio de Medio Ambiente realizará una inspección exhaustiva de la calidad de
aire que respiran los habitantes de los centros poblados de Larrea y San Marcos; caso contrario, se
esperará el próximo año para inspeccionar los dos centros poblados.

Representación
Variable: Concentración de nitrato (fibra/litro)
Variable de agrupación: Centro poblado: Larrea (1) San Marcos (2)
Herramienta estadística: Prueba de hipótesis para la diferencia de medias y prueba de hipótesis
para la razón de varianzas

Cálculo
Para establecer cuál es el estadístico de prueba adecuado para la prueba de diferencia de medias
poblacionales, debemos realizar primero una prueba de razón de varianzas para determinar si
consideramos que las varianzas poblacionales son iguales o diferentes.

Prueba de hipótesis para la razón de varianzas


Las hipótesis para la razón de varianzas son:

𝐻0 : 𝜎12 = 𝜎22
𝐻1 : 𝜎12 ≠ 𝜎22

El nivel de significancia es de  = 0,05.

El valor del estadístico de prueba es:

𝑠12 0,006102
𝐹𝑐𝑎𝑙 = = = 20,42
𝑠22 0,001352
UPC MA444 Estadística 196
Donde:
1 1 1
𝐹1 = = = = 0,1890
𝐹𝛼; 𝑛 𝐹0,025; 5; 7 5,29
2 2 −1,𝑛1 −1

𝐹2 = 𝐹0,025; 7; 5 = 6,85

Aplicando las reglas de decisión, se rechaza H0.

Conclusión
Con un nivel de significancia de 5%, es posible afirmar que las varianzas poblacionales son
heterogéneas.

Prueba de hipótesis para la diferencia de medias

Las hipótesis para la diferencia de medias son:

𝐻0 𝜇1 ≤ 𝜇2
𝐻1 𝜇1 > 𝜇2

𝐻0 𝜇1 − 𝜇2 ≤ 0
𝐻1 𝜇1 − 𝜇2 > 0

El nivel de significancia es de  = 0,05.

De acuerdo con la prueba de razón de varianzas, se acepta de las varianzas poblacionales son
heterogéneas, por lo tanto, el estadístico de la prueba adecuado para la diferencia de medias es:

(𝑥1 − 𝑥2 ) − 𝑘
𝑡𝑐𝑎𝑙 =
𝑆2 𝑆2
√ 1+ 2
𝑛1 𝑛2

Reemplazando los valores:

(0,04806 − 0,03286) − 0
𝑡𝑐𝑎𝑙 = = 6,83
2 2
√0,00610 + 0,00135
8 6

Los grados de libertad del estadístico de prueba se obtienen de la siguiente manera:

2
𝑆2 𝑆2
(𝑛1 + 𝑛2 )
1 2
𝜐=
2 2 2
𝑆 𝑆22
( 1) ) (
𝑛1 𝑛2
+
(𝑛1 − 1) (𝑛2 − 1)
UPC MA444 Estadística 197
Reemplazando los valores:
2
0,006102 0,001352
( 8 + 6 )
𝜐= 2 2 = 7,90
0,006102 0,001352
( 8 ) ( 6 )
+
(8 − 1) (6 − 1)

Los grados de libertad son 𝑣 = 7,90. Se redondea al entero menor, 𝑣 = 7.

La prueba es unilateral derecha.

1,89458

El valor crítico es 𝑡0,05; 7 = 1,89458.

𝜐 0.4 0.3 0.2 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015
6 0.26483 0.55338 0.9057 1.13416 1.43976 1.94318 2.10431 2.31326 2.44691 2.61224 2.82893
7 0.26317 0.54911 0.89603 1.11916 1.41492 1.89458 2.04601 2.24088 2.36462 2.51675 2.71457
8 0.26192 0.54593 0.88889 1.10815 1.39682 1.85955 2.00415 2.18915 2.30600 2.44898 2.63381

Análisis

Como 𝑡𝑐𝑎𝑙 = 6,83 > 𝑡𝑐𝑟𝑖𝑡𝑖𝑐𝑜 = 1,89458, entonces se rechaza H0.

Conclusión
A un nivel de confianza de 5%, existe evidencia estadística suficiente para afirmar que la concentración
promedio de nitrato en Larrea es mayor que en San Marcos.

Argumentación
Debido a que la concentración promedio de nitrato en Larrea es mayor que en San Marcos, el
Ministerio de Medio Ambiente realizará una inspección exhaustiva de la calidad de aire en el centro
poblado de Larrea.
UPC MA444 Estadística 198
Ejemplo 2

La empresa de ingeniería Forte pertenece al rubro de la construcción. Para un proyecto realizado a una
empresa minera de Ancash, se tuvo como principal tarea el movimiento de tierras. Ante ello, es
evidente que el soporte de mantenimiento que necesita esta división es elemental para la eficiencia
del trabajo.

El jefe del área de mantenimiento enviará personal de la zona norte a la zona centro, siempre y cuando
los costos de mano de obra de la zona centro superen a los costos de la zona norte. Para decidir, use
un nivel de significación del 4%. Asuma que los costos se distribuyen normalmente y que las varianzas
poblacionales son desconocidas y homogéneas.

Costo de mano de obra en la zona centro (1)


2506,46 2563,99 2501,06 2581,49 2730,66 2544,64 2534,54 2666,93

Costo de mano de obra en la zona norte (2)


Tamaño de muestra Media Desviación estándar
10 2484,5 55,5
UPC MA444 Estadística 199
UPC MA444 Estadística 200
Ejemplo 3

Un componente de los satélites son los paneles solares. La compañía Intel está probando dos tipos de
paneles solares: el EQM y el EM3, los cuales deben pasar un estricto control de calidad. Según
información del departamento de calidad si la potencia de los paneles solares EQM supera en más de
dos kW a los de EM3, se sugiere dejar de fabricar el modelo EM3.

El jefe de producción seleccionó al azar dos muestras de paneles de ambos modelos y registra las
potencias de estos. A continuación, se presenta la siguiente información:

Variable Tamaño de muestra Promedio Desviación estándar


Panel EQM (1) 16 27,21 1,620
Panel EM3 (2) 21 23,63 3,490

Considerando que la potencia se distribuye normalmente, con un nivel de significación del 5%, ¿se
debe dejar de fabricar el modelo EM3?
UPC MA444 Estadística 201
UPC MA444 Estadística 202
Ejercicios propuestos

59. Los siguientes datos corresponden a la resistencia a la compresión a los 28 días, en kg/cm2,
reportados por dos laboratorios:

Laboratorio 1 287,0 238,2 314,3 365,9 362,0 388,7 292,9 290,3


Laboratorio 2 306,0 338,0 349,4 307,4 316,2 326,9

Con 5% de nivel de significación, ¿los laboratorios reportan resultados en promedio similares?


Asuma poblaciones normales.

60. La exactitud obtenida en mediciones con GPS depende del equipo receptor. Uno de los fabricantes
de receptores está realizando un estudio para comparar la exactitud de dos modelos, GPSMAP (1)
y Oregón (2). Según información del departamento de control de calidad, la exactitud del modelo
GPSMAP es menor que la de Oregón, por lo cual se sugiere dejar de fabricarla.

El jefe de producción seleccionó al azar dos muestras de receptores de ambos modelos con la
finalidad de realizar la prueba correspondiente y registra la exactitud, en mm, obtenida por ambos
receptores. Considerando que la exactitud se distribuye normalmente y con un nivel de
significación del 4%, ¿la empresa debe dejar de fabricar el modelo GPSMAP.

61. El tiempo de exposición, en minutos, de un metal con una sustancia química hasta lograr un
adherido perfecto es parte de un proceso de producción. Se considera que el menor tiempo de
exposición es mejor. Como parte de la mejora del proceso se somete a prueba dos procedimientos
y se mide el tiempo de exposición para dos muestras independientes.

Procedimiento Tamaño de muestra Media Desviación estándar


Procedimiento A 31 12,97 4,25
Procedimiento B 25 11,99 2,47

a. Asumiendo que los tiempos de exposición tienen distribución normal, ¿se puede afirmar que hay
diferencia en la variación de los tiempos? Use un nivel de significación del 10%.
b. Asumiendo que los tiempos de exposición tienen distribución normal y usando un nivel de
significación del 5%, ¿recomendaría el procedimiento B?
UPC MA444 Estadística 203
Caso: Constructora R&P

Constructora R&P es una empresa dedicada a la


construcción de puentes y carreteras. Recientemente
adquirió la buena pro por parte de la autoridad
competente para la construcción de un puente en la
provincia de Virú al norte del país. Los fierros de
construcción son materiales básicos para la
construcción del puente porque brinda la resistencia a
la flexión. En el mercado existen fierros de
construcción tanto de procedencia nacional como
importados.

El jefe del área de compra de materiales sospecha que el promedio de la resistencia a la flexión de las
columnas es mayor cuando se usan los fierros de procedencia nacional que cuando se usan los fierros
importados. De ser cierta su sospecha, elegirá fierros nacionales para la construcción. Para ello,
seleccionó al azar registros del último año de la resistencia a la flexión, en kg/cm 2, de las columnas
construidas con cada tipo de fierro obteniendo los siguientes resultados:

Fierro nacional (1) Fierro importado (2)


Tamaño de muestra 21 16
Media 41,8 39,1
Desviación estándar 2,57 2,02

Sabiendo que la resistencia a flexión de las columnas se distribuye normalmente y que sus varianzas
poblacionales son homogéneas. A un nivel de significación del 5% ¿cuál será la decisión del jefe del
área de compra de materiales?

Interpretación Representación Cálculo Análisis Argumentación


El estudiante El estudiante El estudiante El estudiante grafica El estudiante
identifica la identifica la determina las regiones críticas presenta un informe
problemática y lo variable, la técnica correctamente, con el (los) valor(es) sobre la
redacta como estadística y con precisión, el crítico(s). problemática que se
problema o como presenta las valor del Fundamenta deseaba resolver,
objetivo. hipótesis. estadístico de correctamente la dando respuesta al
prueba. decisión estadística y objetivo.
la conclusión.
UPC MA444 Estadística 204
Diseño de experimentos
Un experimento diseñado es una prueba o serie de pruebas en las cuales se inducen cambios
deliberados en las variables de entrada (factores controlables) de un proceso o sistema, de manera
que sea posible observar e identificar las causas de los cambios en la variable de salida (variable
respuesta).

Variable de entrada
(Factores Variable de salida
Proceso
controlables y no (Variable respuesta)
controlables)

Ejemplo 1

Se tienen dos poblaciones, una de alumnos que lleva el curso de Estadística en modalidad presencial y
otra de alumnos que lleva el curso en modalidad blended. Se quiere saber si la nota promedio de los
alumnos es similar en ambas modalidades.

N1: modalidad presencial N2: modalidad blended

¿µ1 = µ2?

n1 = 5
n2 = 10
𝑥̅1 𝑥̅2

Variable en estudio

Variable de agrupación (poblaciones)

Elemento

Parámetro

Herramienta estadística
UPC MA444 Estadística 205
Conceptos generales

Factor
Variable independiente que afecta los resultados del experimento: controlables o no controlables. En
un experimento se puede evaluar uno o más factores.

Tratamiento
Un tratamiento corresponde a los niveles de un factor o a la combinación de los niveles de dos o más
factores. Es un conjunto de procedimientos cuyo efecto sobre la variable respuesta nos interesa
estudiar. Su efecto se mide y se compara con otros tratamientos.

Variable respuesta
Es la variable en la cual se evaluarán los efectos de los tratamientos.

Unidad experimental
Es la unidad, sujeto u objeto, al el cual se le aplica un tratamiento.

Ejemplo 2

Se tienen ahora tres poblaciones, una de alumnos que lleva el curso de Estadística en modalidad
presencial, otra en modalidad blended y otra en modalidad online. Se quiere saber si la nota promedio
de los alumnos es similar en las tres modalidades.

N1: modalidad presencial N2: modalidad blended N3: modalidad online

¿µ1 = µ2 = µ3?

n1 = 5 n2 = 10 n3 = 5

𝑥̅1 𝑥̅2 𝑥̅3


UPC MA444 Estadística 206
Identifique los conceptos generales:

Antes Ahora Identifique

Variable en estudio Variable respuesta

Variable de agrupación (poblaciones) Factor

Categorías de la variable de agrupación Tratamientos

Elemento Unidad de análisis

Herramienta estadística

A continuación, se presentan los datos recolectados, los mismos que se han tabulado en una matriz de
datos. El 𝑌𝑖𝑗 representa la variable en estudio, siendo 𝑖 el tratamiento y 𝑗 las repeticiones.

Tratamientos
Repeticiones
Tratamiento 1 Tratamiento 2 Tratamiento 3
1 𝑌11 𝑌21 𝑌31
2 𝑌12 𝑌22 𝑌32
3 𝑌13 𝑌23 𝑌33
… … … …
𝑗 𝑌1𝑗 𝑌2𝑗 𝑌3𝑗
… … … …
𝑛𝑖 𝑌1𝑛1 𝑌2𝑛2 𝑌3𝑛3
Total 𝒀𝟏. 𝒀𝟐. 𝒀𝟑.

Ejemplo 3

El gerente de una compañía dedicada a ensamblar piezas de equipos electrónicos realizó un estudio
con el fin de comparar la eficacia de tres programas de capacitación, A, B y C. Para ello se asignaron al
azar quince empleados, cinco a cada uno de los tres programas. Después de terminado los cursos de
capacitación se registró el tiempo, en minutos, que les tomó ensamblar las piezas en los equipos
electrónicos.

Complete lo solicitado:

Variable respuesta

Factor

Tratamientos

Unidad experimental
UPC MA444 Estadística 207
Diseño completamente al azar

En el diseño completamente al azar (DCA) suponga que se cuenta con los resultados de 𝑘 muestras
aleatorias independientes, cada una de tamaño 𝑛𝑖 , obtenidas desde 𝑘 diferentes poblaciones y se
desea probar la hipótesis de que las medias de estas 𝑘 poblaciones son todas iguales.

Las poblaciones que se desea comparar suelen ser producto de la aplicación de distintos tratamientos
a ciertas unidades de análisis.

Considere el caso en el que se desea comparar el efecto de cinco programas de incentivos en la


productividad de los trabajadores.

En este caso:
• Los cinco programas de incentivos serían los cinco tratamientos aplicados (los cuales definen las
cinco poblaciones que se van a comparar).
• La unidad de análisis sería un trabajador (quien recibe el tratamiento).

Los datos para analizar pueden arreglarse en una tabla como la que se muestra a continuación:

Tratamientos
Repeticiones
Tratamiento 1 Tratamiento 2 … Tratamiento i … Tratamiento k
1 𝑌11 𝑌21 … 𝑌𝑖1 … 𝑌𝑘1
2 𝑌12 𝑌22 … 𝑌𝑖2 … 𝑌𝑘2
3 𝑌13 𝑌23 … 𝑌𝑖3 … 𝑌𝑘3
… … … … … … …
𝑗 𝑌1𝑗 𝑌2𝑗 … 𝑌𝑖𝑗 … 𝑌𝑘𝑗
… … … … … … …
𝑛𝑖 𝑌1𝑛1 𝑌2𝑛2 … 𝑌𝑖𝑛𝑖 … 𝑌𝑘𝑛𝑘
Total 𝒀𝟏. 𝒀𝟐. … 𝒀𝒊. … 𝒀𝒌.

Para probar la hipótesis de la igualdad de las medias, se deben probar los siguientes supuestos:

• Homogeneidad de las varianzas


• Normalidad de los errores.

Supuesto 1: Homogeneidad de varianzas

Las hipótesis son:

𝐻0 : 𝜎12 = 𝜎22 = 𝜎32 = 𝜎42


𝐻1 : 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑎 𝜎𝑖2 𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒; 𝑖 = 1, 2, 3, 4

La hipótesis 𝐻0 significa la varianza es la misma en las cuatro sucursales y la hipótesis 𝐻1 significa que
al menos una varianza es diferente.
UPC MA444 Estadística 208
Los resultados de Minitab son:

Test for Equal Variances for Depósitos

Bartlett's Test

1 Test Statistic 0.19


P-Value 0.980
Levene's Test
Test Statistic 0.04
P-Value 0.988
2
Sucursal

0.5 1.0 1.5 2.0 2.5 3.0


95% Bonferroni Confidence Intervals for StDevs

Como el p valor (P-value) es mayor al nivel de significancia 𝛼 (0,988 > 0,05), no se rechaza H0, el
resultado de esta prueba indica que no hay suficiente evidencia estadística afirmar que alguna de las
varianzas poblacionales es diferente, es decir, se acepta que el supuesto de homogeneidad de
varianzas al 5% de nivel de significancia.

Supuesto 2: Normalidad de los errores


Las hipótesis son:

𝐻0 : Los errores del modelo sí tienen distribución normal


𝐻1 : Los errores del modelo no tienen distribución normal

Los resultados de Minitab son:

Probability Plot of RESI1


Normal
99
Mean 5.551115E-17
StDev 0.9708
95 N 28
KS 0.081
90
P-Value >0.150
80
70
Percent

60
50
40
30
20

10
5

1
-2 -1 0 1 2
RESI1

Como el p valor (P-value) es mayor al nivel de significancia 𝛼 (0,150 > 0,05), no se rechaza H0, el
resultado de esta prueba indica que no hay suficiente evidencia estadística para afirmar que los errores
del modelo no tienen distribución normal, es decir se acepta el supuesto de normalidad al 5% de nivel
de significancia.
UPC MA444 Estadística 209
Observación

Ambos supuestos se han obtenido con el software Minitab. Para efectos del curso se asumirán ambos
supuestos.

El modelo para este diseño es el siguiente:

𝑦𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝜀𝑖𝑗 𝑖 = 1, 2, ⋯ , 𝑘 ; 𝑗 = 1, 2, ⋯ , 𝑛𝑖

donde:
𝑦𝑖𝑗 : = valor observado del 𝑖-ésimo tratamiento en la 𝑗-ésima repetición
𝜇 : = efecto de la media poblacional
𝜏𝑖 : = efecto del 𝑖-ésimo tratamiento
𝜀𝑖𝑗 : = error experimental asociado a la observación 𝑦𝑖𝑗

Por ejemplo, podríamos usar en análisis de varianza para responder a las siguientes situaciones:

• Una importante compañía de construcciones desea comparar tres marcas de taladros para
determinar cuánto tiempo pasa antes de necesitar una reparación; si los tiempos de vida de los
taladros de cada marca se distribuyen normalmente. ¿Las marcas de taladro tienen un tiempo de
vida útil promedio similar a las otras marcas antes de requerir una reparación?

• Un ingeniero civil residente de una obra desea evaluar el efecto que tiene las técnicas de mezclado
de concreto sobre la resistencia (kg/cm2) a la compresión. Para ello evalúa cuatro técnicas
diferentes y para realizar la prueba produce especímenes de concreto. ¿La resistencia promedio a
la compresión es la misma para cada técnica de mezclado?

• Una empresa constructora brinda capacitación con diferentes métodos a sus operarios. ¿El
rendimiento promedio de los operarios en la empresa es el mismo según los métodos de
adiestramiento recibido por el operario?

• Una importante compañía de construcciones desea comparar tres marcas de camiones antes de
ordenar toda una nueva flota de una clase de camión. ¿Los costos medios de operación por
kilómetro de cada camión es el mismo para cada marca de camión?
UPC MA444 Estadística 210
Análisis de la varianza

El análisis de la varianza (o Anova: Analysis of variance) es un método para comparar tres o más medias.
Se desea medir el efecto del factor en estudio (variable independiente de naturaleza cualitativa o
cuantitativa) sobre la variable respuesta (variable dependiente de naturaleza cuantitativa).

En un diseño completamente al azar (DCA) los tratamientos se asignan aleatoriamente a las unidades
experimentales.

Hay k poblaciones (k tratamientos) y se seleccionan k muestras aleatorias independientes, una de cada


población.

Esta técnica estadística permite descomponer la variabilidad total de los resultados de un experimento
en sus distintas fuentes (tratamientos, error experimental), con la finalidad de compararlas e
identificar su importancia relativa en la explicación de la variación total.

Variabilidad entre grupos Variabilidad dentro de los grupos

•Mide el efecto de los tratamientos •Mide la variabilidad del error experimental

Tabla del ANOVA o ANVA


Fuente de
Grados de libertad Suma de cuadrados Cuadrado medio Fc
variación
𝑆𝑀𝑇𝑅
Tratamientos 𝑘−1 𝑆𝐶𝑇𝑅 𝐶𝑀𝑇𝑅 =
𝑘−1 𝐶𝑀𝑇𝑅
𝑆𝐶𝐸 𝐶𝑀𝐸
Error 𝑛−𝑘 𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝑇𝑅 𝐶𝑀𝐸 =
𝑛• − 𝑘

Total 𝑛−1 𝑆𝐶𝑇

La prueba para 𝑘 medias o el análisis de varianza se basa en la descomposición de la variación total de


los datos con respecto a la media global (𝑆𝐶𝑇) en dos partes:

𝑘 𝑛𝑖 𝑘 𝑛𝑖
2
2 𝑦..2
𝑆𝐶𝑇 = ∑ ∑(𝑦𝑖𝑗 − 𝑦̅) = ∑ ∑ 𝑦𝑖𝑗 −
𝑛.
𝑖=1 𝑗=1 𝑖=1 𝑗=1

Variación dentro de las muestras o variación intragrupos que denotaremos como 𝑆𝐶𝑇𝑅.

𝑘 𝑘
2
𝑦𝑖.2 𝑦..2
𝑆𝐶𝑇𝑅 = ∑ 𝑛𝑖 (𝑦̅𝑖 − 𝑦̅) = ∑ −
𝑛𝑖 𝑛.
𝑖=1 𝑖=1
UPC MA444 Estadística 211
Variación entre muestras o variación intergrupos que denotaremos como 𝑆𝐶𝐸.

𝑘 𝑛𝑖
2
𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝑇𝑅 = ∑ ∑(𝑦𝑖𝑗 − 𝑦̅𝑖 )
𝑖=1 𝑗=1

donde:

𝑆𝐶𝑇: Suma de cuadrados del total


𝑆𝐶𝑇𝑅: Suma de cuadrados de los tratamientos
𝑆𝐶𝐸: Suma de cuadrados del error
𝑛𝑖 : Tamaño de muestra del 𝑖-ésimo tratamiento
𝑛: Tamaño de muestra total 𝑛 = 𝑛1 + 𝑛2 + ⋯ + 𝑛𝑘
𝑘: Número de tratamientos
𝑌𝑖 : Total de la 𝑖-ésima muestra 𝑌 = 𝑌1 + 𝑌2 + ⋯ + 𝑌𝑘

Asumiendo el cumplimiento de los supuestos antes mencionados, y que en realidad no hay diferencia
entre los tratamientos, la cantidad Fc del cuadro de análisis de varianza seguiría una distribución F con
los grados de libertad del tratamiento y con los grados de libertad del error.

Entonces, se puede utilizar esta distribución para evaluar la hipótesis nula de que no hay diferencias
entre las medias de los tratamientos.

Hipótesis estadística

1. Formular las hipótesis.

𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘
𝐻1 : 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑎 𝜇𝑖 𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒 𝑎 𝑙𝑜𝑠 𝑑𝑒𝑚á𝑠

𝐻0 es la afirmación de que no hay diferencia entre las medias poblacionales, es decir, que el factor
en estudio no afecta a la variable respuesta.

𝐻1 es la afirmación de que sí hay diferencia entre las medias poblacionales, es decir, que el factor
en estudio sí afecta a la variable respuesta.

2. Fijar el nivel de significación: 𝛼

3. Calcular el estadístico de prueba.

𝐶𝑀𝑇𝑅
𝐹𝑐 =
𝐶𝑀𝐸

4. Establecer la región crítica.

El valor crítico es: 𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑜 = 𝐹; 𝑔𝑙 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜; 𝑔𝑙 𝑒𝑟𝑟𝑜𝑟 = 𝐹; 𝑘−1; 𝑛−𝑘
UPC MA444 Estadística 212
5. Aplicar los criterios de decisión.

El valor crítico es:

𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑜 = 𝐹; 𝑔𝑙 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜; 𝑔𝑙 𝑒𝑟𝑟𝑜𝑟 = 𝐹; 𝑘−1; 𝑛−𝑘

En Excel se usa: =INV.F.CD (probabilidad; grados de libertad1; grados de libertad2)

Para tomar una decisión seguimos la siguiente regla:

Si 𝐹𝑐 ≤ 𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑜 , no se rechaza 𝐻0
Si 𝐹𝑐 > 𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑜 , sí se rechaza 𝐻0

6. Realizar la conclusión.

Ejemplo 1
La gerente de mercadeo de un banco planea poner en marcha cierto tipo de promociones para atraer
nuevos clientes en cuatro sucursales del banco. Ella está convencida que diferentes tipos de
promociones atraerán a personas de diferentes grupos de ingreso, por lo que, de haber diferencias
entre los ingresos medios de los clientes de cada sucursal, se optará por un programa de promociones
distinto para cada una.

Considere a los montos de los depósitos, en miles de soles, como una medida representativa de los
ingresos de los clientes. Se presentan datos para una muestra de siete depósitos de cada sucursal
¿Debe la gerente optar por un programa de promociones distinto para cada sucursal? Evalúe esta
posibilidad con un nivel de significación del 5%.

Depósito Sucursal 1 Sucursal 2 Sucursal 3 Sucursal 4


1 Y11 = 5,3 Y21 = 3,3 Y31 = 3,6 Y41 = 4,3
2 Y12 = 2,6 Y22 = 4,6 Y32 = 2,8 Y42 = 2,5
3 Y13 = 3,6 Y23= 2,1 Y33 = 4,5 Y43 = 1,8
4 Y14 = 3,8 Y24 = 3,5 Y34 = 3,8 Y44 = 3,0
5 Y15 = 2,7 Y25 = 5,0 Y35 = 1,9 Y45 = 3,9
6 Y16 = 5,1 Y26 = 2,8 Y36 = 4,1 Y46 = 3,5
7 Y17 = 4,2 Y27 = 2,5 Y37 = 5,1 Y47 = 4,1
Total, Yi. Y1. = 27,3 Y2. = 23,8 Y 3. = 25,8 Y 4. = 23,1

Solución

Variable respuesta

Factor

Tratamientos

Unidad experimental
UPC MA444 Estadística 213
1. Formular las hipótesis.

𝐻0 : 𝜇1 = 𝜇2 = 𝜇3
𝐻1 : 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑎 𝜇𝑖 𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒 𝑎 𝑙𝑜𝑠 𝑑𝑒𝑚á𝑠; 𝑖 = 1, 2, 3

𝐻0 es la afirmación de que no hay diferencia entre las medias poblacionales, es decir, que el factor
en estudio no afecta a la variable respuesta.

𝐻1 es la afirmación de que sí hay diferencia entre las medias poblacionales, es decir, que el factor
en estudio sí afecta a la variable respuesta.

2. Establecer el nivel de significación:  = 0,05

3. Calcular el valor del estadístico de prueba.

Los cálculos para obtener las sumas de cuadrados son:

2
𝑦..2 (∑𝑘=4 7
𝑖=1 ∑𝑗=1 𝑦𝑖𝑗 ) (27,3 + 23,8 + 25,8 + 23,1)2 1002
𝑇𝐶 = = = = = 357,1429
𝑛 ∑𝑘=4
𝑖=1 𝑛𝑖 7+7+7+7 28

La suma de cuadrados total es:

𝑘=4 7
2 𝑦..2
𝑆𝐶𝑇 = ∑ ∑ 𝑦𝑖𝑗 − = (5,32 + 2,62 + ⋯ + 4,12 ) − 357,1429 = 27,0171
𝑛.
𝑖=1 𝑗=1

La suma de cuadrados de los tratamientos es:

𝑘=4
𝑦𝑖.2 𝑦..2 27,32 23,82 25,82 23,12
𝑆𝐶𝑇𝑅 = ∑ − =( + + + ) − 357,1429 = 1,568
𝑛𝑖 𝑛. 7 7 7 7
𝑖=1

La suma de cuadrados de los errores es:

𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝑇𝑅 = 27,0171 − 1,568 = 25,4486

La tabla del análisis de varianza:

Fuente de Suma de Cuadrados


Grados de libertad Fcalculado
variación cuadrados medio
1,569 0,523
Tratamientos 𝑘−1=4−1=3 𝑆𝐶𝑇𝑅 = 1,569 = 0,523 = 0,49
3 1,060
25,449
Error 𝑛 − 𝑘 = 28 − 4 = 24 𝑆𝐶𝐸 = 25,449 = 1,060
24

Total 𝑛 − 1 = 28 − 1 = 27 𝑆𝐶𝑇 = 27,017

El valor del estadístico de prueba es:


𝐹𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 0,49
UPC MA444 Estadística 214

4. Establecer la región crítica.

Esta es una prueba unilateral izquierda.

El valor crítico es:

𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑜 = 𝐹; 𝑔𝑙 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠; 𝑔𝑙 𝑒𝑟𝑟𝑜𝑟 = 𝐹; 𝑘−1; 𝑛−𝑘 = 𝐹0,05; 3; 24 = 3,01

v1
𝜶
v2 1 2 3 4 5 6 7 8 9 10

0.050 24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30 2.25
0.025 5.72 4.32 3.72 3.38 3.15 2.99 2.87 2.78 2.70 2.64
0.010 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26 3.17
0.005 9.55 6.66 5.52 4.89 4.49 4.20 3.99 3.83 3.69 3.59

5. Aplicar los criterios de decisión.

𝐹𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 0,49 < 𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑜 = 3,01; entonces no se rechaza 𝐻0 .

6. Realizar la conclusión.

Al 5% de significación, no es posible afirmar que al menos un monto promedio sea diferente a los
demás.
UPC MA444 Estadística 215
Método de comparaciones múltiples: Prueba de Tukey - Kramer

Se supone que el experimentador tiene a su disposición mediciones relativas a varios tratamientos. El


análisis de varianza indica si hay evidencias de que al menos una de las medias sea diferente o no.
Cuando se rechaza la hipótesis nula, el análisis de varianza no revela cuál o cuáles de las medias son
significativamente diferentes. En este caso, se debe utilizar otra prueba estadística.

Cuando el experimentador desea determinar todos los pares de medias que se puede concluir que
difieren de otro (µi versus µj) se utiliza la prueba de comparación múltiple de Tukey – Kramer, con el
fin de probar todas las hipótesis nulas simultáneas. Para fines de este curso se presentará la salida
obtenida con MINITAB.

Ejemplo 1
Croma Color S.A. es una empresa especializada en la comercialización de pinturas envasadas a nivel
industrial, comercial y residencial. El gerente de marketing propone lanzar una campaña publicitaria
para incrementar las ventas de las pinturas. La campaña publicitaria se lanzará en el distrito o distritos
donde las ventas promedio, sean menores. Para identificar el distrito dónde se lanzará la campaña
publicitaria, se registró el monto de venta, en miles de soles, de algunos meses del último año tomados
al azar. Los resultados se presentan a continuación:

Santa Anita Breña Ate


70 30 40
60 40 50
60 30 70
80 40 80
60 40 60

Los resultados de la prueba de Tukey – Kramer son:

Factor N Mean Grouping


Santa Anita 5 66.00 A
Ate 5 60.00 A
Breña 5 36.00 B

¿En qué distrito o distritos se debe lanzar la campaña publicitaria? Utilice un nivel de significación del
1%.

Interpretación Representación Cálculo Análisis Argumentación


Identifica la Identifica el factor, Realiza la prueba de Realiza y analiza Sustenta los
problemática, tratamientos, la técnica las comparaciones resultados
señalando variable de estadística aplicada múltiples encontrados en la
claramente el respuesta, unidad e interpreta. muestra y brinda
objetivo del experimental una
caso. Identifica la técnica recomendación al
estadística a usar. problema.
UPC MA444 Estadística 216
Solución

Interpretación

Determinar en qué distrito o distritos se debe lanzar la campaña publicitaria.

Representación

Factor: Distrito
Tratamientos: Santa Anita, Breña, Ate
Variable respuesta: Monto de ventas de pintura envasada, en miles de soles
Unidad experimental: Un mes de venta de pintura envasada
Herramienta estadística: Usaremos la herramienta del diseño completamente al azar (DCA)

1. Formular las hipótesis.

𝐻0 : 𝜇1 = 𝜇2 = 𝜇3
𝐻1 : 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑎 𝜇𝑖 𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒 𝑎 𝑙𝑎𝑠 𝑑𝑒𝑚á𝑠; 𝑖 = 1, 2, 3

2. Establecer el nivel de significación:  = 0,05

Cálculo

3. Calcular el valor del estadístico de prueba.

Fuente de Suma de
Grados de libertad Cuadrados medio Fcalculado
variación cuadrados
2520 1260
Tratamientos 𝑘– 1 = 3 − 1 = 2 𝑆𝐶𝑇𝑅 = 2520 = 1260 = 10,5
2 120
1440
Error 𝑛 − 𝑘 = 15 − 3 = 12 𝑆𝐶𝐸 = 1440 = 120
12

Total 𝑛 − 1 = 15 − 1 = 14 𝑆𝐶𝑇 = 3960

Finalmente, la tabla del análisis de varianza es:

Fuente de Suma de
Grados de libertad Cuadrado medio Fcalculado
variación cuadrados
Distritos 2 2520 1260 10,5
Error 12 1440 120
Total 14 3960

El valor del estadístico de prueba es:

𝐹𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 10,5
UPC MA444 Estadística 217
El valor crítico es:

𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑜 = 𝐹; 𝑔𝑙 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜; 𝑔𝑙 𝑒𝑟𝑟𝑜𝑟 = 𝐹; 𝑘−1; 𝑛−𝑘 = 𝐹0,05; 2; 12 = 3,89

v1
𝛼
v2 1 2 3 4 5 6 7 8 9 10

0.050 12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75
0.025 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44 3.37
0.010 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30
0.005 11.75 8.51 7.23 6.52 6.07 5.76 5.52 5.35 5.20 5.09

Análisis

Para decidir comparamos el valor del estadístico de prueba y el valor crítico.

𝐹𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 10,5 > 𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑜 = 3,89

Por lo tanto, se rechaza H0.

Conclusión: Al 1% de nivel de significancia, se puede afirmar que existe diferencia en al menos un


monto promedio de venta de pintura envasada, en miles de soles.

De la prueba Tukey - Kramer

µBreña µAte µSanta Anita


36,0 60,0 66,0

Se puede observar que no hay diferencia significativa entre las ventas de los distritos de Ate y Santa
Anita. Los distritos con mayor monto promedio de ventas de pintura envasada son Ate y Santa Anita.
Por lo tanto, la empresa debe decidir por dichos distritos para lanzar la campaña publicitaria.

Argumentación

La campaña publicitaria se lanzará solo en el distrito de Breña, porque las ventas promedio de pintura
envasada son menores.
UPC MA444 Estadística 218
Ejemplo 2

Un ingeniero civil residente de una obra desea evaluar el efecto que tienen las técnicas de mezclado
de concreto sobre la resistencia (kg/cm2) a la compresión. Para ello evalúa cuatro técnicas diferentes
y para realizar la prueba produce especímenes de concreto. La resistencia a la compresión del concreto
de cada técnica se distribuye normalmente y tienen la misma varianza. Los datos recolectados son los
siguientes:

Técnica 1 Técnica 2 Técnica 3 Técnica 4


2765 3200 2800 2600
2665 3300 3150 2700
2865 2975 2885 2600
2890 3150 2850 2765

Factor N Mean Grouping


Técnica 2 4 3156.3 A
Técnica 3 4 2921.3 A B
Técnica 1 4 2796.3 B
Técnica 4 4 2666.3 B

a. Identifique:

Variable respuesta

Factor

Tratamientos

Unidad experimental

b. Al 5% de significación, ¿al menos una técnica de mezclado influye en la resistencia a la compresión


del concreto?

Anova con Excel

Fuente de Grados de Suma de


Cuadrados medio Fcalculado
variación libertad cuadrados
Tratamientos

Error

Total

1. Formular las hipótesis de trabajo

H0:
H1:
UPC MA444 Estadística 219
2. Establecer el nivel de significación:  =

3. Calcular el valor del estadístico de prueba: Fc =

4. Aplicar el criterio de decisión.

Como Fc = …………… …… Fcrit …………; ………., ………. = ……….….. entonces …….. rechaza H0.

5. Realizar la conclusión.

c. Si la prueba resulta significativa, ¿qué técnica recomendaría utilizar?


UPC MA444 Estadística 220
Ejercicios propuestos

62. Una compañía que produce ladrillos efectuó un experimento para determinar si cuatro
temperaturas de cocción específicas, en °F, afectan la densidad de cierto tipo de ladrillo, en
gr/cm3. La densidad de los ladrillos para cada temperatura se distribuye normalmente y tienen la
misma varianza.
Temperaturas
100°F (1) 125°F (2) 150°F (3) 175°F (4)
19,9 21,7 20,9 21,8
19,7 21,4 20,8 21,9
19,8 21,5 20,8 21,7
19,7 21,5 20,6 21,6
20,0 21,7
Factor N Mean Grouping
175°F (4) 5 21.7400 A
125°F (2) 4 21.5250 A
150°F (3) 4 20.7750 B
100°F (1) 5 19.8200 C

a. Interprete el valor de Y23.


b. Complete el siguiente cuadro:

Variable respuesta

Factor

Tratamientos

Unidad experimental

c. Utilice nivel de significación de 5% para probar si al menos una temperatura de cocción influye
en la densidad de los ladrillos. Presente el ANOVA del Excel.
d. Si la prueba resulta significativa, ¿qué temperatura recomendaría utilizar?

63. Una importante compañía de construcciones desea comparar tres marcas de taladros para
determinar cuánto tiempo pasa antes de necesitar una reparación. Los tiempos de vida de los
taladros de cada marca se distribuyen normalmente y tienen la misma varianza. Los datos de los
tiempos de vida útil, en decenas de horas, para cada marca se encuentran en la siguiente tabla:

Marca A Marca B Marca C


6 10 3
2 9 2
4 8 5
1 6 4
7
UPC MA444 Estadística 221

Factor N Mean Grouping


Marca B 4 8.250 A
Marca A 5 4.000 B
Marca C 4 3.500 B

a. Identifique:

Variable respuesta

Factor

Tratamientos

Unidad experimental

b. Interprete el valor de Y13.


c. ¿Sugieren los datos que el tiempo promedio de vida es el mismo para cada marca de taladro
antes de una reparación? Utilice nivel de significación de 5%.
d. Si la prueba resulta significativa, ¿qué marca de taladro recomendaría utilizar?

64. Un empresario debe elegir la alternativa más eficiente para fabricar un mismo producto. Se
analiza el costo por unidad, en soles, de tres alternativas. El costo por unidad para cada alternativa
se distribuye normalmente y tienen la misma varianza, ¿qué alternativa deberá elegirse?

Alternativa A Alternativa B Alternativa C


9,35 8,35 9,35
8,35 8,35 10,35
7,35 7,35 9,35
8,35 7,35 8,35
9,35 8,35 9,35
7,35 7,35 9,35

Factor N Mean Grouping


Alternativa C 6 9.350 A
Alternativa A 6 8.350 A B
Alternativa B 6 7.850 B

a. Pruebe si existe alguna diferencia significativa en los costos unitarios de las tres alternativas
de fabricación. Utilice nivel de significación de 5%.
b. Si existen diferencias, ¿entre qué grupos están las diferencias? Utilice nivel de significación de
5%.

65. Importación Bombardera desea determinar si el tipo de chip (A, B, C) que tienen las laptops que
ellos importan influye en el tiempo de respuesta (microsegundos). El tiempo de respuesta para
UPC MA444 Estadística 222
cada tipo de chip se distribuye normalmente y tienen la misma varianza. Al probar cinco laptops
con cada tipo de chip, se obtuvieron los siguientes resultados, en microsegundos:

Tipo A Tipo B Tipo C


18 24 17
23 25 14
21 30 19
18 27 20
24 38 17

Factor N Mean Grouping


Tipo B 5 28.80 A
Tipo A 5 20.80 B
Tipo C 5 17.40 B

a. Al nivel de significancia del 5%, ¿la importadora puede concluir que hay diferencia en los
tiempos promedio de respuesta según el tipo de chip utilizado?
b. Si la prueba resulta significativa, ¿qué tipo de chip recomendaría utilizar?

66. Para determinar si la resistencia a la ruptura (libras/ pulg2) difiere según el tipo de estructura, se
tomó al azar una muestra de zonas con estructura tipo cimientos, zonas con estructura tipo
terraplenes y zonas con estructura tipo excavación. Asuma que se cumplen los supuestos de
normalidad y de homogeneidad. Los resultados de la resistencia a la ruptura (libras/ pulg2) se
presenta en el siguiente cuadro:

Cimiento Terraplenes Excavación


2050 2200 2300
2100 2230 2180
2100 2150 2200
2100 2150 2200
2150 2200

Tipo_estructura N Media Agrupación


Excavación 5 2216.0 A
Terraplenes 5 2176.0 A
Cimiento 4 2087.5 B

a. Complete la siguiente información:

Variable respuesta
Factor
Tratamientos
Unidad experimental

b. Explique y fundamente, con un nivel de significación del 5%, ¿con qué tipo de estructura se
debería construir la represa?
UPC MA444 Estadística 223
Caso: Compañía Clean

La compañía Clean S.A ha diseñado cuatro sistemas diferentes (A, B, C y


D) para limpiar manchas de grasa en departamentos. Los especialistas
desean determinar cuál de estos sistemas es más efectivo. Para ello,
diseñan un experimento de la siguiente manera: de una muestra de 19
trabajadores de la empresa (todos con la misma destreza en el trabajo) se
seleccionaron aleatoriamente cinco trabajadores para el sistema A, cinco
para el sistema B, cuatro para el sistema C y cinco para el sistema D, de tal
manera que cada grupo de trabajadores limpia las manchas de grasa con un determinado sistema.

La siguiente tabla contiene los resultados, medidos por área, en m2, que se limpian en una hora:

Sistema A Sistema B Sistema C Sistema D


15 22 16 13
14 20 18 15
20 26 18 12
17 23 20 10
22 23 12

Factor N Mean Grouping


Sistema 2 5 22.800 A
Sistema 3 4 18.000 B
Sistema 1 5 17.600 B
Sistema 4 5 12.400 C

¿Qué sistema o sistemas para limpiar manchas de grasa en departamentos es más efectiva de tal
manera que se pueda trabajar exclusivamente con dicho sistema? Asuma que se cumplen los
supuestos de normalidad y homogeneidad. Utilice un nivel de significación del 5%.

Interpretación Representación Cálculo Análisis Argumentación


Identifica la Identifica el factor, Realiza las pruebas Presenta el valor de la Sustenta los
problemática, niveles, necesarias de la tabla. resultados
señalando tratamientos, técnica estadística Realiza la decisión y encontrados en la
claramente el variable de aplicada e conclusión estadística. muestra y brinda
objetivo del respuesta, unidad interpreta. Realiza y analiza las una
caso. experimental comparaciones recomendación al
Identifica la técnica múltiples problema.
estadística a usar.
Plantea la hipótesis.
UPC MA444 Estadística 224
Regresión lineal simple
Podemos hacernos muchas preguntas sobre la relación entre dos variables:

• ¿La velocidad de transferencia de datos de un disco duro depende de la velocidad en que giran los
discos del plato del disco duro o de su capacidad de almacenamiento?
• ¿El tiempo de ejecución de una obra civil depende del número de trabajadores o del índice de
automatización?
• ¿El tiempo de falla de los equipos electrónicos dependerá de la resistencia de los resistores?
• ¿El sueldo dependerá del grado de instrucción?
• ¿El tiempo de procesamiento de trabajos estará relacionado con el número de trabajos por día?
• ¿La temperatura está relacionada con la presión sobre el rendimiento de un producto químico?

Estas preguntas surgen cuando queremos estudiar dos variables de una población con el fin de
examinar la relación existente entre ellas. Las dos variables en estudio son variables cuantitativas que
nos permitirá construir una ecuación lineal que modela la relación existente entre estas dos variables.

En el análisis de regresión la ecuación lineal puede usarse para estimar o predecir los valores de una
variable dependiente, llamada Y, cuando se conocen o se suponen conocidos los valores de otra
variable, variable independiente, llamada X.

El análisis de correlación permite determinar el grado de relación lineal existente entre dos variables.
Es útil en un trabajo exploratorio cuando el investigador desea encontrar el grado o la fuerza de esa
relación.

La regresión lineal simple es modelar la dependencia de la variable Y en función de la variable X a través


de la ecuación de una recta

𝑌𝑖 = 𝛽0 ± 𝛽1 𝑋𝑖 + 𝑒𝑖 𝑖 = 1, 2, 3, … , 𝑛
Donde:
𝑋: = variable independiente
𝑌: = variable dependiente

Se trabaja con variables de tipo cuantitativas, entre las cuales se puede establecer una relación
funcional.

𝑌 = 𝑓(𝑋)

Entonces diremos que la variable Y depende de la variable X.


UPC MA444 Estadística 225
Ejemplo 1

Para cada par de variables, identifique la variable dependiente (𝑌) e independiente (𝑋), la pendiente
(positiva o negativa) y el tipo de relación (inversa o directa) y qué significa el tipo de relación:

Ingreso mensual (soles)


Variables
Consumo mensual (soles)

Variable dependiente

Variable independiente

Pendiente

Tipo de relación

Significado de la relación

Precio de venta del auto (dólares)


Variables
Antigüedad (años)

Variable dependiente

Variable independiente

Pendiente

Tipo de relación

Significado de la relación
UPC MA444 Estadística 226
Diagrama de dispersión o gráfico del plot

El primer paso en el análisis de regresión es registrar simultáneamente los valores de las dos variables
asociadas (𝑋, 𝑌) en una gráfica bidimensional para ver si existe una tendencia lineal que podría explicar
la relación entre estas dos variables

10
8
9
7
8

7 6 Cuando X crece, Y decrece


6 5

5 4

4 3

3 2 Modelo lineal
2 Buen ajuste
1
1
0
0 0 2 4 6 8 10
0 2 4 6 8 10

8 10

9
7 Modelo lineal
8
6
Buen ajuste
7
5 6

4 5

4
3
3
2
Cuando X crece, Y crece 2
1
1

0 0
0 2 4 6 8 10 0 2 4 6 8 10

Método de los mínimos cuadrados

Mediante este método es posible seleccionar la recta que se ajuste mejor a los datos. La recta
resultante tiene dos características importantes:

• La suma de las desviaciones verticales de los puntos con relación a la recta es cero.
• La suma de los cuadrados de las desviaciones es mínima (es decir, ninguna otra recta daría una
menor suma de cuadrados de tales desviaciones). Es decir, ∑𝑛𝑖=1(𝑦𝑖 − 𝑦̂𝑖 )2 es mínima.

Los valores de 𝑏0 y b1 que minimizan la suma de los cuadrados de las desviaciones, son las soluciones
de las llamadas ecuaciones normales de la recta de regresión:
𝑛 𝑛

∑ 𝑦𝑖 = 𝑛𝑏0 + 𝑏1 (∑ 𝑥𝑖 )
𝑖=1 𝑖=1

𝑛 𝑛 𝑛

∑ 𝑥𝑖 𝑦𝑖 = 𝑏0 (∑ 𝑥𝑖 ) + 𝑏1 (∑ 𝑥𝑖2 )
𝑖=1 𝑖=1 𝑖=1
UPC MA444 Estadística 227
Este método nos permite estimar los parámetros del modelo de regresión. Resolviendo las ecuaciones
simultáneas para 𝑏𝑜 y 𝑏1 tenemos:

𝑛(∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 ) − (∑𝑛𝑖=1 𝑥𝑖 )(∑𝑛𝑖=1 𝑦𝑖 )


𝑏1 = 2
𝑛(∑𝑛𝑖=1 𝑥𝑖2 ) − (∑𝑛𝑖=1 𝑥𝑖 )

𝑏𝑜 = 𝑦̅ − 𝑏1 𝑥̅

Recta o ecuación de regresión

El modelo poblacional es:

𝑌 = 𝛽0 + 𝛽1 𝑋 + 𝑒

El modelo muestral es:

𝑦̂ = 𝑏0 + 𝑏1 𝑥

donde:
𝑏1 es la pendiente de la recta o coeficiente de regresión.
𝑏0 es la ordenada en el origen o intercepto de la recta con eje Y.

Ejemplo 1
Para las siguientes variables:
𝑌: = ingreso mensual (soles)
𝑋: = experiencia profesional (años)

a. Indique la relación entre las variables.


UPC MA444 Estadística 228
b. Interprete el valor de los coeficientes de regresión.

𝑏0 = …

𝑏1 = …

Ejemplo 2
Se desea modelar la vida útil (en años) de un satélite en función de la cantidad de combustible (en kg)
requerido para moverlo de su posición orbital, usando un modelo lineal. Los datos se muestran a
continuación:

Vida útil 10,8 11,5 12 12,4 13,2 13,7 13,9 14,1 14,8 15
Cantidad de combustible 150,4 156,3 162,5 165,8 172,5 168,9 184,5 185,9 187,2 199,4

Dispersión de la vida útil vs la cantidad de combustible

15

14
Vida útil

13

12

11
150 160 170 180 190 200
Cantidad de combustible
Fuente: Empresa A

a. Comente el diagrama de dispersión de estas variables.


UPC MA444 Estadística 229
b. Calcule e interprete los coeficientes de regresión estimados del ejemplo anterior, considerando la
siguiente información:

X:= cantidad de
N° Y:= vida útil xy x2 y2
combustible
1 150,4 10,8 1624,32 22620,16 116,64
2 156,3 11,5 1797,45 24429,69 132,25
3 162,5 12,0 1950,00 26406,25 144,00
4 165,8 12,4 2055,92 27489,64 153,76
5 172,5 13,2 2277,00 29756,25 174,24
6 168,9 13,7 2313,93 28527,21 187,69
7 184,5 13,9 2564,55 34040,25 193,21
8 185,9 14,1 2621,19 34558,81 198,81
9 187,2 14,8 2770,56 35043,84 219,04
10 199,4 15,0 2991,00 39760,36 225,00
Total 1733,4 131,4 22965,92 302632,46 1744,64

c. Interprete los valores de los coeficientes de regresión.

𝑏0

𝑏1
UPC MA444 Estadística 230
Validación del modelo de regresión lineal

No siempre la ecuación estimada es válida. Puede ocurrir que no exista pendiente, es decir que la
pendiente poblacional sea igual a 0. Esto significaría que no existe relación lineal entre las variables X
e Y. Es necesario entonces verificar si el modelo es válido.

El objetivo de esta prueba es probar que la pendiente poblacional 𝛽1 es diferente a cero.

1. Establecer las hipótesis:

𝐻0 : 𝛽1 = 0
𝐻1 : 𝛽1 ≠ 0

2. Fijar el nivel de significancia: 𝛼

3. Calcular el valor del estadístico de prueba.

𝐶𝑀𝑅𝑒𝑔
𝐹𝑐𝑎𝑙 =
𝐶𝑀𝐸𝑟𝑟𝑜𝑟

El valor 𝐹𝑐𝑎𝑙 se obtiene de la tabla del análisis de varianza. El análisis de la varianza es la descomposición
de la variación total en sus fuentes de variación: regresión y error (residual).

Fuente de Grados de Suma de Cuadrado medio Estadístico de


variación libertad cuadrados prueba
𝑆𝐶𝑅𝑒𝑔 𝐶𝑀𝑅𝑒𝑔
Regresión 1 𝑆𝐶𝑅𝑒𝑔 𝐶𝑀𝑅𝑒𝑔 = 𝐹𝑐 =
1 𝐶𝑀𝐸
𝑆𝐶𝐸
Error (residual) 𝑛– 2 𝑆𝐶𝐸 𝐶𝑀𝐸 =
𝑛−2
Total 𝑛– 1 𝑆𝐶𝑇

Donde:

La suma de cuadrados de la regresión se calcula con:


𝑛
(∑𝑛𝑖=1 𝑥𝑖 )2
𝑆𝐶𝑅𝑒𝑔 = 𝛽̂12 (∑ 𝑥𝑖2 − )
𝑛
𝑖=1

La suma de cuadrados de los errores se calcula con:

𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝑅𝑒𝑔

La suma de cuadrados total se calcula con:


UPC MA444 Estadística 231
𝑛
(∑𝑛𝑖=1 𝑦𝑖 )2
𝑆𝐶𝑇 = ∑ 𝑦𝑖2 −
𝑛
𝑖=1

4. Establecer la región crítica.

El valor crítico es 𝐹𝑐𝑟𝑖𝑡 (𝛼, 1, 𝑛 − 2)

5. Aplicar los criterios de decisión.

Si 𝐹𝑐𝑎𝑙 > 𝐹𝑐𝑟𝑖𝑡 (𝛼, 1, 𝑛 − 2), entonces se rechaza Ho


Si 𝐹𝑐𝑎𝑙 ≤ 𝐹𝑐𝑟𝑖𝑡 (𝛼, 1, 𝑛 − 2),entonces no se rechaza Ho

6. Realizar la conclusión

Si se rechaza Ho; con un nivel de significancia , el modelo de regresión es válido.


Si no se rechaza Ho; con un nivel de significancia , el modelo de regresión no es válido.

Ejemplo 1

A un nivel de significación del 5%, valide el modelo de regresión lineal del ejercicio anterior. Obtenga
el ANOVA del Excel.

1. Establecer las hipótesis:

𝐻0 :
𝐻1 :

2. Fijar el nivel de significancia: α

3. Calcular el valor del estadístico de prueba.

𝐶𝑀𝑅𝑒𝑔
𝐹𝑐𝑎𝑙 =
𝐶𝑀𝐸𝑟𝑟𝑜𝑟

4. Establecer la región crítica.

5. Aplicar los criterios de decisión.

6. Realizar la conclusión.
UPC MA444 Estadística 232
Coeficiente de determinación

Es una medida de bondad de ajuste del modelo. Nos indica que tan bueno es el modelo para explicar
el porcentaje de variabilidad de la variable dependiente Y. Por lo tanto, el coeficiente de determinación
R2 indica el porcentaje de la variabilidad de la variable Y que es explicada por X en el modelo de
regresión lineal estimado.

También nos ayuda a saber la precisión con la que se puede predecir o pronosticar el valor de la
variable dependiente, si se conocen los valores de la variable dependiente.

El coeficiente de determinación 𝑅 2 se calcula de la siguiente manera:

𝑆𝐶𝑅𝑒𝑔
𝑅2 = × 100%
𝑆𝐶𝑇𝑜𝑡

Coeficiente de correlación

El coeficiente de correlación expresa el grado de asociación lineal que existe entre dos variables X e Y.
El coeficiente de correlación muestral se denota por r y varía dentro del intervalo de -1 a 1. El
coeficiente de correlación r siempre tiene el signo de la pendiente b1

√𝑅 2 𝑠𝑖 𝑏1 > 0
𝑟={
−√𝑅 2 𝑠𝑖 𝑏1 < 0

• Si b1 y r son positivos, entonces la relación entre las variables es directa.


• Si b1 y r son negativos, entonces la relación entre las variables es inversa.

Además,

• Cuando r = 0, indica que no existe correlación o asociación entre las variables.


• Cuando r se acerca -1 o a +1 indica que existe una asociación fuerte.
• Cuando r = -1 o r = +1, la correlación o asociación entre estas variables es perfecta.

En los resultados del Excel, el valor de r siempre se muestra en positivo. En el caso de que la pendiente
b1 sea negativa, deberá colocar al coeficiente de correlación r el signo negativo.

Los valores que se pueden tomar como referencia para determinar si existe o no una relación lineal
directa o inversa se muestra a continuación y pueden variar de acuerdo con el campo de estudio:

-1,0 -0,65 -0,2 0,2 0,65 1,0


Relación lineal fuerte e inversa No existe relación lineal Relación lineal fuerte y directa
UPC MA444 Estadística 233
Ejemplo 1

Indique qué valor de r2 y r que le corresponde a cada gráfico. Considere los siguientes valores: r = 0,95;
r = -0,78 y r = 0,52. Además, indique el tipo de relación entre las variables.

Rellene los espacios en blanco.

Situación 1

E f ……………..…………., , v
…………………….. y …………………………

E f ……………………….

Situación 2

E f …………………….……., , relación entre las variables es


……………………….. y …………………………

E f …………………….

Situación 3

E f …………………………., , v es
……………………….. y …………………………

El f …………………….
UPC MA444 Estadística 234
Regresión usando una calculadora Casio

Coeficientes de regresión usando calculadora

Los pasos para obtener los valores de los coeficientes de regresión 𝑏0 y 𝑏1 , el coeficiente de regresión
𝑟 usando una calculadora Casio son los siguientes:

1. Desactive la opción de frecuencias.


2. Ingrese al MODE 3: STAT.

3. Elija la opción 2: A+BX.

4. Ingrese los datos en ambas columnas, X e Y.

5. Presione Shift + 1. A continuación, presione 5: Reg.


UPC MA444 Estadística 235

Las opciones que se muestran son las siguientes:

1: A es el valor del intercepto 𝑏0


2: B es el valor de la pendiente 𝑏1
3: r es el valor del coeficiente de correlación
4: 𝑥̂ es el valor estimado de la variable X para un valor dado de la variable Y
5: 𝑦̂ es el valor estimado de la variable Y para un valor dado de la variable X

En la calculadora, 𝑏0 = A y 𝑏1 = B. Luego, el modelo de regresión es:

Y = A + B X = 𝑏0 + 𝑏1 𝑥

En la calculadora, el coeficiente de correlación 𝑟 = r.

Análisis de varianza usando calculadora

La tabla de análisis de varianza ANVA es la siguiente:

Fuente de Grados de Suma de Cuadrados Estadístico de


variación libertad cuadrados medio prueba
𝐶𝑀𝑅𝑒𝑔
Regresión 1 𝑆𝐶𝑅𝑒𝑔 𝐶𝑀𝑅𝑒𝑔 𝐹𝑐 =
𝐶𝑀𝐸
Error (residual) 𝑛−2 𝑆𝐶𝐸 𝐶𝑀𝐸

Total 𝑛−1 𝑆𝐶𝑇

Para realizar la tabla de análisis de varianza se necesita calcular la suma de cuadrados total 𝑆𝐶𝑇, la
suma de cuadrados de la regresión 𝑆𝐶𝑅𝑒𝑔 y la suma de cuadrados de errores 𝑆𝐶𝐸.
UPC MA444 Estadística 236
Para calcular la suma de cuadrados total 𝑆𝐶𝑇 usaremos la siguiente fórmula:

𝑆𝐶𝑇 = (𝑛 − 1)𝑆𝑌2

Para calcular la suma de cuadrados de la regresión 𝑆𝐶𝑅𝑒𝑔 usaremos la siguiente fórmula:

𝑆𝐶𝑅𝑒𝑔 = 𝑅 2 × 𝑆𝐶𝑇

Para calcular la suma de cuadrados de errores 𝑆𝐶𝐸 usaremos la siguiente fórmula:

𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝑅𝑒𝑔

Los pasos en la calculadora son los siguientes:

1. Para calcular el valor del coeficiente de correlación r presione Shift + 1 y seleccione Reg, opción 3.
2. Para calcular el valor del coeficiente de determinación R2 eleve al cuadrado el valor de r.
3. Para calcular el valor 𝑆𝑌 ; seleccione Shift + 1, luego la opción 4 y luego elija 7: sy.

Ejemplo 1
Usando una calculadora Casio
Una empresa dedicada a la fabricación de equipos de telecomunicación considera que la vida útil de
los equipos puede estar explicada por la temperatura del ambiente en el que trabaja mediante una
relación lineal. Para encontrar la ecuación de regresión lineal de la vida útil de los quipos en función
de la temperatura del ambiente se tomó una muestra de 11 datos, los cuales se muestran en la tabla
siguiente:

Temperatura (ºC) 24 20 18 16 10 12 13 28 16 15 23
Vida útil (en años) 8,0 6,4 5,5 4,6 3,8 3,9 5,6 8,5 6,6 4,5 8,8

a. Indique la variable dependiente y la independiente.


b. Estime el modelo de regresión e interprete el coeficiente de regresión 𝑏1 .
c. Calcule e interprete el coeficiente de correlación.
d. Calcule e interprete el coeficiente de determinación.
a. Estime la vida útil de un equipo, en años, si la temperatura del medio ambiente donde trabaja es
de 10,5 °C.
e. Presente el cuadro de análisis de varianza.
f. Valide el modelo de regresión. Use un nivel de significancia del 5%.
UPC MA444 Estadística 237
Solución
a. Indique la variable dependiente y la independiente.

Solución

Variable dependiente: vida útil de los equipos (en años)


Variable independiente: temperatura del medio ambiente (en °C)

b. Estime el modelo de regresión e interprete el coeficiente de regresión 𝑏1 .

Solución

Siguiendo los pasos descritos en una calculadora Casio obtendrá las siguientes pantallas.

La ecuación del modelo de regresión es:

𝑦̂ = 𝑏0 + 𝑏1 𝑥 = 𝐴 + 𝐵𝑥

Usando los valores de la calculadora:

𝑦̂ = 0,7984 + 0,2944𝑥

𝑏1 = 0,2944. Ante el incremento de 1°C en la temperatura del ambiente, la vida útil del equipo se
incrementa, en promedio, 0,2944 años.

c. Interprete el coeficiente de correlación.

Solución

El valor del coeficiente de correlación r = 0,9041


UPC MA444 Estadística 238
Entre las variables vida útil del equipo y la temperatura del medio ambiente en el que trabaja existe
una fuerte relación y es directa por ser el valor del coeficiente cercano a 1.

d. Interprete el coeficiente de determinación.

Solución

El valor del coeficiente de determinación R2 se obtiene elevando al cuadrado el valor del


coeficiente de correlación r. Luego, R2 = r2 = 0,90412 = 0,8174.

El 81,74% de la variabilidad total de la vida útil de un equipo está siendo explicada por la
temperatura del ambiente en el que trabaja en el modelo de regresión estimado.

e. Estime la vida útil de un equipo, en años, si la temperatura del medio ambiente donde trabaja es
de 10,5 °C.

Solución

Para estimar la vida útil, reemplazamos 𝑋 = 10,5 en la ecuación de regresión:

𝑦̂ = 0,7984 + 0,2944 𝑥

𝑦̂ = 0,7984 + 0,2944 × 10,5 = 3,89

La vida útil de un equipo, en años, estimada es 3,89 años; si la temperatura del medio ambiente
donde trabaja es de 10,5 °C.

f. Presente el cuadro de análisis de varianza.

Solución

La tabla de análisis de varianza ANVA es la siguiente:

Fuente de Grados de Suma de Cuadrados Estadístico de


variación libertad cuadrados medio prueba
𝐶𝑀𝑅𝑒𝑔
Regresión 1 𝑆𝐶𝑅𝑒𝑔 𝐶𝑀𝑅𝑒𝑔 𝐹𝑐 =
𝐶𝑀𝐸
Error (residual) 𝑛−2 𝑆𝐶𝐸 𝐶𝑀𝐸

Total 𝑛−1 𝑆𝐶𝑇

Para realizar la tabla de análisis de varianza se necesitan calcular la suma de cuadrados de la


regresión 𝑆𝐶𝑅𝑒𝑔, la suma de cuadrados de errores 𝑆𝐶𝐸 y la suma de cuadrados total 𝑆𝐶𝑇.

Para calcular la suma de cuadrados total 𝑆𝐶𝑇 usaremos la siguiente fórmula:

𝑆𝐶𝑇 = (𝑛 − 1)𝑆𝑌2
UPC MA444 Estadística 239

Para calcular la suma de cuadrados de la regresión 𝑆𝐶𝑅𝑒𝑔 usaremos la siguiente fórmula:

𝑆𝐶𝑅𝑒𝑔 = 𝑅 2 × 𝑆𝐶𝑇

Para calcular la suma de cuadrados de errores 𝑆𝐶𝐸 usaremos la siguiente fórmula:

𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝑅𝑒𝑔

Usando los valores de la calculadora:

El valor del coeficiente de correlación 𝑟 es r = 0,9040953415.

El valor del coeficiente de determinación 𝑅 2 es r2 = 0,90409534152 = 0,8174.

Reemplazando:
𝑆𝐶𝑇 = (𝑛 − 1)𝑆𝑦2 = 10 × 1,80212 = 32,4756

𝑆𝐶𝑅𝑒𝑔 = 𝑅 2 × 𝑆𝐶𝑇 = 0,90412 × 32,4756 = 26,5456

𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝑅𝑒𝑔 = 32,4756– 26,545 = 5,9300

La tabla de análisis de varianza ANVA se calcula de la siguiente manera:

Fuente de Grados de libertad Suma de Cuadrados medio Estadístico de


variación cuadrados prueba
26,5456 26,5456
Regresión 1 𝑆𝐶𝑅𝑒𝑔 = 26,5456 𝐶𝑀𝑅𝑒𝑔 = 𝐹𝑐 =
1 0,6589
Error 5,9300
𝑛 − 2 = 11 − 2 = 9 𝑆𝐶𝐸 = 5,9300 𝐶𝑀𝐸 =
(residual) 9

Total 𝑛 − 1 = 11 − 1 = 10 𝑆𝐶𝑇 = 32,4756

La tabla de análisis de varianza ANVA quedaría de la siguiente manera:


Fuente de Grados de libertad Suma de Cuadrado medio Estadístico de
variación cuadrados prueba
Regresión 1 26,5456 26,5456 40,2878
Error
9 5,9300 0,6589
(residual)
Total 10 32,4756
UPC MA444 Estadística 240

g. Valide el modelo de regresión. Considere un nivel de significancia del 5%.

Solución

Validar el modelo de regresión implica probar que la pendiente poblacional es diferente de cero,
por tanto, las hipótesis son:

𝐻0 𝛽1 = 0
𝐻1 𝛽1 ≠ 0

El nivel de significancia del 5%; luego,  = 0,05.

El valor del estadístico de la prueba es:

𝐶𝑀𝑅𝑒𝑔 26,5458
𝐹𝑐 = = = 40,2878
𝐶𝑀𝐸 0,6590

Establecer la región crítica

𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑜 (0,05; 1; 11 − 2) = 𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑜 (0.05; 1; 9) = 5,12

v1
𝛼
v2 1 2 3 4 5 6 7 8 9 10

0.050 9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14
0.025 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96
0.010 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26
0.005 13.61 10.11 8.72 7.96 7.47 7.13 6.88 6.69 6.54 6.42

Decisión

𝐹𝑐 = 40,2878 > 𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑜 (0.05; 1; 9) = 5,12, entonces, se rechaza H0.

Conclusión
Con un nivel de significación del 5%, el modelo es válido. Por lo tanto, existe una relación lineal
entre la vida útil del equipo y la temperatura del ambiente.
UPC MA444 Estadística 241
Caso: SYMA

Syma es una de las marcas más populares de drones sobre todo


porque lleva muchos años innovando y lanzando infinidad de
cuadricópteros que conquistan el mercado una y otra vez. Estos
drones destacan sobre todo por su bajo precio, su facilidad de
manejo y su robustez. Debido a las últimas investigaciones se sabe
que el tiempo de vuelo de los drones está en función de la
temperatura del medio ambiente.

La empresa desea incursionar en América Latina, donde las temperaturas son más cálidas, para lo cual
debe cumplir con un tiempo mínimo de vuelo de seis minutos a una temperatura ambiente de 30°C.
De cumplir con la exigencia, ingresará al mercado latino, de lo contrario deberá realizar reajustes a su
dron.

Se ha encargado al área de producción realizar la estimación solicitada, para ello se seleccionó una
muestra de 10 drones. Los resultados se presentan a continuación:

Temperatura (°C) 25 26 20 25 23 18 18 20 21 22
Duración (minutos) 8,0 9,0 10,3 8,4 8,6 12,5 14,0 11,5 8,9 10,0

Interpretación Representación Cálculo Análisis Argumentación


Identifica la Identifica las Realiza las pruebas En base a los Brinda una
problemática, variables, comenta necesarias de la resultados de la recomendación al
señalando el diagrama de técnica estadística evidencia muestral problema, sustentada
claramente el dispersión. aplicada e interpreta. interpreta los en los resultados
objetivo del Presenta el modelo Presenta el modelo valores de los encontrados en la
caso. a estimar e indica estimado y realiza la coeficientes de muestra de acuerdo
la herramienta a estimación puntual. correlación y con el contexto
usar. determinación. presentado.

Solución

Interpretación

Determinar si Syma ingresará al mercado latino donde las temperaturas son más cálidas.

Representación

Variable dependiente: Tiempo de vuelo (minutos)


Variable independiente: Temperatura del medio ambiente (°C)
UPC MA444 Estadística 242

Dispersión de del tiempo de vuelo vs la temperatura del medio ambiente

15
14
13
Duración (min)

12
11
10
9
8
7
6
17 18 19 20 21 22 23 24 25 26 27
Temperatura (°C)
Fuente Syma S.A.

Se observa una relación inversa, es decir a mayor valor de la temperatura en el ambiente menor será
el tiempo de vuelo (minutos).

El modelo por estimar es:


𝑌̂ = 𝑏0 ± 𝑏1 𝑋

La herramienta que usaremos será la regresión lineal simple.

Cálculo

Fuente de variación Grados de libertad Suma de cuadrados Promedio de los cuadrados F


Regresión 1 26.147 26.1467 23.17
Residuos 8 9.029 1.1287
Total 9 35.176

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.86215497
Coeficiente de determinación R^2 0.74331119

El modelo de regresión estimado es:

𝑌̂ = 𝑏0 − 𝑏1 𝑋

𝑌̂ = 22,94 − 0,588 𝑋

La interpretación de la pendiente es 𝑏1 = −0,588.

Si la temperatura del medio ambiente se incrementa en 1°C el tiempo de vuelo de los drones disminuye
en 0,588 minutos.
UPC MA444 Estadística 243
Validación del modelo

Validar el modelo de regresión implica probar que la pendiente poblacional es diferente de cero, por
tanto, las hipótesis son:

𝐻0 𝛽1 = 0
𝐻1 𝛽1 ≠ 0

El nivel de significancia del 5%; luego,  = 0,05.

El valor del estadístico de la prueba es:

𝐶𝑀𝑅𝑒𝑔 26,1467
𝐹𝑐𝑎𝑙 = = = 23,17
𝐶𝑀𝐸𝑟𝑟𝑜𝑟 1,1287

Establezcamos la región crítica:

El valor crítico es:

𝐹𝑐𝑟í𝑡𝑖𝑐𝑜 (0,05, 1, 9) = 5,12

v1
𝛼
v2 1 2 3 4 5 6 7 8 9 10

0.050 9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14
0.025 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96
0.010 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26
0.005 13.61 10.11 8.72 7.96 7.47 7.13 6.88 6.69 6.54 6.42

Como 𝐹𝑐𝑎𝑙 = 23,17 > 𝐹𝑐𝑟í𝑡𝑖𝑐𝑜 = 5,12, entonces se rechaza H0.

Conclusión
Con un nivel de significación del 5 %, el modelo es válido. Por lo tanto, existe una relación lineal entre
la vida útil del equipo y la temperatura del ambiente.

𝑌̂ = 22,94 − 0,588 × 30 = 5,3

Para una temperatura de 30°C, el tiempo de vuelo estimado es de 5,3 minutos.


UPC MA444 Estadística 244

Análisis
R2 = (26,147/35,176) x100% = 74,33% o directamente de la tabla 0,7433x100% = 74,33%

Interpretación
El 74,33% de la variabilidad total de la duración del tiempo de vuelo de los drones es explicada por la
temperatura en el modelo de regresión estimado.

r = 0,8622
Entre las variables tiempo de vuelo y la temperatura del medio ambiente existe una relación fuerte y
es directa por ser el valor del coeficiente de correlación cercano a 1.

Argumentación
No se cumple con la exigencia de un tiempo mínimo de vuelo de 6 minutos a una temperatura de 30°C.
Por lo tanto, la empresa deberá realizar ajustes a su dron.
UPC MA444 Estadística 245
Ejercicios propuestos

67. Para la construcción de carreteras que experimentan heladas intensas, es importante que la
densidad del concreto (kg/m2) seleccionado tenga un valor bajo de conductividad térmica
(watts/metros.Kelvin) para reducir al mínimo los daños provocados por cambios de temperatura.
Por lo tanto, se desea estimar la conductividad térmica en función de la densidad que posee el
concreto. Por lo tanto, se toman 12 trozos al azar de diferentes densidades de concreto y se
registra la conductividad. Los datos se muestran en la siguiente tabla:

Densidad del concreto 300 400 500 600 700 800 900 1000 1100 1200 1400 1600
Conductividad térmica 0,065 0,08 0,095 0,115 0,13 0,15 0,175 0,205 0,23 0,27 0,346 0,436

a. Indique la variable dependiente y la independiente.


b. Comente el diagrama de dispersión o plot.
c. Presente la ecuación de la recta o modelo de regresión estimado.
d. Interprete el valor de la pendiente de la recta.
e. Valide el modelo Use 1% de significancia.
f. Interprete el coeficiente de determinación y correlación.
g. Estime la conductividad térmica cuando la densidad del concreto es 850 kg/m2.

68. Export es una empresa proveedora de GPS para automóviles de diferentes modelos. El jefe del
departamento de ventas ha implementado charlas motivadoras para sus agentes vendedores y
desea modelar mediante una relación lineal la eficiencia en ventas (%) en función al tiempo
acumulado de horas en las que estuvo presente el agente vendedor en las charlas de capacitación
durante el último trimestre.

Los siguientes datos corresponden a una muestra aleatoria de 10 agentes vendedores. Se registró
el tiempo acumulado de horas en las que estuvo presente el agente vendedor en las charlas de
capacitación durante el último trimestre y la eficiencia de sus ventas.

Eficiencia en las ventas (%) 47 84 80 46 62 72 52 87 37 68


Tiempo acumulado, en horas 27 45 41 19 35 39 19 49 15 31

a. Indique la variable dependiente y la independiente.


b. Presente el gráfico del plot y comente.
c. Presente la ecuación de la recta.
d. Interprete los coeficientes del modelo de regresión estimado.
e. Realice el proceso de validación del modelo, con un nivel de significación de 5%.
f. Interprete el coeficiente de determinación y el de correlación.
g. Estime la eficiencia de la venta cuando el agente vendedor ha acumulado 20 horas de
capacitación.

69. El área de producción del fabricante NanoTec registró el tiempo de vuelo de los drones del modelo
CX-STAR en función de la temperatura del medio ambiente. Para una muestra de 10 drones se
tienen los siguientes resultados:

Temperatura (°C) 25 26 20 25 23 18 18 20 21 22
Tiempo de vuelo (min.) 8 9 10,3 8,4 8,6 12,5 14 11,5 8,9 10
UPC MA444 Estadística 246
a. Presente el gráfico del plot y comente.
b. Obtenga el modelo estimado de regresión lineal simple.
c. Interprete el coeficiente de regresión.
d. Valide el modelo estimado. Use  = 0,05.
e. Determine e interprete el coeficiente de determinación.
f. Estime el tiempo de vuelo cuando la temperatura del medio ambiente es 24°C.
UPC MA444 Estadística 247
Tablas estadísticas
Tabla de la distribución normal estándar

Área bajo la curva normal 𝑃(𝑍 ≤ 𝑧) = 𝛼

Z -0.09 -0.08 -0.07 -0.06 -0.05 -0.04 -0.03 -0.02 -0.01 -0.00
-3.9 0.000033 0.000034 0.000036 0.000037 0.000039 0.000041 0.000042 0.000044 0.000046 0.000048
-3.8 0.000050 0.000052 0.000054 0.000057 0.000059 0.000062 0.000064 0.000067 0.000069 0.000072
-3.7 0.000075 0.000078 0.000082 0.000085 0.000088 0.000092 0.000096 0.000100 0.000104 0.000108
-3.6 0.000112 0.000117 0.000121 0.000126 0.000131 0.000136 0.000142 0.000147 0.000153 0.000159
-3.5 0.000165 0.000172 0.000178 0.000185 0.000193 0.000200 0.000208 0.000216 0.000224 0.000233
-3.4 0.000242 0.000251 0.000260 0.000270 0.000280 0.000291 0.000302 0.000313 0.000325 0.000337
-3.3 0.000349 0.000362 0.000376 0.000390 0.000404 0.000419 0.000434 0.000450 0.000466 0.000483
-3.2 0.000501 0.000519 0.000538 0.000557 0.000577 0.000598 0.000619 0.000641 0.000664 0.000687
-3.1 0.000711 0.000736 0.000762 0.000789 0.000816 0.000845 0.000874 0.000904 0.000935 0.000968
-3.0 0.001001 0.001035 0.001070 0.001107 0.001144 0.001183 0.001223 0.001264 0.001306 0.001350

-2.9 0.00139 0.00144 0.00149 0.00154 0.00159 0.00164 0.00169 0.00175 0.00181 0.00187
-2.8 0.00193 0.00199 0.00205 0.00212 0.00219 0.00226 0.00233 0.00240 0.00248 0.00256
-2.7 0.00264 0.00272 0.00280 0.00289 0.00298 0.00307 0.00317 0.00326 0.00336 0.00347
-2.6 0.00357 0.00368 0.00379 0.00391 0.00402 0.00415 0.00427 0.00440 0.00453 0.00466
-2.5 0.00480 0.00494 0.00508 0.00523 0.00539 0.00554 0.00570 0.00587 0.00604 0.00621
-2.4 0.00639 0.00657 0.00676 0.00695 0.00714 0.00734 0.00755 0.00776 0.00798 0.00820
-2.3 0.00842 0.00866 0.00889 0.00914 0.00939 0.00964 0.00990 0.01017 0.01044 0.01072
-2.2 0.01101 0.01130 0.01160 0.01191 0.01222 0.01255 0.01287 0.01321 0.01355 0.01390
-2.1 0.01426 0.01463 0.01500 0.01539 0.01578 0.01618 0.01659 0.01700 0.01743 0.01786
-2.0 0.01831 0.01876 0.01923 0.01970 0.02018 0.02068 0.02118 0.02169 0.02222 0.02275

-1.9 0.02330 0.02385 0.02442 0.02500 0.02559 0.02619 0.02680 0.02743 0.02807 0.02872
-1.8 0.02938 0.03005 0.03074 0.03144 0.03216 0.03288 0.03362 0.03438 0.03515 0.03593
-1.7 0.03673 0.03754 0.03836 0.03920 0.04006 0.04093 0.04182 0.04272 0.04363 0.04457
-1.6 0.04551 0.04648 0.04746 0.04846 0.04947 0.05050 0.05155 0.05262 0.05370 0.05480
-1.5 0.05592 0.05705 0.05821 0.05938 0.06057 0.06178 0.06301 0.06426 0.06552 0.06681
-1.4 0.06811 0.06944 0.07078 0.07215 0.07353 0.07493 0.07636 0.07780 0.07927 0.08076
-1.3 0.08226 0.08379 0.08534 0.08691 0.08851 0.09012 0.09176 0.09342 0.09510 0.09680
-1.2 0.09853 0.10027 0.10204 0.10383 0.10565 0.10749 0.10935 0.11123 0.11314 0.11507
-1.1 0.11702 0.11900 0.12100 0.12302 0.12507 0.12714 0.12924 0.13136 0.13350 0.13567
-1.0 0.13786 0.14007 0.14231 0.14457 0.14686 0.14917 0.15151 0.15386 0.15625 0.15866

-0.9 0.16109 0.16354 0.16602 0.16853 0.17106 0.17361 0.17619 0.17879 0.18141 0.18406
-0.8 0.18673 0.18943 0.19215 0.19489 0.19766 0.20045 0.20327 0.20611 0.20897 0.21186
-0.7 0.21476 0.21770 0.22065 0.22363 0.22663 0.22965 0.23270 0.23576 0.23885 0.24196
-0.6 0.24510 0.24825 0.25143 0.25463 0.25785 0.26109 0.26435 0.26763 0.27093 0.27425
-0.5 0.27760 0.28096 0.28434 0.28774 0.29116 0.29460 0.29806 0.30153 0.30503 0.30854
-0.4 0.31207 0.31561 0.31918 0.32276 0.32636 0.32997 0.33360 0.33724 0.34090 0.34458
-0.3 0.34827 0.35197 0.35569 0.35942 0.36317 0.36693 0.37070 0.37448 0.37828 0.38209
-0.2 0.38591 0.38974 0.39358 0.39743 0.40129 0.40517 0.40905 0.41294 0.41683 0.42074
-0.1 0.42465 0.42858 0.43251 0.43644 0.44038 0.44433 0.44828 0.45224 0.45620 0.46017
-0.0 0.46414 0.46812 0.47210 0.47608 0.48006 0.48405 0.48803 0.49202 0.49601 0.50000
UPC MA444 Estadística 248
Tabla de la distribución normal estándar

Área bajo la curva normal 𝑃(𝑍 ≤ 𝑧) = 𝛼

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.50000 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.52790 0.53188 0.53586
0.1 0.53983 0.54380 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57535
0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 0.60257 0.60642 0.61026 0.61409
0.3 0.61791 0.62172 0.62552 0.62930 0.63307 0.63683 0.64058 0.64431 0.64803 0.65173
0.4 0.65542 0.65910 0.66276 0.66640 0.67003 0.67364 0.67724 0.68082 0.68439 0.68793
0.5 0.69146 0.69497 0.69847 0.70194 0.70540 0.70884 0.71226 0.71566 0.71904 0.72240
0.6 0.72575 0.72907 0.73237 0.73565 0.73891 0.74215 0.74537 0.74857 0.75175 0.75490
0.7 0.75804 0.76115 0.76424 0.76730 0.77035 0.77337 0.77637 0.77935 0.78230 0.78524
0.8 0.78814 0.79103 0.79389 0.79673 0.79955 0.80234 0.80511 0.80785 0.81057 0.81327
0.9 0.81594 0.81859 0.82121 0.82381 0.82639 0.82894 0.83147 0.83398 0.83646 0.83891

1.0 0.84134 0.84375 0.84614 0.84849 0.85083 0.85314 0.85543 0.85769 0.85993 0.86214
1.1 0.86433 0.86650 0.86864 0.87076 0.87286 0.87493 0.87698 0.87900 0.88100 0.88298
1.2 0.88493 0.88686 0.88877 0.89065 0.89251 0.89435 0.89617 0.89796 0.89973 0.90147
1.3 0.90320 0.90490 0.90658 0.90824 0.90988 0.91149 0.91309 0.91466 0.91621 0.91774
1.4 0.91924 0.92073 0.92220 0.92364 0.92507 0.92647 0.92785 0.92922 0.93056 0.93189
1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408
1.6 0.94520 0.94630 0.94738 0.94845 0.94950 0.95053 0.95154 0.95254 0.95352 0.95449
1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.96080 0.96164 0.96246 0.96327
1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670

2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169
2.1 0.98214 0.98257 0.98300 0.98341 0.98382 0.98422 0.98461 0.98500 0.98537 0.98574
2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158
2.4 0.99180 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361
2.5 0.99379 0.99396 0.99413 0.99430 0.99446 0.99461 0.99477 0.99492 0.99506 0.99520
2.6 0.99534 0.99547 0.99560 0.99573 0.99585 0.99598 0.99609 0.99621 0.99632 0.99643
2.7 0.99653 0.99664 0.99674 0.99683 0.99693 0.99702 0.99711 0.99720 0.99728 0.99736
2.8 0.99744 0.99752 0.99760 0.99767 0.99774 0.99781 0.99788 0.99795 0.99801 0.99807
2.9 0.99813 0.99819 0.99825 0.99831 0.99836 0.99841 0.99846 0.99851 0.99856 0.99861

3.0 0.998650 0.998694 0.998736 0.998777 0.998817 0.998856 0.998893 0.998930 0.998965 0.998999
3.1 0.999032 0.999065 0.999096 0.999126 0.999155 0.999184 0.999211 0.999238 0.999264 0.999289
3.2 0.999313 0.999336 0.999359 0.999381 0.999402 0.999423 0.999443 0.999462 0.999481 0.999499
3.3 0.999517 0.999534 0.999550 0.999566 0.999581 0.999596 0.999610 0.999624 0.999638 0.999651
3.4 0.999663 0.999675 0.999687 0.999698 0.999709 0.999720 0.999730 0.999740 0.999749 0.999758
3.5 0.999767 0.999776 0.999784 0.999792 0.999800 0.999807 0.999815 0.999822 0.999828 0.999835
3.6 0.999841 0.999847 0.999853 0.999858 0.999864 0.999869 0.999874 0.999879 0.999883 0.999888
3.7 0.999892 0.999896 0.999900 0.999904 0.999908 0.999912 0.999915 0.999918 0.999922 0.999925
3.8 0.999928 0.999931 0.999933 0.999936 0.999938 0.999941 0.999943 0.999946 0.999948 0.999950
3.9 0.999952 0.999954 0.999956 0.999958 0.999959 0.999961 0.999963 0.999964 0.999966 0.999967
UPC MA444 Estadística 249
Tabla de la distribución t - Student

Área bajo la curva 𝑃(𝑇 ≥ 𝑐) = 𝛼

𝛼
𝜐 0.4 0.3 0.2 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015 0.01 0.005
1 0.32492 0.72654 1.37638 1.96261 3.07768 6.31375 7.91582 10.57889 12.7062 15.89454 21.20495 31.82052 63.65674
2 0.28868 0.61721 1.06066 1.38621 1.88562 2.91999 3.31976 3.89643 4.30265 4.84873 5.64278 6.96456 9.92484
3 0.27667 0.58439 0.97847 1.24978 1.63774 2.35336 2.60543 2.95051 3.18245 3.48191 3.89605 4.54070 5.84091
4 0.27072 0.56865 0.94096 1.18957 1.53321 2.13185 2.33287 2.60076 2.77645 2.99853 3.29763 3.74695 4.60409
5 0.26718 0.55943 0.91954 1.15577 1.47588 2.01505 2.19096 2.42158 2.57058 2.75651 3.00287 3.36493 4.03214
6 0.26483 0.55338 0.9057 1.13416 1.43976 1.94318 2.10431 2.31326 2.44691 2.61224 2.82893 3.14267 3.70743
7 0.26317 0.54911 0.89603 1.11916 1.41492 1.89458 2.04601 2.24088 2.36462 2.51675 2.71457 2.99795 3.49948
8 0.26192 0.54593 0.88889 1.10815 1.39682 1.85955 2.00415 2.18915 2.30600 2.44898 2.63381 2.89646 3.35539
9 0.26096 0.54348 0.8834 1.09972 1.38303 1.83311 1.97265 2.15038 2.26216 2.39844 2.5738 2.82144 3.24984
10 0.26018 0.54153 0.87906 1.09306 1.37218 1.81246 1.9481 2.12023 2.22814 2.35931 2.52748 2.76377 3.16927

11 0.25956 0.53994 0.87553 1.08767 1.36343 1.79588 1.92843 2.09614 2.20099 2.32814 2.49066 2.71808 3.10581
12 0.25903 0.53862 0.87261 1.08321 1.35622 1.78229 1.91231 2.07644 2.17881 2.30272 2.46070 2.68100 3.05454
13 0.25859 0.5375 0.87015 1.07947 1.35017 1.77093 1.89887 2.06004 2.16037 2.2816 2.43585 2.65031 3.01228
14 0.25821 0.53655 0.86805 1.07628 1.34503 1.76131 1.8875 2.04617 2.14479 2.26378 2.41490 2.62449 2.97684
15 0.25789 0.53573 0.86624 1.07353 1.34061 1.75305 1.87774 2.03429 2.13145 2.24854 2.39701 2.60248 2.94671
16 0.25760 0.53501 0.86467 1.07114 1.33676 1.74588 1.86928 2.02400 2.11991 2.23536 2.38155 2.58349 2.92078
17 0.25735 0.53438 0.86328 1.06903 1.33338 1.73961 1.86187 2.01500 2.10982 2.22385 2.36805 2.56693 2.89823
18 0.25712 0.53382 0.86205 1.06717 1.33039 1.73406 1.85534 2.00707 2.10092 2.21370 2.35618 2.55238 2.87844
19 0.25692 0.53331 0.86095 1.06551 1.32773 1.72913 1.84953 2.00002 2.09302 2.20470 2.34565 2.53948 2.86093
20 0.25674 0.53286 0.85996 1.06402 1.32534 1.72472 1.84433 1.99371 2.08596 2.19666 2.33624 2.52798 2.84534

21 0.25658 0.53246 0.85907 1.06267 1.32319 1.72074 1.83965 1.98804 2.07961 2.18943 2.32779 2.51765 2.83136
22 0.25643 0.53208 0.85827 1.06145 1.32124 1.71714 1.83542 1.98291 2.07387 2.18289 2.32016 2.50832 2.81876
23 0.25630 0.53175 0.85753 1.06034 1.31946 1.71387 1.83157 1.97825 2.06866 2.17696 2.31323 2.49987 2.80734
24 0.25617 0.53144 0.85686 1.05932 1.31784 1.71088 1.82805 1.97399 2.0639 2.17154 2.30691 2.49216 2.79694
25 0.25606 0.53115 0.85624 1.05838 1.31635 1.70814 1.82483 1.9701 2.05954 2.16659 2.30113 2.48511 2.78744
26 0.25595 0.53089 0.85567 1.05752 1.31497 1.70562 1.82186 1.96651 2.05553 2.16203 2.29581 2.47863 2.77871
27 0.25586 0.53065 0.85514 1.05673 1.3137 1.70329 1.81913 1.96320 2.05183 2.15782 2.29091 2.47266 2.77068
28 0.25577 0.53042 0.85465 1.05599 1.31253 1.70113 1.81659 1.96014 2.04841 2.15393 2.28638 2.46714 2.76326
29 0.25568 0.53021 0.85419 1.05530 1.31143 1.69913 1.81424 1.95729 2.04523 2.15033 2.28217 2.46202 2.75639
30 0.25561 0.53002 0.85377 1.05466 1.31042 1.69726 1.81205 1.95465 2.04227 2.14697 2.27826 2.45726 2.75000

31 0.25553 0.52984 0.85337 1.05406 1.30946 1.69552 1.81000 1.95218 2.03951 2.14383 2.27461 2.45282 2.74404
32 0.25546 0.52967 0.853 1.0535 1.30857 1.69389 1.80809 1.94987 2.03693 2.14090 2.27120 2.44868 2.73848
33 0.25540 0.5295 0.85265 1.05298 1.30774 1.69236 1.80629 1.94770 2.03452 2.13816 2.26801 2.44479 2.73328
34 0.25534 0.52935 0.85232 1.05248 1.30695 1.69092 1.80461 1.94567 2.03224 2.13558 2.26501 2.44115 2.72839
35 0.25528 0.52921 0.85201 1.05202 1.30621 1.68957 1.80302 1.94375 2.03011 2.13316 2.26219 2.43772 2.72381
36 0.25523 0.52908 0.85172 1.05158 1.30551 1.6883 1.80153 1.94195 2.02809 2.13087 2.25953 2.43449 2.71948
37 0.25518 0.52895 0.85144 1.05117 1.30485 1.68709 1.80012 1.94024 2.02619 2.12871 2.25702 2.43145 2.71541
38 0.25513 0.52883 0.85118 1.05077 1.30423 1.68595 1.79878 1.93863 2.02439 2.12667 2.25465 2.42857 2.71156
39 0.25508 0.52871 0.85094 1.0504 1.30364 1.68488 1.79751 1.93711 2.02269 2.12474 2.25240 2.42584 2.70791
40 0.25504 0.52861 0.85070 1.05005 1.30308 1.68385 1.79631 1.93566 2.02108 2.12291 2.25027 2.42326 2.70446
UPC MA444 Estadística 250
Tabla de la distribución t – Student

Área bajo la curva 𝑃(𝑇 ≥ 𝑐) = 𝛼

𝛼
𝜐 0.4 0.3 0.2 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015 0.01 0.005
41 0.25500 0.52850 0.85048 1.04971 1.30254 1.68288 1.79517 1.93428 2.01954 2.12117 2.24825 2.42080 2.70118
42 0.25496 0.52840 0.85026 1.04939 1.30204 1.68195 1.79409 1.93298 2.01808 2.11952 2.24633 2.41847 2.69807
43 0.25492 0.52831 0.85006 1.04908 1.30155 1.68107 1.79305 1.93173 2.01669 2.11794 2.24449 2.41625 2.69510
44 0.25488 0.52822 0.84987 1.04879 1.30109 1.68023 1.79207 1.93054 2.01537 2.11644 2.24275 2.41413 2.69228
45 0.25485 0.52814 0.84968 1.04852 1.30065 1.67943 1.79113 1.92941 2.0141 2.11500 2.24108 2.41212 2.68959
46 0.25482 0.52805 0.84951 1.04825 1.30023 1.67866 1.79023 1.92833 2.0129 2.11364 2.23949 2.41019 2.68701
47 0.25479 0.52798 0.84934 1.04800 1.29982 1.67793 1.78937 1.92729 2.01174 2.11233 2.23797 2.40835 2.68456
48 0.25476 0.52790 0.84917 1.04775 1.29944 1.67722 1.78855 1.92630 2.01063 2.11107 2.23652 2.40658 2.68220
49 0.25473 0.52783 0.84902 1.04752 1.29907 1.67655 1.78776 1.92535 2.00958 2.10987 2.23512 2.40489 2.67995
50 0.25470 0.52776 0.84887 1.04729 1.29871 1.67591 1.78700 1.92444 2.00856 2.10872 2.23379 2.40327 2.67779

51 0.25467 0.52769 0.84873 1.04708 1.29837 1.67528 1.78627 1.92356 2.00758 2.10762 2.2325 2.40172 2.67572
52 0.25465 0.52763 0.84859 1.04687 1.29805 1.67469 1.78558 1.92272 2.00665 2.10655 2.23127 2.40022 2.67373
53 0.25462 0.52757 0.84846 1.04667 1.29773 1.67412 1.78491 1.92191 2.00575 2.10553 2.23009 2.39879 2.67182
54 0.25460 0.52751 0.84833 1.04648 1.29743 1.67356 1.78426 1.92114 2.00488 2.10455 2.22895 2.39741 2.66998
55 0.25458 0.52745 0.84821 1.04630 1.29713 1.67303 1.78364 1.92039 2.00404 2.10361 2.22785 2.39608 2.66822
56 0.25455 0.52740 0.84809 1.04612 1.29685 1.67252 1.78304 1.91967 2.00324 2.10270 2.22679 2.39480 2.66651
57 0.25453 0.52735 0.84797 1.04595 1.29658 1.67203 1.78246 1.91897 2.00247 2.10182 2.22577 2.39357 2.66487
58 0.25451 0.52730 0.84786 1.04578 1.29632 1.67155 1.78190 1.9183 2.00172 2.10097 2.22479 2.39238 2.66329
59 0.25449 0.52725 0.84776 1.04562 1.29607 1.67109 1.78137 1.91765 2.00100 2.10015 2.22384 2.39123 2.66176
60 0.25447 0.52720 0.84765 1.04547 1.29582 1.67065 1.78085 1.91703 2.00030 2.09936 2.22292 2.39012 2.66028

61 0.25445 0.52715 0.84755 1.04532 1.29558 1.67022 1.78034 1.91642 1.99962 2.0986 2.22204 2.38905 2.65886
62 0.25444 0.52711 0.84746 1.04518 1.29536 1.6698 1.77986 1.91584 1.99897 2.09786 2.22118 2.38801 2.65748
63 0.25442 0.52706 0.84736 1.04504 1.29513 1.6694 1.77939 1.91527 1.99834 2.09715 2.22035 2.38701 2.65615
64 0.25440 0.52702 0.84727 1.04490 1.29492 1.66901 1.77893 1.91472 1.99773 2.09645 2.21955 2.38604 2.65485
65 0.25439 0.52698 0.84719 1.04477 1.29471 1.66864 1.77849 1.91419 1.99714 2.09578 2.21877 2.38510 2.65360
66 0.25437 0.52694 0.84710 1.04464 1.29451 1.66827 1.77806 1.91368 1.99656 2.09514 2.21802 2.38419 2.65239
67 0.25436 0.52690 0.84702 1.04452 1.29432 1.66792 1.77765 1.91318 1.99601 2.09451 2.21729 2.38330 2.65122
68 0.25434 0.52687 0.84694 1.04440 1.29413 1.66757 1.77724 1.91269 1.99547 2.09390 2.21658 2.38245 2.65008
69 0.25433 0.52683 0.84686 1.04428 1.29394 1.66724 1.77685 1.91222 1.99495 2.09330 2.21589 2.38161 2.64898
70 0.25431 0.52680 0.84679 1.04417 1.29376 1.66691 1.77647 1.91177 1.99444 2.09273 2.21523 2.38081 2.64790

75 0.25425 0.52664 0.84644 1.04365 1.29294 1.66543 1.77473 1.90967 1.9921 2.09008 2.21216 2.37710 2.64298
80 0.25419 0.5265 0.84614 1.04320 1.29222 1.66412 1.77321 1.90784 1.99006 2.08778 2.20949 2.37387 2.63869
85 0.25414 0.52637 0.84587 1.0428 1.29159 1.66298 1.77187 1.90623 1.98827 2.08574 2.20713 2.37102 2.63491
90 0.25410 0.52626 0.84563 1.04244 1.29103 1.66196 1.77068 1.90480 1.98667 2.08394 2.20504 2.36850 2.63157
95 0.25406 0.52616 0.84542 1.04212 1.29053 1.66105 1.76961 1.90352 1.98525 2.08233 2.20317 2.36624 2.62858
100 0.25402 0.52608 0.84523 1.04184 1.29007 1.66023 1.76866 1.90237 1.98397 2.08088 2.20150 2.36422 2.62589
105 0.25399 0.52600 0.84506 1.04158 1.28967 1.65950 1.76779 1.90133 1.98282 2.07958 2.19998 2.36239 2.62347
110 0.25396 0.52592 0.84490 1.04134 1.28930 1.65882 1.76701 1.90039 1.98177 2.07839 2.19861 2.36073 2.62126
120 0.25391 0.52580 0.84463 1.04093 1.28865 1.65765 1.76564 1.89874 1.97993 2.07631 2.19620 2.35782 2.61742
∞ 0.25335 0.52440 0.84162 1.03643 1.28156 1.64484 1.75069 1.88079 1.95997 2.05375 2.17009 2.32635 2.57583
UPC MA444 Estadística 251
Tabla de la distribución F

Área bajo la curva: 𝑃(𝐹 ≥ 𝑐) = 𝛼


v1
𝛼 v2 1 2 3 4 5 6 7 8 9 10
0.050 1 161.45 199.50 215.71 224.58 230.16 233.99 236.77 238.88 240.54 241.88
0.025 647.79 799.48 864.15 899.60 921.83 937.11 948.20 956.64 963.28 968.63
0.010 4052.18 4999.34 5403.53 5624.26 5763.96 5858.95 5928.33 5980.95 6022.40 6055.93
0.005 16212.46 19997.36 21614.13 22500.75 23055.82 23439.53 23715.20 23923.81 24091.45 24221.84
0.050 2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40
0.025 38.51 39.00 39.17 39.25 39.30 39.33 39.36 39.37 39.39 39.40
0.010 98.50 99.00 99.16 99.25 99.30 99.33 99.36 99.38 99.39 99.40
0.005 198.50 199.01 199.16 199.24 199.30 199.33 199.36 199.38 199.39 199.39
0.050 3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79
0.025 17.44 16.04 15.44 15.10 14.88 14.73 14.62 14.54 14.47 14.42
0.010 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.34 27.23
0.005 55.55 49.80 47.47 46.20 45.39 44.84 44.43 44.13 43.88 43.68
0.050 4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96
0.025 12.22 10.65 9.98 9.60 9.36 9.20 9.07 8.98 8.90 8.84
0.010 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.55
0.005 31.33 26.28 24.26 23.15 22.46 21.98 21.62 21.35 21.14 20.97
0.050 5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74
0.025 10.01 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6.68 6.62
0.010 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16 10.05
0.005 22.78 18.31 16.53 15.56 14.94 14.51 14.20 13.96 13.77 13.62
0.050 6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06
0.025 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60 5.52 5.46
0.010 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87
0.005 18.63 14.54 12.92 12.03 11.46 11.07 10.79 10.57 10.39 10.25
0.050 7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64
0.025 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90 4.82 4.76
0.010 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 6.62
0.005 16.24 12.40 10.88 10.05 9.52 9.16 8.89 8.68 8.51 8.38
0.050 8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35
0.025 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 4.36 4.30
0.010 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 5.81
0.005 14.69 11.04 9.60 8.81 8.30 7.95 7.69 7.50 7.34 7.21
0.050 9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14
0.025 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96
0.010 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26
0.005 13.61 10.11 8.72 7.96 7.47 7.13 6.88 6.69 6.54 6.42
0.050 10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98
0.025 6.94 5.46 4.83 4.47 4.24 4.07 3.95 3.85 3.78 3.72
0.010 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85
0.005 12.83 9.43 8.08 7.34 6.87 6.54 6.30 6.12 5.97 5.85
0.050 11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85
0.025 6.72 5.26 4.63 4.28 4.04 3.88 3.76 3.66 3.59 3.53
0.010 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63 4.54
0.005 12.23 8.91 7.60 6.88 6.42 6.10 5.86 5.68 5.54 5.42
0.050 12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75
0.025 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44 3.37
0.010 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30
0.005 11.75 8.51 7.23 6.52 6.07 5.76 5.52 5.35 5.20 5.09
UPC MA444 Estadística 252
Tabla de la distribución F

Área bajo la curva: 𝑃(𝐹 ≥ 𝑐) = 𝛼


v1
𝜶 v2 12 15 20 24 30 40 50 60 70 120
0.050 1 243.90 245.95 248.02 249.05 250.10 251.14 251.77 252.20 252.50 253.25
0.025 976.72 984.87 993.08 997.27 1001.40 1005.60 1008.10 1009.79 1011.01 1014.04
0.010 6106.68 6156.97 6208.66 6234.27 6260.35 6286.43 6302.26 6312.97 6320.89 6339.51
0.005 24426.73 24631.62 24836.51 24937.09 25041.40 25145.71 25212.76 25253.74 25283.55 25358.05
0.050 2 19.41 19.43 19.45 19.45 19.46 19.47 19.48 19.48 19.48 19.49
0.025 39.41 39.43 39.45 39.46 39.46 39.47 39.48 39.48 39.48 39.49
0.010 99.42 99.43 99.45 99.46 99.47 99.48 99.48 99.48 99.48 99.49
0.005 199.42 199.43 199.45 199.45 199.48 199.48 199.48 199.48 199.48 199.49
0.050 3 8.74 8.70 8.66 8.64 8.62 8.59 8.58 8.57 8.57 8.55
0.025 14.34 14.25 14.17 14.12 14.08 14.04 14.01 13.99 13.98 13.95
0.010 27.05 26.87 26.69 26.60 26.50 26.41 26.35 26.32 26.29 26.22
0.005 43.39 43.08 42.78 42.62 42.47 42.31 42.21 42.15 42.10 41.99
0.050 4 5.91 5.86 5.80 5.77 5.75 5.72 5.70 5.69 5.68 5.66
0.025 8.75 8.66 8.56 8.51 8.46 8.41 8.38 8.36 8.35 8.31
0.010 14.37 14.20 14.02 13.93 13.84 13.75 13.69 13.65 13.63 13.56
0.005 20.70 20.44 20.17 20.03 19.89 19.75 19.67 19.61 19.57 19.47
0.050 5 4.68 4.62 4.56 4.53 4.50 4.46 4.44 4.43 4.42 4.40
0.025 6.52 6.43 6.33 6.28 6.23 6.18 6.14 6.12 6.11 6.07
0.010 9.89 9.72 9.55 9.47 9.38 9.29 9.24 9.20 9.18 9.11
0.005 13.38 13.15 12.90 12.78 12.66 12.53 12.45 12.40 12.37 12.27
0.050 6 4.00 3.94 3.87 3.84 3.81 3.77 3.75 3.74 3.73 3.70
0.025 5.37 5.27 5.17 5.12 5.07 5.01 4.98 4.96 4.94 4.90
0.010 7.72 7.56 7.40 7.31 7.23 7.14 7.09 7.06 7.03 6.97
0.005 10.03 9.81 9.59 9.47 9.36 9.24 9.17 9.12 9.09 9.00
0.050 7 3.57 3.51 3.44 3.41 3.38 3.34 3.32 3.30 3.29 3.27
0.025 4.67 4.57 4.47 4.41 4.36 4.31 4.28 4.25 4.24 4.20
0.010 6.47 6.31 6.16 6.07 5.99 5.91 5.86 5.82 5.80 5.74
0.005 8.18 7.97 7.75 7.64 7.53 7.42 7.35 7.31 7.28 7.19
0.050 8 3.28 3.22 3.15 3.12 3.08 3.04 3.02 3.01 2.99 2.97
0.025 4.20 4.10 4.00 3.95 3.89 3.84 3.81 3.78 3.77 3.73
0.010 5.67 5.52 5.36 5.28 5.20 5.12 5.07 5.03 5.01 4.95
0.005 7.01 6.81 6.61 6.50 6.40 6.29 6.22 6.18 6.15 6.06
0.050 9 3.07 3.01 2.94 2.90 2.86 2.83 2.80 2.79 2.78 2.75
0.025 3.87 3.77 3.67 3.61 3.56 3.51 3.47 3.45 3.43 3.39
0.010 5.11 4.96 4.81 4.73 4.65 4.57 4.52 4.48 4.46 4.40
0.005 6.23 6.03 5.83 5.73 5.62 5.52 5.45 5.41 5.38 5.30
0.050 10 2.91 2.85 2.77 2.74 2.70 2.66 2.64 2.62 2.61 2.58
0.025 3.62 3.52 3.42 3.37 3.31 3.26 3.22 3.20 3.18 3.14
0.010 4.71 4.56 4.41 4.33 4.25 4.17 4.12 4.08 4.06 4.00
0.005 5.66 5.47 5.27 5.17 5.07 4.97 4.90 4.86 4.83 4.75
0.050 11 2.79 2.72 2.65 2.61 2.57 2.53 2.51 2.49 2.48 2.45
0.025 3.43 3.33 3.23 3.17 3.12 3.06 3.03 3.00 2.99 2.94
0.010 4.40 4.25 4.10 4.02 3.94 3.86 3.81 3.78 3.75 3.69
0.005 5.24 5.05 4.86 4.76 4.65 4.55 4.49 4.45 4.41 4.34
0.050 12 2.69 2.62 2.54 2.51 2.47 2.43 2.40 2.38 2.37 2.34
0.025 3.28 3.18 3.07 3.02 2.96 2.91 2.87 2.85 2.83 2.79
0.010 4.16 4.01 3.86 3.78 3.70 3.62 3.57 3.54 3.51 3.45
0.005 4.91 4.72 4.53 4.43 4.33 4.23 4.17 4.12 4.09 4.01
UPC MA444 Estadística 253
Tabla de la distribución F

Área bajo la curva: 𝑃(𝐹 ≥ 𝑐) = 𝛼


v1
𝜶 v2 1 2 3 4 5 6 7 8 9 10
0.050 13 4.7 3.8 3.4 3.2 3.0 2.9 2.8 2.8 2.7 2.7
0.025 6.4 5.0 4.3 4.0 3.8 3.6 3.5 3.4 3.3 3.2
0.010 9.1 6.7 5.7 5.2 4.9 4.6 4.4 4.3 4.2 4.1
0.005 11.4 8.2 6.9 6.2 5.8 5.5 5.3 5.1 4.9 4.8
0.050 14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60
0.025 6.30 4.86 4.24 3.89 3.66 3.50 3.38 3.29 3.21 3.15
0.010 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03 3.94
0.005 11.06 7.92 6.68 6.00 5.56 5.26 5.03 4.86 4.72 4.60
0.050 15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54
0.025 6.20 4.77 4.15 3.80 3.58 3.41 3.29 3.20 3.12 3.06
0.010 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.80
0.005 10.80 7.70 6.48 5.80 5.37 5.07 4.85 4.67 4.54 4.42
0.050 20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35
0.025 5.87 4.46 3.86 3.51 3.29 3.13 3.01 2.91 2.84 2.77
0.010 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 3.37
0.005 9.94 6.99 5.82 5.17 4.76 4.47 4.26 4.09 3.96 3.85
0.050 24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30 2.25
0.025 5.72 4.32 3.72 3.38 3.15 2.99 2.87 2.78 2.70 2.64
0.010 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26 3.17
0.005 9.55 6.66 5.52 4.89 4.49 4.20 3.99 3.83 3.69 3.59
0.050 30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 2.16
0.025 5.57 4.18 3.59 3.25 3.03 2.87 2.75 2.65 2.57 2.51
0.010 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07 2.98
0.005 9.18 6.35 5.24 4.62 4.23 3.95 3.74 3.58 3.45 3.34
0.050 40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.08
0.025 5.42 4.05 3.46 3.13 2.90 2.74 2.62 2.53 2.45 2.39
0.010 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89 2.80
0.005 8.83 6.07 4.98 4.37 3.99 3.71 3.51 3.35 3.22 3.12
0.050 45 4.06 3.20 2.81 2.58 2.42 2.31 2.22 2.15 2.10 2.05
0.025 5.38 4.01 3.42 3.09 2.86 2.70 2.58 2.49 2.41 2.35
0.010 7.23 5.11 4.25 3.77 3.45 3.23 3.07 2.94 2.83 2.74
0.005 8.71 5.97 4.89 4.29 3.91 3.64 3.43 3.28 3.15 3.04
0.050 50 4.03 3.18 2.79 2.56 2.40 2.29 2.20 2.13 2.07 2.03
0.025 5.34 3.97 3.39 3.05 2.83 2.67 2.55 2.46 2.38 2.32
0.010 7.17 5.06 4.20 3.72 3.41 3.19 3.02 2.89 2.78 2.70
0.005 8.63 5.90 4.83 4.23 3.85 3.58 3.38 3.22 3.09 2.99
0.050 60 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04 1.99
0.025 5.29 3.93 3.34 3.01 2.79 2.63 2.51 2.41 2.33 2.27
0.010 7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72 2.63
0.005 8.49 5.79 4.73 4.14 3.76 3.49 3.29 3.13 3.01 2.90
0.050 70 3.98 3.13 2.74 2.50 2.35 2.23 2.14 2.07 2.02 1.97
0.025 5.25 3.89 3.31 2.97 2.75 2.59 2.47 2.38 2.30 2.24
0.010 7.01 4.92 4.07 3.60 3.29 3.07 2.91 2.78 2.67 2.59
0.005 8.40 5.72 4.66 4.08 3.70 3.43 3.23 3.08 2.95 2.85
0.050 120 3.92 3.07 2.68 2.45 2.29 2.18 2.09 2.02 1.96 1.91
0.025 5.15 3.80 3.23 2.89 2.67 2.52 2.39 2.30 2.22 2.16
0.010 6.85 4.79 3.95 3.48 3.17 2.96 2.79 2.66 2.56 2.47
0.005 8.18 5.54 4.50 3.92 3.55 3.28 3.09 2.93 2.81 2.71
UPC MA444 Estadística 254
Tabla de la distribución F

Área bajo la curva: 𝑃(𝐹 ≥ 𝑐) = 𝛼


v1
𝜶 v2 12 15 20 24 30 40 50 60 70 120
0.050 13 2.6 2.5 2.5 2.4 2.4 2.3 2.3 2.3 2.3 2.3
0.025 3.2 3.1 2.9 2.9 2.8 2.8 2.7 2.7 2.7 2.7
0.010 4.0 3.8 3.7 3.6 3.5 3.4 3.4 3.3 3.3 3.3
0.005 4.6 4.5 4.3 4.2 4.1 4.0 3.9 3.9 3.8 3.8
0.050 14 2.53 2.46 2.39 2.35 2.31 2.27 2.24 2.22 2.21 2.18
0.025 3.05 2.95 2.84 2.79 2.73 2.67 2.64 2.61 2.60 2.55
0.010 3.80 3.66 3.51 3.43 3.35 3.27 3.22 3.18 3.16 3.09
0.005 4.43 4.25 4.06 3.96 3.86 3.76 3.70 3.66 3.62 3.55
0.050 15 2.48 2.40 2.33 2.29 2.25 2.20 2.18 2.16 2.15 2.11
0.025 2.96 2.86 2.76 2.70 2.64 2.59 2.55 2.52 2.51 2.46
0.010 3.67 3.52 3.37 3.29 3.21 3.13 3.08 3.05 3.02 2.96
0.005 4.25 4.07 3.88 3.79 3.69 3.59 3.52 3.48 3.45 3.37
0.050 20 2.28 2.20 2.12 2.08 2.04 1.99 1.97 1.95 1.93 1.90
0.025 2.68 2.57 2.46 2.41 2.35 2.29 2.25 2.22 2.20 2.16
0.010 3.23 3.09 2.94 2.86 2.78 2.69 2.64 2.61 2.58 2.52
0.005 3.68 3.50 3.32 3.22 3.12 3.02 2.96 2.92 2.88 2.81
0.050 24 2.18 2.11 2.03 1.98 1.94 1.89 1.86 1.84 1.83 1.79
0.025 2.54 2.44 2.33 2.27 2.21 2.15 2.11 2.08 2.06 2.01
0.010 3.03 2.89 2.74 2.66 2.58 2.49 2.44 2.40 2.38 2.31
0.005 3.42 3.25 3.06 2.97 2.87 2.77 2.70 2.66 2.63 2.55
0.050 30 2.09 2.01 1.93 1.89 1.84 1.79 1.76 1.74 1.72 1.68
0.025 2.41 2.31 2.20 2.14 2.07 2.01 1.97 1.94 1.92 1.87
0.010 2.84 2.70 2.55 2.47 2.39 2.30 2.25 2.21 2.18 2.11
0.005 3.18 3.01 2.82 2.73 2.63 2.52 2.46 2.42 2.38 2.30
0.050 40 2.00 1.92 1.84 1.79 1.74 1.69 1.66 1.64 1.62 1.58
0.025 2.29 2.18 2.07 2.01 1.94 1.88 1.83 1.80 1.78 1.72
0.010 2.66 2.52 2.37 2.29 2.20 2.11 2.06 2.02 1.99 1.92
0.005 2.95 2.78 2.60 2.50 2.40 2.30 2.23 2.18 2.15 2.06
0.050 45 1.97 1.89 1.81 1.76 1.71 1.66 1.63 1.60 1.59 1.54
0.025 2.25 2.14 2.03 1.96 1.90 1.83 1.79 1.76 1.74 1.68
0.010 2.61 2.46 2.31 2.23 2.14 2.05 2.00 1.96 1.93 1.85
0.005 2.88 2.71 2.53 2.43 2.33 2.22 2.16 2.11 2.08 1.99
0.050 50 1.95 1.87 1.78 1.74 1.69 1.63 1.60 1.58 1.56 1.51
0.025 2.22 2.11 1.99 1.93 1.87 1.80 1.75 1.72 1.70 1.64
0.010 2.56 2.42 2.27 2.18 2.10 2.01 1.95 1.91 1.88 1.80
0.005 2.82 2.65 2.47 2.37 2.27 2.16 2.10 2.05 2.02 1.93
0.050 60 1.92 1.84 1.75 1.70 1.65 1.59 1.56 1.53 1.52 1.47
0.025 2.17 2.06 1.94 1.88 1.82 1.74 1.70 1.67 1.64 1.58
0.010 2.50 2.35 2.20 2.12 2.03 1.94 1.88 1.84 1.81 1.73
0.005 2.74 2.57 2.39 2.29 2.19 2.08 2.01 1.96 1.93 1.83
0.050 70 1.89 1.81 1.72 1.67 1.62 1.57 1.53 1.50 1.49 1.44
0.025 2.14 2.03 1.91 1.85 1.78 1.71 1.66 1.63 1.60 1.54
0.010 2.45 2.31 2.15 2.07 1.98 1.89 1.83 1.78 1.75 1.67
0.005 2.68 2.51 2.33 2.23 2.13 2.02 1.95 1.90 1.86 1.77
0.050 120 1.83 1.75 1.66 1.61 1.55 1.50 1.46 1.43 1.41 1.35
0.025 2.05 1.94 1.82 1.76 1.69 1.61 1.56 1.53 1.50 1.43
0.010 2.34 2.19 2.03 1.95 1.86 1.76 1.70 1.66 1.62 1.53
0.005 2.54 2.37 2.19 2.09 1.98 1.87 1.80 1.75 1.71 1.61
UPC MA444 Estadística 255
Índice

bastones, 28
Circular, 19
B de barras, 19
Bayes histograma, 36
Teorema de, 89 ojiva, 36
Pareto, 22
C
M
Censo, 147
Coeficiente de correlación, 221 Marca de clase, 32
Coeficiente de determinación, 221 Media
aritmética, 43
Medidas de tendencia central, 43
D Medidas de variación
Distribución Desviación estándar, 54
binomial, 105 Varianza, 54
continua, 130 Moda, 49
exponencial, 130 Muestra, 7
normal, 134 Muestreo, 147
normal estándar, 134, 135 aleatorio simple, 149
Poisson, 109 probabilístico, 149

E P
Escalas de medición Parámetro, 16, 42
intervalo, 10 Probabilidad
nominal, 10 condicional, 80
ordinal, 10 Prueba de hipótesis
razón, 10 media poblacional, 167
Esperado medias poblacionales, 186
de una variable discreta, 102 proporción poblacional, 176
de variable continua, 125 varianzas poblacionales, 183
Estadística
definición, 6 R
descriptiva, 6, 98
inferencial, 6 Regla multiplicativa
Estadístico, 16, 42 para eventos independientes, 83
Evento Regresión
complementario, 70 lineal, 215
compuesto, 67
independientes, 83 T
mutuamente excluyentes, 67
simple, 66 Tamaño de muestra
Experimento aleatorio, 66 media de una población, 158
Tipos de errores, 165
F
V
Frecuencia
acumulada absoluta, 28 Variable
porcentual, 28 aleatoria continua, 117
Función aleatoria discreta, 99
de densidad, 117 continua, 9
de distribución acumulada, 120 cualitativa, 9
cuantitativa, 9
discreta, 9
G Varianza
Gráfico de una variable aleatoria, 102, 125
UPC MA444 Estadística 256

También podría gustarte