Está en la página 1de 315

ESTADÍSTICA APLICADA

Presentación del curso


Definiciones básicas
Temario
• Presentación del curso
• Definición de conceptos básicos de la estadística:
Población, Muestra, Unidad elemental, Variables,
Tipo de variables, Escalas de medición
Logro de la sesión
• Al finalizar la sesión, el estudiante interpreta la
terminología básica de la estadística en casos reales
del ámbito de la ingeniería.
1

DEFINICIONES BÁSICAS
Definición de Estadística
Es la ciencia que proporciona un conjunto de métodos,
técnicas y procedimientos para recopilar, organizar,
presentar y analizar datos con el fin de describirlos o
realizar generalizaciones válidas

Recopilar
información

Organizar información

Presentar Analizar Tomar


información información decisiones
Subdivisión de la Estadística
ESTADÍSTICA Describe y analiza un conjunto de datos usando tablas de
DESCRIPTIVA frecuencia, gráficos, medidas de resumen.
ESTADÍSTICA INFERENCIAL
Generaliza los resultados hallados en una
muestra representativa, haciéndolos
válidos a la población en base a métodos
y técnicas que hacen posible estimar las
característica mas importantes de la
población.
Población – Muestra, Parámetro - Estadístico

Parámetro: Medida que resume una característica de la población


Estadístico: Medida que resume una característica de la muestra
Notación de principales parámetros y estadísticos:
Unidad elemental, Variables y
Observación
Unidad elemental:
entidades acerca de
las cuales se toma
información.

Variables:
características de
interés para el
investigador. Pueden
tomar diferentes valores Observación:
al ser medidas. conjunto de
mediciones obtenidas
de un elemento en
particular.

DATO, Se obtiene al medir una característica de la unidad elemental


Ejemplo 1
POBLACIÓN

Toda la producción mensual de barras de acero de la


empresa ACERO PERÚ
MUESTRA

70 barras de acero elegidas de la producción


de la empresa ACERO PERÚ

UNIDAD ELEMENTAL 1 barra de acero de producción


de la empresa ACERO PERÚ

Tipo Grosor de la Barra Longitud Número de fallas

Fierro corrugado ½ pulgadas 9 metros 2

DATO DATO DATO DATO  OBSERVACIÓN


Ejemplo 2
Alpha Soft” es una compañía dedicada a brindar servicios informáticos a
empresas que deseen tener una presencia firme y contundente en la red. Esta
compañía se dedica al tendido de redes LAN, instalación de equipos, servidores
y toda una gama de productos tecnológicos que puedan resultar imprescindibles
para una empresa. Como parte de un estudio realizado por “Alpha Soft” se
analiza la información de 200 clientes seleccionados al azar en Perú el año 2017
teniendo como variables:
I. Tipos de lenguajes de programación (Cobol, Java, Informixs-4gl, etc)
II. Cantidad de servidores por empresa.
III. Costo de las licencias de software (en dólares)
IV. Sistema operativo instalado (Windows, UNIX, etc)

Identifique población, muestra, unidad elemental.


Ejemplo 3

El objetivo de un estudio llevado a cado en agosto del 2017 fue proponer


estrategias que permitan reducir al mínimo la morosidad de las personas cuando
solicitan un crédito personal, vehicular e hipotecario. Para la realización del
estudio se tomó una muestra aleatoria de 120 clientes que habían solicitado un
crédito al Banco Millennium S. A. recopilando la siguiente información:
•Monto del crédito solicitado (Soles)
•Carga familiar del cliente (Cantidad de dependientes)
•Tipo de crédito (Personal, vehicular, hipotecario)Situación laboral (Estable,
eventual, independiente)
•Capacidad de pago (Suficiente, justa, insuficiente)
•Dictamen del crédito (Aprobado, duda, rechazado)
•Calificación del cliente (Bueno, regular, malo, descartado)
•Cuota mensual que paga el cliente (Soles)
Identifique la población, muestra y unidad elemental.
Variable y tipo de variable
Son las características que presentan los elementos de una población y
pueden asumir diferentes valores al ser medidas

Variable Al ser medidas quedan expresadas por


etiquetas o nombres que se utilizan para
Cualitativa
identificar una característica o atributo

Al ser medidas quedan expresadas por Variable


números que se utilizan para identificar una Cuantitativa
característica o atributo

Cuantitativa discreta: toma valores en un conjunto finito o infinito numerable

Cuantitativa continua: puede tomar valores en un intervalo determinado


MEDIR = Asignar valor a una característica

Estatura
Marca de auto

Nro de celulares
por persona
ESCALAS DE MEDICIÓN
El registro de una característica, se hace usando una de las cuatro escalas: nominal,
ordinal, intervalos y de razón.
TIPO DE VARIABLE: CUALITATIVA TIPO DE VARIABLE: CUANTITATIVA
NOMINAL ORDINAL INTERVALO RAZÓN
Tiene intervalos
Además de etiquetar al Tiene intervalos iguales y
constantes entre un
Solo se puede elemento para poder pueden ser medidos,
valor y otro, posee un
etiquetar al identificarlo se puede pero no tiene punto de
punto de partida (cero
elemento para establecer ORDEN en las partida. Puede asumir
natural = ausencia de
poder identificarlo categorías valores negativos.
característica)
CERO RELATIVO
CERO ABSOLUTO
Tiempo
Nro de
Distrito de Nivel de Grado de transcurrido
Género Temperatura Estatura defectos de un
residencia satisfacción instrucción hasta una
producto
fecha

Muy Bueno Inicial 10 °C 500 AC 1,56 cm 0


Surco Masculino Bueno Primaria 5 °C 100 AC 1,58 cm 1
Barranco Femenino Regular Secundaria 0 °C 200 DC 1,66 cm 2
Miraflores Malo Superior -5 °C 1290 DC 1,51 cm 3
Muy Malo -10°C 4
Ejemplo:
Cualitativas Cuantitativas

• Nominal • Intervalo

Temperatura
Del ambiente
Género del cliente

• Ordinal • Razón

Grado de instrucción del Gasto mensual en


entrevistado educación
Ejemplo 4
Alpha Soft” es una compañía dedicada a brindar servicios informáticos a
empresas que deseen tener una presencia firme y contundente en la red. Esta
compañía se dedica al tendido de redes LAN, instalación de equipos, servidores
y toda una gama de productos tecnológicos que puedan resultar imprescindibles
para una empresa. Como parte de un estudio realizado por “Alpha Soft” se
analiza la información de 200 clientes seleccionados al azar en Perú el año 2017
teniendo como variables:
I. Tipos de lenguajes de programación (Cobol, Java, Informixs-4gl, etc)
II. Cantidad de servidores por empresa.
III. Costo de las licencias de software (en dólares)
IV. Sistema operativo instalado (Windows, UNIX, etc)

Identifique el tipo de variable y escala de medición de cada variable


Ejemplo 5

El objetivo de un estudio llevado a cado en agosto del 2017 fue proponer


estrategias que permitan reducir al mínimo la morosidad de las personas cuando
solicitan un crédito personal, vehicular e hipotecario. Para la realización del
estudio se tomó una muestra aleatoria de 120 clientes que habían solicitado un
crédito al Banco Millennium S. A. recopilando la siguiente información:
•Monto del crédito solicitado (Soles)
•Carga familiar del cliente (Cantidad de dependientes)
•Tipo de crédito (Personal, vehicular, hipotecario)Situación laboral (Estable,
eventual, independiente)
•Capacidad de pago (Suficiente, justa, insuficiente)
•Dictamen del crédito (Aprobado, duda, rechazado)
•Calificación del cliente (Bueno, regular, malo, descartado)
•Cuota mensual que paga el cliente (Soles)
•Según el contexto del caso, complete la siguiente tabla

Población

Unidad
elemental

•Complete los espacios en blanco considerando la información del caso de estudio

Gráfico
Variable Tipo de variable Escala de medición
adecuado
Calificación
del cliente
Histograma de
frecuencias
Tipo de
crédito

Cuantitativa discreta
Ejemplo 6
Wuxi Battery Co. es una compañía fabricante de baterías o pilas alcalinas de zinc-
dióxido de manganeso bajo la norma ANSI que tiene tres plantas de producción.
Últimamente sus clientes se están quejando de que las baterías no están
cumpliendo con las especificaciones. Debido a lo expuesto, el Gerente de
Producción ha solicitado al jefe de control de calidad un informe.
Para realizar el estudio se tomó una muestra al azar de 500 baterías alcalinas de
zinc–dióxido de manganeso producidas en sus tres plantas de producción. Las
variables consideradas en el estudio son:
N° Variable Unidad/Descripción
01 Longitud Representa la altura que tiene la batería alcalina AA en mm.
02 Diámetro Representa el diámetro que tiene la batería alcalina AA en mm.
Tiempo de Representa el tiempo de duración de la batería en uso típico como la radio en
03
duración horas.
Es el turno de trabajo donde proviene las baterías alcalinas AA (1: Mañana, 2: Tarde
04 Turno
y 3: Noche)
Principales problemas reportados (recarga, voltaje, fuga de hidróxido,
05 Problemas
funcionamiento defectuoso debido a su temperatura de almacenamiento, otros)
Origen de la batería alcalina AA según planta de procedencia (1: norte, 2: sur y 3:
06 Planta
este)
Número de
07 Representa el número de problema presentado en las pilas alcalinas AA.
problemas
• De acuerdo a la información proporcionada, responda lo
siguiente:

Población

Muestra

Unidad elemental

• Complete los espacios en la tabla en base la información recogida de la


encuesta

Variable
(Escriba el nombre de la Tipo de variable Escala de medición
variable)
Turno
Cuantitativa continua
Nominal
Nª de problemas
Ejemplo propuesto:
La Empresa Systems Artificial Intelligence (SAI) se dedica al desarrollo de sistemas
basados en inteligencia artificial y está conformada por un equipo de especialistas
de ingeniería industrial y de sistemas. Para cumplir con sus metas la Empresa
actualmente está en un proceso de autoevaluación, por tal motivo se ha
seleccionado al azar 105 productos de sistemas de inteligencia artificial
desarrollados en los últimos cinco años. Las características de interés auditadas son:

• Utilidades (en cientos de miles de soles)


• Tiempo de desarrollo (días)
• Número de programadores.
• Tipo de clientes: Universidades, Empresa privadas, Institutos de investigación,
Entidades gubernamentales.
• Tipo de problemas: Falta de programadores, pocas capacitaciones, insuficientes
reuniones de coordinación, falta de diseñadores.
• Nivel de dificultad: Básico, promedio, avanzado.

Determine la población, muestra, unidad elemental, variables, tipo de cada


variable y escala de medición.
Conclusiones:
✓ La muestra es un subconjunto de la población y debe ser
representativa. Los elementos son elegidos al azar.
✓ La diferencia entre parámetro y estadístico radica en su procedencia:
población y muestra.
✓ Las variables cualitativas se caracterizan porque califican o clasifican,
mientras que; las variables cuantitativas se caracteriza porque
cuantifican.
✓ Las escalas nominal y ordinal se le atribuyen a las variables
cualitativas
✓ Las escalas de intervalo y razón se le atribuye a las variables
cuantitativas.
Bibliografía

 Video “Año Internacional de la estadística” http://youtu.be/O_UeYczBbPg


 Diario Gestión http://gestion.buscamas.pe/encuestas
 Cuaderno de Trabajo del curso
Material producido para el curso Estadística Aplicada 1
Autor: Profesores del curso

ESTADÍSTICA APLICADA 1- EPE


COPYRIGHT © UPC 2018
ESTADÍSTICA APLICADA I

Organización para datos


cualititativos
Logro de la sesión

• Al finalizar la sesión, el estudiante interpreta los


resultados de tablas y gráficos estadísticos que
construye con rigurosidad.
Temario
• Organización para datos cualitativos con
una variable:
• Tabla de frecuencias
• Gráfico de barras
• Gráfico circular
1

Organización de datos
cualitativos:
Una variable
•Tabla de frecuencias para variables cualitativas en Excel

• Asegúrese que cada columna represente una variable en estudio.


• Ubique el cursor en cualquier celda de los datos.
• Haga clic en la opción Insertar de la barra de menú.
• Seleccione Tabla dinámica y haga clic en Aceptar,
• Arrastre la variable de la cual desea el cuadro a la zona de Etiquetas de
fila y también a la zona de ∑ Valores.
• Copie la tabla sin incluir los títulos, en otra celda.
• Calcule la frecuencia relativa hi

• Elabore una tabla de frecuencias para analizar la variable “Función en la


empresa”.
Gráfico de barras en Excel

• Seleccione las columnas de categorías de la variable y de la frecuencia


absoluta o relativa. Use la tecla Ctrl si necesita seleccionar celdas no
contiguas.
• Haga clic en la opción Insertar de la barra de menú y active el icono
Columnas. Seleccione la opción Columna y presione Aceptar.
• Haga doble clic en el área del gráfico para configurar la presentación en la
opción DISEÑO: Título de gráfico, Rótulo del eje o Etiquetas de datos

Elabore un gráfico de barras para analizar la variable “Función en la empresa”.


Gráfico circular en Excel

• Seleccione las columnas de la variable y la de frecuencia absoluta o relativa.


• Haga clic en la opción Insertar de la barra de menú y active el icono
Circular. Seleccione la opción Circular y presione Aceptar.
• Haciendo doble clic en el área del gráfico, aparecerá una pestaña de
DISEÑO para la configuración adecuada.

Elabore un gráfico circular para analizar la variable “Función en la empresa”.


Ejercicios:
Para desarrollar los ejercicios propuestos debe usar la base de datos
publicada en el Aula Virtual: “Base de Datos Guía Excel”
• Elabore una tabla de frecuencias para analizar la variable “Función en
la empresa”.
• Interprete la frecuencia simple y relativa del tercer intervalo
• Elabore un gráfico de barras y circular para analizar la variable
“Función en la empresa”.
• Elabore un gráfico de barras y circular para analizar la variable
“Relación con la gerencia”.
Bibliografía
 Guía de Excel para el curso
Material producido para el curso de Estadística Aplicada 1
Autor: Profesores del curso

ESTASÍSTICA APLICADA 1- EPE


COPYRIGHT © UPC 2018
ESTADÍSTICA APLICADA I

Organización para datos


cualititativos
Logro de la sesión

• Al finalizar la sesión, el estudiante interpreta los


resultados de tablas y gráficos estadísticos que
construye con rigurosidad.
1
Organización de datos
cualitativos:
Tabla de frecuencias para
Dos variables cualitativas
•Tabla de frecuencias para dos variables cualitativas en Excel

• Asegúrese que cada columna represente una variable en estudio.


• Ubique el cursor en cualquier celda de los datos.
• Haga clic en la opción Insertar de la barra de menú.
• Seleccione Tabla dinámica y haga clic en Aceptar,
• Arrastre una de las variable de la cual desea el cuadro a la zona de
Etiquetas de fila y la otra a Etiquetas de columna.
• Luego arrastre cualquier variable a la zona de ∑ Valores.

• Elabore una tabla de frecuencias para analizar la variable “Relaciones con


la gerencia y Género”.
Recomendaciones para títulos de tablas y gráficos de dos variables
cualitativas:

La tabla de doble entrada y su gráfico deben tener el mismo título. Una manera
ordenada de presentarlo es teniendo en cuenta si la tabla de doble entrada
corresponde al total general o si ella corresponde al total de fila o al total de columna

Si la tabla o gráfico corresponde al total general entonces el título debe incluir las dos
variables en estudio separadas por la letra Y. El orden de las variables es indistinto.
Si la tabla o gráfico corresponde al total de fila 100% o columna 100%, el título incluye
dos palabras claves: según y por, donde el según determina la variable que va en la
leyenda y el por la variable que totaliza el 100%.
Ejercicios:
Para desarrollar los ejercicios propuestos debe usar la base de datos
publicada en el Aula Virtual: : “Base de Datos Guía Excel”
• Elabore una tabla de frecuencias para analizar en forma conjunta las
variables “Función en la empresa” y “Género”
• Interprete la frecuencia absoluta de la tercera fila y segunda columna.
• Elabore una tabla de frecuencias porcentuales para representar la
“Función en la empresa” por “Género”
• Elabore una tabla de frecuencias porcentuales para representar
“Género” por “Función en la empresa”
Bibliografía
 Guía de Excel para el curso
Material producido para el curso de Estadística Aplicada 1
Autor: Profesores del curso

ESTASÍSTICA APLICADA 1- EPE


COPYRIGHT © UPC 2018
ESTADÍSTICA APLICADA I

Organización para datos


cuantitativos
Temario
• Organización para una variable
cuantitativa discreta :
• Tabla de frecuencias
• Organización para una variable
cuantitativa continua :
• Tabla de frecuencias
• Regla de Sturges
Temario
• Al finalizar la sesión, el estudiante interpreta los
resultados de tablas de distribución de
frecuencia que construye con rigurosidad.
1

Organización de datos
Cuantitativos:
TABLA DE FRECUENCIAS:
VARIABLE CUANTITATIVA DISCRETA
La distribución de frecuencias es una tabla que presenta la
siguiente estructura:
2013 - 1
EJERCICIO 1:
Los siguientes datos corresponden al número de capacitaciones recibidas
por los trabajadores de la empresa Creativa’s en lo que va del año:

Presentar la información en una tabla de frecuencias


2013 - 1
TABLA DE FRECUENCIAS :
VARIABLE CUANTITATIVA CONTINUA

Los pasos para elaborar una tabla de


distribución de frecuencias para variables
Es un resumen de un conjunto de datos cuantitativas continuas son:
que consiste en presentar para cada • Determinar el Rango: Xmáx - Xmín
categoría el número de elementos • Determinar la cantidad de intervalos
(frecuencia) que la componen.
• Determinar el ancho de cada intervalo

Rango: R = Xmáximo - Xmínimo


Nro de intervalos: k = 1 + 3,322 x log n (Regla de Sturgess)
rango r
Amplitud w 
k k
El valor de W debe ser redondeado por EXCESO a la cantidad
de decimales que presente los datos
ESTRUCTURA DE UNA TABLA DE FRECUENCIAS PARA UNA
VARIABLE CUANTITATIVA CONTINUA

[ L inf L sup > Xi fi hi Fi Hi


[ ]
< ]
< ]
< ]
< ]

Linf: Límite inferior del intervalo; Lsup: Límite superior del intervalo
Xi: Marca de clase o Punto medio del intervalo
fi: Frecuencia Absoluta Simple
Fi: Frecuencia Absoluta Acumulada
hi: Frecuencia Relativa Simple
Hi: Frecuencia Relativa Acumulada
EJERCICIO 2:
El jefe de la Oficina de Rentas de una municipalidad ha realizado un
estudio sobre los impuestos que pagan los vecinos del distrito. A
continuación se muestra los pagos de impuestos, en soles, de 48
viviendas elegidas al azar en el 2017.

Elabore la tabla de
frecuencias para la variable
Pago por impuestos
municipales año 2017.

145.1 151 159 195.6 196.9 202.6 204.9 206.1 206.5 208 208 209.3
216.3 225.9 227.1 231.2 234.8 238.4 239.9 241.1 242.9 244 247.7 249.5
252.5 257.1 259.2 262.5 265.2 271 286.7 288.1 289.1 291 291.9 294.5
303.6 305.8 315.4 315.5 317.2 320.2 324.8 331.1 331.7 344.6 346.7 351.1
RESULTADOS:
Distribución de contribuyentes según pago de impuesto
municipal (en soles)

Pago de impuestos Marca de clase fi hi Fi Hi


[145,1 ; 174,6] 159,85 3 0,0625 3 0,0625
]174,6 ; 204,1] 189,35 3 0,0625 6 0,1250
]204,1 ; 233,6] 218,85 10 0,2084 16 0,3334
]233,6 ; 263,1] 248,35 12 0,2500 28 0,5834
]263,1 ; 292,6] 277,85 7 0,1458 35 0,7292
]292,6 ; 322,1] 307,35 7 0,1458 42 0,8750
]322,1 ; 351,6] 336,85 6 0,1250 48 1,0000
Total 48
Fuente: Oficina de Rentas de la Municipalidad
EJERCICIO 3:
Se ha demostrado que el PH del café está
relacionado con la acidez percibida del café.
Un PH mayor a 4.5 y hasta 5.5 es el rango
preferido para que una taza de café sea
considerada “taza de excelencia”. A
continuación se presenta el PH de una
muestra de 40 tazas de café instantáneo
nescafé tradición producido por la empresa:
a) Describa la variable de interés y elabore la tabla de frecuencias
correspondiente para esta variable. Use la regla de Sturgess.
b) Indique el valor y la respectiva interpretación de la frecuencia absoluta
acumulada del cuarto intervalo
c) ¿Qué porcentaje de tazas de café instantáneo nescafé tradición serán
consideradas como “taza de excelencia”?

3.0 3.1 3.3 3.5 3.8 3.9 3.9 4.2 4.3 4.4
4.4 4.5 4.5 4.5 4.6 4.7 4.7 4.8 4.9 4.9
5.0 5.1 5.1 5.2 5.3 5.3 5.3 5.4 5.4 5.5
5.5 5.6 5.6 5.7 5.7 5.8 5.8 5.9 5.9 6.0
2013 - 1
EJERCICIO: Al realizar una encuesta se presentó la información …
Distribución de estudiantes UAC según número de cursos matriculados
Ciclo 2017-1
Nº Cursos fi hi pi
1 0.300
2 124 0.248
3 100
4 0.140
5 56 0.112
Total 500
Fuente: Asuntos académicos

a) Determine la Población, Muestra y Unidad elemental


b) Complete la tabla de frecuencias parcialmente mostrada
c) Interprete f4, h3 y p4
2013 - 1
EJERCICIO:

Se sabe que los gastos mensuales (en nuevos soles) en 50 hogares, por
concepto de pensiones educativas, tienen un valor mínimo de 297.86 y un
valor máximo de 867.72. Además, todos los datos cuentan con 2
decimales. Entonces:
a. Si se quisiera organizar estos datos en una tabla de frecuencias, se
debería trabajar con k = ___ intervalos.
b. Para calcular la amplitud del intervalo (w) se debe considerar ___ cifras
decimales y el valor de w sería: W = ____
Bibliografía
 Cuaderno de trabajo del curso
Material producido para el curso de Estadística Aplicada 1
Autor: Profesores del curso

ESTASÍSTICA APLICADA 1- EPE


COPYRIGHT © UPC 2018
TABLA DE FRECUENCIAS
PARA VARIABLE
CUANTITATIVA DISCRETA
Y CONTINUA
Temario
• Organización para datos de una variable
cuantitativa discreta :
• Tabla de frecuencias
• Diagrama de Bastones

• Organización para datos de una variable


cuantitativa continua :
• Regla de Sturgess
• Histograma, Polígono
Logro de la sesión
• Al finalizar la sesión, el estudiante interpreta los
resultados de tablas de distribución de frecuencia y
sus respectivos gráficos que construye con
rigurosidad.
1

Organización de datos para una


variable cuantitativa discreta
2013 - 1
EJERCICIO 1:
Los siguientes datos corresponden al número de capacitaciones recibidas
por los trabajadores de la empresa Creativa’s en lo que va del año:

Considerando la información mostrada, elabore un Gráfico de bastones


(líneas o varas)
Gráfico de Bastones, líneas o varas

• Primero debe construir la tabla de frecuencias para esta variable.


• Luego seleccione la columna de frecuencias fi.
• Haga clic en la opción Insertar de la barra de menú.
• Seleccione Gráfico de Líneas (2D), Líneas con marcadores y haga clic
en Aceptar,
• Doble clic sobre las líneas, seleccionar Sin línea
• Seleccionar Agregar elemento de gráfico, Líneas, Líneas de unión.

• Elabore una tabla de frecuencias para analizar la variable “Número de


capacitaciones recibidas”.
Distribución de trabajadores según número
de capacitaciones
16

Número de trabajadores
14 14
12
10 10
8
6
4
3 1
2 2
0
0
0 1 2 3 4 5

Número de capacitaciones
Fuente : Empresa Creativa’s
2

Organización de datos de una variable


cuantitativa continua
CASO PROPUESTO

La compañía Steel proveedora de barras de


acero para la construcción, ha introducido
cambios en su proceso de producción y
analiza la resistencia a la tracción de cierto
tipo de barras que actualmente produce. Para
cumplir este propósito toma una muestra al
azar y somete las barras a prueba, obteniendo
los resultados que se muestran a
continuación:

67.92 69.07 69.12 69.4 69.4 69.62 69.98 70.13 70.24 70.8 70.94 71.13
71.43 71.54 71.62 71.81 72.52 72.57 72.83 72.88 72.98 73.09 73.14 73.29
74.42 74.78 74.84 75.12 75.27 75.96 76.14 76.18 76.67 78.77 80.87 81.65

Variable: Resistencia a la tracción (kg/cm2)


Tipo: Cuantitativa continua
Escala: Razón
Considerando el caso propuesto:
Construir una tabla de frecuencias usando como información datos no agrupados

67.92 69.07 69.12 69.4 69.4 69.62 69.98 70.13 70.24 70.8 70.94 71.13
71.43 71.54 71.62 71.81 72.52 72.57 72.83 72.88 72.98 73.09 73.14 73.29
74.42 74.78 74.84 75.12 75.27 75.96 76.14 76.18 76.67 78.77 80.87 81.65

n = 36 1. Determinar el Rango: R = Xmáx - Xmín

Xmín = 67.92
2. Determinar el número de intervalos: K= 1 + 3.322*log(n)
Xmáx = 81.65
3. Determinar la amplitud del intervalo: W = R / K
R = Xmáx – Xmín = 13.73

K = 1 + 3.322*log( 36 ) = 6.17 ≈ 6

W = 13.73 / 6 = 2.2883 ≈ 2.29


Número de intervalos: K = 6
Amplitud de intervalos: W = 2.29

[ L inf L sup > Xi fi Fi hi Hi


[ 67.92 70.21 ] 69.065 8 8 0.222 0.222

< 70.21 72.50 ] 71.355 8 16 0.222 0.444

< 72.50 74.79 ] 73.645 10 26 0.278 0.722

< 74.79 77.08 ] 75.935 7 33 0.194 0.916

< 77.08 79.37 ] 78.225 1 34 0.028 0.944

< 79.37 81.66 ] 80.515 2 36 0.056 1.000

67.92 69.07 69.12 69.4 69.4 69.62 69.98 70.13 70.24 70.8 70.94 71.13
71.43 71.54 71.62 71.81 72.52 72.57 72.83 72.88 72.98 73.09 73.14 73.29
74.42 74.78 74.84 75.12 75.27 75.96 76.14 76.18 76.67 78.77 80.87 81.65
Histograma de Frecuencias:

• Primero debe construir la tabla de frecuencias para esta variable.


• Luego seleccione la columna de frecuencias fi.
• Haga clic en la opción Insertar de la barra de menú.
• Seleccione Gráfico de columnas (2D), primera opción,
• Doble clic sobre Diseño rápido y elija la opción Diseño8
• Configurar títulos y eje horizontal.

• Elabore el histograma de frecuencias para analizar la variable


“Resistencia a la tracción”.
Distribución de barras de acero según Resistencia a
la tracción
12

Porcentaje de barras de acero


10
10

8 8
8
7

2
2
1

0
67.92 - 70.21 70.21 - 72.5 72.5 - 74.79 74.79 - 77.08 77.08 - 79.37 79.37 - 81.66

Resistencia a la tracción
Fuente: Steel S.A.
Polígono de Frecuencias:

• Primero debe construir la tabla de frecuencias para esta variable.


• Luego agregar una fila adicional en la primera fila con frecuencia cero y
otra fila al final de la tabla con frecuencia cero.
• Calcular la marca de clase de estas nuevas filas
• Seleccione la columna fi, Insertar Gráfico de líneas (2D), primera opción,
• Doble clic sobre Diseño rápido y elija la opción Diseño 10
• Configurar títulos y eje horizontal.

• Elabore el polígono de frecuencias para analizar la variable “Resistencia a


la tracción”.
Distribución de barras de acero según su
Resistencia a la tracción
12
10
N° de Barras de acero
10
8 8
8 7
6
4
2
2 1
0 0
0
66.775 69.065 71.355 73.645 75.935 78.225 80.515 82.805

Fuente: Steel S.A. Resistencia a la tracción


Ejercicio propuesto 1:

Una empresa proveedora de ladrillos para la


construcción, analiza la resistencia a la
compresión de cierto tipo de ladrillos fabricados
especialmente para una construcción. El
ingeniero responsable selecciona una muestra de
ladrillos y los somete cada uno de ellos a un
ensayo de resistencia a la compresión (kg/cm2).
Los resultados se muestran a continuación:

101.2 101.3 101.6 101.9 102.4 102.5 102.9 102.9 103.3 103.7 103.8 103.9
103.9 104 104 104.3 104.3 104.4 104.6 104.7 104.9 105 105.3 105.6
105.7 105.8 105.9 105.9 106.1 106.2 106.2 106.3 106.3 106.5 106.7 107.1
107.2 107.2 107.7 107.8 107.9 107.9 107.9 108 108.4 108.4 109 110.6

Utilice la información obtenida para construir una tabla de frecuencias.


Ejercicio propuesto 2:

Edificaciones B&B, inspeccionará los sistemas


eléctricos en varias plantas del sector
industrial. La detección temprana y confiable
de daños en componentes de sistemas
relevantes a la producción es esencial para
poder garantizar la seguridad y confiabilidad
del sistema. Estudios previos determinan que
la temperatura en los sistemas eléctricos
debe ser monitoreada permanentemente.
Edificaciones B&B debe emitir un informe acerca de la temperatura (°F) en los
sistemas eléctricos para lo cual Ud. debe presentar primero una tabla de frecuencias.

77.09 77.422 78.138 79.9 80.475 80.715 81.155 81.764 82.785 82.819 82.933
83.117 83.216 83.22 83.393 83.542 84.026 84.378 84.776 84.997 85.005 85.776
85.852 86.932 86.953 87.136 87.627 88.258 90.614 90.649 91.072 92.045 92.75
Material producido para el curso de Estadística Aplicada 1
Autor: Profesores del curso

ESTASÍSTICA APLICADA 1- EPE


COPYRIGHT © UPC 2018
ESTADÍSTICA APLICADA I

Gráfico para dos variables cualitativas


Diagrama de Pareto
1
Organización de datos
cualitativos:
Gráfico para
Dos variables cualitativas
Recomendaciones para títulos de tablas y gráficos de dos variables
cualitativas:

La tabla de doble entrada y su gráfico deben tener el mismo título. Una manera
ordenada de presentarlo es teniendo en cuenta si la tabla de doble entrada
corresponde al total general o si ella corresponde al total de fila o al total de columna

Si la tabla o gráfico corresponde al total general entonces el título debe incluir las dos
variables en estudio separadas por la letra Y. El orden de las variables es indistinto.
Si la tabla o gráfico corresponde al total de fila 100% o columna 100%, el título incluye dos
palabras claves: según y por, donde el según determina la variable que va en la leyenda y
el por la variable que totaliza el 100%.
Ejercicios:
Para desarrollar los ejercicios propuestos debe usar la base de datos
publicada en el Aula Virtual: Base Datos Guia Excel
• Elabore una tabla de frecuencias y presente un gráfico adecuado para
analizar en forma conjunta las variables “Función en la empresa” y
“Género”
• Elabore un gráfico adecuado para representar “Función en la empresa”
por “Género”
2

Diagrama de Pareto
Diagrama de Pareto
Vilfredo Pareto (1848-1923)

El diagrama de Pareto es una representación gráfica que


permite identificar y seleccionar los aspectos prioritarios
que hay que tratar en un determinado problema.
Secuencia para la construcción del
gráfico de Pareto:
Ejemplo:
La siguiente tabla muestra información ordenada de Defensa Civil sobre los
defectos observados con mayor frecuencia en los puentes vecinales construidos
en estructura de madera de cierta localidad del interior del país:

Defectos fi hi Hi Hi %
Pandeos y rajadura 40 0.32 0.32 32
Pudrimientos de las piezas 30 0.24 0.56 56
Efectos de desgaste 20 0.16 0.72 72
Deformaciones 15 0.12 0.84 84
Ataques de insectos 10 0.08 0.92 92
Acción de fuego 5 0.04 0.96 96
Otros 5 0.04 1 100
TOTAL 125 1

Fuente: Defensa Civil


Diagrama de Pareto
Distribución de puentes vecinales según
defecto reportado
Ejercicio:
“Choripan” es una empresa dedicada a la fabricación de embutidos cárnicos.
Su proceso de producción se enfoca en mejorar y optimizar sus productos
para que de esta forma, puedan cumplir con los estándares del mercado e
incluso superarlos. La empresa está interesada en identificar los problemas
principales que se pueden encontrar en la elaboración de embutidos crudos
curados. En base a la siguiente información construya la tabla y el diagrama
de Pareto:

PROBLEMAS EN EL PROCESO DE PROBLEMAS EN EL PROCESO DE FABRICACIÓN DEL


FABRICACIÓN DEL CHORIZO
CHORIZO
Problema más importante fi Problema más
Embarrado 11
fi hi Fi Hi
importante
Embutición 20
Nitrificación 12
Otros 10
Sabor 7
Textura 18

 PARETO EN YOUTUBE: https://www.youtube.com/watch?v=3mPylwOnwPs


Conclusiones:

✓ Para construir la tabla de Pareto hay que ordenar las


frecuencias de mayor a menor.
✓ La categoría “Otros” siempre va al final pues representa
un sin número de categorías con muy bajas frecuencias.
✓ Pareto es un técnica que busca identificar los principales
problemas para enfrentarlos y corregirlos.
✓ Para determinar quienes son los principales problemas se
aplica la regla 80%-20% o basta que superen el 50% al
menos dos categorías.
Bibliografía
 PARETO EN YOUTUBE: https://www.youtube.com/watch?v=3mPylwOnwPs
 Video “Año Internacional de la estadística” http://youtu.be/O_UeYczBbPg
 Diario Gestión http://gestion.buscamas.pe/encuestas
 Cuaderno de Trabajo del curso
Material producido para el curso Estadística Aplicada 1
Autor: Profesores del curso

ESTADÍSTICA APLICADA 1- EPE


COPYRIGHT © UPC 2018
ESTADÍSTICA APLICADA I

Medidas de tendencia central


Medidas de asimetría
Medidas de posición
Logro de la sesión
• Al término de la sesión, el estudiante analiza los
datos usando las medidas de tendencia central,
asimetría, posición y dispersión siendo riguroso
en el cálculo.
MEDIDAS DE TENDENCIA
1

CENTRAL
Media, Mediana, Moda, Media ponderada
Medidas de Tendencia Central
Localizan el centro de una distribución. Indican el valor alrededor del cual
tienden a concentrarse las demás observaciones.
Se pretende conseguir un valor representativo del conjunto total de datos
que se analiza

Media Mediana Moda

Posición Frecuencia
X 
x i
El valor que se presenta con
n mayor frecuencia según:
fi, hi o pi
Media o Promedio
Datos

No agrupados Agrupados

n
V. Discreta V. Continua
x i
x i 1
k k
n
 xi f i k  i fi
x '
k
x i 1
  xi hi x i 1
  xi' hi
n i 1 n i 1

En Excel, usaremos la función =PROMEDIO(DATOS)


Ejemplo 1
Considerando la siguiente información, calcule el valor medio o
promedio.
Distribución de computadoras según
número de monitores con falla

Número de fi hi%
monitores
con falla
0 30 60%
1 10 20%
2 5 10%
3 3 6%
4 2 4%
Total 50 100.00%

Fuente: Área de mantenimiento


Mediana (datos no agrupados)
Es el valor que ocupa la posición central una vez que los datos están ordenados
de menor a mayor. La mediana es el valor tal que aproximadamente el 50% de
las observaciones son menores o iguales a su valor. Se denota por Me.

Número de datos: n

es par es impar

𝑿 𝒏 + 𝑿(𝒏+𝟏) 𝑴𝒆 = 𝑿 𝒏+𝟏
𝟐 𝟐 ( 𝟐 )
𝑴𝒆 =
𝟐

En Excel, usaremos la función =MEDIANA(DATOS)


Ejemplo 2 Halle la mediana para los siguientes datos:

Elemento: 1 colaborador de la empresa Sanyo


Variables: Número de piezas ensambladas por día
Datos: 2, 2, 2, 2, 2, 2, 3, 3, ….., 5, 5, 6 Datos no agrupados

Distribución de trabajadores según


número de piezas ensambladas
Número de
piezas fi hi%
ensambladas
2 6 20.00% Datos
3 8 26.67% agrupados
4 12 40.00%
5 3 10.00%
6 1 3.33%
Total 30 100.00%
Fuente: Sanyo – Área de producción
Moda
Para un conjunto de datos, la moda es el valor que se presenta con mayor
frecuencia

Xi fi Ejemplo:
5 Xi : Número de tardanzas de los trabajadores.
0
1 3
Interpretación:
2 12
El número de tardanzas más frecuente de
los trabajadores es 2 veces al mes.
3 1
4 2

En Excel, use la función =MODA(DATOS) o =MODA.VARIOS(DATOS)


Ejemplo 3

Interpretación
 El servicio solicitado con mayor frecuencia en la empresa de telefonía Movilnet es la
internet.
Ejemplo 4 Halle la moda para los siguientes datos:

Elemento: 1 trabajador de la empresa Sanyo


Variables: Número de piezas ensambladas por día
Datos: 2, 2, 2, 2, 2, 2, 3, 3, ….., 5, 5, 6 Datos no agrupados

Distribución de trabajadores según


número de piezas ensambladas
Número de fi hi%
piezas
ensambladas
2 6 20.00%
3 8 26.67%
Datos agrupados
4 12 40.00%
5 3 10.00%
6 1 3.33%
Total 30 100.00%
Fuente: Sanyo – Área de producción
Características:
Media Mediana Moda

Fácil de Calcular Usa ordenación No siempre es


ascendente único valor
(subjetiva)
Afectada por los No se ve No se ve afectada
valores extremos afectada por los valores
Se calcula en por los valores extremos
variables extremos Se calcula para
cuantitativas Se calcula en cualquier tipo
variables variable
cuantitativas, y
cualitativas
escala ordinal.
Media ponderada
Donde:

Xw   ( x ).( w )
i i xi  valor de las observaciones
w i wi  pesos o ponderaciones

Se usa cuando las observaciones no tienen la misma importancia.

Ejemplo: Considere la siguiente información y determine el promedio final

Evaluación Ponderación Nota obtenida


Promedio de PC 20% 13.75
Trabajo Final 15% 15
Evaluaciones de Laboratorio 25% 14.5
Examen Final 40% 16
Ejemplo 5
• Una fábrica produce pernos en tres turnos diarios: En el turno de la
mañana trabajan 18 máquinas, en el turno tarde 15 máquinas y en el
turno noche 12 máquinas. Las máquinas que están en mantenimiento
en un turno trabajan en forma alternada en los otros turnos. Las
máquinas del turno mañana produce en promedio 435 pernos, las de la
tarde 418,6 y de noche 396,7 pernos. ¿Cuántos pernos en promedio
produce una máquina de esta fábrica en un día?
Conclusiones:
• Las medidas de tendencia central permiten resumir en un valor la
tendencia de las observaciones.
• La ventaja de la mediana sobre la media es que es más
representativa cuando hay puntos discordantes (valores extremos).
• Sólo la moda puede ser calculada para variables cualitativas y
variables cuantitativas.
• La mediana puede calcularse para variables cuantitativas y variables
cualitativas medidas en escala ordinal.
• La media ponderada es usada para resumir datos de una variable,
cuando ésta es afectada por pesos o ponderaciones.
• La interpretación de la moda implica la expresión de “el valor más
frecuente” no el uso de “la mayoría de los casos”.
2

Medidas de asimetría
Formas de una distribución:

Datos
Simétrica o sesgo nulo concentrados en
el centro.
Media = Mediana = Moda

Datos
Asimétrica negativa o concentrados en
sesgo izquierdo los valores más
grandes.
Media < Mediana < Moda

Datos
Asimétrica positivo o
sesgo derecho concentrados en
los valores más
Media > Mediana > Moda
pequeños.
Ejemplo 6
• Se tomo una muestra de 18 estudiantes de colegios públicos y se
calculó las medidas de tendencia central sobre la variable edad.
Los resultados fueron los siguientes:
ഥ = 16,25 años
𝒙 me = 16 años mo = 15 años
¿Qué tipo de asimetría presenta la variable edad?
¿Qué significado puede tener este asimetría?
• Se tomó una muestra de 17 estudiantes de colegios privados y se
calculó las medidas de tendencia central sobre la variable edad.
Los resultados fueron los siguientes:
ഥ = 15,7 años
𝒙 me = 16 años mo = 16,25 años
¿Qué tipo de asimetría presenta variable edad? ¿Qué significa?
3

Medidas de posición
Estaturas de jugadores:

¿Cuál es la estatura mínima a partir del cual se encuentra el 20% de los


jugadores con mayores estaturas?

20%

estatura mínima
¿Qué medida estadística debemos utilizar?
Medidas de Posición o Cuantiles
Son valores que determinan la posición de un dato respecto a los demás en
una serie y que previamente han sido ordenados de menor a mayor

Los percentiles dividen un conjunto de datos en 100 partes porcentualmente


iguales.

Dado un percentil Pk, el K% de los datos son menores o iguales al valor de


Pk y el otro (100-k)% superiores al valor de Pk

En Excel, usaremos la función =PERCENTIL.EXC(datos; k/100)


Cuartiles dividen un conjunto de datos
en 4 partes porcentualmente iguales.
Cada parte contiene el 25% de la
información.

Se denotan por Q1, Q2 , Q3.

Deciles dividen un conjunto de datos en


10 partes porcentualmente iguales. Cada
parte contiene el 10% de la información.

Se denotan por D1, D2, ... , D8 , D9.


Percentiles para datos no agrupados:
• Ordene los datos de manera ascendente: X1, X2, X3, …..Xn
• Calcule la posición i del percentil k:

k n  1 E: parte entera
i  E, d
100 d: parte decimal
• Calcule el percentil k:

Pk  X ( E )  0, d * ( X ( E 1)  X ( E ) )

Ejemplo:
Después de realizar un estudio, se obtuvo que en el 45% de las
obras de instalación eléctrica se demoran más de 8.7 días. Entonces
8.7 es el valor del percentil ………….
Ejemplo:

Se eligió una muestra de 12 obras y se obtuvo los tiempos (días) de


demora en la instalación eléctrica:
12; 15; 20; 12; 10; 18; 17; 15; 15; 08; 10; 16
Halle:
a) El tiempo mínimo de instalación para considerar el 20% de obras en
las que se empleó mayor tiempo.
b) El tiempo máximo de instalación para considerar el 20% de obras
en las que se empleó menor tiempo.
Bibliografía
 Enlace encuestas.com
http://www.encuestas.com.pe/encuesta-aprobacion-presidencial-gfk-abril-2014/
 Diario Gestión
http://gestion.pe/economia/cajamarca-y-su-debil-entorno-economico-2073242
 Publicación digital INEI
http://www.inei.gob.pe/media/MenuRecursivo/publicaciones_digitales/Est/Lib1157/libro.pdf
 Cuaderno de Trabajo del curso
Material producido para el curso de coloque aquí el nombre del curso
Autor: Profesores del curso

CE86 ESTADÍSTICA APLICADA 1- EPE


COPYRIGHT © UPC 2018
ESTADÍSTICA APLICADA I

Medidas de Dispersión
Diagrama de cajas
Logro de la sesión

• Al término de la sesión, el estudiante analiza los


datos usando las medidas de tendencia central,
dispersión, posición y asimetría, siendo riguroso
en el cálculo.
Producción diaria de atún

Local A Local B

ഥ𝑨 = 2500 und.
𝒙 ഥ𝑩 = 2500 und.
𝒙

Conservas de atún producidas diariamente según local de producción.

Local A

Local B

Producción de atún

¿En cuál de los dos locales la producción es más


dispersa?
1

Medidas de Dispersión
Medidas de dispersión
Es la medida de dispersión más simple usada
especialmente para pocos datos no agrupados.
1. Rango: R = Xmáx - Xmín Mide la dispersión del 100% de datos

Usado especialmente en el caso de


2. Rango Intercuartílico:
datos con valores extremos. Mide la
RIC = P75 – P25 dispersión del 50% de datos centrales

3. Varianza: 𝜎 2 o S2 y Es el más conocido con propiedades


Desviación Estándar:  o S usadas en Estadística Inferencial.

4. Coeficiente de Mide la dispersión relativa respecto a la


variación: CV. media aritmética.
Rango ( R ) R = x (máximo) - x (mínimo )

Ejemplo 2:

Se ha medido la resistencia a la deformación de tubos circulares de dos


marcas A y B. Las primeras mediciones obtenidas son las siguientes:

Marca Resistencia a la deformación (kN)


Marca A 96 102 104 108 126 128 150 156
Marca B 114 111 128 114 83 125 121 121

Descriptivo Marca A Marca B


Mínimo
Máximo
Rango

Interpretación : El 100% de las observaciones presenta una variación de …..


RANGO INTERCUARTÍLICO (RIC)

Es la diferencia entre el Cuartil 3 (Q3 = P75 ) y el Cuartil 1 (Q1= P25).

RIC = Q3 – Q1

Como se puede observar este valor considera la variación del 50% de las
observaciones centrales.
La Varianza:
Esta medida es la más utilizada porque considera al total de datos de la
muestra.
Se define como el promedio de los cuadrados de las distancias de cada dato a
la media aritmética.

PARA DATOS SIN AGRUPAR:


Parámetro: N

 Xi   
2
Varianza Poblacional: σ2
V X  2  i 1

PARA DATOS SIN AGRUPAR:


Estadístico: n

 X i  X
2
Varianza Muestral: S2
S2  i 1

n 1
Varianza y desviación estándar para datos agrupados

Datos cuantitativos
Datos discretos continuos o agrupados en
intervalos
𝑛 / 2
2
2
σ𝑖=1 𝑥𝑖 − 𝑥ҧ 𝑓𝑖 σ𝑛𝑖=1 𝑥î − 𝑥ҧ 𝑓𝑖
Muestral 𝑆 =
𝑛−1 𝑆2 =
𝑛−1

2
2
σ𝑁 2
𝑖=1 𝑥𝑖 − 𝜇 𝑓𝑖 σ𝑁
𝑖=1
/
𝑥î −𝜇 𝑓𝑖
Poblacional 𝜎 =
𝑁 𝜎2 =
𝑁
Ejemplo 3:
Para la siguiente tabla de frecuencias calcular: varianza, desviación
estándar y coeficiente de variación:
X : Tiempo utilizado para ensamblar un componente
electrónico (50 ensambles)
Usar la calculadora científica Casio - Natural

HORAS Xi fi
2,8 – 3,3 3,05 2
3,3 – 3,8 3,55 6
3,8 – 4,3 4,05 10
4,3 – 4,8 4,55 17
4,8 – 5,3 5,05 8
5,3 – 5,8 5,55 5
5,8 – 6,3 6,05 2
TOTAL 50

https://www.youtube.com/watch?v=9ql-vTM6gq0
Propiedades de la varianza

Si K es una constante, X e Y son variables:

1. V(X)  0

2. V(K ) = 0

3. V(K X ) = K2 V(X)

4. V(K ± X) = V(X)

5. V( X + Y) = V(X) + V(Y) Si X e Y son variables


V( X - Y) = V(X) + V(Y) independientes
COEFICIENTE DE VARIACIÓN:

Es una medida de dispersión relativa, sirve para comparar las


dispersiones de dos o más grupos de datos. normalmente se da
en porcentaje.

S
CV(X)  x100%
X

El CV. es útil para comparar dos o mas grupos de datos con


diferente media e inclusive con diferentes unidades de medida,
como ejemplo valores monetarios en soles y dólares.
Aplicación del Coeficiente de Variación

Analizar comparativamente los sueldos de los trabajadores de


una empresa de según su categoría.

Desv. Estándar
Categoría Media X C.V
(S)
Directivos 820 3500,0
Empleados 630 2100,0
Operarios 980 1050,0

Analizando:
CV(direc.) < CV(empl) < CV (operar.)
Los sueldos de los operarios son los más heterogeneos.
Ejemplo 4:
Se tiene cuatro marcas de bombillas A, B, C y D. Se presenta a
continuación la duración (en días) registrada de cierto número de
bombillas de cada marca.

Marca A: duración registrada en días: 5; 10; 12; 13; 18


Marca B Marca C
Duración No. de Duración No. De
(días) bombillas (días) bombillas
3 2 0–5 4
11 4 5 – 10 8
15 3 10 – 15 12
20 1 15 – 20 2

Marca D: duración registrada en días: 11; 12; 12; 13; 14; 15; 15; 15; 15; 16

a. ¿Qué marca compraría usted y por qué? Sustente su respuesta a


base del análisis de las medidas de tendencia central y de
dispersión de los datos presentados.
b. Calcule para las marcas B y D: P25 P75. Interprete estos valores
Ejercicio:
La siguiente tabla corresponde a los pesos en gramos de dos muestras tomadas
aleatoriamente de cierto embutido que es elaborado por dos máquinas distintas (1 y
2). El muestreo se realizó dado que últimamente se han detectado ciertos problemas
por la diferencia del peso de los embutidos entre las dos máquinas, lo que ha
causado malestar entre los consumidores del producto.
Pesos (g) x´ f máquina A f máquina B
208,0 - 210,7 209,4 0 4
210,7 - 213,4 212,1 1 13
213,4 - 216,1 214,8 8 19
216,1 - 218,8 217,5 17 26
218,8 - 221,5 220,2 30 14
221,5 - 224,2 222,9 17 4
224,2 - 226,9 225,6 7 0
a. Calcule las medidas de dispersión de cada muestra.
b. Se considera que el peso de los embutidos es aceptable si su promedio es de 220
gramos y si la desviación estándar no supera los 3,1 gramos. Si sólo hay discrepancias
con el peso promedio se puede solucionar fácilmente pues las máquinas pueden
regularse desde su tablero de control. En cambio, si los pesos tienen valores muy
dispersos, es necesario reparar la máquina pues la causa es un excesivo desgaste. Con
estos criterios y los datos de las muestras, ¿qué le recomendaría hacer?
Autoevaluación:

Enunciado Verdadero Falso

Cuando el número de datos es grande se usa el


Rango.

La medida estadística que que permite comparar la


dispersión de dos o mas grupos de datos es el
coeficiente de variación.

La varianza poblacional se define como la suma de las


diferencias al cuadrado de cada valor respecto a su
media entre el numero de datos.

Dispersión es equivalente a valores extremos.


2

Diagrama de cajas
Diagrama de caja
Un diagrama de caja es una gráfica que describe la distribución de un
conjunto de datos tomando como referencia los valores de los
cuartiles como medida de posición y el valor del rango intercuartil
como medida de referencia para la dispersión.

Diagrama de caja de la Resistencia

20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39

Resistencia
Utilidad del Diagramas de cajas
Permite:
•Comparar las medianas de
dos o mas conjuntos de
datos.

•Observar el tipo de
distribución de los datos
(simétrica o asimétrica).

•Determinar la dispersión
en el 50% central de los
datos.

•Identificar la presencia de
valores extremos (datos
atípicos)
Pasos para la construcción de un diagrama de caja
1. Se calcula: Q1, Q2 , Q3 , RIC y 1,5RIC.
2. Se traza una línea de referencia horizontal o vertical (para la escala)
3. Se traza un rectángulo con los extremos en el primer y tercer cuartil y se traza
una recta vertical en la mediana.
4. Se dibujan los límites a 1,5 rango intercuartil de los cuartiles 1 y 3, Se considera
que los datos fuera de estos límites son atípicos. Li =Q1-(1,5)RIC; Ls=Q3 +(1,5)RIC.
5. Las líneas antes y después de las cajas se llaman bigotes, se traza desde los
extremos de la caja hasta el mínimo y máximo dentro de los límites inferior y
superior.
6. Se marcan con un asterisco los valores fuera de los límites (valores atípicos).

bigote
Ejemplo 5
Se desea analizar el consumo de gas natural en los hogares de un distrito
limeño, el gasto mensual en este combustible, en nuevos soles de 36
hogares se muestra a continuación.

20,6 21,2 21,8 23,5 24 24,3 24,5 24,6 24,6

24,6 24,8 24,9 25 25,2 25,4 26,3 27,1 27,3

27,5 28,3 28,4 28,6 29,3 29,4 29,5 29,5 29,5

29,6 30,4 30,4 30,9 31,5 32,4 32,5 32,7 37,6

Realice un diagrama de caja con esta información. Comente el resultado.


Solución:
Después de ordenar los datos:
1. Cálculos: Q1=24,60; Q2 = 27,40; Q3 = 29,575
RIC = 4,975; 1,5RIC = 7,4625
• LI = 24,60 – 7,4625 = 17,1375; LS = 29,575+7,4625 = 37,0375
2. Construcción de la escala:
Ejercicio:
Dos modos que usan los empleados de una fábrica para ir a trabajar
diariamente son A y B. A continuación vemos unas muestras de tiempos en
minutos de cada modo:

Modo A 28 29 32 37 33 25 29 32 45 34
Modo B 29 31 33 32 34 30 31 32 35 33

Trace un diagrama de caja para cada modo y en base a los resultados


obtenidos, ¿Qué modo de trasporte debe preferirse?, Explique sus razones.
Solución:
Evaluación:
Llene los espacios en blanco de tal manera que la proposición

Llene los espacios en blanco de tal manera que


Distribución del índice de calidad para productos fabricados en dos plantas
la proposición resultante resulte verdadera
200
1. El índice de calidad mediano es
aproximadamente______________ en
ambas plantas. 150
2. El índice de calidad en la planta A presenta

Indice de calidad
distribución asimétrica_______________
mientras que el índice de calidad en la
100
planta B presenta distribución
asimétrica____________________
3. La variabilidad del índice de calidad en el
50
50% central es mayor en la planta ______
que en la planta __________
4. El índice de calidad presenta valores
0
atípicos en la planta ______ mientras que Planta A Planta B
el índice de calidad no presenta valores Fuente: Elaboración propia
atípicos en la planta _______
Bibliografía
 Enlace encuestas.com
http://www.encuestas.com.pe/encuesta-aprobacion-presidencial-gfk-abril-2014/
 Diario Gestión
http://gestion.pe/economia/cajamarca-y-su-debil-entorno-economico-2073242
 Publicación digital INEI
http://www.inei.gob.pe/media/MenuRecursivo/publicaciones_digitales/Est/Lib1157/libro.pdf
 Cuaderno de Trabajo del curso
Material producido para el curso de coloque aquí el nombre del curso
Autor: Profesores del curso

CE86 ESTADÍSTICA APLICADA 1- EPE


COPYRIGHT © UPC 2016
ESTADÍSTICA APLICADA I

Probabilidades
Operaciones de eventos
Axiomas y Teoremas de Probabilidades
Logro de la sesión
• Al término de la sesión, el estudiante calcula las
probabilidades en situaciones de incertidumbre
para la toma de decisiones en casos reales del
ámbito de su profesión.
1

Experimento aleatorio, espacio


muestral, eventos
Si realizamos el siguiente experimento:

E: Lanzamiento de dos dados y


observamos los número que caen
hacia arriba

¿Podemos saber con exactitud qué números caerán?


¿Cuáles son los posibles números que podemos observar?
¿Por qué es considerado un experimento aleatorio?

Si dejamos caer una piedra,


¿puede considerarse un
experimento aleatorio?
Experimento aleatorio ( )

Es aquél que puede dar lugar a varios resultados, sin que


pueda ser previsible enunciar con certeza cuál de éstos va a
ser observado en la realización del experimento; no obstante,
a medida que el número de repeticiones aumenta, surgen
ciertos patrones en la frecuencia de ocurrencia de los
resultados.

Característica: Se repite indefinidamente, depende del azar


y se puede asociar a un modelo matemático.
Espacio muestral (Ω):
Es el conjunto de todos los posibles resultados del
experimento aleatorio. Puede ser Finito, Infinito
numerable o continuo.

Evento:
Es un subconjunto del espacio muestral. Para
simbolizar se utiliza las primeras letras del alfabeto,
ejemplo: A, B, C,…. etc.

Número de puntos muestrales n(A):


Es el número de elementos o de casos favorables del
evento A.
Ejemplos de experimento aleatorio
1 : Lanzar un dado

2 : Se lanzan dos monedas y se registra el resultado obtenido..

3 : Seleccionar un dispositivo electrónico y registrar si es defectuoso o no.

4: Observar el tiempo de vida de un artefacto eléctrico.

Ejemplos de espacio muestral


Evento Simple
Un evento se llama simple si consta de sólo un punto muestral.

Evento Compuesto
Es una colección específica de puntos muestrales.
Operaciones con eventos
Unión: AUB Intersección: AB
 


Complemento de un evento
AC
Eventos mutuamente excluyentes
Son aquellos eventos donde la ocurrencia de uno de ellos excluye la
ocurrencia del otro, esto no pueden ocurrir los dos a la vez.


A B
2

Probabilidad
¿Es posible que al enviar una señal,
ésta no llegue al destino final?

¿Qué tan probable es que no llegue


la señal?

¿Es poco probable o muy probable?


http://www.gingachile.cl/wp-
content/uploads/2010/10/ts2-300x266.png

¿Qué tan probable es que se termine


la construcción en el plazo fijado?

¿Es poco probable o muy probable?


http://cde.gestion2.e3.pe/ima/0/0/0/0/0/473.jpg
¿Qué es probabilidad?
El valor de las La probabilidad es la cuantificación de la
probabilidades, posibilidad de la ocurrencia de un
varía de 0 a 1 evento. Esto es, la medición de la
0 ≤ P(A) ≤ 1 posibilidad de que un evento ocurra.
Definición clásica de la probabilidad de un
evento

Sea un experimento aleatorio cuyo correspondiente espacio


muestral  está formado por un número n, finito, de posibles
resultados distintos y con la misma probabilidad de ocurrir,
entonces definimos la probabilidad de un evento A como
sigue:

n  A  número de casos favorables al evento A


P( A)  
n  número total de casos
Axiomas de la probabilidad

Sea  un espacio muestral y A un evento de . Una función P


definida en  es denominada una probabilidad si satisface los
siguientes axiomas:

 P(A)  0 para todo A 

 P() = 1.
 Sea {Aj}, Aj   , j=1,2,...,n una sucesión de eventos
mutuamente excluyentes, entonces:

P(A1  A 2  .........  A n )  P(A1 )  P(A 2 )  .......  P(A n )


Teorema:

Teorema: P( A)  P( A )  1
c

Teorema: P(A  B)  P(A)  P(B)  P(A  B)

En un espacio muestral finito la


suma de las probabilidades de
todos los eventos simples Ei debe
ser igual a 1.
Diagrama de Venn

P(ABC) P(BAC)
= P(A)-P(AB) =P(B)-P(AB)
= P(sólo A) = P(sólo B)

La probabilidad de la unión de
dos eventos cualesquiera P(AB)=P(A)+P(B)-P(AB)

A B Ω La probabilidad de la unión de dos


eventos mutuamente excluyentes

P(AB)=P(A)+P(B)
Ejemplo 1
Si A y B son eventos mutuamente excluyentes, y se conoce que
P(A) = 0,2 y que P(B) = 0,3.
Calcule:
P(AC) ; P(BC) ; P(Aᴜ B) ; P(A ∩ B) ; P(AC ∩ BC) ; P(AC ∩ 𝐵) ;
P(BC ∩ 𝐴 )

Ejemplo 2
Si A y B son eventos tal que: P(A) = 0.2; P(B) = 0.3 y P(A ∩ B) = 0.1
Calcule:
P(AC) ; P(BC) ; P(Aᴜ B) ; P(A ∩ B) ; P(AC ∩ BC) ; P(AC ∩ 𝐵) ; P(BC ∩
𝐴)
Ejemplo 3
En un lote de vehículos, hay 10 vehículos rojos, 20 vehículos
blanco y 12 vehículos azules.
Si extrae un vehículo al azar:
1. ¿cuál es la probabilidad que el vehículo sea rojo o azul?
2. ¿cuál es la probabilidad que el vehículo no sea blanco?

Ejemplo 4
Una fabrica trabaja con dos máquinas procesadoras A y B. La
probabilidad que la máquina procesadora A funcione
correctamente es 0,85 y que la máquina procesadora B
funciones correctamente es 0,78. La probabilidad de que al
menos uno de las dos funcione correctamente es 0,92.
Determine la probabilidad de que funcione correctamente sólo
una máquina.
Ejemplo 3 – Solución:
R: Vehículo rojo, B: Vehículo blanco, A: Vehículo azul
n(R)=10 n(B)=20 n(A)=12 n(Ω)=42
1. ¿cuál es la probabilidad que el vehículo sea rojo o azul?
Como son eventos mutuamente excluyentes la fórmula es:
P(R U A) = P(R) + P(A) = 10/42 + 12/42 = 0,5238
2. ¿cuál es la probabilidad que el vehículo no sea blanco?
P(BC)=1- P(B) = 1 – 20/42 = 0,5238
Ejemplo 4 – Solución:
A: Máquina procesadora A funciona correctamente. P(A)=0,85
B: Máquina procesadora B funciona correctamente. P(B)=0,78
P(AUB)=0,92 (al menos uno de las dos funcione correctamente)

Determine la probabilidad de que funcione correctamente sólo una máquina.


¿ P(B∩Ac) + P(A∩Bc ) ? (Sólo B + Sólo A)
Por teorema: P(B∩Ac) = P(B)-P(A∩B) y P(A∩Bc) = P(A)-P(A∩B)
Por teorema: P(AUB)=P(A)+P(B)-P(A∩B) despejamos P(A∩B)=0,85+0,78-0,92=0,71
Reemplazamos: P(B∩Ac) = P(B)-P(A∩B) = 0,78-0,71=0,07
P(A∩Bc) = P(A)-P(A∩B)=0,85-0,71= 0,14
Respuesta es 0,07+0,14=0,21
Ejemplo 5
Formalice en cada una de las
En la presenta tabla se muestra la preguntas
información resumida de los Si se elige a azar a un estudiante
estudiantes de Estadística Aplicada I calcule:
matriculados en el semestre 2017 II a. ¿Cuál es la probabilidad de que
sea de Ingeniería Industrial o
de acuerdo a la carrera y el colegio
no pertenezca a colegio
de procedencia. nacional?0.5155
b. ¿Cuál es la probabilidad que
Carrera Total
sea estudiante de Ingeniería
Colegio de A: B: C:
Ingeniería Ingeniería Empresarial? .1598
Procedencia Ingeniería c. ¿Cuál es la probabilidad de que
Informació Empresaria
Industrial
n l no sea de colegio nacional?
N: Nacional 140 65 155 360 .6289
C
N : Particular 280 85 245 610 d. ¿Cuál es la probabilidad de que
sea de Ingeniería empresarial y
Total 420 150 400 970 de colegio particular?.6125
Ejemplo 5 - Solución
Carrera Total

Colegio de A: B: C:
Ingeniería Ingeniería
Procedencia Ingeniería
Informació Empresaria
Industrial
n l
N: Nacional 140 65 155 360
C
N : Particular 280 85 245 610
Total 420 150 400 970
a. ¿ Cuál es la probabilidad de que sea de Ingeniería Industrial o no pertenezca a
colegio nacional?
P(A U Nc)=750/970
b. ¿Cuál es la probabilidad de que sea de estudiante de Ingeniería Empresarial?
P(C) = 400/970
c. ¿Cuál es la probabilidad de que no sea de colegio nacional?
P(NC) = 610/970
d. ¿Cuál es la probabilidad de que sea de Ingeniería empresarial y de colegio
particular?
P(C ∩ NC) = 245/970
Ejemplo de repaso
El 30% de los estudiantes en una universidad son limeños, el
10% estudian ingeniería, el 1% estudian ingeniería y son
limeños. Si se selecciona al azar un estudiante:

1. ¿Cuál es la probabilidad de que sea limeño o no


pertenezca a la facultada de ingeniería?
2. ¿Cuál es la probabilidad de que solo sea un estudiante
de ingeniería?
3. ¿Cuál es la probabilidad de que no sea limeño?
4. ¿Cuál es la probabilidad de que no sea limeño ni
estudiante de ingeniería?
Materiales y Recursos

 Cuaderno de trabajo
 ANDERSON, David R.; SWEENEY, Dennis; WILLIAMS, Thomas. 2012. Estadística para Negocios y
Economía, México, Editorial Cengage Learning,
 .http://jaguar.cgr.go.cr/content/dav/jaguar/Documentos/cgr/centro_conoc/pdfs/economia_est
adistica/estadistica-adm.pdf
Material producido para el curso:
Por equipo de profesores de Estadística Aplicada I
ESTASÍSTICA APLICADA 1- PREGRADO
COPYRIGHT © UPC 2016
ESTADÍSTICA APLICADA I

• Variable aleatoria discreta


• Función de probabilidad
• Valor Esperado y Varianza
• Distribuciones especiales discretas:
Distribución Binomial, Distribución
Hipergeométrica
Logro de la sesión

• Al finalizar la sesión, el estudiante calcula


probabilidades, valor esperado y varianza, asociadas
a distribuciones de probabilidad de variables
aleatorias discretas.
:

Variable aleatoria
Variable aleatoria discreta
Función de probabilidades
Valor esperado y varianza
Variable aleatoria
Sea E un experimento y Ω el espacio muestral asociado, una variable aleatoria es
una descripción numérica del resultado de un experimento aleatorio.
Una variable aleatoria asocia un valor numérico a cada uno de los resultados
experimentales, es una función que asigna valores numéricos a los elementos del
espacio muestral.
El rango de la variable aleatoria X es el conjunto RX de todos sus posibles valores.

S Reales

w
x=X(w)
RX

E: Lanzamiento de dos monedas X: Número de caras obtenidas


Ω = {ss, cs, sc, cc} Rx = 0,1,2
Tipos de variable aleatoria
Una variable aleatoria puede ser discreta o continua,
depende del tipo de valores numéricos que asume.

V.A.DISCRETA V.A.CONTINUA
Su rango es un conjunto

Finito o infinito Infinito no numerable


numerable de valores de valores

Ejemplos
• Número de artículos • Peso de una persona
producidos al mes. en kilogramos.
• Número de clientes que • Tiempo de fabricación
llegan a un banco. de un perno en minutos.
Ejemplos
Experimento Variable Valores posibles
Aleatoria

Realizar 100 llamadas X: Número de ventas Rx: 0,1,2,3,…..,100


de ventas logradas

Inspeccionar un lote Y: Número de artículos Rx: 0,1,2,3,4,5


de 50 artículos donde defectuosos
5 son defectuosos

Trasladarse de la UPC Z: Tiempo de traslado Rx: { t ∈ 𝑹 / 15 ≤ t ≤ 90}


al hogar. en minutos
Distribución de probabilidad de una variable
aleatoria discreta
La función de probabilidad de una
variable aleatoria discreta X es
representada por f.
Es denominada como “Distribución
de probabilidad”.
Esta función asigna a cada Toda función de probabilidad
valor de la variable debe cumplir:
aleatoria, la probabilidad de
que X asuma ese valor, esto • 𝑓 𝑥 = 𝑃 𝑋 = 𝑥 ≥ 0 ∀𝑥 ∈ 𝑅
es: f(x) = P(X = x). • σ𝑛𝑖=1 𝑓 𝑥𝑖 = 1

El Rango de una variable aleatoria discreta es


un conjunto finito o infinito numerable.
Distribución de probabilidad de una variable
aleatoria discreta

X x1 X2 … xn
p(X=xi) = f(xi) f(x1) f(x2) … f(xn)

Función de
probabilidad
Valor esperado y varianza

 El valor esperado y varianza de una variable aleatoria


discreta X, se definen por:
Donde:
 X =E  X    x f  x  𝜎𝑥2 = 𝑉 𝑋 = 𝐸 𝑋 2 − (𝐸 𝑋 )2
E  X 2    x 2 f  x 

 Sea g una función de la variable aleatoria


discreta X. El valor esperado de g(x) es:

E  g  x     g  xi  f  xi 
Ejemplo 1:
El Centro de Información ha registrado la siguiente tabla de
distribución de probabilidad para el número de libros por semana que
un estudiante solicita.
Número de libros por semana 0 1 2 3 4
Probabilidad f(x) 0,2 4b 2b 0,15 b/2

a. Determine el valor de la constante “b” para que f(x) sea una


función de probabilidad. Presente la tabla y la gráfica de
probabilidad.
b. Si se selecciona un alumno al azar, calcule la probabilidad de que
en una semana:
• Solicite dos libros.
• Solicite a lo más 3 libros.
• Solicite por lo menos 2 libros.
Propiedades: Valor esperado y varianza

Sean a y b constantes, X e Y variables aleatorias


independientes
 E[a] = a

 V[a] = 0

 E[aX] = a E[X]

 V[aX] = a2 V[X]

 E[aX ± bY] = a E[X] ± b E[Y]

 V[aX± bY] = a2 V[X] + b2 V[Y]


Ejemplo 2:
La demanda de un microprocesador Intel Celeron de 64 bits de proceso y 1 Mb
de memoria cache presenta la siguiente función de probabilidad:

Demanda 2000 3000 4000 5000 6000


Probabilidad 0,10 0,25 0,35 0,20 0,10

a. Elabore la gráfica correspondiente a la distribución de probabilidades de la


demanda.
b. Estime el valor esperado de la demanda y el coeficiente de variación.
c. El costo de fabricación del microprocesador es de 60 dólares y el precio de
venta es de 80 dólares, además los costos fijos ascienden a 10 mil dólares. Si
la compañía decide programar la producción de dicho componente
tomando exactamente el valor esperado de la demanda ¿cuál será la
utilidad esperada de la compañía?
Distribuciones especiales discretas
Distribución Binomial
Un experimento Binomial consiste de una serie de “n”
pruebas o ensayos fijados antes de realizar el experimento.

❖ Se realiza “n” pruebas o ensayos independientes entre


si.
❖ Las pruebas son idénticas y cada una puede resultar en
uno de dos resultados: Éxito (E) o Fracaso (F).
❖ La probabilidad nde(muestra)
éxito es constante de una prueba a
otra y se denota por p.

Si una variable aleatoria X tiene distribución Binomial:


Se denota X ~ B(n, p)
Distribución Binomial
Número de éxitos obtenidos al
VARIABLE realizar n ensayos.

PARÁMETROS nyp

f x   PX  x  C xn p x 1  p 
n x
FUNCIÓN DE
PROBABILIDAD x  0 ,1, 2 ,  , n

VALOR E(X) = np
ESPERADO

VARIANZA V(X) = np(1-p)


Ejemplo 1:
Acerotubo S.A. fabrica diariamente una
cantidad invariable de tubos de acero.
Los productos son fabricados
independientemente uno de otro. La
probabilidad de que un producto resulte
defectuoso es del 10%.

Calcule la probabilidad de que en una muestra de 15 tubos


elegidos al azar:
➢ 2 tubos sean defectuosos.
➢ A lo más tres tubos sean defectuosos.
➢ 10 tubos no sean defectuosos.
➢ Por lo menos 4 tubos no sean defectuosos.
Ejercicio propuesto:
Un agente de seguros de vida vende pólizas a cinco individuos todos de la
misma edad. De acuerdo con tablas actuales, la probabilidad de que un
individuo con esa edad viva 30 años o más es de 3/5. Uno de los cálculos
necesarios para hacer estimaciones de pagos de las primas de seguro es la
probabilidad de que un número determinado de asegurados de la misma
edad viva 30 años o más. De acuerdo al enunciado se pide que:

a. Determine la función de probabilidad y la tabla de probabilidades.


b. Calcule el valor esperado y la varianza.
c. Calcule la probabilidad:
• De que en la muestra de cinco individuos, dos de ellos vivan 30 años
o más.
• De que en la muestra de cinco individuos, vivan 30 años o más, entre
3 y 4 individuos.
• De que en la muestra de cinco individuos, vivan menos de 30 años,
por lo menos 1 individuo.
• De que en la muestra de cinco individuos, vivan menos de 30 años,
entre 1 y 4 individuos.
Distribución Hipergeométrica
El experimento consiste de una serie de n pruebas o ensayos
fijados antes de realizar el experimento.

❖ Se realiza n pruebas o ensayos independientes entre si.


❖ Las pruebas son idénticas y cada una puede resultar en uno de dos
resultados: Éxito (E) o Fracaso (F).
❖ La probabilidad de éxito NO es constante de una prueba a otra.

n (muestra)
Si una variable aleatoria X tiene distribución Hipergeométrica:
Se denota X ~ H (N, n, r)

N = Tamaño de población
n = Tamaño de muestra
r = Número de éxitos en la población
Número de éxitos obtenidos en
VARIABLE la muestra de n elementos.

PARÁMETROS N, n y r

Cxr CnNxr
FUNCIÓN DE f  x   P  X  x 
PROBABILIDAD CnN
x  max  0, n  r  N  , , min  r , n 

r
VALOR ESPERADO E X  n
N

r  r  N  n 
VARIANZA V X  n  1   
N  N   N 1 
Ejemplo 2:
Una compañía manufacturera utiliza un
mecanismo de control para realizar el
embarque de sus artículos por aduana. De
una caja de 25 artículos de los cuales hay 2
artículos defectuosos, se selecciona una
muestra de 4 artículos para verificar si tiene
algún artículo defectuoso.
Si se encuentra al menos un artículo defectuoso, la caja entera
se regresa para verificarla al 100%. Caso contrario, la caja se
embarca.

¿Cuál es la probabilidad que la caja se embarca?


Ejercicio propuesto:
Enigma Home Center en su sección de electrodomésticos tiene 9
congeladoras de liquidación de las cuales 4 tienen defectos. Una
cadena de restaurantes compra al azar 3 de ellas.
a. Defina la variable aleatoria de congeladoras defectuosas compradas
por la cadena de restaurantes y su distribución de probabilidad (con
sus parámetros)
b. Elabore la gráfica correspondiente.
c. Estime el valor esperado y la desviación estándar.
d. Calcule la probabilidad:
• De que en la muestra elegida haya 1 congeladora defectuosa.
• De que en la muestra elegida haya al menos 2 congeladoras
defectuosas.
• De que en la muestra elegida haya más de 2 congeladoras
defectuosas.
• De que en la muestra elegida haya entre 2 y 4 congeladoras
defectuosas.
• De que en la muestra elegida haya a lo más 1 congeladora no
defectuosa.
Conclusiones:
✓Una variable aleatoria discreta es una función que asigna valores
numéricos a los elementos del espacio muestral.
✓Hay dos tipos de variable aleatoria: discreta y continua, la diferencia
radica en el tipo de valores numéricos que asume la variable aleatoria.
✓El recorrido de la variable aleatoria discreta es un conjunto finito o
infinito numerable.
✓Toda función de probabilidad debe cumplir dos condiciones: f(x)≥0 y ∑
f(x)=1
✓La interpretación del valor esperado es: Si el experimento se repitiera
muchas veces, a la larga, el número promedio de “variable” es igual a
E(x).
ESTADÍSTICA APLICADA I

Probabilidad Condicional
Independencia de Eventos
Probabilidad Total
Teorema de Bayes
Logro de la sesión
• Calcular la probabilidad de un evento a partir de
probabilidades condicionadas (Probabilidad Total).
• Aplicar el “Teorema de Bayes” a un evento de
interés.
1

PROBABILIDAD CONDICIONAL
Probabilidad Condicional
Sean los eventos A y B  , y además se sabe que P(B) >0, entonces la
probabilidad de que ocurra A, dado que ya ocurrió B, se denomina
Probabilidad Condicional de A dado B; y se calcula mediante la siguiente
expresión:
P( A  B)
P( A B)  ; P( B)  0
P( B)

 Primer Axioma: 0  P(A / B)  1.


 Segundo Axioma: P( / B) = 1.

 Tercer Axioma: Para k eventos mutuamente excluyentes,


A1, ..., Ak se tiene que:

P A i B  
k k
 i1  i1 P( A i B)
Ejemplo 1
En una conferencia,
la siguiente forma:
los concurrentes se encuentran distribuidos de

Carrera V : Varon M : Mujer Total


I : Ingenieria 160 140 300
E : Educación 60 90 150
C : Contabilidad 180 70 250
Total 400 300 700
Si se elige una persona al azar, hallar la probabilidad:
a. Que sea varón.
b. Que sea mujer o no sea de Ingeniería .
c. Que sea de mujer y de Contabilidad.
d. Si es varón ¿cuál es probabilidad que sea de Educación?
e. Si no es de Ingeniería ¿cuál es probabilidad que sea una mujer de
educación?
Formalice en todos los casos.
Ejemplo 2
En el presente ciclo académico, en la facultad, se han
matriculados 1500 estudiantes, de los cuales 300 son del quinto
superior. El 45% de los estudiantes del quinto superior son
mujeres. Mientras que el 65% de los que no son del quinto
superior son mujeres.
a) Si se escoge al azar el expediente de un estudiante
matriculado para una entrevista personal y se comprueba que
es del quinto superior, ¿cuál es la probabilidad de que sea el
expediente de una mujer?
b) Si se escoge al azar el expediente de un estudiante
matriculado para una entrevista personal y es varón ¿cuál es la
probabilidad de que sea el expediente de un estudiante que está
en el quinto superior?
Solución
En el presente ciclo académico, en la facultad, se han matriculados
1500 estudiantes, de los cuales 300 son del quinto superior. El 45%
de los estudiantes del quinto superior son mujeres. Mientras que el
65% de los que no son del quinto superior son mujeres.

Género del Estudiante


Calificación del Estudiante Total
Hombre (H) Mujeres (M)
5to. Superior (Q) 165 135 300

No 5to.superior(QC) 420 780 1200

Total 585 915 1500

El experimento es  = {extraer un expediente}, y como existen 1500


estudiantes matriculados, n(  ) = 1500.

Se tiene dos eventos:


2

REGLA DE MULTIPLICACIÓN
INDEPENDENCIA DE EVENTOS
Regla de la multiplicación
Sean los eventos A y B  , con P(B)>0, entonces a
partir del teorema de probabilidad condicional se
cumple:

P( A  B)
P( A B) 
P( B) P( A  B)  P( A B)  P( B)
También:

P( A  B) P( A  B)  P( B A)  P( A)
P( B A) 
P( A)
Eventos independientes
Son aquellos eventos en los que la ocurrencia de un evento
no influye en la ocurrencia de otro u otros eventos.

Dados los eventos A y B independientes, entonces se


cumple que:
P(A/B) = P(A) P(B/A) = P(B)

Luego por el teorema de la multiplicación:

P(A  B) = P(A)xP(B)
Propiedades
Si los eventos A y B son independientes,
entonces también son independientes:

• A y Bc, es decir P(A Bc)=P(A)P(Bc)

• A c y B, es decir P(Ac  B)=P(Ac)P(B)

• Ac y Bc, es decir P(Ac  Bc)=P(Ac)P(Bc)

Nota
Estas propiedades se pueden generalizar a más
de dos eventos.
Ejemplo 4
En la fabricación de cierto producto se presenta el
defecto tipo 1 con una probabilidad de 0,01 y el
defecto tipo 2 con una probabilidad de 0,05. Si las
ocurrencias de los defectos en los productos son
independientes, calcule la probabilidad de que:

a. Un artículo tenga ambos defectos.


b. Un artículo solo el defecto 1.
c. Un artículo contenga solo un defecto.
d. No tenga ningún defecto.
Ejemplo 5
Un sistema está conformado por cinco componentes
que funcionan independientemente. La probabilidad
de que un componente funcione correctamente es
0,70.

a) Calcule la probabilidad de que al menos un


componente funcione correctamente. 0,99757

b) calcule la probabilidad de que al menos un


componente no funcione correctamente. 0,83193
Autoevaluación

Contestar verdadero (V) o falso (V) si los eventos A y B


son independientes y se sabe que P(A) = 1/3 y P(B) =
1/2 :
P(AB) 5/6 F
P(AUB) 2/3 V
P(ACBC) 1/3 V
P(ACUBC) 1/3 F
P(ACB) 1/3 V
Autoevaluación
• Sea A un evento cualquiera P(A) es negativo. F
• Si dos eventos A y B son mutuamente excluyentes F
entonces P(A n B) ≠ ᵠ .
• El experimento aleatorio se puede realizar muchas veces
• En Permutación se considera el orden. V
• Cuando se hace uso de las combinatorias se considera el V
orden.
• Cuando dos eventos A y B son mutuamente excluyentes F
entonces P(A u B) = P(A) + P(B) – P(A n B).
F
3

TEOREMA DE LA PROBABILIDAD TOTAL


TEOREMA DE BAYES
Partición del espacio muestral
Se denomina partición del espacio muestral Ω a una
colección de k eventos A1, A2, A3, ………, Ak que sean
mutuamente excluyentes y cuya unión es el espacio
muestral Ω, verificándose las siguientes condiciones:
1) P( Ai )  0, i  1,2,...k
2) Ai  A j   i  j
k 
3)  Ai  
i 1 A1 A2 … Ak
Probabilidad Total
Si k eventos A1, A2, A3, ... , Ak constituyen una
partición del espacio muestral Ω, entonces para
cualquier evento B de Ω:

A1 A2 … Ak

k k
PB   PB  A i    PA i  PB A i 
i 1 i 1
Árbol de probabilidades

PB A B PA  B  PA PB A


A
PA PA  B'  PA PB' A
PB' A 
B’

PB A' B PA'B  PA' PB A'


PA´
A’
PA'B'  PA' PB' A'
PB' A'
B’
Teorema de Bayes

Si k eventos A1, A2, A3, ... , Ak constituyen una


partición del espacio muestral Ω, entonces para
cualquier evento B de Ω:

PA i  B PA i PB A i 


PA i B   k
PB
 PA i  PB A i 
i 1
Ejemplo 1:
Tres máquinas: A, B y C, producen el 45%, 30% y 25%
respectivamente del total de las piezas producidas en una
fábrica. Los porcentajes de producción de defectuosos de
estas máquinas son del 3%, 4% y 5%.

a. Si seleccionamos una pieza al azar ¿cuál es la


probabilidad de que sea defectuosa?
b. Si tomamos al azar una pieza y resulta defectuosa ¿cuál
es la probabilidad de que haya sido producida por la
máquina B?
c. ¿Qué máquina tiene mayor probabilidad de haber
producido una pieza defectuosa?
Ejemplo 1 - Solución
Tres máquinas: A, B y C, producen el 45%, 30% y 25% respectivamente, del total de las
piezas producidas en una fábrica. Los porcentajes de producción de defectuosos de
estas máquinas son del 3%, 4% y 5%.

a. Si seleccionamos una pieza al azar ¿cuál es la probabilidad de que sea defectuosa?


b. Si tomamos al azar una pieza y resulta defectuosa ¿cuál es la probabilidad de que
haya sido producida por la máquina B?
c. ¿Qué máquina tiene mayor probabilidad de haber producido una pieza
defectuosa?

Solución:

a. P (D) : La probabilidad de que la pieza


elegida sea defectuosa, 0.30

por la probabilidad tenemos:

P(D) = P(A) . P(D/A) + P(B) . P(D/B) + P(C). P(D/C) =


= 0.45 . 0.03 + 0.30 . 0.04 + 0.25 . 0.05 =
= 0.038
b. Debemos calcular P(B/D). Por el teorema de Bayes:

P(B/D) = P(B) . P(D/B) = P(B) . P(D/B) =


P(A) . P(D/A) + P(B) . P(D/B) + P ( C ) . P(D/C) P(D)

= 0.30 . 0.04 = 0.316


0.038

c. Calculamos P(A/D) y P(C/D), comparamos con el valor de P(B/D) ya calculado.


Aplicando Bayes tenemos.

P(A/D) = P(A) . P(D/A) = 0.45 . 0.03 = 0.355


P(D) 0.038

P(C/D) = P(C) . P(D/C) = 0.25 . 0.05 = 0.329


P(D) 0.038
Ejemplo 2:
Una compañía de desarrollo urbano esta considerando la
posibilidad de construir un centro comercial en un sector de la
ciudad. Un elemento vital en esta consideración es un proyecto de
una autopista que une este sector con el centro de la ciudad.

Si el Consejo municipal aprueba esta autopista, hay una


posibilidad del 0,90 que la compañía construya el centro
comercial, en tanto que si la autopista no es aprobada, la
probabilidad que construya el centro comercial es del 0,20.
Basándose en la información disponible el presidente de la
compañía estima que hay una probabilidad de 0,60 de que
construyan la autopista.

a) ¿Cuál es la probabilidad de que la compañía construya el


centro comercial?
b) Dado que el centro comercial sea construido, ¿Cuál es la
posibilidad de que la autopista sea aprobada?
Sea A : La autopista ha sido aprobada
B : El centro comercial es construido.

P(B/A) =0.90 B P(A  B) = P(A) x P(B/A)

A Bc
P(A) = 0.60 P(Bc/A) = 0.10

P(B /Ac) = 0.20 B P(Ac  B) = P(Ac) x P(B/Ac)

Ac
P(Ac) = 0.40
Bc
P(Bc /Ac) = 0.80

a) P (B) = P(A) . P(B/A) + P(Ac) . P(B/Ac) = 0.60 . 0.90 + 0.40 . 0.20 = 0.62

b) P (A/B)= P(A). P(B/A) = 0.60 . 0.90 = 0.54/0.62 = 0.87


P(B) 0.62
Autoevaluación
Enigma Autoclean S.A. empresa de servicios de limpieza a automóviles, tiene 10
automóviles de fabricación europea y 15 de fabricación japonesa en espera de ser
atendidos en la mañana de un sábado. Debido al poco personal ese día, sólo
pueden ser atendidos 6 automóviles. Si los 6 se escogen al azar, responda lo
siguiente: ¿cuál es la probabilidad de que 3 sean de fabricación europea y los otros
3 sean japoneses?

El experimento aleatorio:

El Nº de elementos del espacio muestral:

Nº de elementos del evento:

Probabilidad de ocurrencia del evento anterior:


Materiales y Recursos

 Cuaderno de trabajo
 ANDERSON, David R.; SWEENEY, Dennis; WILLIAMS, Thomas. 2012. Estadística para Negocios y
Economía, México, Editorial Cengage Learning,
 .http://jaguar.cgr.go.cr/content/dav/jaguar/Documentos/cgr/centro_conoc/pdfs/economia_est
adistica/estadistica-adm.pdf
Material producido para el curso:
Por equipo de profesores de Estadística Aplicada I
ESTASÍSTICA APLICADA 1- PREGRADO
COPYRIGHT © UPC 2017
ESTADÍSTICA APLICADA I

• Variable aleatoria discreta


• Función de probabilidad
• Valor Esperado y Varianza
• Distribuciones especiales discretas:
Distribución Binomial, Distribución
Hipergeométrica
Logro de la sesión

• Al finalizar la sesión, el estudiante calcula


probabilidades, valor esperado y varianza, asociadas
a distribuciones de probabilidad de variables
aleatorias discretas.
:

Variable aleatoria
Variable aleatoria discreta
Función de probabilidades
Valor esperado y varianza
Variable aleatoria
Sea E un experimento y Ω el espacio muestral asociado, una variable aleatoria es
una descripción numérica del resultado de un experimento aleatorio.
Una variable aleatoria asocia un valor numérico a cada uno de los resultados
experimentales, es una función que asigna valores numéricos a los elementos del
espacio muestral.
El rango de la variable aleatoria X es el conjunto RX de todos sus posibles valores.

S Reales

w
x=X(w)
RX

E: Lanzamiento de dos monedas X: Número de caras obtenidas


Ω = {ss, cs, sc, cc} Rx = 0,1,2
Tipos de variable aleatoria
Una variable aleatoria puede ser discreta o continua,
depende del tipo de valores numéricos que asume.

V.A.DISCRETA V.A.CONTINUA
Su rango es un conjunto

Finito o infinito Infinito no numerable


numerable de valores de valores

Ejemplos
• Número de artículos • Peso de una persona
producidos al mes. en kilogramos.
• Número de clientes que • Tiempo de fabricación
llegan a un banco. de un perno en minutos.
Ejemplos
Experimento Variable Valores posibles
Aleatoria

Realizar 100 llamadas X: Número de ventas Rx: 0,1,2,3,…..,100


de ventas logradas

Inspeccionar un lote Y: Número de artículos Rx: 0,1,2,3,4,5


de 50 artículos donde defectuosos
5 son defectuosos

Trasladarse de la UPC Z: Tiempo de traslado Rx: { t ∈ 𝑹 / 15 ≤ t ≤ 90}


al hogar. en minutos
Distribución de probabilidad de una variable
aleatoria discreta
La función de probabilidad de una
variable aleatoria discreta X es
representada por f.
Es denominada como “Distribución
de probabilidad”.
Esta función asigna a cada Toda función de probabilidad
valor de la variable debe cumplir:
aleatoria, la probabilidad de
que X asuma ese valor, esto • 𝑓 𝑥 = 𝑃 𝑋 = 𝑥 ≥ 0 ∀𝑥 ∈ 𝑅
es: f(x) = P(X = x). • σ𝑛𝑖=1 𝑓 𝑥𝑖 = 1

El Rango de una variable aleatoria discreta es


un conjunto finito o infinito numerable.
Distribución de probabilidad de una variable
aleatoria discreta

X x1 X2 … xn
p(X=xi) = f(xi) f(x1) f(x2) … f(xn)

Función de
probabilidad
Valor esperado y varianza

 El valor esperado y varianza de una variable aleatoria


discreta X, se definen por:
Donde:
 X =E  X    x f  x  𝜎𝑥2 = 𝑉 𝑋 = 𝐸 𝑋 2 − (𝐸 𝑋 )2
E  X 2    x 2 f  x 

 Sea g una función de la variable aleatoria


discreta X. El valor esperado de g(x) es:

E  g  x     g  xi  f  xi 
Ejemplo 1:
El Centro de Información ha registrado la siguiente tabla de
distribución de probabilidad para el número de libros por semana que
un estudiante solicita.
Número de libros por semana 0 1 2 3 4
Probabilidad f(x) 0,2 4b 2b 0,15 b/2

a. Determine el valor de la constante “b” para que f(x) sea una


función de probabilidad. Presente la tabla y la gráfica de
probabilidad.
b. Si se selecciona un alumno al azar, calcule la probabilidad de que
en una semana:
• Solicite dos libros.
• Solicite a lo más 3 libros.
• Solicite por lo menos 2 libros.
Propiedades: Valor esperado y varianza

Sean a y b constantes, X e Y variables aleatorias


independientes
 E[a] = a

 V[a] = 0

 E[aX] = a E[X]

 V[aX] = a2 V[X]

 E[aX ± bY] = a E[X] ± b E[Y]

 V[aX± bY] = a2 V[X] + b2 V[Y]


Ejemplo 2:
La demanda de un microprocesador Intel Celeron de 64 bits de proceso y 1 Mb
de memoria cache presenta la siguiente función de probabilidad:

Demanda 2000 3000 4000 5000 6000


Probabilidad 0,10 0,25 0,35 0,20 0,10

a. Elabore la gráfica correspondiente a la distribución de probabilidades de la


demanda.
b. Estime el valor esperado de la demanda y el coeficiente de variación.
c. El costo de fabricación del microprocesador es de 60 dólares y el precio de
venta es de 80 dólares, además los costos fijos ascienden a 10 mil dólares. Si
la compañía decide programar la producción de dicho componente
tomando exactamente el valor esperado de la demanda ¿cuál será la
utilidad esperada de la compañía?
Distribuciones especiales discretas
Distribución Binomial
Un experimento Binomial consiste de una serie de “n”
pruebas o ensayos fijados antes de realizar el experimento.

❖ Se realiza “n” pruebas o ensayos independientes entre


si.
❖ Las pruebas son idénticas y cada una puede resultar en
uno de dos resultados: Éxito (E) o Fracaso (F).
❖ La probabilidad nde(muestra)
éxito es constante de una prueba a
otra y se denota por p.

Si una variable aleatoria X tiene distribución Binomial:


Se denota X ~ B(n, p)
Distribución Binomial
Número de éxitos obtenidos al
VARIABLE realizar n ensayos.

PARÁMETROS nyp

f x   PX  x  C xn p x 1  p 
n x
FUNCIÓN DE
PROBABILIDAD x  0 ,1, 2 ,  , n

VALOR E(X) = np
ESPERADO

VARIANZA V(X) = np(1-p)


Ejemplo 1:
Acerotubo S.A. fabrica diariamente una
cantidad invariable de tubos de acero.
Los productos son fabricados
independientemente uno de otro. La
probabilidad de que un producto resulte
defectuoso es del 10%.

Calcule la probabilidad de que en una muestra de 15 tubos


elegidos al azar:
➢ 2 tubos sean defectuosos.
➢ A lo más tres tubos sean defectuosos.
➢ 10 tubos no sean defectuosos.
➢ Por lo menos 4 tubos no sean defectuosos.
Ejercicio propuesto:
Un agente de seguros de vida vende pólizas a cinco individuos todos de la
misma edad. De acuerdo con tablas actuales, la probabilidad de que un
individuo con esa edad viva 30 años o más es de 3/5. Uno de los cálculos
necesarios para hacer estimaciones de pagos de las primas de seguro es la
probabilidad de que un número determinado de asegurados de la misma
edad viva 30 años o más. De acuerdo al enunciado se pide que:

a. Determine la función de probabilidad y la tabla de probabilidades.


b. Calcule el valor esperado y la varianza.
c. Calcule la probabilidad:
• De que en la muestra de cinco individuos, dos de ellos vivan 30 años
o más.
• De que en la muestra de cinco individuos, vivan 30 años o más, entre
3 y 4 individuos.
• De que en la muestra de cinco individuos, vivan menos de 30 años,
por lo menos 1 individuo.
• De que en la muestra de cinco individuos, vivan menos de 30 años,
entre 1 y 4 individuos.
Distribución Hipergeométrica
El experimento consiste de una serie de n pruebas o ensayos
fijados antes de realizar el experimento.

❖ Se realiza n pruebas o ensayos independientes entre si.


❖ Las pruebas son idénticas y cada una puede resultar en uno de dos
resultados: Éxito (E) o Fracaso (F).
❖ La probabilidad de éxito NO es constante de una prueba a otra.

n (muestra)
Si una variable aleatoria X tiene distribución Hipergeométrica:
Se denota X ~ H (N, n, r)

N = Tamaño de población
n = Tamaño de muestra
r = Número de éxitos en la población
Número de éxitos obtenidos en
VARIABLE la muestra de n elementos.

PARÁMETROS N, n y r

Cxr CnNxr
FUNCIÓN DE f  x   P  X  x 
PROBABILIDAD CnN
x  max  0, n  r  N  , , min  r , n 

r
VALOR ESPERADO E X  n
N

r  r  N  n 
VARIANZA V X  n  1   
N  N   N 1 
Ejemplo 2:
Una compañía manufacturera utiliza un
mecanismo de control para realizar el
embarque de sus artículos por aduana. De
una caja de 25 artículos de los cuales hay 2
artículos defectuosos, se selecciona una
muestra de 4 artículos para verificar si tiene
algún artículo defectuoso.
Si se encuentra al menos un artículo defectuoso, la caja entera
se regresa para verificarla al 100%. Caso contrario, la caja se
embarca.

¿Cuál es la probabilidad que la caja se embarca?


Ejercicio propuesto:
Enigma Home Center en su sección de electrodomésticos tiene 9
congeladoras de liquidación de las cuales 4 tienen defectos. Una
cadena de restaurantes compra al azar 3 de ellas.
a. Defina la variable aleatoria de congeladoras defectuosas compradas
por la cadena de restaurantes y su distribución de probabilidad (con
sus parámetros)
b. Elabore la gráfica correspondiente.
c. Estime el valor esperado y la desviación estándar.
d. Calcule la probabilidad:
• De que en la muestra elegida haya 1 congeladora defectuosa.
• De que en la muestra elegida haya al menos 2 congeladoras
defectuosas.
• De que en la muestra elegida haya más de 2 congeladoras
defectuosas.
• De que en la muestra elegida haya entre 2 y 4 congeladoras
defectuosas.
• De que en la muestra elegida haya a lo más 1 congeladora no
defectuosa.
Conclusiones:
✓Una variable aleatoria discreta es una función que asigna valores
numéricos a los elementos del espacio muestral.
✓Hay dos tipos de variable aleatoria: discreta y continua, la diferencia
radica en el tipo de valores numéricos que asume la variable aleatoria.
✓El recorrido de la variable aleatoria discreta es un conjunto finito o
infinito numerable.
✓Toda función de probabilidad debe cumplir dos condiciones: f(x)≥0 y ∑
f(x)=1
✓La interpretación del valor esperado es: Si el experimento se repitiera
muchas veces, a la larga, el número promedio de “variable” es igual a
E(x).
ESTADÍSTICA APLICADA I

Distribuciones especiales discretas


Temario

Distribuciones especiales discretas:


• Distribución Poisson
Logro de la sesión
• Al finalizar la sesión, el estudiante calcula
probabilidades, valor esperado y varianza,
asociadas a modelos de probabilidad de
distribuciones discretas conocidas.
Distribución Poisson
Un experimento Poisson cuenta el número de ocurrencias en
alguna unidad de medida.

❖ La variable aleatoria X es el número de ocurrencias en un


intervalo de tiempo, área, volumen o unidad de medida.
❖ λ denota el número esperado de éxitos en un intervalo de
tiempo o unidad de medida.
n (muestra)
Si una variable aleatoria X tiene distribución Poisson:
Se denota por X ~ P (l)

1 minuto 1 minuto 1 minuto


Número de eventos independientes que
VARIABLE ocurren en un espacio continuo*

PARÁMETROS l

e  l lx
FUNCIÓN DE f  x   P X  x  
x!
PROBABILIDAD
x  0 ,1, 2 , 

VALOR ESPERADO E(X) = l

VARIANZA V(X) = l
Ejemplo 3:
Los cambios realizados en los
procedimientos de los aeropuertos
requieren una planeación
considerable. Los índices de llegada
de los aviones es un factor
importante que se debe tomar en
cuenta. Si los aviones pequeños
llegan al aeropuerto con una media
de 6 por hora.
a. Defina la variable en estudio y halle la probabilidad de que exactamente
cuatro aeronaves pequeñas lleguen en un lapso de una hora.
b. ¿Cuál es la probabilidad que lleguen más de 4 aeronaves en una hora?
c. Defina la variable en estudio y ¿Cuál es la probabilidad de que
exactamente cuatro aeronaves pequeñas lleguen en un lapso de media
hora?
d. ¿Cuál es la probabilidad que lleguen más de 4 aeronaves en media hora?
Pasos para el cálculo de Probabilidad_ de VAD:

- Defina la Variable Aleatorio Discreta (VAD):

Distribución Binomial
- Identifique el Tipo de Distribución: Distribución Hipergeométrica
Distribución Poisson

- Parámetros (según el Tipo de Distribución):

Distribución Binomial Se denota X ~ B(n, p)

Distribución Hipergeométrica Se denota X ~ H (N, n, r)


Distribución Poisson Se denota por X ~ P (l)

- Función de Densidad o de Probabilidad:


Autoevaluación
Texto Distribución Parámetros
La probabilidad de que un componente sobreviva a la
prueba de choque dada es 3/4. Encuentre la Binomial n=4;
probabilidad de que sobrevivan a la prueba p = 3/4
exactamente dos si se prueban cuatro componentes.
Un fabricante de tejido de lana afirma que el promedio
de defectos en sus productos es de 1 por dos metros Poisson l 0.5 por
cuadrados ¿Cuál es la probabilidad de obtener 3 o más m2
defectos en cualquier metro cuadrado?
El estudio de un inventario determina que, en
promedio, las demandas de un artículo particular de Poisson l 10 por 2
un almacén se realiza cinco veces al día. ¿Cuál es la días
probabilidad de que en dos días cualesquiera se pida
este artículo más de nueve veces?
Si seleccionó una muestra de 10 estudiantes ¿cuál es la
N=730
probabilidad de que seleccione 3 estudiantes que
Hipergeo r = 610
desaprobaron la PC1, si se conoce que la PC1 lo dieron
métrica n = 10
730 estudiantes, de los cuales aprobaron 120.
Bibliografía
 Guía del curso de Estadística Aplicada de la UPC.
Material producido para el curso de Estadística Aplicada I
Autor: Profesores del curso

CE86 ESTASÍSTICA APLICADA 1- EPE


COPYRIGHT © UPC 2017
ESTADÍSTICA APLICADA I

Distribuciones especiales discretas


Temario

Distribuciones especiales discretas:


• Distribución Binomial
• Distribución Hipergeométrica
• Distribución Poisson
Logro de la sesión
• Al finalizar la sesión, el estudiante calcula
probabilidades, valor esperado y varianza,
asociadas a modelos de probabilidad de
distribuciones discretas conocidas.
¿Las variables que se describen tendrán el mismo
modelo de probabilidad?

X: Número de autos ensamblados


en un día.

X: Número de termas eléctricas que cumplen


con las especificaciones técnicas de
seguridad de un lote de 10 termas eléctricas.

X: Número de latas de conservas defectuosas en


una muestra de 5 latas de conservas elegidas
al azar de un lote de 30 latas de conservas
(se conoce que 3 latas son defectuosas).
- Identifique/De las variables aleatorias discretas:
- Qué tipo de “Distribución Especial Discreta” asume la variable en estudio:
Valores posibles
Experimento Variable Aleatoria [x] de X
1.- Lanzar una moneda cuatro veces. Contar el número de caras que salen

2.- Realizar el control de calidad de Contar el número de teléfonos


10 teléfonos celulares. celulares que presentan algún
defecto.

3.- Jugar un partido de futbol. Contar el número de goles que


se anota el equipo contrario
Distribución Binomial
Un experimento Binomial consiste de una serie de “n”
pruebas o ensayos fijados antes de realizar el experimento.

❖ Se realiza “n” pruebas o ensayos independientes entre


si.
❖ Las pruebas son idénticas y cada una puede resultar en
uno de dos resultados: Éxito (E) o Fracaso (F).
❖ La probabilidad nde(muestra)
éxito es constante de una prueba a
otra y se denota por p.

Si una variable aleatoria X tiene distribución Binomial:


Se denota X ~ B(n, p)
Distribución Binomial
Número de éxitos obtenidos al
VARIABLE realizar n ensayos.

PARÁMETROS nyp

f x   PX  x  C xn p x 1  p 
n x
FUNCIÓN DE
PROBABILIDAD x  0 ,1, 2 ,  , n

VALOR E(X) = np
ESPERADO

VARIANZA V(X) = np(1-p)


Ejemplo 1:
Acerotubo S.A. fabrica diariamente una
cantidad invariable de tubos de acero.
Los productos son fabricados
independientemente uno de otro. La
probabilidad de que un producto resulte
defectuoso es del 10%.

Calcule la probabilidad de que en una muestra de 15 tubos


elegidos al azar:
➢ 2 tubos sean defectuosos.
➢ A lo más tres tubos sean defectuosos.
➢ 10 tubos no sean defectuosos.
➢ Por lo menos 4 tubos no sean defectuosos.
Ejercicio propuesto:
Un agente de seguros de vida vende pólizas a cinco individuos todos de la
misma edad. De acuerdo con tablas actuales, la probabilidad de que un
individuo con esa edad viva 30 años o más es de 3/5. Uno de los cálculos
necesarios para hacer estimaciones de pagos de las primas de seguro es la
probabilidad de que un número determinado de asegurados de la misma
edad viva 30 años o más. De acuerdo al enunciado se pide que:

a. Determine la función de probabilidad y la tabla de probabilidades.


b. Calcule el valor esperado y la varianza.
c. Calcule la probabilidad:
• De que en la muestra de cinco individuos, dos de ellos vivan 30 años
o más.
• De que en la muestra de cinco individuos, vivan 30 años o más, entre
3 y 4 individuos.
• De que en la muestra de cinco individuos, vivan menos de 30 años,
por lo menos 1 individuo.
• De que en la muestra de cinco individuos, vivan menos de 30 años,
entre 1 y 4 individuos.
Distribución Hipergeométrica
El experimento consiste de una serie de n pruebas o ensayos
fijados antes de realizar el experimento.

❖ Se realiza n pruebas o ensayos independientes entre si.


❖ Las pruebas son idénticas y cada una puede resultar en uno de dos
resultados: Éxito (E) o Fracaso (F).
❖ La probabilidad de éxito NO es constante de una prueba a otra.

n (muestra)
Si una variable aleatoria X tiene distribución Hipergeométrica:
Se denota X ~ H (N, n, r)

N = Tamaño de población
n = Tamaño de muestra
r = Número de éxitos en la población
Número de éxitos obtenidos en
VARIABLE la muestra de n elementos.

PARÁMETROS N, n y r

Cxr CnNxr
FUNCIÓN DE f  x   P  X  x 
PROBABILIDAD CnN
x  max  0, n  r  N  , , min  r , n 

r
VALOR ESPERADO E X  n
N

r  r  N  n 
VARIANZA V X  n  1   
N  N   N 1 
Ejemplo 2:
Una compañía manufacturera utiliza un
mecanismo de control para realizar el
embarque de sus artículos por aduana. De
una caja de 25 artículos de los cuales hay 2
artículos defectuosos, se selecciona una
muestra de 4 artículos para verificar si tiene
algún artículo defectuoso.
Si se encuentra al menos un artículo defectuoso, la caja entera
se regresa para verificarla al 100%. Caso contrario, la caja se
embarca.

¿Cuál es la probabilidad que la caja se embarca?


Ejercicio propuesto:
Enigma Home Center en su sección de electrodomésticos tiene 9
congeladoras de liquidación de las cuales 4 tienen defectos. Una
cadena de restaurantes compra al azar 3 de ellas.
a. Defina la variable aleatoria de congeladoras defectuosas compradas
por la cadena de restaurantes y su distribución de probabilidad (con
sus parámetros)
b. Elabore la gráfica correspondiente.
c. Estime el valor esperado y la desviación estándar.
d. Calcule la probabilidad:
• De que en la muestra elegida haya 1 congeladora defectuosa.
• De que en la muestra elegida haya al menos 2 congeladoras
defectuosas.
• De que en la muestra elegida haya más de 2 congeladoras
defectuosas.
• De que en la muestra elegida haya entre 2 y 4 congeladoras
defectuosas.
• De que en la muestra elegida haya a lo más 1 congeladora no
defectuosa.
Distribución Poisson
Un experimento Poisson cuenta el número de ocurrencias en
alguna unidad de medida.

❖ La variable aleatoria X es el número de ocurrencias en un


intervalo de tiempo, área, volumen o unidad de medida.
❖ λ denota el número esperado de éxitos en un intervalo de
tiempo o unidad de medida.
n (muestra)
Si una variable aleatoria X tiene distribución Poisson:
Se denota por X ~ P (l)

1 minuto 1 minuto 1 minuto


Número de eventos independientes que
VARIABLE ocurren en un espacio continuo*

PARÁMETROS l

e  l lx
FUNCIÓN DE f  x   P X  x  
x!
PROBABILIDAD
x  0 ,1, 2 , 

VALOR ESPERADO E(X) = l

VARIANZA V(X) = l
Ejemplo 3:
Los cambios realizados en los
procedimientos de los aeropuertos
requieren una planeación
considerable. Los índices de llegada
de los aviones es un factor
importante que se debe tomar en
cuenta. Si los aviones pequeños
llegan al aeropuerto con una media
de 6 por hora.
a. Defina la variable en estudio y halle la probabilidad de que exactamente
cuatro aeronaves pequeñas lleguen en un lapso de una hora.
b. ¿Cuál es la probabilidad que lleguen más de 4 aeronaves en una hora?
c. Defina la variable en estudio y ¿Cuál es la probabilidad de que
exactamente cuatro aeronaves pequeñas lleguen en un lapso de media
hora?
d. ¿Cuál es la probabilidad que lleguen más de 4 aeronaves en media hora?
Pasos para el cálculo de Probabilidad_ de VAD:

- Defina la Variable Aleatorio Discreta (VAD):

Distribución Binomial
- Identifique el Tipo de Distribución: Distribución Hipergeométrica
Distribución Poisson

- Parámetros (según el Tipo de Distribución):

Distribución Binomial Se denota X ~ B(n, p)

Distribución Hipergeométrica Se denota X ~ H (N, n, r)


Distribución Poisson Se denota por X ~ P (l)

- Función de Densidad o de Probabilidad:


Autoevaluación
Texto Distribución Parámetros
La probabilidad de que un componente sobreviva a la
prueba de choque dada es 3/4. Encuentre la Binomial n=4;
probabilidad de que sobrevivan a la prueba p = 3/4
exactamente dos si se prueban cuatro componentes.
Un fabricante de tejido de lana afirma que el promedio
de defectos en sus productos es de 1 por dos metros Poisson l 0.5 por
cuadrados ¿Cuál es la probabilidad de obtener 3 o más m2
defectos en cualquier metro cuadrado?
El estudio de un inventario determina que, en
promedio, las demandas de un artículo particular de Poisson l 10 por 2
un almacén se realiza cinco veces al día. ¿Cuál es la días
probabilidad de que en dos días cualesquiera se pida
este artículo más de nueve veces?
Si seleccionó una muestra de 10 estudiantes ¿cuál es la
N=730
probabilidad de que seleccione 3 estudiantes que
Hipergeo r = 610
desaprobaron la PC1, si se conoce que la PC1 lo dieron
métrica n = 10
730 estudiantes, de los cuales aprobaron 120.
Bibliografía
 Guía del curso de Estadística Aplicada de la UPC.
Material producido para el curso de Estadística Aplicada I
Autor: Profesores del curso

CE86 ESTASÍSTICA APLICADA 1- EPE


COPYRIGHT © UPC 2017
ESTADÍSTICA APLICADA I

Distribución Exponencial
Temario
• Distribución Uniforme
• Distribución Exponencial
• Distribución Normal
Logro de la sesión
• Al finalizar la sesión, el estudiante calcula
probabilidades asociadas a la distribución
Uniforme, Exponencial y Normal
1

Distribución Uniforme
Metro de Lima
• Cuenta con 36 trenes y
Metropolitana Actualmente sus tiempos de espera
el tren entre un tren a otro se
eléctrico encuentra entre 5 a 10
minutos.

• Si los trenes de ambas


líneas salen de manera
Línea 1 y sincronizada y llegan a
Línea 2 una estación entre 8:00
a.m. y 8:10 a.m

• ¿Será igual de probable


de que el tren línea 1
Tiempo de llegue entre 8:00 – 8:02
llegada que la probabilidad de
que el tren línea 2
llegue entre 8:03-8:05?
Distribución Uniforme
PARÁMETROS X~U(a,b) Parámetros: a, b
FUNCIÓN DE f ( x) 
1
a xb
DENSIDAD ba
f(x)

GRÁFICO 1 / (b-a)
f (x)

0 a k1 k2 b x

FUNCIÓN
Fx  
x -a
ACUMULADA b-a
VALOR ab
X  E  X  
ESPERADO 2

(b  a) 2
VARIANZA   V X  
2
X
12
Ejemplo:
El tiempo que un estudiante tarda en resolver un examen se modela
como una variable aleatoria continua que con distribución de
probabilidad uniforme de parámetros a = 50 minutos y b = 90 minutos.
Calcule la probabilidad de:

a) Que un estudiante se demore mas de


75 minutos.
b) Que un estudiante se demore entre 50
y 70 minutos.
c) ¿Cuál será el tiempo mínimo de un
estudiante en resolver un examen
para estar en el 20% de estudiantes
que más demoran?
d) El coeficiente de variación de la
variable en estudio
En cada una de las preguntas formalice la probabilidad
Solución:
X = { tiempo tarda en resolver el examen}
X ~ U [50,90]
(𝟗𝟎−𝟕𝟓)
a) P(X>75) = = 0,375
𝟒𝟎

(𝟕𝟓−𝟓𝟎)
b) P(50<X<75) = = 0,625
𝟒𝟎

(𝟗𝟎−𝒌)
c) P(X>k) = 0,20 entonces = 0,20; k = 82 minutos
𝟒𝟎

𝝈 𝟏𝟏,𝟓𝟒𝟕
d) CV = * 100 = * 100 = 16,5%
𝝁 𝟕𝟎
2

Distribución Exponencial
Metro de Lima
• Cuenta con 36 trenes y
Metropolitana Actualmente sus tiempos de espera
el tren entre un tren a otro se
eléctrico encuentra entre 5 a 10
minutos.

• Si los trenes de ambas


líneas salen de manera
Línea 1 y sincronizada y llegan a
Línea 2 una estación entre 8:00
a.m. y 8:10 a.m

• ¿Será igual de probable


de que el tren línea 1
Tiempo de llegue entre 8:00 – 8:02
llegada que la probabilidad de
que el tren línea 2
llegue entre 8:03-8:05?
Aplicaciones de distribución exponencial

Confiabilidad del Tiempo de


vida de un componente
eléctrico

El tiempo de espera en un
banco

Primas de seguros y modelos


de supervivencia
Distribución Exponencial
PARÁMETROS X~Exp(β) Parámetro: β
x

f x   e
FUNCIÓN DE 1
DENSIDAD
β
; x0
β

GRÁFICO

x

Fx   1  e
FUNCIÓN ACUMULADA β

VALOR ESPERADO  x  E(X)  

VARIANZA  x2  V ( X )   2
Ejemplo:
El tiempo hasta que falle por primera vez la batería de un celular se
distribuyen según un modelo exponencial, con un tiempo promedio de
vida útil es de 500 horas.
a) Calcule la probabilidad de
una batería funcione más
de 600 horas.
b) ¿Cuál es el tiempo máximo
que funcionan la batería
para estar en el 15% de las
baterías que menos duran?

c) Calcule la probabilidad de una batería funcione como máximo 600


horas.
d) Calcule la probabilidad de una batería funcione como por lo menos
520 hrs y como máximo 625 horas.
Solución:
F(k) = P  X  k   1 e  k  

X = {Tiempo hasta que falle por primera vez la batería}


X ~ Exp (500)
600
a) P( X > 600) = 1 – P(X ≤ 600) = 1 – ( 1 - 𝑒 − 500 )= 0,3012
b) P(X<k) = 0.15
𝑘

0,15 = 1-𝑒 para despejar k sacamos logaritmo
500

neperiano en ambos lados

𝑘
Ln(0,85) = - entonces k = 81,26 horas
500
3

Distribución Normal y
Normal estándar
Metro de Lima
Metropolitana Actualmente
• Cuenta con 36 trenes y
sus tiempos de espera
el tren entre un tren a otro se
eléctrico encuentra entre 5 a 10
minutos.

• Si los trenes de ambas


líneas salen de manera
Línea 1 y sincronizada y llegan a
Línea 2 una estación entre 8:00
a.m. y 8:10 a.m

• ¿Será igual de probable


de que el tren línea 1
Tiempo de llegue entre 8:00 – 8:02
llegada que la probabilidad de
que el tren línea 2
llegue entre 8:03-8:05?
Control de calidad
en un proceso de
Control de
producción calidad en los
• Son todos los mecanismos,
acciones, herramientas realizadas
procesos de para detectar la presencia de
producción errores

• Se suele interpretar como su


aptitud para producir artículos
de acuerdo con las
Capacidad
especificaciones. Representa un
del proceso indicador estadístico mide la
Cpk distancia de 3 veces sigma de
cada lado de la media

• Si los límites superior e inferior


del proceso se encuentran
dentro del rango establecido
por las tolerancias, significa
que el proceso satisface las
especificaciones de calidad.
Distribución Normal

La variable aleatoria continua X tiene distribución normal,


con parámetros  y 2 , si su función de densidad es:

1  x 
2

1   
f  x  e 2  
  x  
2

Notación: X ~ N(, 2)


Campana de Gauss
Media
Mediana
Moda

El extremo izquierdo se
extiende de manera El extremo derecho se
indefinida y nunca toca el extiende de manera
eje horizontal. indefinida y nunca toca el
eje horizontal.

• Es simétrica respecto al eje vertical x = .


• Las medidas de tendencia central coinciden.
• El rango va de – α a + α
Estandarización de una variable: X
N(,  2)

X 
Z

El proceso de estandarización es el cambio de variable


X  N(,  2) a la variable aleatoria Z que tiene distribución
Normal Estándar, es decir Z  N( = 0,  2 = 1)
Lectura de la tabla de distribución normal estándar (Z)

Utilizamos la tabla normal estándar bajo el criterio gráfico siguiente:

La probabilidad representa el área debajo de la curva normal


estándar con valores menores iguales a un número z0.
Cálculo de probabilidad usando la tabla normal estándar
(Z):
Ejemplo: Si X~ N( =2,2= 5 ), calcular: P(X<3.5)
=2 y  2 =5  = 5

Estandarización:
Ejemplo:
Una máquina despachadora de refrescos
está ajustada para servir un promedio de
200
mililitros por vaso. Si la cantidad de
refresco es normalmente distribuida con
una desviación estándar de 15 mililitros:

a. ¿Qué proporción de los vasos contendrá más de 224


mililitros?
b. ¿Cuál es la probabilidad de que un vaso contenga entre 191
y 209 mililitros?
c. ¿Debajo de qué valor se obtiene el 25% de refrescos con
menor contenido?
Solución:
X: contenido de refresco en un vaso

X ~ N (𝜇 = 200 𝑚𝑙 , 𝜎 2 = 225 ml2)

(224−200)
a. P(X > 224) = 1 – P ( X≤ 224) = 1 – P ( Z ≤ ) =1–
15
P(Z≤1,60) = 1 – 0, 9452 = 0,0548
(191−200) (209−200)
b. P( 191 ≤ X ≤ 209 ) = P( ≤Z≤ )
15 15
P(- 0,60 ≤ Z ≤0,60) = P(Z ≤ 0,60) – P (Z ≤ - 0,60) =
0,7257 – 0,2743 = 0,4514
a. ¿Debajo de qué valor se obtiene el 25% de refrescos con
menor contenido?
Sean X1, X2 y X3 tiempo que se demora un brazo en ensamblar una
pieza de un producto,
X1: Tiempo del brazo mecánico 1 ~ N(12; 0,02)
X2: Tiempo del brazo mecánico 2 ~ N(24; 0,03)
X3: Tiempo del brazo mecánico 3 ~ N(18; 0,04)
¿Qué distribución tendría el tiempo
total de ensamblaje Xt=X1+X2+X3?
Propiedad reproductiva de la Normal
• Si X1, X2, ... , Xk son variables aleatorias
independientes tales que Xi  N(i ,i2) entonces
la variable aleatoria
k
 k k
2 2
Y   ci X i  N   ci i ,  ci  i 
i 1  i 1 i 1 

• Considerar C=1, ¿cómo se expresa la propiedad?


Ejemplo:
Una empresa fabricante de detergentes tiene
asignada una máquina especial para el llenado
y sellado de las bolsas del detergente Enigma
Limón. Se sabe que el peso de detergente que
la máquina deposita en las bolsas sigue una
distribución normal con media de 87,5 gramos
y desviación estándar de 0,5 gramos; se sabe
también que las bolsas vacías utilizadas en el
embolsado de Enigma Limón tienen un peso
que sigue una distribución normal con media
21,5 gramos y una desviación estándar de 1,2
gramos.

¿Cuál es la probabilidad de que una bolsa llena de detergente, escogida al


azar a la salida del proceso de embolsado, tenga un peso mayor a 110
gramos?
Autoevaluación
• Si el costo de producción tiene una distribución
normal con media de 172 dólares y varianza de 16,25 V
dolares2 esos valores corresponden a sus
parámetros.
• Si X1 y X2 se distribuyen como una distribución V
normal entonces X1+X2 también se distribuirán como
una normal.
• Si X es una variable normal se cumple que F
P(X > 3) = P (X ≤ 3)
Autoevaluación
• El tiempo de producción de un artículo tiene una
distribución exponencial con media de 3,25 F
minutos entonces su varianza es 3,25 minutos.

• El tiempo de espera de un usuario hasta abordar el


tren eléctrico tiene una distribución uniforme con V
parámetros de 5 hasta 20 minutos, entonces la
media es de 12,5 minutos.
Bibliografía
 Probabilidad e Inferencia Estadística - Rufino Moya – Gregorio Saravia
 Cuaderno de Trabajo del curso
ESTADÍSTICA APLICADA I

•Variable aleatoria continua


•Valor esperado, Varianza
•Aplicaciones con Excel de distribuciones especiales discretas
Temario

•Variable aleatoria continua


•Valor esperado
•Varianza
Logro de la sesión
• Al finalizar la sesión, el estudiante calcula
probabilidades, valor esperado y varianza,
asociadas a distribuciones de probabilidad de
variables aleatorias continuas.
X: El tiempo de vida útil de un auto (en años)

¿Qué tipo de variable aleatoria es?


Variable aleatoria continua
Función de densidad
Función de distribución acumulada
Valor esperado y varianza
Función de densidad

La función de densidad de
probabilidad para una
variable aleatoria continua
es la función f que
satisface:


P  a  X  b    f ( x)dx
b
f  x  0  f  x  dx  1

a
Se cumple que:

i) Es una función no negativa. f(x)  0


ii) El área bajo la gráfica de la función y por encima
del eje X es igual a 1.

y = f(x)

 f x  dx
-
 1
Observación
Si X es una variable aleatoria continua, se
cumple:

1. P  a  X  b   P  a  X  b    f ( x)dx
b

P  a  X  b   P  a  X  b    f ( x)dx
b

P  a  X  b   P  a  X  b    f ( x)dx
b

2. P( X  a)  0
Valor Esperado y Varianza

E X    X   x f x  dx


Valor esperado de X

  V(X)  E(X )  E(X) E( X 2 )   f x dx


2 2 2 2
x
X


Varianza de X Valor esperado de X2


Propiedades del valor esperado y varianza:

E[a X ± b] = a E[X] ± b

Valor Esperado

V aX  b   a . V  X 
2

V aX  bY   a . V  X   b V Y 
2 2

Varianza

X e Y son variables independientes


Autoevaluación
Afirmación Verdadero Falso
Si X es v.a.c entonces se cumple:
X
P ( a  x  b)  P ( x  b)  P ( x  a )
La función de densidad de una variable
aleatoria continua siempre cumple con X
esta condición f ( x)  0
Si X es una variable aleatoria continua
entonces: X
P(X<c) = P(X< c)
Sean X e Y v.a. independientes entonces:
X
V(x-y) = V(x) - V(y)
Bibliografía
 Probabilidad e Inferencia Estadística - Rufino Moya – Gregorio Saravia
 Cuaderno de Trabajo del curso

También podría gustarte