Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DEFINICIONES BÁSICAS
Definición de Estadística
Es la ciencia que proporciona un conjunto de métodos,
técnicas y procedimientos para recopilar, organizar,
presentar y analizar datos con el fin de describirlos o
realizar generalizaciones válidas
Recopilar
información
Organizar información
Variables:
características de
interés para el
investigador. Pueden
tomar diferentes valores Observación:
al ser medidas. conjunto de
mediciones obtenidas
de un elemento en
particular.
Estatura
Marca de auto
Nro de celulares
por persona
ESCALAS DE MEDICIÓN
El registro de una característica, se hace usando una de las cuatro escalas: nominal,
ordinal, intervalos y de razón.
TIPO DE VARIABLE: CUALITATIVA TIPO DE VARIABLE: CUANTITATIVA
NOMINAL ORDINAL INTERVALO RAZÓN
Tiene intervalos
Además de etiquetar al Tiene intervalos iguales y
constantes entre un
Solo se puede elemento para poder pueden ser medidos,
valor y otro, posee un
etiquetar al identificarlo se puede pero no tiene punto de
punto de partida (cero
elemento para establecer ORDEN en las partida. Puede asumir
natural = ausencia de
poder identificarlo categorías valores negativos.
característica)
CERO RELATIVO
CERO ABSOLUTO
Tiempo
Nro de
Distrito de Nivel de Grado de transcurrido
Género Temperatura Estatura defectos de un
residencia satisfacción instrucción hasta una
producto
fecha
• Nominal • Intervalo
Temperatura
Del ambiente
Género del cliente
• Ordinal • Razón
Población
Unidad
elemental
Gráfico
Variable Tipo de variable Escala de medición
adecuado
Calificación
del cliente
Histograma de
frecuencias
Tipo de
crédito
Cuantitativa discreta
Ejemplo 6
Wuxi Battery Co. es una compañía fabricante de baterías o pilas alcalinas de zinc-
dióxido de manganeso bajo la norma ANSI que tiene tres plantas de producción.
Últimamente sus clientes se están quejando de que las baterías no están
cumpliendo con las especificaciones. Debido a lo expuesto, el Gerente de
Producción ha solicitado al jefe de control de calidad un informe.
Para realizar el estudio se tomó una muestra al azar de 500 baterías alcalinas de
zinc–dióxido de manganeso producidas en sus tres plantas de producción. Las
variables consideradas en el estudio son:
N° Variable Unidad/Descripción
01 Longitud Representa la altura que tiene la batería alcalina AA en mm.
02 Diámetro Representa el diámetro que tiene la batería alcalina AA en mm.
Tiempo de Representa el tiempo de duración de la batería en uso típico como la radio en
03
duración horas.
Es el turno de trabajo donde proviene las baterías alcalinas AA (1: Mañana, 2: Tarde
04 Turno
y 3: Noche)
Principales problemas reportados (recarga, voltaje, fuga de hidróxido,
05 Problemas
funcionamiento defectuoso debido a su temperatura de almacenamiento, otros)
Origen de la batería alcalina AA según planta de procedencia (1: norte, 2: sur y 3:
06 Planta
este)
Número de
07 Representa el número de problema presentado en las pilas alcalinas AA.
problemas
• De acuerdo a la información proporcionada, responda lo
siguiente:
Población
Muestra
Unidad elemental
Variable
(Escriba el nombre de la Tipo de variable Escala de medición
variable)
Turno
Cuantitativa continua
Nominal
Nª de problemas
Ejemplo propuesto:
La Empresa Systems Artificial Intelligence (SAI) se dedica al desarrollo de sistemas
basados en inteligencia artificial y está conformada por un equipo de especialistas
de ingeniería industrial y de sistemas. Para cumplir con sus metas la Empresa
actualmente está en un proceso de autoevaluación, por tal motivo se ha
seleccionado al azar 105 productos de sistemas de inteligencia artificial
desarrollados en los últimos cinco años. Las características de interés auditadas son:
Organización de datos
cualitativos:
Una variable
•Tabla de frecuencias para variables cualitativas en Excel
La tabla de doble entrada y su gráfico deben tener el mismo título. Una manera
ordenada de presentarlo es teniendo en cuenta si la tabla de doble entrada
corresponde al total general o si ella corresponde al total de fila o al total de columna
Si la tabla o gráfico corresponde al total general entonces el título debe incluir las dos
variables en estudio separadas por la letra Y. El orden de las variables es indistinto.
Si la tabla o gráfico corresponde al total de fila 100% o columna 100%, el título incluye
dos palabras claves: según y por, donde el según determina la variable que va en la
leyenda y el por la variable que totaliza el 100%.
Ejercicios:
Para desarrollar los ejercicios propuestos debe usar la base de datos
publicada en el Aula Virtual: : “Base de Datos Guía Excel”
• Elabore una tabla de frecuencias para analizar en forma conjunta las
variables “Función en la empresa” y “Género”
• Interprete la frecuencia absoluta de la tercera fila y segunda columna.
• Elabore una tabla de frecuencias porcentuales para representar la
“Función en la empresa” por “Género”
• Elabore una tabla de frecuencias porcentuales para representar
“Género” por “Función en la empresa”
Bibliografía
Guía de Excel para el curso
Material producido para el curso de Estadística Aplicada 1
Autor: Profesores del curso
Organización de datos
Cuantitativos:
TABLA DE FRECUENCIAS:
VARIABLE CUANTITATIVA DISCRETA
La distribución de frecuencias es una tabla que presenta la
siguiente estructura:
2013 - 1
EJERCICIO 1:
Los siguientes datos corresponden al número de capacitaciones recibidas
por los trabajadores de la empresa Creativa’s en lo que va del año:
Linf: Límite inferior del intervalo; Lsup: Límite superior del intervalo
Xi: Marca de clase o Punto medio del intervalo
fi: Frecuencia Absoluta Simple
Fi: Frecuencia Absoluta Acumulada
hi: Frecuencia Relativa Simple
Hi: Frecuencia Relativa Acumulada
EJERCICIO 2:
El jefe de la Oficina de Rentas de una municipalidad ha realizado un
estudio sobre los impuestos que pagan los vecinos del distrito. A
continuación se muestra los pagos de impuestos, en soles, de 48
viviendas elegidas al azar en el 2017.
Elabore la tabla de
frecuencias para la variable
Pago por impuestos
municipales año 2017.
145.1 151 159 195.6 196.9 202.6 204.9 206.1 206.5 208 208 209.3
216.3 225.9 227.1 231.2 234.8 238.4 239.9 241.1 242.9 244 247.7 249.5
252.5 257.1 259.2 262.5 265.2 271 286.7 288.1 289.1 291 291.9 294.5
303.6 305.8 315.4 315.5 317.2 320.2 324.8 331.1 331.7 344.6 346.7 351.1
RESULTADOS:
Distribución de contribuyentes según pago de impuesto
municipal (en soles)
3.0 3.1 3.3 3.5 3.8 3.9 3.9 4.2 4.3 4.4
4.4 4.5 4.5 4.5 4.6 4.7 4.7 4.8 4.9 4.9
5.0 5.1 5.1 5.2 5.3 5.3 5.3 5.4 5.4 5.5
5.5 5.6 5.6 5.7 5.7 5.8 5.8 5.9 5.9 6.0
2013 - 1
EJERCICIO: Al realizar una encuesta se presentó la información …
Distribución de estudiantes UAC según número de cursos matriculados
Ciclo 2017-1
Nº Cursos fi hi pi
1 0.300
2 124 0.248
3 100
4 0.140
5 56 0.112
Total 500
Fuente: Asuntos académicos
Se sabe que los gastos mensuales (en nuevos soles) en 50 hogares, por
concepto de pensiones educativas, tienen un valor mínimo de 297.86 y un
valor máximo de 867.72. Además, todos los datos cuentan con 2
decimales. Entonces:
a. Si se quisiera organizar estos datos en una tabla de frecuencias, se
debería trabajar con k = ___ intervalos.
b. Para calcular la amplitud del intervalo (w) se debe considerar ___ cifras
decimales y el valor de w sería: W = ____
Bibliografía
Cuaderno de trabajo del curso
Material producido para el curso de Estadística Aplicada 1
Autor: Profesores del curso
Número de trabajadores
14 14
12
10 10
8
6
4
3 1
2 2
0
0
0 1 2 3 4 5
Número de capacitaciones
Fuente : Empresa Creativa’s
2
67.92 69.07 69.12 69.4 69.4 69.62 69.98 70.13 70.24 70.8 70.94 71.13
71.43 71.54 71.62 71.81 72.52 72.57 72.83 72.88 72.98 73.09 73.14 73.29
74.42 74.78 74.84 75.12 75.27 75.96 76.14 76.18 76.67 78.77 80.87 81.65
67.92 69.07 69.12 69.4 69.4 69.62 69.98 70.13 70.24 70.8 70.94 71.13
71.43 71.54 71.62 71.81 72.52 72.57 72.83 72.88 72.98 73.09 73.14 73.29
74.42 74.78 74.84 75.12 75.27 75.96 76.14 76.18 76.67 78.77 80.87 81.65
Xmín = 67.92
2. Determinar el número de intervalos: K= 1 + 3.322*log(n)
Xmáx = 81.65
3. Determinar la amplitud del intervalo: W = R / K
R = Xmáx – Xmín = 13.73
K = 1 + 3.322*log( 36 ) = 6.17 ≈ 6
67.92 69.07 69.12 69.4 69.4 69.62 69.98 70.13 70.24 70.8 70.94 71.13
71.43 71.54 71.62 71.81 72.52 72.57 72.83 72.88 72.98 73.09 73.14 73.29
74.42 74.78 74.84 75.12 75.27 75.96 76.14 76.18 76.67 78.77 80.87 81.65
Histograma de Frecuencias:
8 8
8
7
2
2
1
0
67.92 - 70.21 70.21 - 72.5 72.5 - 74.79 74.79 - 77.08 77.08 - 79.37 79.37 - 81.66
Resistencia a la tracción
Fuente: Steel S.A.
Polígono de Frecuencias:
101.2 101.3 101.6 101.9 102.4 102.5 102.9 102.9 103.3 103.7 103.8 103.9
103.9 104 104 104.3 104.3 104.4 104.6 104.7 104.9 105 105.3 105.6
105.7 105.8 105.9 105.9 106.1 106.2 106.2 106.3 106.3 106.5 106.7 107.1
107.2 107.2 107.7 107.8 107.9 107.9 107.9 108 108.4 108.4 109 110.6
77.09 77.422 78.138 79.9 80.475 80.715 81.155 81.764 82.785 82.819 82.933
83.117 83.216 83.22 83.393 83.542 84.026 84.378 84.776 84.997 85.005 85.776
85.852 86.932 86.953 87.136 87.627 88.258 90.614 90.649 91.072 92.045 92.75
Material producido para el curso de Estadística Aplicada 1
Autor: Profesores del curso
La tabla de doble entrada y su gráfico deben tener el mismo título. Una manera
ordenada de presentarlo es teniendo en cuenta si la tabla de doble entrada
corresponde al total general o si ella corresponde al total de fila o al total de columna
Si la tabla o gráfico corresponde al total general entonces el título debe incluir las dos
variables en estudio separadas por la letra Y. El orden de las variables es indistinto.
Si la tabla o gráfico corresponde al total de fila 100% o columna 100%, el título incluye dos
palabras claves: según y por, donde el según determina la variable que va en la leyenda y
el por la variable que totaliza el 100%.
Ejercicios:
Para desarrollar los ejercicios propuestos debe usar la base de datos
publicada en el Aula Virtual: Base Datos Guia Excel
• Elabore una tabla de frecuencias y presente un gráfico adecuado para
analizar en forma conjunta las variables “Función en la empresa” y
“Género”
• Elabore un gráfico adecuado para representar “Función en la empresa”
por “Género”
2
Diagrama de Pareto
Diagrama de Pareto
Vilfredo Pareto (1848-1923)
Defectos fi hi Hi Hi %
Pandeos y rajadura 40 0.32 0.32 32
Pudrimientos de las piezas 30 0.24 0.56 56
Efectos de desgaste 20 0.16 0.72 72
Deformaciones 15 0.12 0.84 84
Ataques de insectos 10 0.08 0.92 92
Acción de fuego 5 0.04 0.96 96
Otros 5 0.04 1 100
TOTAL 125 1
CENTRAL
Media, Mediana, Moda, Media ponderada
Medidas de Tendencia Central
Localizan el centro de una distribución. Indican el valor alrededor del cual
tienden a concentrarse las demás observaciones.
Se pretende conseguir un valor representativo del conjunto total de datos
que se analiza
Posición Frecuencia
X
x i
El valor que se presenta con
n mayor frecuencia según:
fi, hi o pi
Media o Promedio
Datos
No agrupados Agrupados
n
V. Discreta V. Continua
x i
x i 1
k k
n
xi f i k i fi
x '
k
x i 1
xi hi x i 1
xi' hi
n i 1 n i 1
Número de fi hi%
monitores
con falla
0 30 60%
1 10 20%
2 5 10%
3 3 6%
4 2 4%
Total 50 100.00%
Número de datos: n
es par es impar
𝑿 𝒏 + 𝑿(𝒏+𝟏) 𝑴𝒆 = 𝑿 𝒏+𝟏
𝟐 𝟐 ( 𝟐 )
𝑴𝒆 =
𝟐
Xi fi Ejemplo:
5 Xi : Número de tardanzas de los trabajadores.
0
1 3
Interpretación:
2 12
El número de tardanzas más frecuente de
los trabajadores es 2 veces al mes.
3 1
4 2
Interpretación
El servicio solicitado con mayor frecuencia en la empresa de telefonía Movilnet es la
internet.
Ejemplo 4 Halle la moda para los siguientes datos:
Xw ( x ).( w )
i i xi valor de las observaciones
w i wi pesos o ponderaciones
Medidas de asimetría
Formas de una distribución:
Datos
Simétrica o sesgo nulo concentrados en
el centro.
Media = Mediana = Moda
Datos
Asimétrica negativa o concentrados en
sesgo izquierdo los valores más
grandes.
Media < Mediana < Moda
Datos
Asimétrica positivo o
sesgo derecho concentrados en
los valores más
Media > Mediana > Moda
pequeños.
Ejemplo 6
• Se tomo una muestra de 18 estudiantes de colegios públicos y se
calculó las medidas de tendencia central sobre la variable edad.
Los resultados fueron los siguientes:
ഥ = 16,25 años
𝒙 me = 16 años mo = 15 años
¿Qué tipo de asimetría presenta la variable edad?
¿Qué significado puede tener este asimetría?
• Se tomó una muestra de 17 estudiantes de colegios privados y se
calculó las medidas de tendencia central sobre la variable edad.
Los resultados fueron los siguientes:
ഥ = 15,7 años
𝒙 me = 16 años mo = 16,25 años
¿Qué tipo de asimetría presenta variable edad? ¿Qué significa?
3
Medidas de posición
Estaturas de jugadores:
20%
estatura mínima
¿Qué medida estadística debemos utilizar?
Medidas de Posición o Cuantiles
Son valores que determinan la posición de un dato respecto a los demás en
una serie y que previamente han sido ordenados de menor a mayor
k n 1 E: parte entera
i E, d
100 d: parte decimal
• Calcule el percentil k:
Pk X ( E ) 0, d * ( X ( E 1) X ( E ) )
Ejemplo:
Después de realizar un estudio, se obtuvo que en el 45% de las
obras de instalación eléctrica se demoran más de 8.7 días. Entonces
8.7 es el valor del percentil ………….
Ejemplo:
Medidas de Dispersión
Diagrama de cajas
Logro de la sesión
Local A Local B
ഥ𝑨 = 2500 und.
𝒙 ഥ𝑩 = 2500 und.
𝒙
Local A
Local B
Producción de atún
Medidas de Dispersión
Medidas de dispersión
Es la medida de dispersión más simple usada
especialmente para pocos datos no agrupados.
1. Rango: R = Xmáx - Xmín Mide la dispersión del 100% de datos
Ejemplo 2:
RIC = Q3 – Q1
Como se puede observar este valor considera la variación del 50% de las
observaciones centrales.
La Varianza:
Esta medida es la más utilizada porque considera al total de datos de la
muestra.
Se define como el promedio de los cuadrados de las distancias de cada dato a
la media aritmética.
Xi
2
Varianza Poblacional: σ2
V X 2 i 1
X i X
2
Varianza Muestral: S2
S2 i 1
n 1
Varianza y desviación estándar para datos agrupados
Datos cuantitativos
Datos discretos continuos o agrupados en
intervalos
𝑛 / 2
2
2
σ𝑖=1 𝑥𝑖 − 𝑥ҧ 𝑓𝑖 σ𝑛𝑖=1 𝑥î − 𝑥ҧ 𝑓𝑖
Muestral 𝑆 =
𝑛−1 𝑆2 =
𝑛−1
2
2
σ𝑁 2
𝑖=1 𝑥𝑖 − 𝜇 𝑓𝑖 σ𝑁
𝑖=1
/
𝑥î −𝜇 𝑓𝑖
Poblacional 𝜎 =
𝑁 𝜎2 =
𝑁
Ejemplo 3:
Para la siguiente tabla de frecuencias calcular: varianza, desviación
estándar y coeficiente de variación:
X : Tiempo utilizado para ensamblar un componente
electrónico (50 ensambles)
Usar la calculadora científica Casio - Natural
HORAS Xi fi
2,8 – 3,3 3,05 2
3,3 – 3,8 3,55 6
3,8 – 4,3 4,05 10
4,3 – 4,8 4,55 17
4,8 – 5,3 5,05 8
5,3 – 5,8 5,55 5
5,8 – 6,3 6,05 2
TOTAL 50
https://www.youtube.com/watch?v=9ql-vTM6gq0
Propiedades de la varianza
1. V(X) 0
2. V(K ) = 0
3. V(K X ) = K2 V(X)
4. V(K ± X) = V(X)
S
CV(X) x100%
X
Desv. Estándar
Categoría Media X C.V
(S)
Directivos 820 3500,0
Empleados 630 2100,0
Operarios 980 1050,0
Analizando:
CV(direc.) < CV(empl) < CV (operar.)
Los sueldos de los operarios son los más heterogeneos.
Ejemplo 4:
Se tiene cuatro marcas de bombillas A, B, C y D. Se presenta a
continuación la duración (en días) registrada de cierto número de
bombillas de cada marca.
Marca D: duración registrada en días: 11; 12; 12; 13; 14; 15; 15; 15; 15; 16
Diagrama de cajas
Diagrama de caja
Un diagrama de caja es una gráfica que describe la distribución de un
conjunto de datos tomando como referencia los valores de los
cuartiles como medida de posición y el valor del rango intercuartil
como medida de referencia para la dispersión.
20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39
Resistencia
Utilidad del Diagramas de cajas
Permite:
•Comparar las medianas de
dos o mas conjuntos de
datos.
•Observar el tipo de
distribución de los datos
(simétrica o asimétrica).
•Determinar la dispersión
en el 50% central de los
datos.
•Identificar la presencia de
valores extremos (datos
atípicos)
Pasos para la construcción de un diagrama de caja
1. Se calcula: Q1, Q2 , Q3 , RIC y 1,5RIC.
2. Se traza una línea de referencia horizontal o vertical (para la escala)
3. Se traza un rectángulo con los extremos en el primer y tercer cuartil y se traza
una recta vertical en la mediana.
4. Se dibujan los límites a 1,5 rango intercuartil de los cuartiles 1 y 3, Se considera
que los datos fuera de estos límites son atípicos. Li =Q1-(1,5)RIC; Ls=Q3 +(1,5)RIC.
5. Las líneas antes y después de las cajas se llaman bigotes, se traza desde los
extremos de la caja hasta el mínimo y máximo dentro de los límites inferior y
superior.
6. Se marcan con un asterisco los valores fuera de los límites (valores atípicos).
bigote
Ejemplo 5
Se desea analizar el consumo de gas natural en los hogares de un distrito
limeño, el gasto mensual en este combustible, en nuevos soles de 36
hogares se muestra a continuación.
Modo A 28 29 32 37 33 25 29 32 45 34
Modo B 29 31 33 32 34 30 31 32 35 33
Indice de calidad
distribución asimétrica_______________
mientras que el índice de calidad en la
100
planta B presenta distribución
asimétrica____________________
3. La variabilidad del índice de calidad en el
50
50% central es mayor en la planta ______
que en la planta __________
4. El índice de calidad presenta valores
0
atípicos en la planta ______ mientras que Planta A Planta B
el índice de calidad no presenta valores Fuente: Elaboración propia
atípicos en la planta _______
Bibliografía
Enlace encuestas.com
http://www.encuestas.com.pe/encuesta-aprobacion-presidencial-gfk-abril-2014/
Diario Gestión
http://gestion.pe/economia/cajamarca-y-su-debil-entorno-economico-2073242
Publicación digital INEI
http://www.inei.gob.pe/media/MenuRecursivo/publicaciones_digitales/Est/Lib1157/libro.pdf
Cuaderno de Trabajo del curso
Material producido para el curso de coloque aquí el nombre del curso
Autor: Profesores del curso
Probabilidades
Operaciones de eventos
Axiomas y Teoremas de Probabilidades
Logro de la sesión
• Al término de la sesión, el estudiante calcula las
probabilidades en situaciones de incertidumbre
para la toma de decisiones en casos reales del
ámbito de su profesión.
1
Evento:
Es un subconjunto del espacio muestral. Para
simbolizar se utiliza las primeras letras del alfabeto,
ejemplo: A, B, C,…. etc.
Evento Compuesto
Es una colección específica de puntos muestrales.
Operaciones con eventos
Unión: AUB Intersección: AB
Complemento de un evento
AC
Eventos mutuamente excluyentes
Son aquellos eventos donde la ocurrencia de uno de ellos excluye la
ocurrencia del otro, esto no pueden ocurrir los dos a la vez.
Ω
A B
2
Probabilidad
¿Es posible que al enviar una señal,
ésta no llegue al destino final?
P() = 1.
Sea {Aj}, Aj , j=1,2,...,n una sucesión de eventos
mutuamente excluyentes, entonces:
Teorema: P( A) P( A ) 1
c
P(ABC) P(BAC)
= P(A)-P(AB) =P(B)-P(AB)
= P(sólo A) = P(sólo B)
La probabilidad de la unión de
dos eventos cualesquiera P(AB)=P(A)+P(B)-P(AB)
P(AB)=P(A)+P(B)
Ejemplo 1
Si A y B son eventos mutuamente excluyentes, y se conoce que
P(A) = 0,2 y que P(B) = 0,3.
Calcule:
P(AC) ; P(BC) ; P(Aᴜ B) ; P(A ∩ B) ; P(AC ∩ BC) ; P(AC ∩ 𝐵) ;
P(BC ∩ 𝐴 )
Ejemplo 2
Si A y B son eventos tal que: P(A) = 0.2; P(B) = 0.3 y P(A ∩ B) = 0.1
Calcule:
P(AC) ; P(BC) ; P(Aᴜ B) ; P(A ∩ B) ; P(AC ∩ BC) ; P(AC ∩ 𝐵) ; P(BC ∩
𝐴)
Ejemplo 3
En un lote de vehículos, hay 10 vehículos rojos, 20 vehículos
blanco y 12 vehículos azules.
Si extrae un vehículo al azar:
1. ¿cuál es la probabilidad que el vehículo sea rojo o azul?
2. ¿cuál es la probabilidad que el vehículo no sea blanco?
Ejemplo 4
Una fabrica trabaja con dos máquinas procesadoras A y B. La
probabilidad que la máquina procesadora A funcione
correctamente es 0,85 y que la máquina procesadora B
funciones correctamente es 0,78. La probabilidad de que al
menos uno de las dos funcione correctamente es 0,92.
Determine la probabilidad de que funcione correctamente sólo
una máquina.
Ejemplo 3 – Solución:
R: Vehículo rojo, B: Vehículo blanco, A: Vehículo azul
n(R)=10 n(B)=20 n(A)=12 n(Ω)=42
1. ¿cuál es la probabilidad que el vehículo sea rojo o azul?
Como son eventos mutuamente excluyentes la fórmula es:
P(R U A) = P(R) + P(A) = 10/42 + 12/42 = 0,5238
2. ¿cuál es la probabilidad que el vehículo no sea blanco?
P(BC)=1- P(B) = 1 – 20/42 = 0,5238
Ejemplo 4 – Solución:
A: Máquina procesadora A funciona correctamente. P(A)=0,85
B: Máquina procesadora B funciona correctamente. P(B)=0,78
P(AUB)=0,92 (al menos uno de las dos funcione correctamente)
Colegio de A: B: C:
Ingeniería Ingeniería
Procedencia Ingeniería
Informació Empresaria
Industrial
n l
N: Nacional 140 65 155 360
C
N : Particular 280 85 245 610
Total 420 150 400 970
a. ¿ Cuál es la probabilidad de que sea de Ingeniería Industrial o no pertenezca a
colegio nacional?
P(A U Nc)=750/970
b. ¿Cuál es la probabilidad de que sea de estudiante de Ingeniería Empresarial?
P(C) = 400/970
c. ¿Cuál es la probabilidad de que no sea de colegio nacional?
P(NC) = 610/970
d. ¿Cuál es la probabilidad de que sea de Ingeniería empresarial y de colegio
particular?
P(C ∩ NC) = 245/970
Ejemplo de repaso
El 30% de los estudiantes en una universidad son limeños, el
10% estudian ingeniería, el 1% estudian ingeniería y son
limeños. Si se selecciona al azar un estudiante:
Cuaderno de trabajo
ANDERSON, David R.; SWEENEY, Dennis; WILLIAMS, Thomas. 2012. Estadística para Negocios y
Economía, México, Editorial Cengage Learning,
.http://jaguar.cgr.go.cr/content/dav/jaguar/Documentos/cgr/centro_conoc/pdfs/economia_est
adistica/estadistica-adm.pdf
Material producido para el curso:
Por equipo de profesores de Estadística Aplicada I
ESTASÍSTICA APLICADA 1- PREGRADO
COPYRIGHT © UPC 2016
ESTADÍSTICA APLICADA I
Variable aleatoria
Variable aleatoria discreta
Función de probabilidades
Valor esperado y varianza
Variable aleatoria
Sea E un experimento y Ω el espacio muestral asociado, una variable aleatoria es
una descripción numérica del resultado de un experimento aleatorio.
Una variable aleatoria asocia un valor numérico a cada uno de los resultados
experimentales, es una función que asigna valores numéricos a los elementos del
espacio muestral.
El rango de la variable aleatoria X es el conjunto RX de todos sus posibles valores.
S Reales
w
x=X(w)
RX
V.A.DISCRETA V.A.CONTINUA
Su rango es un conjunto
Ejemplos
• Número de artículos • Peso de una persona
producidos al mes. en kilogramos.
• Número de clientes que • Tiempo de fabricación
llegan a un banco. de un perno en minutos.
Ejemplos
Experimento Variable Valores posibles
Aleatoria
X x1 X2 … xn
p(X=xi) = f(xi) f(x1) f(x2) … f(xn)
Función de
probabilidad
Valor esperado y varianza
E g x g xi f xi
Ejemplo 1:
El Centro de Información ha registrado la siguiente tabla de
distribución de probabilidad para el número de libros por semana que
un estudiante solicita.
Número de libros por semana 0 1 2 3 4
Probabilidad f(x) 0,2 4b 2b 0,15 b/2
V[a] = 0
E[aX] = a E[X]
V[aX] = a2 V[X]
PARÁMETROS nyp
f x PX x C xn p x 1 p
n x
FUNCIÓN DE
PROBABILIDAD x 0 ,1, 2 , , n
VALOR E(X) = np
ESPERADO
n (muestra)
Si una variable aleatoria X tiene distribución Hipergeométrica:
Se denota X ~ H (N, n, r)
N = Tamaño de población
n = Tamaño de muestra
r = Número de éxitos en la población
Número de éxitos obtenidos en
VARIABLE la muestra de n elementos.
PARÁMETROS N, n y r
Cxr CnNxr
FUNCIÓN DE f x P X x
PROBABILIDAD CnN
x max 0, n r N , , min r , n
r
VALOR ESPERADO E X n
N
r r N n
VARIANZA V X n 1
N N N 1
Ejemplo 2:
Una compañía manufacturera utiliza un
mecanismo de control para realizar el
embarque de sus artículos por aduana. De
una caja de 25 artículos de los cuales hay 2
artículos defectuosos, se selecciona una
muestra de 4 artículos para verificar si tiene
algún artículo defectuoso.
Si se encuentra al menos un artículo defectuoso, la caja entera
se regresa para verificarla al 100%. Caso contrario, la caja se
embarca.
Probabilidad Condicional
Independencia de Eventos
Probabilidad Total
Teorema de Bayes
Logro de la sesión
• Calcular la probabilidad de un evento a partir de
probabilidades condicionadas (Probabilidad Total).
• Aplicar el “Teorema de Bayes” a un evento de
interés.
1
PROBABILIDAD CONDICIONAL
Probabilidad Condicional
Sean los eventos A y B , y además se sabe que P(B) >0, entonces la
probabilidad de que ocurra A, dado que ya ocurrió B, se denomina
Probabilidad Condicional de A dado B; y se calcula mediante la siguiente
expresión:
P( A B)
P( A B) ; P( B) 0
P( B)
P A i B
k k
i1 i1 P( A i B)
Ejemplo 1
En una conferencia,
la siguiente forma:
los concurrentes se encuentran distribuidos de
REGLA DE MULTIPLICACIÓN
INDEPENDENCIA DE EVENTOS
Regla de la multiplicación
Sean los eventos A y B , con P(B)>0, entonces a
partir del teorema de probabilidad condicional se
cumple:
P( A B)
P( A B)
P( B) P( A B) P( A B) P( B)
También:
P( A B) P( A B) P( B A) P( A)
P( B A)
P( A)
Eventos independientes
Son aquellos eventos en los que la ocurrencia de un evento
no influye en la ocurrencia de otro u otros eventos.
P(A B) = P(A)xP(B)
Propiedades
Si los eventos A y B son independientes,
entonces también son independientes:
Nota
Estas propiedades se pueden generalizar a más
de dos eventos.
Ejemplo 4
En la fabricación de cierto producto se presenta el
defecto tipo 1 con una probabilidad de 0,01 y el
defecto tipo 2 con una probabilidad de 0,05. Si las
ocurrencias de los defectos en los productos son
independientes, calcule la probabilidad de que:
A1 A2 … Ak
k k
PB PB A i PA i PB A i
i 1 i 1
Árbol de probabilidades
Solución:
A Bc
P(A) = 0.60 P(Bc/A) = 0.10
Ac
P(Ac) = 0.40
Bc
P(Bc /Ac) = 0.80
a) P (B) = P(A) . P(B/A) + P(Ac) . P(B/Ac) = 0.60 . 0.90 + 0.40 . 0.20 = 0.62
El experimento aleatorio:
Cuaderno de trabajo
ANDERSON, David R.; SWEENEY, Dennis; WILLIAMS, Thomas. 2012. Estadística para Negocios y
Economía, México, Editorial Cengage Learning,
.http://jaguar.cgr.go.cr/content/dav/jaguar/Documentos/cgr/centro_conoc/pdfs/economia_est
adistica/estadistica-adm.pdf
Material producido para el curso:
Por equipo de profesores de Estadística Aplicada I
ESTASÍSTICA APLICADA 1- PREGRADO
COPYRIGHT © UPC 2017
ESTADÍSTICA APLICADA I
Variable aleatoria
Variable aleatoria discreta
Función de probabilidades
Valor esperado y varianza
Variable aleatoria
Sea E un experimento y Ω el espacio muestral asociado, una variable aleatoria es
una descripción numérica del resultado de un experimento aleatorio.
Una variable aleatoria asocia un valor numérico a cada uno de los resultados
experimentales, es una función que asigna valores numéricos a los elementos del
espacio muestral.
El rango de la variable aleatoria X es el conjunto RX de todos sus posibles valores.
S Reales
w
x=X(w)
RX
V.A.DISCRETA V.A.CONTINUA
Su rango es un conjunto
Ejemplos
• Número de artículos • Peso de una persona
producidos al mes. en kilogramos.
• Número de clientes que • Tiempo de fabricación
llegan a un banco. de un perno en minutos.
Ejemplos
Experimento Variable Valores posibles
Aleatoria
X x1 X2 … xn
p(X=xi) = f(xi) f(x1) f(x2) … f(xn)
Función de
probabilidad
Valor esperado y varianza
E g x g xi f xi
Ejemplo 1:
El Centro de Información ha registrado la siguiente tabla de
distribución de probabilidad para el número de libros por semana que
un estudiante solicita.
Número de libros por semana 0 1 2 3 4
Probabilidad f(x) 0,2 4b 2b 0,15 b/2
V[a] = 0
E[aX] = a E[X]
V[aX] = a2 V[X]
PARÁMETROS nyp
f x PX x C xn p x 1 p
n x
FUNCIÓN DE
PROBABILIDAD x 0 ,1, 2 , , n
VALOR E(X) = np
ESPERADO
n (muestra)
Si una variable aleatoria X tiene distribución Hipergeométrica:
Se denota X ~ H (N, n, r)
N = Tamaño de población
n = Tamaño de muestra
r = Número de éxitos en la población
Número de éxitos obtenidos en
VARIABLE la muestra de n elementos.
PARÁMETROS N, n y r
Cxr CnNxr
FUNCIÓN DE f x P X x
PROBABILIDAD CnN
x max 0, n r N , , min r , n
r
VALOR ESPERADO E X n
N
r r N n
VARIANZA V X n 1
N N N 1
Ejemplo 2:
Una compañía manufacturera utiliza un
mecanismo de control para realizar el
embarque de sus artículos por aduana. De
una caja de 25 artículos de los cuales hay 2
artículos defectuosos, se selecciona una
muestra de 4 artículos para verificar si tiene
algún artículo defectuoso.
Si se encuentra al menos un artículo defectuoso, la caja entera
se regresa para verificarla al 100%. Caso contrario, la caja se
embarca.
PARÁMETROS l
e l lx
FUNCIÓN DE f x P X x
x!
PROBABILIDAD
x 0 ,1, 2 ,
VARIANZA V(X) = l
Ejemplo 3:
Los cambios realizados en los
procedimientos de los aeropuertos
requieren una planeación
considerable. Los índices de llegada
de los aviones es un factor
importante que se debe tomar en
cuenta. Si los aviones pequeños
llegan al aeropuerto con una media
de 6 por hora.
a. Defina la variable en estudio y halle la probabilidad de que exactamente
cuatro aeronaves pequeñas lleguen en un lapso de una hora.
b. ¿Cuál es la probabilidad que lleguen más de 4 aeronaves en una hora?
c. Defina la variable en estudio y ¿Cuál es la probabilidad de que
exactamente cuatro aeronaves pequeñas lleguen en un lapso de media
hora?
d. ¿Cuál es la probabilidad que lleguen más de 4 aeronaves en media hora?
Pasos para el cálculo de Probabilidad_ de VAD:
Distribución Binomial
- Identifique el Tipo de Distribución: Distribución Hipergeométrica
Distribución Poisson
PARÁMETROS nyp
f x PX x C xn p x 1 p
n x
FUNCIÓN DE
PROBABILIDAD x 0 ,1, 2 , , n
VALOR E(X) = np
ESPERADO
n (muestra)
Si una variable aleatoria X tiene distribución Hipergeométrica:
Se denota X ~ H (N, n, r)
N = Tamaño de población
n = Tamaño de muestra
r = Número de éxitos en la población
Número de éxitos obtenidos en
VARIABLE la muestra de n elementos.
PARÁMETROS N, n y r
Cxr CnNxr
FUNCIÓN DE f x P X x
PROBABILIDAD CnN
x max 0, n r N , , min r , n
r
VALOR ESPERADO E X n
N
r r N n
VARIANZA V X n 1
N N N 1
Ejemplo 2:
Una compañía manufacturera utiliza un
mecanismo de control para realizar el
embarque de sus artículos por aduana. De
una caja de 25 artículos de los cuales hay 2
artículos defectuosos, se selecciona una
muestra de 4 artículos para verificar si tiene
algún artículo defectuoso.
Si se encuentra al menos un artículo defectuoso, la caja entera
se regresa para verificarla al 100%. Caso contrario, la caja se
embarca.
PARÁMETROS l
e l lx
FUNCIÓN DE f x P X x
x!
PROBABILIDAD
x 0 ,1, 2 ,
VARIANZA V(X) = l
Ejemplo 3:
Los cambios realizados en los
procedimientos de los aeropuertos
requieren una planeación
considerable. Los índices de llegada
de los aviones es un factor
importante que se debe tomar en
cuenta. Si los aviones pequeños
llegan al aeropuerto con una media
de 6 por hora.
a. Defina la variable en estudio y halle la probabilidad de que exactamente
cuatro aeronaves pequeñas lleguen en un lapso de una hora.
b. ¿Cuál es la probabilidad que lleguen más de 4 aeronaves en una hora?
c. Defina la variable en estudio y ¿Cuál es la probabilidad de que
exactamente cuatro aeronaves pequeñas lleguen en un lapso de media
hora?
d. ¿Cuál es la probabilidad que lleguen más de 4 aeronaves en media hora?
Pasos para el cálculo de Probabilidad_ de VAD:
Distribución Binomial
- Identifique el Tipo de Distribución: Distribución Hipergeométrica
Distribución Poisson
Distribución Exponencial
Temario
• Distribución Uniforme
• Distribución Exponencial
• Distribución Normal
Logro de la sesión
• Al finalizar la sesión, el estudiante calcula
probabilidades asociadas a la distribución
Uniforme, Exponencial y Normal
1
Distribución Uniforme
Metro de Lima
• Cuenta con 36 trenes y
Metropolitana Actualmente sus tiempos de espera
el tren entre un tren a otro se
eléctrico encuentra entre 5 a 10
minutos.
GRÁFICO 1 / (b-a)
f (x)
0 a k1 k2 b x
FUNCIÓN
Fx
x -a
ACUMULADA b-a
VALOR ab
X E X
ESPERADO 2
(b a) 2
VARIANZA V X
2
X
12
Ejemplo:
El tiempo que un estudiante tarda en resolver un examen se modela
como una variable aleatoria continua que con distribución de
probabilidad uniforme de parámetros a = 50 minutos y b = 90 minutos.
Calcule la probabilidad de:
(𝟕𝟓−𝟓𝟎)
b) P(50<X<75) = = 0,625
𝟒𝟎
(𝟗𝟎−𝒌)
c) P(X>k) = 0,20 entonces = 0,20; k = 82 minutos
𝟒𝟎
𝝈 𝟏𝟏,𝟓𝟒𝟕
d) CV = * 100 = * 100 = 16,5%
𝝁 𝟕𝟎
2
Distribución Exponencial
Metro de Lima
• Cuenta con 36 trenes y
Metropolitana Actualmente sus tiempos de espera
el tren entre un tren a otro se
eléctrico encuentra entre 5 a 10
minutos.
El tiempo de espera en un
banco
GRÁFICO
x
Fx 1 e
FUNCIÓN ACUMULADA β
VARIANZA x2 V ( X ) 2
Ejemplo:
El tiempo hasta que falle por primera vez la batería de un celular se
distribuyen según un modelo exponencial, con un tiempo promedio de
vida útil es de 500 horas.
a) Calcule la probabilidad de
una batería funcione más
de 600 horas.
b) ¿Cuál es el tiempo máximo
que funcionan la batería
para estar en el 15% de las
baterías que menos duran?
𝑘
Ln(0,85) = - entonces k = 81,26 horas
500
3
Distribución Normal y
Normal estándar
Metro de Lima
Metropolitana Actualmente
• Cuenta con 36 trenes y
sus tiempos de espera
el tren entre un tren a otro se
eléctrico encuentra entre 5 a 10
minutos.
1 x
2
1
f x e 2
x
2
El extremo izquierdo se
extiende de manera El extremo derecho se
indefinida y nunca toca el extiende de manera
eje horizontal. indefinida y nunca toca el
eje horizontal.
X
Z
Estandarización:
Ejemplo:
Una máquina despachadora de refrescos
está ajustada para servir un promedio de
200
mililitros por vaso. Si la cantidad de
refresco es normalmente distribuida con
una desviación estándar de 15 mililitros:
(224−200)
a. P(X > 224) = 1 – P ( X≤ 224) = 1 – P ( Z ≤ ) =1–
15
P(Z≤1,60) = 1 – 0, 9452 = 0,0548
(191−200) (209−200)
b. P( 191 ≤ X ≤ 209 ) = P( ≤Z≤ )
15 15
P(- 0,60 ≤ Z ≤0,60) = P(Z ≤ 0,60) – P (Z ≤ - 0,60) =
0,7257 – 0,2743 = 0,4514
a. ¿Debajo de qué valor se obtiene el 25% de refrescos con
menor contenido?
Sean X1, X2 y X3 tiempo que se demora un brazo en ensamblar una
pieza de un producto,
X1: Tiempo del brazo mecánico 1 ~ N(12; 0,02)
X2: Tiempo del brazo mecánico 2 ~ N(24; 0,03)
X3: Tiempo del brazo mecánico 3 ~ N(18; 0,04)
¿Qué distribución tendría el tiempo
total de ensamblaje Xt=X1+X2+X3?
Propiedad reproductiva de la Normal
• Si X1, X2, ... , Xk son variables aleatorias
independientes tales que Xi N(i ,i2) entonces
la variable aleatoria
k
k k
2 2
Y ci X i N ci i , ci i
i 1 i 1 i 1
La función de densidad de
probabilidad para una
variable aleatoria continua
es la función f que
satisface:
P a X b f ( x)dx
b
f x 0 f x dx 1
a
Se cumple que:
y = f(x)
f x dx
-
1
Observación
Si X es una variable aleatoria continua, se
cumple:
1. P a X b P a X b f ( x)dx
b
P a X b P a X b f ( x)dx
b
P a X b P a X b f ( x)dx
b
2. P( X a) 0
Valor Esperado y Varianza
E X X x f x dx
Valor esperado de X
E[a X ± b] = a E[X] ± b
Valor Esperado
V aX b a . V X
2
V aX bY a . V X b V Y
2 2
Varianza