Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CARRERAS EN LÍNEA
PROBABILIDAD Y ESTADISTICA
DOCUMENTO BASE DE LECTURA DEL TEMA Nº 1
“ESTADISTICA DESCRIPTIVA”
Universidad Estatal de Milagro – UNEMI
Este compendio recoge textualmente documentos e información de varias fuentes debidamente citadas, así
como referencias elaboradas por el autor para conectar los diferentes temas.
Se lo utilizará únicamente con fines educativos
CARRERAS EN LÍNEA
Probabilidad y Estadística
Unidad 1.- Estadística Descriptiva
Objetivo
Desarrollo de subtemas:
Introducción
En el Ecuador existen eventos electorales cada cierto intervalo de tiempo, y estos son
realizados por organismos del gobierno, de tal forma que los partidos políticos inscriben
sus candidaturas para poder tener sus representantes como candidatos, esto deriva a que
en las vísperas de las elecciones existan estudios previos para conocer el posible
ganador y estos resultados aunque en muchos casos son usados para captar mayor
cantidad de votos, son obtenidos de acuerdo a la aceptación del candidato y le dará una
idea general de su situación y preferencia de sus electores. Las preguntas que se podrían
generar de estos estudios es: ¿Cuál fue el tamaño de la muestra para poder tener un
criterio de validez del estudio? ¿Qué niveles de tolerancia manejo el estudio? ¿Qué tipo
de muestreo se utilizó para ello? ¿Se manejó muestras de reposición? Y así existirán un
sin número de interrogantes que mediante el uso de la Estadística se pudieran responder,
una vez que existan resultados oficiales se podrían analizar que el estudio tuvo el mayor
acercamiento a los resultados reales y se podría definir quien uso o encontró el modelo
que permitiría poder predecir un posible resultado electoral, sin embargo, para llegar a
CARRERAS EN LÍNEA
estos modelos deberían ser validados con relación al tiempo y contrastados con más
resultados reales.
En ingeniería, esto incluye tareas tan diversas como calcular la longitud promedio
de los tiempos muertos en una computadora, recabar y presentar datos acerca
del número de individuos que asisten a un seminario sobre energía solar, evaluar
la efectividad de productos comerciales, predecir la confiabilidad de un vehículo
de lanzamiento y estudiar las vibraciones en las alas de una aeronave.(Miller &
Freund, 1993)
Importancia
de datos en modo de tablas y gráficas, luego paso a ser una técnica muy útil para
la realización de investigaciones que contengan valores descriptivos. (Johnson,
2012)
Estadística Descriptiva
Este método al ser básicamente la descripción de los datos no puede asumir que
estos tengan algún tipo de propiedad más allá de la que la misma descripción
menciona, debido a que se dedica únicamente a describir y analizar los datos de
un grupo dado, sin argumentar ninguna conclusión ni tampoco hacer inferencia de
grupos más grandes. Es probable que sea utilizada al inicio del análisis, es decir
cuando se tiene contacto por primera vez con los datos.
Al sustituir o reducir el grupo de datos que se han obtenido por un mínimo número
dentro de los valores descriptivos como: el promedio, la mediana, la media
geométrica, la varianza, la desviación típica, etc. Esta ayuda brindaría las
propiedades relevantes de todos los datos que se han observado, así como
también las principales características que podrían ser clave dentro del grupo de
investigación.
Con frecuencia esta técnica propone una metodología sencilla y con una gran
eficiencia para poder caracterizar los datos resumidos, además de ofrecer un
modelo sencillo de presentación de toda dicha información recopilada.
Y esa así se considera un método con un potencial alto que se podría aplicar en
las diversas situaciones que pueden presentarse en la que se involucraría la
utilización de los datos, además de la ayuda en la comprensión e interpretación de
los diferentes datos siendo de mucha utilidad al momento de la toma de
decisiones.
Estadística Inferencial
CARRERAS EN LÍNEA
Al principio suelen formarse ciertas interrogantes como: ¿hay alguna relación entre
estas dos poblaciones?, ¿Cuál sería la mediana de esta población de acuerdo a
sus características?, aquí es donde se define claramente lo que se va proceder a
estudiar en una determinada población sean las variables, etc.
Es importante saber que este método es utilizado cuando se requiere ejecutar una
afirmación por encima de los elementos a medir.
Población
CARRERAS EN LÍNEA
Muestra
Tipos de variables
a) Cualitativas: Los valores que determinan esta variable son cualidades, no
números. Ejemplo: sexo, color, religión, etc.
b) Cuantitativa: los valores que determinan esta variable son números. Estas
se dividen en:
» Discretas: En cada lapso, la variable solo puede ser designada por un
número definido de valores. Ejemplo: número de caras de una moneda,
número de hijos, etc.
» Continuas: en cada lapso, la variable puede ser asignada por valores
infinitos. Ejemplo: peso, estatura, etc.
Niveles de medición
CARRERAS EN LÍNEA
a) Escala nominal
Entre los cuatro niveles esta es la menos elaborada y posee básicamente dos
propiedades primordiales.
Primero permite clasificar personas o cosas con fundamento a una evaluación de
las cualidades sometidas a consideración; segundo la utilización de esta no
proporciona información en relación a la cantidad.
Las mediciones en escala nominal no permiten hacer comparaciones de “mas” o
“menos” sino más bien de “similar” o “distinto”.
b) Escala ordinal
Es parecida a la escala nominal clasifica a personas o cosas de acuerdo a sus
cualidades y características evaluadas. Sin embargo, la diferencia radica en que la
escala ordinal en sus clasificaciones incorpora características muy importantes de
“mayor que” o “menor que”.
c) Escala de intervalo
Esta escala agrega características de “cuánto más” y “cuánto menos” a aquellos
de la escala ordinal.
El defecto de esta escala es la carencia de un punto cero verdadero, es decir el
cero no significa que no exista determinada característica, sino sencillamente es
otro punto más en la escala.
d) Escala de razón
CARRERAS EN LÍNEA
Presentación de datos
Los datos estadísticos del resultado de una investigación, experimento o cualquier
tipo de mediciones a menudo son tan numerosos que resultan inservibles a menos
que estas se reduzcan de una manera adecuada. A continuación, conoceremos
como realizar las tablas de frecuencia. (Taylor R. C., 2008)
Tabla de frecuencia
Es la representación de un grupo de datos a manera de tabla o subconjunto de
datos que corresponden a un tema de investigación y que son ordenados en base
al número de observaciones correspondientes a cada uno de los datos o a cada
grupo de datos, los cuales se adecuan a un estudio cualitativo o cuantitativo,
cronología, geografía. Estas tablas se pueden elaborar mediante datos agrupados
Ejemplo #1: Se dan datos del peso(kg) de los alumnos del tercer año de una
institución educativa: 75, 52, 36, 45, 75, 52, 36, 45, 75, 52, 36, 45, 75, 52, 45, 75,
36, 52, 45, 75. Elaborar una tabla de frecuencia para datos agrupados.
M clase fi Xi Fi
20
Gráficos estadísticos
1. Gráfica de barras
Este tipo de grafica se utilizan con frecuencia para describir datos, consiste
básicamente en ordenar los sucesos de mayor a menor, necesitarían
generalmente de dos o tres elementos que representen más de la mitad de la
frecuencia total. (Taylor R. C., 2008)
12
10
0
fútbol hockey basketball nadar tennis no hacen
deporte
CARRERAS EN LÍNEA
2. Diagrama de puntos
En este grafico se comparan las proporciones acumuladas de una variable con las
de una distribución normal, si la variable escogida corresponde con la de la
distribución de prueba, los puntos se consolidan alrededor a una línea recta.
(Taylor R. A., 2012)
71.1; 6
47.7; 5 55.5; 5
39.9; 4
63.3; 0
0 1 2 3 4 5 6
3. Histogramas
Es el diseño más frecuentemente usado de presentación grafica dentro de una
distribución de frecuencias debido a que nos permite observar las pautas, este
proporciona un resumen de la variación de un grupo de datos. Se realizan con
rectángulos adyacentes, la altura de estos representa las frecuencias de la clase y
las bases de los mismos se esparcen entre límites de clases sucesivas. (Taylor R.
C., 2008)
Ejemplo 3: con los datos de la tabla 1. Elabore un histograma
CARRERAS EN LÍNEA
Histograma
7
0
[36;43.8) [43.8;51.6) [51.6;59.4) [59.4;67.2) [67.2;75]
4. Polígonos de frecuencia
Es un gráfico creado por la unión de rectas, partiendo desde el origen del grafico
de histograma y prolongándose con la unión de los puntos medios de cada clase
del gráfico.
Ejemplo 4: Con el uso de los datos de la tabla 1. Elabore un polígono de
frecuencia
Polígono de frecuencia
7
6
5
4
3
2
1
0
0 39.9 47.7 55.5 63.3 71.1 y mayor …
5. Diagrama circular
Conocido comúnmente como pastel, pie o manzana. Es un círculo divido en varias
partes dependiendo de las clases que tenga la variable, de manera que a cada
una le corresponda un arco de circulo proporcional a su frecuencia absoluta o
relativa.
CARRERAS EN LÍNEA
DEPORTES
no hacen deporte futbol
nadar
10% 22%
14%
basketball
hockey 18%
20% tennis
correr
6% 10%
6. Ojiva
» Ojiva ascendente
Ejemplo 6: Con el uso de los datos de la tabla 1. Elabore una ojiva ascendente
Ojiva ascendente
25
20
15
10
0
0 39.9 47.7 55.5 63.3 71.1
CARRERAS EN LÍNEA
» Ojiva descendente
Ojiva descendente
25
20
15
10
0
39.9 47.7 55.5 63.3 71.1
85 89 76 110 104 78 84 96 90 75
102 80 56 78 84 66 69 78 84 98
CARRERAS EN LÍNEA
42 56 58 59 62 66 69 75 76 78
78 78 79 79 80 82 84 84 84 85
86 89 90 94 95 96 98 98 102 104
105 108 110 115 120 120 120 122 130 134
𝑅𝑎𝑛𝑔𝑜 134−42
Amplitud: 𝑎 = = = 15,33 ≈ 𝟏𝟔
𝑚 6
40
Histograma
16
14
12
Frecuencia Absoluta
10
0
[40 – 58) [58 – 74) [74 – 90) [90 – 106) [106 – 122) [122 – 138)
Intervalos de clase
CARRERAS EN LÍNEA
Poligono de Frecuencia
16
14
12
Frecuencia Absoluta
10
8
6
4
2
0
[40 – 58) [58 – 74) [74 – 90) [90 – 106) [106 – 122) [122 – 138)
Intervalos de clase
30
25
20
15
10
5
0
[40 – 58) [58 – 74) [74 – 90) [90 – 106) [106 – 122) [122 – 138)
Intervalos de clase
CARRERAS EN LÍNEA
30
25
20
15
10
5
0
[40 – 58) [58 – 74) [74 – 90) [90 – 106) [106 – 122) [122 – 138)
Intervalos de clase
Recursos complementarios:
Los siguientes recursos complementarios son sugerencias para que se pueda ampliar la
información sobre el tema trabajado, como parte de su proceso de aprendizaje
autónomo:
Referencias:
Lind, D., Marchal, W., & Wathen, S. (2012). Estadistica aplicada a los negocios y la
economía. Estadistica aplicada a los negocios y la economía (Vol. 15).
https://doi.org/10.1007/s13398-014-0173-7.2
PROBABILIDAD Y ESTADISTICA
DOCUMENTO BASE DE LECTURA DEL TEMA Nº 1
“ESTADISTICA DESCRIPTIVA”
Universidad Estatal de Milagro – UNEMI
Este compendio recoge textualmente documentos e información de varias fuentes debidamente citadas, así
como referencias elaboradas por el autor para conectar los diferentes temas.
Se lo utilizará únicamente con fines educativos
CARRERAS EN LÍNEA
Probabilidad y Estadística
Unidad 1.- Estadística Descriptiva
Objetivo
Desarrollo de subtemas:
∑𝑛𝑖=1 𝑥𝑖
𝑥̅ =
𝑛
𝑥̅ = Es la media aritmética
∑𝑛𝑖=1 𝑓𝑖 𝑥𝑖
𝑥̅ =
𝑛
Donde
𝑥(𝑛⁄2) + 𝑥(𝑛+1)
2
𝑛 𝑝𝑎𝑟 𝑀𝑒 =
𝑀𝑒 = 2
𝑛+1
{ 𝑛 𝑖𝑚𝑝𝑎𝑟 𝑀𝑒 = 𝑥 ( )
2
Donde
𝑛+1
( ) − (∑ 𝑓𝑐 + 1)
𝑀𝑒 = 𝐿1 + [ 2 ]∗𝑎
𝑓𝑑
Dónde:
𝒏
= es la cantidad de los datos dividida para 2
𝟐
a) Datos no agrupados
Cuando los datos ya han sido ordenados de manera ascendente y descendente se
visualiza los datos repetidos con mayor frecuencia, estos son los que contienen a la
moda (Mo).
b) Datos agrupados
En los datos agrupados la moda (Mo) es la marca de la clase que incluya la mayor
frecuencia absoluta (fi). Y se calcula mediante la fórmula:
CARRERAS EN LÍNEA
Δ1
𝑀𝑜 = 𝐿1 + ∗𝑎
Δ1 + Δ2
Dónde:
Δ1= Es la diferencia entre la frecuencia absoluta de la clase que contiene a la moda con la
anterior.
a= Amplitud.
Ejercicio #1: Se toma una muestra a 150 estudiantes de la porción de proteínas que
consumen a la semana. Obteniendo los siguientes resultados:
4,6 21 15 23,8 9,5 2,3 13,5 20,7 5,2 22,9 18.,2 22,4 21,7 7,3 23,4
21,9 10 1,5 14,5 17,3 16,2 5,3 8,2 9,1 4,7 1,6 9,8 5,4 21 17,5
12,7 15 4,7 17,3 2,8 9,7 21 2,6 10,1 5,8 8,9 18,4 11 3,9 19,9
23,7 21 15 6,4 17,7 17,5 2 10,7 14,7 15 19,5 4,9 18,3 21 23,5
11,2 3,1 16 21,1 3,5 17,6 5,5 15,6 6 15 4,2 16,3 22,7 4 24,7
8 15 7,9 8,6 10,5 24,3 8,4 18,5 9,3 19,8 17,1 11,1 24,4 13,3 22,3
22,9 21 1,9 10,8 1,3 6,7 5 16,5 3 4,8 17,1 17,8 21,9 7,8 20,5
24,1 5,3 21 14,9 8,5 15 9 15,3 15 20,2 17 2,7 17,9 21 12,5
1,8 15 15 7,8 24,2 3,4 6,3 19,2 4,5 7,5 23,8 20,3 7 13,8 21,5
14,4 21 21 11,7 9,4 21,9 21,3 15,4 23,2 14,3 7,4 24,7 11,5 14,2 22,9
Fuente: Creación propia
Solución:
Primero ordenamos los datos de forma ascendente o descendente. Es este caso será
de forma ascendente
1,3 1,5 1,6 1,8 1,9 2 2,3 2,6 2,7 2,8 3 3,1 3,4 3,5 3,9
4 4,2 4,5 4,6 4,7 4,7 4,8 4,9 5 5,2 5,3 5,3 5,4 5,5 5,8
6 6,3 6,4 6,7 7 7,3 7,4 7,5 7,8 7,8 7,9 8 8,2 8,4 8,5
8,6 8,9 9 9,1 9,3 9,4 9,5 9,7 9,8 10 10,1 10,5 10,7 10,8 11
11,1 11,2 11,5 11,7 12,5 12,7 13,3 13,5 13,8 14,2 14,3 14,4 14,5 14,7 14,9
CARRERAS EN LÍNEA
16,3 16,5 17 17,1 17,1 17,3 17,3 17,5 17,5 17,6 17,7 17,8 17,9 18,2 18,3
18,4 18,5 19,2 19,5 19,8 19,9 20,2 20,3 20,5 20,7 21 21 21 21 21
21 21 21 21 21 21,1 21,3 21,5 21,7 21,9 21,9 21,9 22,3 22,4 22,7
22,9 22,9 22,9 23,2 23,4 23,5 23,7 23,8 23,8 24,1 24,2 24,3 24,4 24,4 24,42
2038.42
𝑥̅ =
150
𝑥̅ = 13,5894
» Calculo de la mediana
Para este ejercicio utilizamos la fórmula de mediana para datos pares debido a que la
cantidad de nuestros datos es 150 un número par. Procedemos a colocar 150 en “n”
obteniendo
𝑥(𝑛⁄2) + 𝑥(𝑛+1)
2
𝑀𝑒 =
2
𝑥(150⁄2) + 𝑥 150
(
2
+1) 𝑥75 + 𝑥76
𝑀𝑒 = =
2 2
Visualizamos en la tabla cual es el valor del dato número 75 y 76; para este ejercicio
es 14,9 y 15, procedemos a sumarlos y dividirlos para 2 obteniendo:
14,9 + 15
𝑀𝑒 =
2
𝑀𝑒 = 14.95
» Calculo de la moda
Cuando los datos ya han sido ordenados, procedemos a visualizar el dato que se
repite con mayor frecuencia.
Para este ejercicio la moda es 15 y 21, debido a que ambos valores se repiten con
una frecuencia igual a 10, por lo tanto, los resultados sería Mo1=15 y Mo2=21.
CARRERAS EN LÍNEA
Con los mismos datos de ejercicio 1 elabore una tabla de frecuencia para datos
agrupados y determine la media aritmética, mediana, moda desarrollar la tabla de
datos agrupados con m = 1 + 3.3 log(n).
Solución:
Xi
1,3 + 4,19
= 2.75
2
4,19 + 7,08
= 5,64
2
7,08 + 9,97
= 8,53
2
9,97 + 12,86
= 11,42
2
12,86 + 15,75
= 14,31
2
15,75 + 18,64
= 17,20
2
CARRERAS EN LÍNEA
18,64 + 21,53
= 20,09
2
21,53 + 24,42
= 22,98
2
Sumatoria 102,92
Luego multiplicamos los fi*xi. y por ultimo para completar la columna de la frecuencia
absoluta acumulada, vamos a sumar cada frecuencia absoluta más la siguiente.
m Clases fi Xi fi*xi Fi
1 [1.3;4.19) 16 2.75 44 16
2 [4.19;7.08) 19 5.64 107.16 35
3 [7.08;9.97) 19 8.53 162.07 54
4 [9.97;12.86) 12 11.42 137.04 66
5 [12.86;15.75) 22 14.31 314.82 88
6 [15.75; 18.64) 19 17.20 326.8 107
7 [18.64; 21.53) 22 20.09 441.98 129
8 [21.53; 24.42] 21 22.98 482.58 150
2016,45
𝑥̅ =
150
𝑥̅ = 13.443
» Calculo de la mediana
𝑛+1
( 2 ) − (∑ 𝑓𝑐 + 1)
𝑀𝑒 = 𝐿1 + [ ]∗𝑎
𝑓𝑑
CARRERAS EN LÍNEA
𝑛 150
= = 75
2 2
Buscamos en la frecuencia absoluta acumulada (Fi) el valor que contenga a 75 esta
será la clase que contiene la mediana en este caso es la clase 5.
75 − 66
𝑀𝑒 = 12,86 + ∗ 2,89
22
𝑀𝑒 = 14,04
» Calculo de la moda
Δ1
𝑀𝑜 = 𝐿1 + ∗𝑎
Δ1 + Δ2
La clase que contiene a la moda es el mayor valor de las frecuencias absolutas, este
ejercicio tiene dos modas: en la clase 5 y en la clase 7 debido a que en estas dos
clases el valor de la frecuencia absoluta es 22.
Moda 1 en la clase 5
10
𝑀𝑜 = 12,86 + ∗ 3,3
10 + 3
𝑀𝑜 = 15,39
Moda 2 en la clase 7
𝐿1 = 18,64
Δ1 = 22 − 19 = 3
Δ2 = 22 − 21 = 1
a = 2,89
3
𝑀𝑜 = 18,64 + ∗ 2,89
3+1
𝑀𝑜 = 20,81
2
∑𝑚
𝑖=1 𝑓𝑖 (𝑥𝑖 − 𝑥̅ )
2
𝜎 =
𝑛
La mayoría de las ocasiones, no se tiene la totalidad de las mediciones de una
determinada población disponibles, por ello será de utilidad realizar el cálculo de la
varianza de una muestra de n mediciones.
CARRERAS EN LÍNEA
Para entrar en detalle no es suficiente con conocer las medidas de tendencia central,
sino también las medidas de dispersión como lo es la desviación estándar la cua l
representa los datos en su distribución, con el único objetivo de tener una proyección
a la realidad para poder tener una buena descripción e interpretación para la toma de
decisiones (Triola, 2004)
Para datos no agrupados:
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝜎=√
𝑛
∑𝑚
𝑖=1 𝑓𝑖 (𝑥𝑖 − 𝑥̅ )
2
𝜎=√
𝑛
Donde
» fi = frecuencia absoluta de cada clase.
» xi = puntos medios de cada clase.
» x̅= media aritmética de los datos.
» n= número total de datos.
» m= número total de clases.
Ejercicios de aplicación
1. Dada los siguientes datos calcular la desviación estándar y varianza para
datos no agrupados. Sabiendo que su media aritmética es 163,67
CARRERAS EN LÍNEA
Procedemos a realizar la resta de cada uno de los valores con la media y los
elevamos al cuadrado (xi − x̅)2 ; obteniendo
|𝒙𝒊 − 𝒙
̅| 16,67 14,67 14,17 11,67 8,67 8,47 0,27 2,98
̅)𝟐
(𝒙𝒊 − 𝒙 277,88 215,20 200,78 136,15 75,16 71,74 0,07 8,88
Fuente: Creación propia
|𝒙𝒊 − 𝒙
̅| 4,33 5,33 6,33 7,33 7,83 16,13 24,33
̅)𝟐
(𝒙𝒊 − 𝒙 18,74 28,40 40,06 53,72 61,30 260,17 591,94
Fuente: Creación propia
» Calculamos la varianza
Sumamos todos los valores de (xi − x̅)2 y los dividimos para la cantidad de datos
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝜎2 =
𝑛
2040,19
𝜎2 =
15
𝜎 2 = 136,01
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝜎= √
𝑛
2040,19
𝜎=√ = √163,01
15
𝜎 = 11,66
M Clases 𝒇𝒊 𝒙𝒊
1 [147 ; 155,2) 5 151,1
Sumatoria 15
Fuente: creación propia
Para el cálculo de la varianza y desviación estándar restamos los puntos medios de
cada clase con la media dada (163,67), los elevamos al cuadrado y los multiplicamos
por su frecuencia absoluta respectiva. fi (xi − x̅)2
Realizamos el mismo cálculo para el coeficiente de asimetría con la diferencia que
elevemos al cubo el resultado de la multiplicación de la frecuencia absoluta con la
resta de los puntos medios de cada clase y su media. fi (xi − x̅)3
Al final calculamos el coeficiente de apuntamiento, pero en este caso elevemos a la
cuarta la resta de los puntos medios de cada clase y su media. fi (xi − x̅)4
Hacemos la sumatoria de todos los valores y completamos la tabla y calculamos los
ítems del enunciado.
m clases 𝒇𝒊 𝒙𝒊 |𝒙𝒊 − 𝒙
̅| ̅)𝟐
𝒇𝒊 (𝒙𝒊 − 𝒙 ̅)𝟑
𝒇𝒊 (𝒙𝒊 − 𝒙 ̅)𝟒
𝒇𝒊 (𝒙𝒊 − 𝒙
1 [147 ; 155,2) 5 151,1 12,57 790,02 9930,60 124827,74
» Calculo de la varianza
∑𝑚
𝑖=1 𝑓𝑖 (𝑥𝑖 − 𝑥̅ )
2
𝜎2 =
𝑛
CARRERAS EN LÍNEA
1730,29
𝜎2 =
15
𝜎 2 = 115,35
» Calculo de la desviación estándar
Le sacamos la raíz cuadrada a la varianza
∑𝑚
𝑖=1 𝑓𝑖 (𝑥𝑖 − 𝑥̅ )
2
𝜎=√
𝑛
𝜎 = √115,35
𝜎 = 10,74
Cuartiles (𝑸𝒌 )
Regla 1: Si el número resultante es un valor entero, entonces este cuartil será igual al
valor clasificado.
𝑛
𝑘 (4 ) − 𝐹𝑘
𝑄𝑘 = 𝐿𝑘 + ∗𝑎
𝑓𝑘
Dónde:
𝒏
𝒌 ( )=clase que contiene el cuartil
𝟒
Deciles (𝑫𝒌 )
De manera similar a los cuartiles, pero en este caso los deciles son medidas
estadísticas que dividen a un conjunto de datos en diez partes iguales, a partir de la
siguiente formula:
𝑛
𝑘 (10) − 𝐹𝑘
𝐷𝑘 = 𝐿𝑘 + ×𝑎
𝑓𝑘
Percentiles (𝑷𝒌)
Son medidas estadísticas que separan un conjunto de datos en cien partes iguales. El
P50 coincide con la mediana y los percentiles 25 y 75 coinciden con el primer y tercer
cuartil (Johnson, 2012).
𝑛
𝑘 (100) − 𝐹𝑘
𝑃𝑘 = 𝐿𝑘 + ∗𝑎
𝑓𝑘
Con los mismos datos de ejercicio 1 donde está elaborada la tabla de frecuencia
para datos agrupados determine P56, D8, Q3.
» Calculamos el 𝑸𝟑
𝑛
𝑘 (4 ) − 𝐹𝑘
𝑄𝑘 = 𝐿𝑘 + ×𝑎
𝑓𝑘
CARRERAS EN LÍNEA
Donde k será el cuartil que deseamos buscar y n el total de los datos analizados
𝑛 150
𝑘 (4 ) = 3 ( ) = 112,5.
4
112.5 − 107
𝑄3 = 18,64 + × 2,89
22
𝑄3 = 19.36
Para calcular el Decil y Percentil se siguen los mismos pasos del cálculo del cuartil
con la diferencial que para la ubicación del decil lo dividimos para 10 y el percentil
para 100.
» Calculamos el D8
𝑛 150
𝑘( ) = 8( ) = 120 Ubicación del cuartil 8.
10 10
𝑛
𝑘 (10) − 𝐹𝑘
𝐷𝑘 = 𝐿𝑘 + ×𝑎
𝑓𝑘
120 − 107
𝐷8 = 18,64 + × 2,89
22
𝐷8 = 20.35
» Calculamos el P 56
𝑛 150
𝑘 (100) = 56 (100) = 84 Ubicación del percentil 56 .
𝑛
𝑘( ) − 𝐹𝑘
100
𝑃𝑘 = 𝐿𝑘 + ×𝑎
𝑓𝑘
CARRERAS EN LÍNEA
84 − 66
𝑃56 = 12,86 + × 2,89
22
𝑃56 = 15,22
Procedemos a completar la tabla con los valores encontrados y las clases
correspondiente a la mediana, moda, cuartil 3, decil 8 y percentil 56.
m Clases fi Xi fi*xi Fi
1 [1.3;4.19) 16 2.75 44 16
2 [4.19;7.08) 19 5.64 107.16 35
3 [7.08;9.97) 19 8.53 162.07 54
4 [9.97;12.86) 12 11.42 137.04 66
clase que contiene 5 [12.86;15.75) 22 14.31 314.82 88
a la mediana, moda
1 y P56
Calculamos la amplitud
Completamos las clases y procedemos a buscar los puntos medios de cada clase (xi).
Sumando los intervalos de cada clase y dividiendo para dos:
Xi
14,4
2,2 + 12,2 = = 7,2
2
34,4
12,2 + 22,2 = = 17,2
2
54,4
22,2 + 32,2 = = 27,2
2
74,2
32,2 + 42,2 = = 37,2
2
94,4
42,2 + 52,2 = = 47,2
2
114,4
52,2 + 62,2 =
2
= 57,2
xi * fi
𝑎 × 7,2 = 7,2 𝑎
16 × 17,2 = 275,2
21 × 27,2 = 571,2
4 × 37,2 = 148,8
× 47,2 = 47,2 𝑏
8 × 57,2 = 457,6
𝑛 = 100
∑𝑛𝑖=1 𝑓𝑖 𝑥𝑖
𝑥̅ =
𝑛
𝑛
∑𝑖=1 𝑓𝑖 𝑥𝑖
25 =
100
CARRERAS EN LÍNEA
∑ 𝑓𝑖 𝑥𝑖 = 25 × 100 = 2500
𝑖=1
𝑎 + 16 + 21 + 4 + 𝑏 + 8 = 100
49 + 𝑎 + 𝑏 = 100
𝑎 = 100 − 49 − 𝑏
𝑎 = 51 − 𝑏
Remplazamos el valor de a
680
𝑏= = 17
40
Reemplazamos en a: a = 51 − 17 = 34
m clases fi xi fi * xi
1 [2,2 ; 12,2) 34 7,2 244,8
2 [12,2 ; 22,2) 16 17,2 275,2
3 [22,2 ; 32,2) 21 27,2 571,2
4 [32,2 ; 42,2) 4 37,2 148,8
5 [42,2 ; 52,2) 17 47,2 802,4
6 52,2 ; 62,2] 8 57,2 457,6
CARRERAS EN LÍNEA
10,74
𝐶𝑉 = (̅̅̅̅̅̅̅̅̅̅) 100%
163,67}
𝐶𝑉 = 6.56 %
Bibliografía
PROBABILIDAD Y ESTADISTICA
DOCUMENTO BASE DE LECTURA DEL TEMA Nº 1
“NOCIONES DE PROBABILIDAD”
Universidad Estatal de Milagro – UNEMI
Este compendio recoge textualmente documentos e información de varias fuentes debidamente citadas, así
como referencias elaboradas por el autor para conectar los diferentes temas.
Se lo utilizará únicamente con fines educativos
CARRERAS EN LÍNEA
Probabilidad y Estadística
Unidad 2.- Probabilidades
Desarrollo de subtemas:
Subtema 1: Técnicas de Conteo: Permutación y Combinación.
Permutación
Según Levine (2006) La terminología permutar significa variar la distribución u orden en el
que permanecían dos o más cosas, en este caso es indispensable precisar si estas cosas
son o no indistinguibles para estar totalmente seguros que la nueva estructura sea en
esencia distinta a la antigua. Las permutaciones pueden ser:
c) Permutaciones circulares
Estas permutaciones se aplican a conjuntos que ordenaremos de manera circular, ya que
no poseen ni un principio ni un final, es decir no tienen ni primer ni último término debido
a que todos los términos se encuentran en una línea cerrada. Para encontrar en número
de permutaciones circulares que se pueden crear, fijar la posición de un elemento, los
restantes pueden cambiar el lugar de distintas formas pudiendo así tomar todas las
posiciones dentro de la circunferencia relativa al primer punto. (Johnson, 2012) Para
hallar las permutaciones circulares utilizaremos la siguiente fórmula:
𝑃𝐶𝑛 = (𝑛 − 1)!
Combinación
Según Johnson (2012) Generalmente combinar significa unir varias cosas, de forma que
constituyan un mismo conjunto, en este caso la denominaremos como el número de
conjuntos de un determinado número de elementos que se puedan constituir en un
universo de objetos, no importa el orden de selección sino más bien los elementos que se
toman. Estas pueden ser:
1. Combinaciones sin repetición
Son los n elementos que se toman de r en r, denotada en 𝐶𝑛𝑟 a los distintos grupos de r
elementos diferentes, esto quiere decir un grupo se puede diferenciar de otro en al menos
un elemento. (Sin importar el orden de selección o colocación). Se lo halla mediante la
fórmula:
𝑛 𝑛!
𝐶𝑛𝑟 = ( ) =
𝑟 (𝑛 − 𝑟)! 𝑟!
2. Combinaciones con repetición
Los n elementos tomados de r en r, son de distintos grupos constituidos por n elementos
de forma que no permite que, entre todos los elementos, no importa el orden y permite
que se repitan los elementos, mediante la siguiente fórmula:
(𝑛 + 𝑟 − 1)
𝐶𝑅𝑛𝑟 =
𝑟! (𝑛 − 1)!
Eventos y sucesos
Es una aseveración relacionada al producto de un evento aleatorio, se lo puede entender
como un subconjunto del espacio muestral que se ha conformado por los resultados del
experimento que hace que el suceso sea seguro. (Paula Rodas, 2009)
Luego de haber realizado el experimento de un suceso si este ocurre se procede a
verificar y sino ocurre respectivamente no se verifica. Un suceso acontece cuando el
resultado del experimento forma parte del conjunto. Se clasifican en:
» Elementales: Consta de un solo resultado
» Compuestos: Es la unión de varios elementales
Es llamado un suceso seguro al que tiene de todos los sucesos elementales Ω y suceso
imposible al que no contiene ningún elemento del espacio muestral Ø, esto da a entender
que el suceso seguro ocurre siempre y el suceso imposible no ocurre nunca.
Entre los sucesos se pueden dar operaciones que permiten que estos se unan, se corten
o se complementen de la misma manera que los subconjuntos de cualquier conjunto.
» “Unión de sucesos (𝑨 ∪ 𝑩): Es el producto del experimento que se encuentran en los
conjuntos A o en B.
» Intersección de sucesos (𝑨 ∩ 𝑩) : Son los puntos pertenecientes de A y B.
» Complementación de sucesos (Ā): Se refiere a los puntos que no se encuentran en
A.
» ̅ ) : Son los puntos que pertenecen al conjunto
Diferencia de sucesos (𝑨 − 𝑩 = 𝑨 ∩ 𝑩
A y no a B” (David M. Levine, 2006).
La diferencia entre un evento y un suceso es que los eventos son más estadísticos y
tienen más probabilidad de ocurrencia.
𝑃 (𝐴 𝑜 𝐵) = 𝑃(𝐴) + 𝑃(𝐵)
CARRERAS EN LÍNEA
Según (Levin & Rubin, 2010) Si dos eventos no son mutuamente excluyentes, es posible
que ambos se presenten al mismo tiempo. Esta regla para dos eventos designados A y B
se escribe:
𝑃 (𝐴 𝑜 𝐵) = 𝑃 (𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵)
La probabilidad de que se presenten A o B cuando A y B no son mutuamente excluyentes
es igual a la probabilidad de que suceda A más la probabilidad de que suceda B menos la
probabilidad de que A y B sucedan juntos.
Ejercicios de Aplicación
El departamento de policía de un campus necesita bicicletas nuevas para su personal de
patrullaje; las probabilidades son 0.17, 0.22, 0.03, 0.29, 0.21 y 0.08 de que comprará Bianshe,
Cannonhill, Fishim, Giante, Trec o HT. Encuentre las probabilidades de que:
a.- Cannonhill o Trec
𝑃(𝐶 𝑜 𝑇) = 𝑃(𝐶) + 𝑃(𝑇)
𝑃(𝐶 𝑜 𝑇) = 0.22 + 0.21 = 0.43
b.- Bianshe, Giante , Trec
𝑃𝑃(𝐵 𝑜 𝐺 𝑜 𝑇) = 𝑃(𝐵) + 𝑃(𝐺) + 𝑃(𝑇)
𝑃(𝐵 𝑜 𝐺 𝑜 𝑇) = 0.17 + 0.29 + 0.21 = 0.67
El 60% de los individuos de una población están vacunados contra una cierta enfermedad.
Durante una epidemia se sabe que el 20% la ha contraído y que 2 de cada 100 individuos están
vacunados y son enfermos. Calcular el porcentaje de individuos que estén vacunados o
enfermos.
𝑃(𝐴 𝑜 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴 𝑜 𝐵) = 0.60 + 0.20 − 0.02
𝑃(𝐴 𝑜 𝐵) = 0.78
CARRERAS EN LÍNEA
Probabilidad Condicional
Al utilizar la simbología P(A) para la probabilidad de un evento A, es significativo
determinar que se está hablando de la probabilidad de A dada en algún espacio muestral
(S), es decir que la propiedad viene dada por la notación P(A/Ѕ) y sirve para referirse a
que se está trabajando en un espacio muestral determinado; así esta notación P(A/Ѕ) se
lee como la probabilidad condicional de A sobre un determinado espacio muestral,
además la manera de utilizarla de una forma simplificada P(A) siempre que se tenga claro
que se está trabajando sobre un espacio muestral.
La probabilidad condicional ocurre al tener un conocimiento previo de los escenarios de
un evento, es decir la manera de como renovar o cambiar la probabilidad de un evento, si
se sabe que otro a ocurrido; estos pueden ser eventos dependientes o independientes, de
esta manera sean A y B dos eventos, si la probabilidad de que ocurra o no ocurra el
evento A no afecta la ocurrencia del evento B , entonces 𝑃(𝐴/𝐵) = 𝑃(𝐴) y se denota que
A y B son eventos independientes, caso contrario decimos que son eventos dependientes.
Así también si se requiere que ambos eventos ocurran (A y B) el evento suele
denominarse evento compuesto 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴)𝑃(𝐴/𝐵). (Johnson, 2012)
Formalmente expresamos que un evento B ve ya ocurrió y queremos conocer la
probabilidad que ocurra un evento A, entonces esta probabilidad condicional viene dada
por:
𝑃(𝐴 ∩ 𝐵)
P(𝐴/𝐵) =
𝑃(𝐵)
Con P (B) > 0, es un evento dependiente.
“Regla del producto: Dado dos eventos A y B, tales que
» 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐵/𝐴)𝑃(𝐴) cuando P(A)>0.
» 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴/𝐵)𝑃(𝐵) cuando P(B)>0.
Esta regla es de utilidad cuando el problema contenga varias etapas, las cuales puedan
ser generalizadas.” (Taylor, 2008)
Teorema de Bayes
El teorema de Bayes fue desarrollada por el reverendo Thomas Bayes en el siglo XVIII y
es denominado como la prolongación de la probabilidad condicional, utilizado para
comprobar las probabilidades que se han calculado con anticipación y de las cuales se
posee nueva información. (David M. Levine, 2006)
CARRERAS EN LÍNEA
𝑃(𝐴𝑗 )𝑃(𝐵/𝐴𝑗 )
𝑃(𝐴𝑗 /𝐵) = 𝑘
∑𝑖=1 𝑃(𝐴𝑖 )𝑃(𝐵/𝐴𝑖 )
Siendo 𝐴𝑗 ,……,𝐴𝑘 los eventos que participan en el espacio S, de modo que P(𝐴𝐽 ) >0 para
i=1,2,3….,k y A sea un evento de manera que P(A) >0 para j=1,2,3….,k
Demostración:
Ejercicios de aplicación
1. Suponga que 5 personas parquean su motocicleta en el mismo estacionamiento cada día.
a) ¿Cuántos cambios pueden hacerse con las cinco motocicletas?
b) ¿Cuál es la probabilidad de que una motocicleta este estacionada en el tercer lugar?
Resolvemos:
a) 𝑃5 = 5! = 5 × 4 × 3 × 2 × 1 = 𝟏𝟐𝟎
b) Una motocicleta está en el lugar determinado, la tercera, solo faltarían ordenar al azar 4
motocicletas:
𝑃4 = 4! = 4 × 3 × 2 × 1 = 24
A= una motocicleta especifica en un determinado lugar.
24 1
𝑃(𝐴) = = = 𝟎, 𝟐
120 5
CARRERAS EN LÍNEA
2. Se lanza un dado obteniendo el espacio muestral Ѕ = {1, 2, 3, 4, 5, 6}. Sean los sucesos
𝐴 = {1, 2} y 𝐵 = {3, 4}. Determine
a) 𝐴 ∩ 𝐵
b) 𝐴̅
c) 𝐵̅
d) 𝐴̅ ∩ 𝐵̅
e) 𝐴 ∩ 𝐵̅
f) 𝑃(𝐴/𝐵)
g) 𝑃(𝐴̅/𝐵̅)
Resolvemos:
a) 𝑨 ∩ 𝑩 = ∅ . no existen valores semejantes en A y B.
̅ = 3, 4, 5, 6 . Debido a que 1 y 2 si pertenecer a “A”.
b) 𝑨
̅ = 1, 2, 5, 6 . Debido a que 3 y 4 si pertenecer a “B”.
c) 𝑩
̅∩𝑩
d) 𝑨 ̅ = 5, 6 . debido a que solo 5 y 6 no pertenecen ni al suceso “A” ni al suceso “B”.
̅ = 1,2 . porque 1 y 2 pertenecen al suceso “A” y no pertenecen a “B”.
e) 𝑨 ∩ 𝑩
𝑃(𝐴∩𝐵) 0
f) 𝑷(𝑨⁄𝑩) = = =0
𝑃(𝐵) 2⁄6
2
𝑃(𝐵) = Porque solo 2 de 6 pertenecen al conjunto B.
6
2
̅
𝑨 𝑃(𝐴̅∩𝐵̅) 6 12 1
g) 𝑷 ( ̅ ) = = 4 = =
𝑩 𝑃(𝐵̅) 24 2
6
n=5; r=3
5 5!
𝐶𝑛𝑟 = ( ) =
3 (5 − 3)! 3!
5 5×4×3×2×1 120
𝐶53 = ( ) = =
3 (2 × 1)(3 × 2 × 1) 12
𝑪𝟓𝟑 = 𝟏𝟎
4. Para tres autos A, B, C. se fabrican piezas del mismo material. El porcentaje de piezas que
resulta defectuosa en cada máquina es, respectivamente, 1%, 2%, 3%. Se mezclan 300
piezas 100 de cada auto y se elige una pieza al azar, que resulta ser defectuosa. ¿Cuál es la
probabilidad de que haya sido fabricada en la máquina A?
CARRERAS EN LÍNEA
D= defectuosos
̅ = no defectuosos
𝐷
D
A ̅
𝐷
100
300
D
Auto B
s ̅
𝐷
D
C
̅
𝐷
𝑃(𝐴 ∩ 𝐷) 𝑃(𝐴)𝑃(𝐷/𝐴)
𝑃(𝐴/𝐷 ) = = 𝑘
𝑃(𝐷) ∑𝑖=1 𝑃(𝐴)𝑃(𝐷/𝐴)
100 1
×
𝑃 (𝐴/𝐷 ) = 300 100
100 1 100 2 100 3
300 × 100 + 300 × 100 + 300 × 100
1
1
𝑃(𝐴/𝐷 ) = 300 =
6 6
300
𝑃(𝐴/𝐷 ) = 0.1667
5. En campeonato consta de 6 equipos de mujeres y 12 de hombres. Se desea escoger un
comité para que rinda cuentas de la participación de los equipos. Hallar la probabilidad de
a) Seleccionar 3 jóvenes de los equipos de hombre
b) Seleccionar exactamente 2 jóvenes del equipo de hombre y 1 del equipo de
mujeres
c) Seleccionar por lo menos 1 del equipo de mujeres.
Resolvemos
Eh= jóvenes equipo hombre
Em= jóvenes equoi mujeres
12 11 10 1320
a) 𝑃(3𝐸ℎ) = × × = = 0.2696
18 17 16 4896
CARRERAS EN LÍNEA
12 11 6 6 12 11 12 6 110
b) 𝑃(2𝐸ℎ 𝑦 1𝐸𝑚) = × × + × × + × × = 0.1617 +
18 17 16 18 17 16 18 17 16
Bibliografía
Paula Rodas, L. M. (2009). Regla de la suma para calculas probabilidades de dos o más eventos.
Redalyc, 6.
Lind, D., Marchal, W., & Wathen, S. (2012). Estadistica aplicada a los negocios y la economía.
Estadistica aplicada a los negocios y la economía (Vol. 15).
UNIVERSIDAD ESTATAL DE MILAGRO
CARRERAS EN LÍNEA
PROBABILIDAD Y ESTADISTICA
DOCUMENTO BASE DE LECTURA DEL TEMA Nº 2
“VARIABLE ALEATORIA DISCRETA Y CONTINUA”
Universidad Estatal de Milagro – UNEMI
Este compendio recoge textualmente documentos e información de varias fuentes debidamente citadas, así
como referencias elaboradas por el autor para conectar los diferentes temas.
Se lo utilizará únicamente con fines educativos
CARRERAS EN LÍNEA
Probabilidad y Estadística
Unidad 2.- Probabilidades
Desarrollo de subtemas:
Subtema 1: Conceptos de variable aleatoria, Distribución de probabilidad.
Variable aleatoria
En cualquier experimento aleatorio, los resultados se presentan al azar; así, a éste se le
denomina variable aleatoria. Por ejemplo, lanzar un dado constituye un experimento:
puede ocurrir cualquiera de los seis posibles resultados. Cada valor de la variable
aleatoria se relaciona con una probabilidad que indica la posibilidad de un resultado
determinado (Lind, Marchal, & Wathen, 2012).
Según (Menhenhall, Beaver, & Beaver, 2016) una variable x es variable aleatoria si el
valor que toma, correspondiente al resultado de un experimento, es una probabilidad o
evento aleatorio. Se pueden considerar numerosos ejemplos de variables aleatorias:
x = Número de defectos en una pieza de mueble seleccionada al azar.
x = Calificación de examen de aptitud escolar (SAT) para un solicitando universitario
seleccionado al azar.
x = Número de llamadas telefónicas recibidas por una línea directa de intervención en
crisis durante un periodo seleccionado al azar.
Distribución de probabilidad
Las distribuciones de probabilidad están relacionadas con las distribuciones de
frecuencias. De hecho, podemos pensar que una distribución de probabilidad es una
distribución de frecuencias teórica. Una distribución de frecuencias teórica es una
distribución de probabilidades que describe la forma en que se espera varíen los
resultados (Levin & Rubin, 2010).
CARRERAS EN LÍNEA
Según (Lind et al., 2012) dice que una distribución de probabilidad lista de todos los
resultados de un experimento y la probabilidad asociada a cada uno de ellos donde se
mencionan las principales características de una distribución de probabilidad.
1.) La probabilidad de un resultado en particular se encuentra entre 0 y 1, ósea
0 ≤ 𝑝(𝑥) ≤ 1
2.) Los resultados son eventos mutuamente excluyentes.
3.) La lista es exhaustiva. Por lo tanto, la suma de las probabilidades de los diversos
eventos es igual a 1, ósea ∑ 𝑝(𝑥) = 1
𝑛 𝑛!
𝑃(𝑥 = 𝑘) = ( ) 𝑝 𝑘 (1 − 𝑝)𝑛−𝑘 = ∗ 𝑝𝑘 (1 − 𝑝)𝑛−𝑘
𝑘 𝑘! (𝑛 − 𝑘)!
n= cantidad de eventos.
X = k= cantidad de éxitos.
Media= 𝑛 × 𝑝
Varianza= 𝑛 × 𝑝 × 𝑞
Características
CARRERAS EN LÍNEA
“Las características más comunes de dicha serie de ensayos conocidos como ensayos
Bernoulli son:
n=10
p caras= 0.5
p sellos= 0.5
a. x= obtener caras
k= 7
𝑝𝑥 = 0.5
Aplicamos la fórmula:
𝑛
𝑃(𝑥 = 𝑘) = ( ) 𝑝 𝑘 (1 − 𝑝)𝑛−𝑘
𝑘
10 10
𝑃(𝑥 = 7) = ( ) 0.57 (1 − 0.5)10−7 = ( ) 0.57 (0.5)3
7 7
10! 1 1 10 ∗ 9 ∗ 8 ∗ 7! 1 1
𝑃(𝑥 = 7) = ( )( ) = ( )( )
3! 7! 128 8 3 ∗ 2 ∗ 1 ∗ 7! 128 8
𝑃(𝑥 = 7) = 0.117
b. X= Obtener caras
𝑝𝑥 = 0.5
K Є [4,7]
𝑃(4 ≤ 𝑥 ≤ 7) = 𝑃(𝑥 = 4) + 𝑃(𝑥 = 5) + 𝑃(𝑥 = 6) + 𝑃(𝑥 = 7)
CARRERAS EN LÍNEA
10 10 10
𝑃(4 ≤ 𝑥 ≤ 7) = ( ) (0.5)4 (0.5)6 + ( ) (0.5)5 (0.5)5 + ( ) (0.5)6 (0.5)4
4 5 6
10
+ ( ) (0.5)7 (0.5)3
7
𝑃(4 ≤ 𝑥 ≤ 7) = 0.7734
c. x= obtener caras
k= 3
𝑝𝑥 = 0.5
𝑃(𝑥 ≤ 3) = 0.1718
d. x= obtener caras
k= 2
𝑝𝑥 = 0.5
𝑛
𝑃(𝑥 = 𝑘) = ( ) 𝑝 𝑘 (1 − 𝑝)𝑛−𝑘
𝑘
4
𝑃(𝑥 = 2) = ( ) (0.8)2 (1 − 0.8)4−2
2
𝑃(𝑥 = 2) = 0.1536
b) x= el departamento se alquile
𝑝𝑥 = 0.8 éxito
𝑃(𝑋 ≥ 2) = 𝑃(𝑥 = 2) + 𝑃(𝑥 = 3) + 𝑃(𝑥 = 4)
4 4 4
𝑃(𝑥 ≥ 2) = ( ) (0.8)2 (0.2)2 + ( ) (0.8)3 (0.2)1 + ( ) (0.8)4 (0.5)0
2 3 3
Distribución Hipergeometrica
Según (Lind et al., 2012) la probabilidad de éxito no es la misma en todos los ensayos
cuando se realiza un muestreo sin reemplazo en una población relativamente pequeña,
no debe aplicarse la distribución binomial. En lugar de ésta se aplica la distribución
hipergeométrica. Por lo tanto, 1) si se selecciona una muestra de una población finita sin
reemplazo y 2) si el tamaño de la muestra n es mayor que 5% del tamaño de la población
N, se aplica la distribución hipergeométrica para determinar la probabilidad de un número
específico de éxitos o fracasos. Esto resulta especialmente apropiado cuando el tamaño
de la población es pequeño.
𝑀 𝑁−𝑀
( )( )
𝑃(𝑥 = 𝑘) = 𝑘 𝑛−𝑘
𝑁
( )
𝑛
Donde.
N representa el tamaño de la población.
M es el número de éxitos en la población.
k es el número de éxitos en la muestra; éste puede asumir los valores 0, 1, 2, 3…
n es el tamaño de la muestra o el número de ensayos
Ejercicios de aplicación
En una urna hay 7 bolas blancas y 5 negras. Se sacan 4 bolas ¿Cuál es la probabilidad
de que sean 3 bolas blancas?
N = 12
n=4
k=3
M=7
7 5
( )( )
𝑃(𝑥 = 3) = 3 1 = 0,3535 = 35,35%
12
( )
4
3 7 3 7
( )( ) ( )( )
𝑃(𝑥 ≥ 2) = 𝑃(𝑥 = 2) + 𝑃 (𝑥 = 3) = 2 2 + 3 1 = 0,3333 = 33,33%
10 10
( ) ( )
4 4
Distribución Poisson
La distribución de probabilidad de Poisson describe el número de veces que se presenta
un evento durante un intervalo específico. El intervalo puede ser de tiempo, distancia,
área o volumen (Lind et al., 2012).
𝜇 𝑥 𝑒−𝜇
𝑃(𝑥 = 𝑘) =
𝑥!
Dónde:
CARRERAS EN LÍNEA
Según (Lind et al., 2012) el modelo se utiliza para describir la distribución de errores en
una entrada de datos, el número de rayones y otras imperfecciones en las cabinas de
automóviles recién pintados, el número de partes defectuosas en envíos, el número de
clientes que esperan mesa en un restaurante o que esperan entrar en una de las
atracciones de Disney World y el número de accidentes en la carretera federal I-75 en un
periodo de tres meses.
Ejercicios de aplicación
Si un banco recibe en promedio 6 cheques sin fondo por día, ¿cuáles son las
probabilidades de que reciba, a) cuatro cheques sin fondo en un día dado, b) 10 cheques
sin fondos en cualquiera de dos días consecutivos?
𝜇 = 6 cheques sin fondo por día
64 𝑒−6
𝑃(𝑥 = 4) = = 0,1339 = 13,39%
4!
Distribución normal
La distribución normal es una distribución continua en ella la variable aleatoria logra tomar
cualquier valor dentro de un intervalo de valores dados, es muy utilizada debido a su
aporte ajustable a las distribuciones de frecuencia reales que se visualiza en muchos
fenómenos incluyendo características humanas. Para su resolución se hace uso de
curvas de frecuencia, esta curva solo tiene un pico en su forma de campana de modo que
es unimodal, la media de una población distribuida frecuentemente se encuentra en el
centro de la curva normal, además por su asimetría la mediana y la moda también están
en el centro, es decir la media, mediana y la moda tienen el mismo valor. (Auchay, 2016)
Generalmente para hallar el área bajo la curva se hace uso de las integrales, debido a
que no es un curso de Integrales, para proceder hallar el área bajo la curva de una
distribución normal lo haremos mediante una tabla de distribución normal; esta tabla solo
da los valores de la mitad del área bajo la curva normal, comenzando de 0.0 en la media,
como es de conocimiento la distribución normal es simétrica es decir los valores
correspondientes a una mitad de la curva también corresponden a la otra. Para hacer uso
de la tabla en la columna de x buscamos el numero entero y el primer decimal; en el
reglón horizontal buscamos el segundo decimal; ejemplo: para encontrar el área bajo la
CARRERAS EN LÍNEA
curva entre la media y un punto que está a 2.05 desviaciones estándar a la derecha de la
media el valor que me da la tabla es:
𝑥−𝜇
𝑧=
𝜎
Dónde:
σ= desviación estándar.
1
(𝑥 ± ) − 𝜇
𝑧= 2
𝜎
CARRERAS EN LÍNEA
1
Los dos “ " que agregamos y restamos son conocidos como factores de corrección de
2
continuidad, su utilidad se da debido a que se está evaluando una variable discreta con
una continua.
Es importante recordar que se debe tener cuidado al hacer uso de esta aproximación, es
bastante buena y sencilla siempre y cuando “np” y “nq” sean al menos cinco.
Características de factores de corrección de continuidad
Es solo en estos casos que se hace uso del factor de corrección de continuidad.
Ejercicios de aplicación
1. Use la tabla 1 para hallar las siguientes probabilidades para una variable Z
aleatoria normal estándar.
a) 𝑃(0 ≤ 𝑍 ≤ 1,2)
b) 𝑃(−0.9 ≤ 𝑍 ≤ 0)
c) 𝑃(0.3 ≤ 𝑍 ≤ 1,56)
Resolvemos
a) 𝑷(𝟎 ≤ 𝒁 ≤ 𝟏, 𝟐)
0.5 − 𝑃(𝑍 ≥ 1.2)
0.5 − 0.1151 = 𝟎. 𝟑𝟖𝟒𝟗
𝒁 ≤ 𝟎)
0.5 − 𝑃(𝑍 ≥ 0.9)
0.5 − 0.1841 = 𝟎. 𝟑𝟏𝟓𝟗
0 0,9
c) 𝑷(𝟎. 𝟑 ≤ 𝒁 ≤ 𝟏, 𝟓𝟔)
𝑃(𝑍 ≥ 0.3) − 𝑃(𝑍 ≥ 1.56)
0 0,3 1.56
CARRERAS EN LÍNEA
𝑃(𝑥 ≤ 5) = 0.02689
n=35
p=0.3
𝜇 = 𝑛𝑝 = 35 × 0.3 = 10.5
N (μ, σ) ~N (0,1)
𝑥−𝜇 𝑧−𝜇
𝑃(𝑥 ≤ 5) = 𝑃 ( )≤( )
𝜎 𝜎
5 − 10,5
𝑃(𝑥 ≤ 5) = 𝑃 (𝑧 ≤ )
2.71
𝑃(𝑧 ≤ −2.02)
22 − 19,5
𝑧=
6
𝒛 = 𝟎, 𝟒𝟐
µ=1200 x=?
Al conocerse el porcentaje del cual queremos obtener un valor x, en este caso 5%,
se debe tomar en cuenta que este 5% también representa una probabilidad de
0.05, esta probabilidad se la vamos a restar a 1 porque lo que queremos saber es
a partir de qué valor de x empieza ese 5% de observaciones, es decir por encima
de ese valor.
CARRERAS EN LÍNEA
𝒙 = 𝟏𝟓𝟕𝟏, 𝟐𝟓
5. Una maquina llenadora automática se gradúa para dispensar 1000 c.c. sin
embargo al realizar un control de calidad se encontró que el 10% de las botellas
contenían más de 1000 c.c. y el 5% contenían menos de 985 c.c. se pregunta el
contenido medio de llenados de botellas
Solución
Datos:
X1=1000 ; z1=0.10
X2= 985 ;z2=0.05
𝑥−𝜇
𝑧=
𝜎
𝑥1 − 𝜇
𝜎=
𝑧1
𝑥2 − 𝜇
𝜎=
𝑧2
𝑥1 − 𝜇 𝑥2 − 𝜇
=
𝑧1 𝑧2
𝑧2∗𝑥1−𝑧1+𝑥2
𝜇=
𝑧2−𝑧1
La media es:
𝜇 = 4.8743
Bibliografía