Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DE PROBABILIDADES
ESTADISTICA
EDISON MORENO FABIÁN ORDÓÑEZ MARLON ARÉVALO
DEPARTAMENTO DE CIENCIAS EXACTAS - ESPE
CLASE # 1
CONTENIDO
Duración 2 horas
1
CLASE # 1
1. Tipo de variables
2.1 Nominal
En esta escala se asigna un número a la característica, sin establecer orden o jerarquía. Así
por ejemplo si se analiza el sexo, masculino se podría asignar el 1 a masculino y 2 a femenino.
2.2 Ordinal
Permite ordenar a los atributos o características jerárquicamente. Por ejemplo, si se clasifica
un grupo de personas en base al nivel de instrucción académica, asignando 1 si no tiene
ninguna instrucción, 2 si tiene instrucción básica, 3 instrucción media, 4 instrucción de
pregrado, 5 instrucción de 4 nivel y 6 para doctorados o postdoctorados.
2.3 De Intervalo
Para este caso, los datos tienen las propiedades de los ordinales y la separación entre las
variables tiene sentido. El valor cero no indica la ausencia de la propiedad.
Por ejemplo, la temperatura media, en donde los valores que se miden permiten saber
mayor o menor temperatura, y las diferencias entre ellos deben ser tomadas en cuenta.
2.4 De Razón
En una escala de razón, los datos tienen todas las propiedades de los datos de intervalo, y la
proporción entre ellos tiene sentido. Para esto se requiere que el valor cero de la escala
indique la ausencia de la propiedad a medir. Por ejemplo el salario de una persona, y se le
compara con otra como un razón en donde se puede decir que la una gana el doble de la
otra o la cuarta parte, etc...
2
CLASE # 1
3. Tablas de frecuencias
xi fi Fi hi (%) Hi(%)
12 25 25 17.24 17.24
15 38 63 26.21 43.45
22 45 108 31.03 74.48
30 22 130 15.17 89.65
50 15 145 10.35 100
∑= 145 100
30 150
20 100
10 50
0 0
12 15 22 30 50 12 15 22 30 50
3
CLASE # 1
4
CLASE # 1
distribución de puntuaciones en bruto (valor representativo del grupo). Este valor calculado
tiende a ubicarse en el centro de los datos
Es muy importante que, a más de saber determinar las medidas de tendencia central,
se les pueda dar una interpretación correcta de la información que éstas proporcionan al
grupo de datos.
Una primera medida es la media poblacional (µ) que es la suma de todos los valores
observados en la población dividido para el número de todos los datos en la población. La
media muestral (ẋ) o media aritmética es la suma de todos los valores observados de la
muestra dividido para el número de todos los datos en la muestra o tamaño muestral (es la
medida de tendencia central más utilizada). La media ponderada posee el mismo principio
que la media aritmética cuyos resultados son iguales, la diferencia entre ellas es que la
repetición de los datos en la media ponderada se le llama peso (frecuencia) y estas es muy
utilizada en datos agrupados.
El valor de la media aritmética pierde su representatividad cuando se ve afectada por
la presencia de uno o más valores sumamente grandes o pequeños (valores extremos o datos
atípicos). En tales casos, la medida de tendencia central más representativa es la mediana.
Otra medida de tendencia central que es utilizada es la media geométrica que resulta
útil para determinar el cambio promedio de porcentajes, razones, índices o tasas de
crecimiento. La media geométrica es la raíz enésima del producto de n datos.
La mediana es un valor que se ubica en el centro (medio) del grupo de datos, considera
su ubicación y subestima los valores de los datos; es decir la mediana una vez que se han
ordenado de menor a mayor, es decir la mediana se ubica 50% antes y 50% después de la
cantidad de los datos que conforman el grupo en el centro. Si el número de datos es par, la
mediana es la media aritmética de los dos valores centrales, pero si el número de datos es
impar, la mediana es el único dato central. Las principales propiedades de la mediana son que
no es influida por la presencia de valores extremos o atípicos y que es utilizada con los datos
de nivel ordinal o más altos.
La moda es el dato u observación que aparece con mayor frecuencia. En una
distribución puede haber una o más modas o no haber ninguna. La moda puede determinarse
para todos los niveles de datos y tiene la ventaja de que no influyen en ella los valores
extremos. Sin embargo, se usa menos que la media o la mediana, ya que en muchos casos
no hay moda o hay más de una.
5
CLASE # 1
Nota: si hay una sola moda es unimodal; si hay dos modas es bimodal y si tiene tres o más
modas es multimodal
3.3.1 Posición relativa de la media mediana y moda en una distribución
EJERCICIO 1
Con el siguiente grupo de datos que se refieren a la variable edad (en años):
Xi = 8, 2, 3, 5, 4, 2, 6, 3, 1, 3, 13, 4
Calcular la media aritmética, la media geométrica, la mediana y la moda. Indicar además
si hay un valor extremo y cuál es el tipo de sesgo de la distribución.
1. Media aritmética:
∑𝑥 8+2+…+4 54
x̅ = = = 12 = 4.5
n 12
2. Media geométrica:
𝑛
𝑛
MG = √∏ 𝑥𝑖
¡=1
12 12
𝑀𝐺 = √8x2x3x5x4x2x6x3x1x3x13x4 = √5391360 = 3.639
3. Mediana:
Xi = 1,2,2,3,3,3,4,4,5,6,8,13
6
CLASE # 1
Media aritmética:
𝑓1 𝑥1 + 𝑓2 𝑥2 + … + 𝑓2 𝑥𝑛 ∑𝑛1 𝑥𝑖 𝑓𝑖
𝑥̅ = =
𝑛 𝑛
Mediana:
𝑛
− 𝐹𝑎
𝑀𝑒 = 𝐿𝑚 + [ 2 ]𝑤
𝑓
7
CLASE # 1
Moda:
Se la puede aproximar por el punto medio de la clase modal. Un valor más preciso se
obtiene aplicando la siguiente fórmula:
d1
Moda Lmo w
d1 d 2
Donde:
Lmo = límite inferior de la clase modal
d 1 = (frecuencia de la clase modal) – (frecuencia de la clase anterior)
Son valores que se ubican en ciertas posiciones que fueron obtenidas al dividir al
grupo de datos en “n” partes iguales para obtener estos valores es necesario ordenar el grupo
de datos de menor a mayor y a partir del dato menor se ubican estas medidas.
Cuartiles (Q) dividen al grupo de datos en cuatro partes iguales y se obtienen Q 1 se
ubica al 25% antes y 75% después, Q2 se ubica al 50% antes y 50% después y el Q3 se ubica al
75% antes y 25% después.
Deciles (D) dividen al grupo de datos en diez partes iguales y se obtienen D 1 se ubica
al 10% antes y 90% después, D2 se ubica al 20% antes y 80% después, D5 se ubica al 50% antes
y 50% después; los demás deciles se los obtiene siguiendo el mismo proceso.
Quintiles dividen al grupo de datos en 5 partes iguales y los percentiles (P) dividen al
grupo de datos en cien partes iguales e igual interpretación que los anteriores.
Para calcular la posición de un cuartil, decil, quintil o percentil se usa la fórmula:
𝑟
𝐿 = (𝑛 + 1)
𝑠
8
CLASE # 1
donde L es la ubicación de cualquier cuantil y n número total del grupo de datos. No confundir
la posición del cuantil con su valor.
𝑟 1
Para la posición del primer cuartil: 𝑠 = 4
𝑟 3
Para el tercer cuartil: 𝑠 = 4
𝑟 3
Para el tercer decil: 𝑠 = 10
𝑟 7
Para el séptimo decil: 𝑠 = 10
𝑟 4
Para el 4 quintil: 𝑠 = 5
𝑟 90
Para el 90 percentil: 𝑠 = 100
9
CLASE # 1
EJERCICIO 3
14 ∗ 5 + 18 ∗ 15 + 30 ∗ 25 + 36 ∗ 35 + 12 ∗ 45 + 10 ∗ 55 3340
𝑥̅ = = = 28.67
120 120
10
CLASE # 1
𝑛
− 𝐹−1 60 − 32
𝑀𝑒 = 𝐿−1 + [2 ] 𝑐 = 20 + [ ] 10 = 29.33
𝑓 30
𝐷1 36 − 30
𝑀𝑑 = 𝐿−1 + [ ] 𝑐 = 30 + [ ] 10 = 32
𝐷1 + 𝐷2 (36 − 30) + (36 − 12)
1 1 3 3
( ) 𝑛 = ( ) 120 = 30 ( ) 𝑛 = ( ) 120 = 90
4 4 4 4
1
(4) 𝑛 − 𝐹−1 30 − 14
𝑄1 = 𝐿−1 + [ ] 𝑐 = 10 + [ ] ∗ 10 = 18.89
𝑓 18
3
(4) 𝑛 − 𝐹−1 90 − 62
𝑄3 = 𝐿−1 + [ ] 𝑐 = 30 + [ ] ∗ 10 = 37.78
𝑓 36
30 150
Frecuencia absoluta
20 100
acumulada
10 50
0 0
[0, 10[ [10, [20, [30, [50, [60, [0, [10, [20, [30, [50, [60,
20[ 30[ 40[ 60[ 70] 10[ 20[ 30[ 40[ 60[ 70]
Histograma de Histograma de
frecuencia relativa frecuencia relativa
35,00 acumulada
Frecuencia relativa
30,00
120,00
25,00
Frecuencia relativa
100,00
20,00 80,00
acumulada
15,00 60,00
10,00 40,00
5,00 20,00
0,00 0,00
[0, [10, [20, [30, [50, [60, [0, [10, [20, [30, [50, [60,
10[ 20[ 30[ 40[ 60[ 70] 10[ 20[ 30[ 40[ 60[ 70]
11
CLASE # 1
12
CLASE # 1
REFERENCIAS BIBLIOGRAFICAS
13
CLASE # 1
14