Está en la página 1de 16

FUNDAMENTOS DE ESTADÍSTICA

Elaboro: Alejandra Espinosa Guzmán


Claudia Espinosa Guzmán

UNIDAD I: INTRODUCCION
1.1 MEDIDAS DE Y TENDENCIAS.

Media, Mediana, Moda


Supóngase que un determinado alumno obtiene 35 puntos en una prueba de
matemáticas. Este puntaje, por sí mismo tiene muy poco significado a menos
que podamos conocer el total de puntos que obtiene una persona promedio al
participar en esa prueba, saber cuál es la calificación menor y mayor que se
obtiene, y cuán variadas son esas calificaciones.
En otras palabras, para que una calificación tenga significado hay que contar con
elementos de referencia generalmente relacionados con ciertos criterios
estadísticos.
Las medidas de tendencia central (media, mediana y moda) sirven como
puntos de referencia para interpretar las calificaciones que se obtienen en una
prueba.
Volviendo a nuestro ejemplo, digamos que la calificación promedio en la prueba
que hizo el alumno fue de 20 puntos. Con este dato podemos decir que la
calificación del alumno se ubica notablemente sobre el promedio. Pero si la
calificación promedio fue de 65 puntos, entonces la conclusión sería muy
diferente, debido a que se ubicaría muy por debajo del promedio de la clase. En
resumen, el propósito de las medidas de tendencia central es: Mostrar en qué
lugar se ubica la persona promedio o típica del grupo. Sirve como un método
para comparar o interpretar cualquier puntaje en relación con el puntaje central
o típico.
Sirve como un método para comparar el puntaje obtenido por una misma
persona en dos diferentes ocasiones. Sirve como un método para comparar los
resultados medios obtenidos por dos o más grupos.
Las medidas de tendencia central más comunes son: La media aritmética:
comúnmente conocida como media o promedio. Se representa por medio de
una letra 𝑥̅ . La mediana: la cual es el puntaje que se ubica en el centro de una
distribución. Se representa como Md (𝒙 ̃ ). La moda: que es el puntaje que se
presenta con mayor frecuencia en una distribución. Se representa Mo.
De estas tres medidas de tendencia central, la media es reconocida como la
mejor y más útil. Sin embargo, cuando en una distribución se presentan casos
cuyos puntajes son muy bajos o muy altos respecto al resto del grupo, es
recomendable utilizar la mediana o la moda. (Porque dadas las características
de la media, esta es afectada por los valores extremos).
La media es considerada como la mejor medida de tendencia central, por las
siguientes razones: Los puntajes contribuyen de manera proporcional al hacer el
cómputo de la media. Es la medida de tendencia central más conocida y
utilizada. Las medias de dos o más distribuciones pueden ser fácilmente
promediadas mientras que las medianas y las modas de las distribuciones no se
promedian. La media se utiliza en procesos y técnicas estadísticas más
complejas mientras que la mediana y la moda en muy pocos casos.

1
FUNDAMENTOS DE ESTADÍSTICA
Elaboro: Alejandra Espinosa Guzmán
Claudia Espinosa Guzmán

Cómo calcular, la media, la moda y la mediana


Media aritmética o promedio (𝒙
̅)
Es aquella medida que se obtiene al dividir la suma de todos los valores de
una variable por la frecuencia total. En palabras más simples, corresponde a
la suma de un conjunto de datos dividida por el número total de dichos datos.
𝒔𝒖𝒎𝒂 𝒅𝒆 𝒕𝒐𝒅𝒐𝒔 𝒍𝒐𝒔 𝒗𝒂𝒍𝒐𝒓𝒆𝒔 𝒙𝟏 + 𝒙𝟐 + 𝒙𝟑 + ⋯ + 𝒙𝒏
̅=
𝒙 =
𝒄𝒂𝒏𝒕𝒊𝒅𝒂𝒅 𝒕𝒐𝒕𝒂𝒍 𝒅𝒆 𝒅𝒂𝒕𝒐𝒔 𝑵
Ejemplo 1:
En matemáticas, un alumno tiene las siguientes notas: 4, 7, 7, 2, 5, 3
N = 6 (número total de datos)
𝟒 + 𝟕 + 𝟕 + 𝟐 + 𝟓 + 𝟑 𝟐𝟖
̅=
𝒙 = = 𝟒. 𝟔𝟕
𝟔 𝟔
La media aritmética de las notas de esa asignatura es 4.67. Este número
representa el promedio.

Ejemplo 2:
El número de horas que tarda un mecánico de trasmisión en quitar, reparar y
reemplazar una trasmisión son: 3.4, 2.9, 3.4, 5.4, 3.6, 2.7, 3.4 y 4.4 ¿cuál es su
media?

𝟑. 𝟒 + 𝟐. 𝟗 + 𝟑. 𝟒 + 𝟓. 𝟒 + 𝟑. 𝟔 + 𝟐. 𝟕 + 𝟑. 𝟒 + 𝟒. 𝟒 𝟐𝟗. 𝟐
̅=
𝒙 = = 𝟑. 𝟔𝟓
𝟖 𝟖

Ejemplo 3:
Cuando se tienen muchos datos es más conveniente agruparlos en una tabla de
frecuencias y luego calcular la media aritmética. El siguiente cuadro con las
medidas de 63 varas de pino lo ilustra.

Largo (en m) Frecuencia absoluta Largo por Frecuencia


5 10 absoluta
5*10 = 50
6 15 6 * 15 = 90
7 20 7*20 = 140
8 12 8*12 =96
9 6 9*6 = 54
Frecuencia total = 63 Frecuencia total
absoluta=430

2
FUNDAMENTOS DE ESTADÍSTICA
Elaboro: Alejandra Espinosa Guzmán
Claudia Espinosa Guzmán

𝒇𝒓𝒆𝒄𝒖𝒆𝒏𝒄𝒊𝒂 𝒕𝒐𝒕𝒂𝒍 𝒂𝒃𝒔𝒐𝒍𝒖𝒕𝒂 𝟒𝟑𝟎


̅=
𝒙 = = 𝟔. 𝟖𝟐𝟓
𝒇𝒓𝒆𝒄𝒖𝒆𝒏𝒄𝒊𝒂 𝒕𝒐𝒕𝒂𝒍 𝟔𝟑

Se debe recordar que la frecuencia absoluta indica cuántas veces se repite


cada valor, por lo tanto, la tabla es una manera más corta de anotar los datos (si
la frecuencia absoluta es 10, significa que el valor a que corresponde se repite
10 veces).

Ejemplo 4:
En la tabla siguiente se muestran del inventario (en días) de 20 tiendas
departamentales

Inventario Frecuencia absoluta Inventario por la frecuencia


absoluta
2.0 1 2.0*1=2.0
3.4 2 3.4*2=6.8
3.8 2 3.8*2= 7.6
4.0 1 4.0*1= 4.0
4.1 5 4.1*5 =20.5
4.7 3 4.7*3= 14.1
4.9 2 4.9*2= 9.8
5.5 4 5.5 *4= 22
20 86.8

𝒇𝒓𝒆𝒄𝒖𝒆𝒏𝒄𝒊𝒂 𝒕𝒐𝒕𝒂𝒍 𝒂𝒃𝒔𝒐𝒍𝒖𝒕𝒂 𝟖𝟔. 𝟖


̅=
𝒙 = = 𝟒. 𝟑𝟒
𝒇𝒓𝒆𝒄𝒖𝒆𝒏𝒄𝒊𝒂 𝒕𝒐𝒕𝒂𝒍 𝟐𝟎

Se debe recordar que la frecuencia absoluta indica cuántas veces se repite


cada valor, por lo tanto, la tabla es una manera más corta de anotar los datos (si
la frecuencia absoluta es 10, significa que el valor a que corresponde se repite
10 veces).

̂):
Moda (Mo o 𝒙
Es la medida que indica cual dato tiene la mayor frecuencia en un conjunto de
datos; o sea, cual se repite más.

3
FUNDAMENTOS DE ESTADÍSTICA
Elaboro: Alejandra Espinosa Guzmán
Claudia Espinosa Guzmán

Ejemplo 1:
Determinar la moda en el siguiente conjunto de datos que corresponden a las
edades de niñas de un Jardín Infantil.
5, 7,3, 3, 7, 8,3, 5, 9, 5,3, 4,3
̂ = 3)
La edad que más se repite es 3, por lo tanto, la Moda es 3 (Mo =𝒙

Ejemplo 2:
El número de horas que tarda un mecánico de trasmisión en quitar, reparar y
reemplazar una trasmisión son: 2.9, 2.7, 3.4, 3.4, 3.4, 3.6, 4.4, y 5.4 cuál es su
moda.
̂=
El tiempo que tarda el mecánico que se repite mas es Moda es 3.4 (Mo =𝒙
3.4)

Ejemplo 3:
20, 12, 14, 23, 78, 56, 96
En este conjunto de datos no existe ningún valor que se repita, por lo tanto, este
conjunto de valores no tiene moda.

Ejemplo 4:
En la tabla siguiente se muestran del inventario (en días) de 20 tiendas
departamentales
Inventario Frecuencia
absoluta
2.0 1
3.4 2
3.8 2
4.0 1
4.1 5
4.7 3
4.9 2
5.5 4

̂ = 4.1)
El inventario que se repite más en las tiendas es: Moda es 4.1 (Mo =𝒙

̃)
Mediana (Med o 𝒙
Para reconocer la mediana, es necesario tener ordenados los valores ya sea de
mayor a menor o lo contrario. Usted divide el total de casos (N) entre dos, y el

4
FUNDAMENTOS DE ESTADÍSTICA
Elaboro: Alejandra Espinosa Guzmán
Claudia Espinosa Guzmán

valor resultante corresponde al número del caso que representa la mediana de


la distribución.
Es el valor central de un conjunto de valores ordenados en forma creciente o
decreciente. Dicho en otras palabras, la Mediana corresponde al valor que deja
igual número de valores antes y después de él en un conjunto de datos
agrupados.
Según el número de valores que se tengan se pueden presentar dos casos: Si
el número de valores es impar, la Mediana corresponderá al valor central de
dicho conjunto de datos.
Si el número de valores es par, la Mediana corresponderá al promedio de los dos
valores centrales (los valores centrales se suman y se dividen por 2).

Ejemplo 1:
Se tienen los siguientes datos: 5, 4, 8, 10, 9, 1, 2
Al ordenarlos en forma creciente, es decir de menor a mayor, se tiene: 1, 2, 4, 5,
8, 9, 10
̃, porque es el valor central en este conjunto de datos
El 5 corresponde a la 𝒙
impares.

Ejemplo 2:
El número de horas que tarda un mecánico de trasmisión en quitar, reparar y
reemplazar una trasmisión son: 2.9, 2.7, 3.4, 3.4, 3.4, 3.6, 4.4, y 5.4 cuál es su
moda
𝟑. 𝟒 + 𝟑. 𝟒 𝟔. 𝟖
̃=
𝒙 = = 𝟑. 𝟒
𝟐 𝟐

Ejemplo 3:

El siguiente conjunto de datos está ordenado en forma decreciente, de mayor a


menor, y corresponde a un conjunto de valores pares, por lo tanto, la Media será
el promedio de los valores centrales.
21, 19, 18, 15, 13, 11, 10, 9, 5, 3

𝟏𝟑 + 𝟏𝟏 𝟐𝟒
̃=
𝒙 = = 𝟏𝟐
𝟐 𝟐

5
FUNDAMENTOS DE ESTADÍSTICA
Elaboro: Alejandra Espinosa Guzmán
Claudia Espinosa Guzmán

Cuatro grupos de estudiantes, formados por:


INDIVIDUOS PESOS
(FRECUENCIA)
15 162
20 148
10 153
15 140

El individuo 30 obtuvo puntaje de 148


El alumno 31 obtuvo puntaje de 148
Entonces, como el total de los individuos es par debemos promediar esos
puntajes:

𝟏𝟒𝟖 + 𝟏𝟒𝟖
̃=
𝒙 = 𝟏𝟒𝟖
𝟐

La mediana es 148, lo cual significa que 30 individuos presentaron un peso


desde 148 hacia abajo (individuo 30 hasta el 1 en el cuadro) y que 30 individuos
presentaron un peso desde 148 hacia arriba (individuos 31 hasta el 60 en el
cuadro).

Ejemplo 5:
En la tabla siguiente se muestran del inventario (en días) de 20 tiendas
departamentales
Inventario Frecuencia
2.0 1
3.4 2
3.8 2
4.0 1
4.1 5
4.7 3
4.9 2
5.5 4

Entonces, como el total de inventarios es par debemos promediar esos puntajes:

𝟒. 𝟏 + 𝟒. 𝟏
̃=
𝒙 = 𝟒. 𝟏
𝟐
La mediana es 4.1, lo cual significa que 10 tiendas presentaron un inventario de
4.1 hacia abajo (inventario10 hasta el 1 en el cuadro) y que 10 tiendas
presentaron un inventario de 4.1 hacia arriba (inventario10 hasta el 20 en el
cuadro)

6
FUNDAMENTOS DE ESTADÍSTICA
Elaboro: Alejandra Espinosa Guzmán
Claudia Espinosa Guzmán

Media, Mediana, Moda para Datos Agrupados:

Tablas de frecuencias con datos agrupados

Cuando los valores de la variable son muchos, conviene agrupar los datos en
intervalos o clases para así realizar un mejor análisis e interpretación de ellos.

• Para construir una tabla de frecuencias con datos agrupados, conociendo los
intervalos, se debe determinar la frecuencia absoluta (fi) correspondiente a
cada intervalo, contando la cantidad de datos cuyo valor está entre los extremos
del intervalo. Luego se calculan las frecuencias relativas y acumuladas, si es
pertinente.

•Si no se conocen los intervalos, se pueden determinar de la siguiente manera:


- Se busca el valor máximo de la variable y el valor mínimo. Con estos datos se
determina el rango.
-Para determinar el número de clases se utiliza la siguiente formula 𝑘 = 1 +
3.332log(𝑛) .
- Comenzando por el mínimo valor de la variable, que será el extremo inferior del
primer intervalo, se suma a este valor la amplitud para obtener el extremo
superior y así sucesivamente.

Ejemplo 1

Veamos el siguiente problema:

Las puntuaciones finales en matemáticas de 80 estudiantes de cierto colegio se


registran en la siguiente tabla:

68 84 75 82 68 90 62 88 76 93
73 79 88 73 60 93 71 59 85 75
64 65 75 87 74 62 95 78 63 72
66 78 82 75 94 77 69 74 68 60
96 78 89 61 75 95 60 79 83 71
79 67 62 97 78 85 76 65 71 75
65 80 73 57 88 78 62 76 53 74
86 67 73 81 72 63 76 75 85 77

-Construir una tabla de frecuencias cuyos datos estén agrupados en ocho


intervalos.

7
FUNDAMENTOS DE ESTADÍSTICA
Elaboro: Alejandra Espinosa Guzmán
Claudia Espinosa Guzmán

1) Ordenar datos

53 62 65 71 73 75 77 79 85 90
57 62 66 71 74 75 78 80 85 93
59 62 67 71 74 75 78 81 86 93
60 63 67 72 74 76 78 82 87 94
60 63 68 72 75 76 78 82 88 95
60 64 68 73 75 76 78 83 88 95
61 65 68 73 75 76 79 84 88 96
62 65 69 73 75 77 79 85 89 97

2) Para poder construir la tabla de frecuencias lo primero que debemos hacer es


calcular el rango.

El rango da la idea de proximidad de los datos a la media. Se calcula restando


el dato menor al dato mayor.

El dato mayor y el menor lo hemos destacado con color rojo:

Dato mayor - dato menor =97-53=44

Por lo tanto; Rango = 44

3) el número de clases es igual a 𝑘 = 1 + 3.332 log(80) = 1 + 3.332(1.9031) =


1 + 6.34 = 7.34

4) En el problema nos dicen que debemos agruparlo en 7 intervalos o clases,


con este dato podemos calcular la amplitud o tamaño de cada intervalo,
dividiendo el valor del rango por la cantidad de intervalos que se desean obtener.

𝟒𝟒
𝑨𝒎𝒑𝒍𝒊𝒕𝒖𝒅 = = 𝟔. 𝟐𝟖
𝟕

Por lo tanto la amplitud de cada intervalo será de 6

Ahora podemos comenzar a construir la tabla de frecuencias:

8
FUNDAMENTOS DE ESTADÍSTICA
Elaboro: Alejandra Espinosa Guzmán
Claudia Espinosa Guzmán

Calificación Frecuencia
fi
53 - 59 3
60 - 66 15
67 - 73 15
74 - 80 25
81 - 87 10
88 - -94 8
95 - 101 4

Cómo calcular, la media, la moda y la mediana para datos agrupados

Calificación fi x D fi*d L.R.C.


53 - 59 3 56 -21 -63 52.5 – 59.5
60 - 66 15 63 -14 -210 59.5 – 66.5
67 - 73 15 70 -7 -105 66.5 – 73.5
74 - 80 25 77 0 0 73.5 – 80.5
81 - 87 10 84 7 70 80.5 – 87.5
88 - -94 8 91 14 112 87.5 – 94.5
95 - 101 4 98 21 84 94.5–101.5
∑ 80 -112

53+59 60+66
X: Marca de clases. Es el promedio de las clases = = 𝟓𝟔, = 𝟔𝟑
2 2

Desviación=dispersión que existe de la marca de clases de mayor frecuencia,


con cada una de las marcas d=56 − 77 = −21, 63 − 77 = −14
Frecuencia por la desviación = 3 ∗ −21 = −63, 15 ∗ −14 = −210
Limites Reales de Clase Inferior y superior= L.C.R.𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 53 − .5 =
52.5 𝑦 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 59 + .5 = 59.5 (Para el caso de enteros siempre se suma
0.5 al límite superior y se le resta 0.5 al límite inferior).
Media aritmética o promedio (𝒙
̅)
∑ 𝒇𝒊 ∗ 𝒅 −𝟏𝟏𝟐
̅=𝒙+
𝒙 = 𝟕𝟕 + = 𝟕𝟕 − 𝟏. 𝟒
𝑵 𝟖𝟎
̅ = 𝟕𝟓. 𝟔
𝒙

9
FUNDAMENTOS DE ESTADÍSTICA
Elaboro: Alejandra Espinosa Guzmán
Claudia Espinosa Guzmán

X= marca de clase de mayor frecuencia (este valor puede ser positivo o


negativo para este caso es negativo y en vez de sumar se resta, si el
resultado es positivo entonces se suma).

∑ 𝐹𝑖 ∗ 𝑑 Sumatoria de la columna de la multiplicación de la frecuencia por la


desviación
N= Numero de datos=Sumatoria de la columna de frecuencia

Mediana Md (𝒙
̃)

𝑵 𝟖𝟎
− ∑ 𝒇𝒊 − 𝟑𝟑 𝟒𝟎 − 𝟑𝟑
̃ = 𝑳𝑹𝑪 + (
𝒙 𝟐 ) 𝒄 = 𝟕𝟑. 𝟓 + ( 𝟐 ) 𝟕 = 𝟕𝟑. 𝟓 + ( )𝟕
𝒇𝒎𝒆𝒅𝒊𝒂𝒏𝒂 𝟐𝟓 𝟐𝟓
𝟕
= 𝟕𝟑. 𝟓 + ( ) 𝟕 = 𝟕𝟑. 𝟓 + (𝟎. 𝟐𝟖 ∗ 𝟕)
𝟐𝟓
̃ = 𝟕𝟑. 𝟓 + 𝟏. 𝟗𝟔 = 𝟕𝟓. 𝟒𝟔
𝒙

LRC = Limite real de clase inferior de mayor frecuencia =73.5


N= Numero de datos= 80
∑fi=Suma de todas las frecuencias inferiores a la frecuencia mayor=
15+15+3=33
Tamaño del intervalo mediana= c= x2 – x1 =63-56=7

Moda Mo (𝒙
̂)

∆𝟏 𝟏𝟎 𝟏𝟎
̂ = 𝑳𝑹𝑪 + (
𝒙 ) 𝒄 = 𝟕𝟑. 𝟓 + ( ) 𝟕 = 𝟕𝟑. 𝟓 + ( ) 𝟕
∆𝟏 + ∆𝟐 𝟏𝟎 + 𝟏𝟓 𝟐𝟓
= 𝟕𝟑. 𝟓 + (𝟎. 𝟒 ∗ 𝟕) = 𝟕𝟑. 𝟓 + 𝟐. 𝟖
̂ = 𝟕𝟔. 𝟑
𝒙

∆1 =frecuencia mayor – frecuencia anterior= 25 – 15=10


∆1 Frecuencia mayor – frecuencia siguiente= 25 – 10=15

10
FUNDAMENTOS DE ESTADÍSTICA
Elaboro: Alejandra Espinosa Guzmán
Claudia Espinosa Guzmán

Ejemplo 2
Un análisis de control de calidad le interesa supervisar los pesos de un producto
en particular los datos se muestran en la siguiente tabla.

1.25 1.2 1.28 1.29 1.2 1.24


1.27 1.21 1.32 1.27 1.18 1.29
1.2 1.23 1.25 1.28 1.24 1.28
1.27 1.25 1.24 1.25 1.27 1.28
1.29 1.18 1.21 1.24 1.2 1.23
1.25 1.27 1.28 1.24 1.29 1.21

1) Ordenar datos

1.18 1.21 1.24 1.25 1.27 1.28


1.18 1.21 1.24 1.25 1.27 1.29
1.2 1.21 1.24 1.25 1.28 1.29
1.2 1.23 1.24 1.27 1.28 1.31
1.2 1.23 1.25 1.27 1.28 1.31
1.2 1.24 1.25 1.27 1.28 1.34

2).Rango= 1.34-1.18=0.16

3).𝑘 = 1 + 3.332 log(36) = 6.18

𝟎.𝟏𝟔
4) Anchura de clase = = 𝟎. 𝟎𝟐𝟔 lo dejamos a 2
𝟔

Pesos Fi X d Fi*d L.C.R.


1.18 – 1.20 6 1.19 -.09 -.54 1.175-1.205
1.21 – 1.23 5 1.22 -.06 -.3 1.205 – 1.235
1.24 – 1.26 10 1.25 -.03 -.3 1.235 – 1.265
1.27 – 1.29 12 1.28 0 0 1.265 – 1.295
1.30 – 1.32 2 1.31 .03 .06 1.295 – 1.325
1.33 – 1.35 1 1.34 .06 .06 1.325 – 1.355

NOTA: En este caso al límite real de clases superior se le sumo 0.005 y para
el límite inferior se le resto 0.005, por lo que depende de los decimales se
le agrega el cero si se tienen 1.3 se agrega 0.05 al límite superior y se le
resta 0.05 al superior

11
FUNDAMENTOS DE ESTADÍSTICA
Elaboro: Alejandra Espinosa Guzmán
Claudia Espinosa Guzmán

∑ 𝒇𝒊 ∗ 𝒅 −𝟏. 𝟎𝟐
̅=𝒙+
𝒙 = 𝟏. 𝟐𝟖 + = 𝟏. 𝟐𝟖 − 𝟎. 𝟎𝟐𝟖𝟑𝟑 = 𝟏. 𝟐𝟓𝟐
𝑵 𝟑𝟔

𝑵 𝟑𝟔
− ∑ 𝒇𝒊 − 𝟐𝟏 𝟏𝟖 − 𝟐𝟏
̃ = 𝑳𝑹𝑪 + (
𝒙 𝟐 ) 𝒄 = 𝟏. 𝟐𝟔𝟓 + ( 𝟐 ) . 𝟎𝟑 = 𝟏. 𝟐𝟔𝟓 + ( ) 𝟎. 𝟎𝟑
𝒇𝒎𝒆𝒅𝒊𝒂𝒏𝒂 𝟏𝟐 𝟏𝟐
−𝟑
= 𝟏. 𝟐𝟔𝟓 + ( ) 𝟎. 𝟎𝟑
𝟏𝟐

̃ = 𝟏. 𝟐𝟓𝟕𝟓
𝒙

∆𝟏 𝟐 𝟐
̂ = 𝑳𝑹𝑪 + (
𝒙 ) 𝒄 = 𝟏. 𝟐𝟔𝟓 + ( ) 𝟎. 𝟎𝟑 = 𝟏. 𝟐𝟔𝟓 + ( ) 𝟎. 𝟎𝟑
∆ 𝟏 + ∆𝟐 𝟐 + 𝟏𝟎 𝟏𝟐

̂ = 𝟏. 𝟐𝟕
𝒙

1.2 MEDIDAS DE DISPERSION Y PROPAGACION

Una medida de dispersión o variabilidad nos determina el grado de acercamiento


o distanciamiento de los valores de una distribución frente a su promedio de
localización, sobre la base de que entre más grande sea el grado de variación
menor uniformidad tendrán los datos (sinónimo de heterogeneidad) y por lo tanto
menor representatividad o confiabilidad del promedio de tendencia central o
localización por haber sido obtenido de datos dispersos. Por el contrario, si este
valor es pequeño (respecto a la unidad de medida) entonces hay una gran
uniformidad entre los datos. Cuando es cero quiere decir que todos los datos son
iguales.

Hay básicamente dos tipos de medidas de dispersión: Medidas Absolutas y


Medidas Relativas. Las absolutas se caracterizan por ser números concretos, es
decir, valores expresados en las mismas unidades de la variable en estudio y
que por lo tanto no permiten comparaciones o análisis respecto a la mayor o
menor dispersión de series expresadas en diferentes unidades. Estas medidas
son: la varianza, la desviación estándar y el rango intercuartilico.

Las medidas relativas de dispersión son valores abstractos, es decir, medidas


adimensionales y por lo tanto no expresadas en ninguna unidad específica,

12
FUNDAMENTOS DE ESTADÍSTICA
Elaboro: Alejandra Espinosa Guzmán
Claudia Espinosa Guzmán

obviando así el inconveniente señalado para las medidas absolutas. La principal


medida es el coeficiente de variación.

La varianza muestral
Se puede definir como el "casi promedio" de los cuadrados de las desviaciones
de los datos con respecto a la media muestral. Su fórmula matemática para el
caso de datos referentes a una muestra es:

∑𝒏𝒊=𝟏(𝒙𝒊 − 𝒙
̅) 𝟐
𝒔𝟐𝒙 =
𝒏−𝟏

Y para el caso de datos de una población es dada por:

∑𝒏𝒊=𝟏(𝒙𝒊 − 𝝁𝒙 )𝟐
𝒔𝟐𝒙 =
𝑵

La desviación estándar muestral:


Es la raíz cuadrada de la varianza

∑𝒏𝒊=𝟏(𝒙𝒊 − 𝒙
̅) 𝟐
𝝈=√
𝒏−𝟏

Y para el caso de datos de una población es dada por:

∑𝒏 (𝒙𝒊 − 𝝁𝒙 )𝟐
𝝈 = √ 𝒊=𝟏
𝑵

La más empleada es la varianza y desviación muestral, pues por lo regular se


sabe el tamaño de la muestra, es muy complicado tener a la población completa
en un estudio.

Calculo de las medidas de dispersión para datos sin agrupar


Ejemplos 1
Los salarios por hora de una muestra de empleados de medio tiempo del Home
Depot se muestran en la siguiente tabla. ¿Cuál es la varianza y desviación
estándar de la muestra?

13
FUNDAMENTOS DE ESTADÍSTICA
Elaboro: Alejandra Espinosa Guzmán
Claudia Espinosa Guzmán

Salario por ̅
x-𝒙 ̅)2
(x-𝒙
hora (x)
12 12-17=-5 (-5)2=25
20 20-17= 3 9
16 -1 1
18 1 1
19 2 4
85 0 40 sumatoria

𝟏𝟐 + 𝟐𝟎 + 𝟏𝟔 + 𝟏𝟖 + 𝟏𝟗 𝟖𝟓
̅=
𝒙 = = 𝟏𝟕
𝟓 𝟓

∑𝒏𝒊=𝟏(𝒙𝒊 − 𝒙
̅) 𝟐 𝟒𝟎 𝟒𝟎
𝒔𝟐𝒙 = = = = 𝟏𝟎
𝒏−𝟏 𝟓−𝟏 𝟒

Por lo tanto la varianza es de 10 en dólares al cuadrado

∑𝒏𝒊=𝟏(𝒙𝒊 − 𝒙
̅) 𝟐 𝟒𝟎 𝟒𝟎
𝝈=√ =√ = √ = √𝟏𝟎 = 𝟑. 𝟏𝟔𝟐𝟑
𝒏−𝟏 𝟓−𝟏 𝟒

Entonces la desviación estándar es de 3.1623 en dólares

Calculo de las medidas de dispersión para datos agrupados


Tomando la tabla del ejemplo 1 de las puntuaciones de los alumnos

Calificación fi X d fi*d L.R.C. u fi*u fi*u2

53 - 59 3 56 -21 -63 52.5 – 59.5 -3 -9 27

60 - 66 15 63 -14 -210 59.5 – 66.5 -2 -30 60

67 - 73 15 70 -7 -105 66.5 – 73.5 -1 -15 15

74 - 80 25 77 0 0 73.5 – 80.5 0 0 0

81 - 87 10 84 7 70 80.5 – 87.5 1 10 10

88 - -94 8 91 14 112 87.5 – 94.5 2 16 32

95 - 101 4 98 21 84 94.5–101.5 3 12 36

80 -16 180

14
FUNDAMENTOS DE ESTADÍSTICA
Elaboro: Alejandra Espinosa Guzmán
Claudia Espinosa Guzmán

Se incrementan tres columnas más que son


𝑑 −21
U= la columna de desviación entre la diferencia de las clases= 𝑐 = = −3
7

Dónde: c= 63-56=7
fi*u =multiplicación de la frecuencia por la columna de u=3 ∗ −3 = −9, 15 ∗
−2 = −30
fi*u2 = multiplicación de u por fi*u = -3*-9=27

Para la desviación estándar:

𝟐
∑ 𝐟𝐢 ∗ 𝐮𝟐 ∑ 𝐟𝐢 ∗ 𝐮 𝟏𝟖𝟎 −𝟏𝟔 𝟐
𝝈=[ √ −( ) ]𝒄 = [ √ −( ) ] 𝟕 = [√𝟐. 𝟐𝟓 − 𝟎. 𝟎𝟒]𝟕
𝒏 𝒏 𝟖𝟎 𝟖𝟎

= [√𝟐. 𝟐𝟏]𝟕 = (𝟏. 𝟒𝟖𝟔𝟔𝟏 ∗ 𝟕) = 𝟏𝟎. 𝟒𝟏

𝟐
𝟐
∑ 𝐟𝐢 ∗ 𝐮𝟐 ∑ 𝐟𝐢 ∗ 𝐮 𝟏𝟖𝟎 −𝟏𝟔 𝟐
𝒔 =[ −( ) ]𝒄 = [ −( ) ] 𝟕 = [𝟐. 𝟐𝟓 − 𝟎. 𝟎𝟒]𝟕
𝒏 𝒏 𝟖𝟎 𝟖𝟎
= [𝟐. 𝟐𝟏]𝟕 = 𝟏𝟓. 𝟒𝟕

1.3 INTRODUCCION A LA PROBABILIDADA


La teoría de probabilidades se ocupa de asignar un cierto número a cada posible
resultado que pueda ocurrir en un experimento aleatorio, con el fin de cuantificar
dichos resultados y saber si un suceso es más probable que otro o relaciones
parecidas. Con este fin, introduciremos algunas definiciones. Si realizamos un
experimento aleatorio, llamaremos espacio muestral del experimento al conjunto
de todos los posibles resultados de dicho experimento. Al espacio muestral lo
representaremos por S (o bien por la letra griega omega Ω). A cada elemento
que forma parte del espacio muestral se le denomina suceso elemental.
Regla de Laplace:
Si realizamos un experimento aleatorio en el que hay n sucesos elementales,
todos igualmente probables, entonces si A es un suceso, la probabilidad de que
ocurra el suceso A es:
𝒏ú𝒎𝒆𝒓𝒐 𝒅𝒆 𝒄𝒂𝒔𝒐𝒔 𝒇𝒂𝒗𝒐𝒓𝒂𝒃𝒍𝒆𝒔 𝒂𝒍 𝒔𝒖𝒄𝒆𝒔𝒐 𝑨
𝒑(𝑨) =
𝒏ú𝒎𝒆𝒓𝒐 𝒅𝒆 𝒄𝒂𝒔𝒐𝒔 𝒑𝒐𝒔𝒊𝒃𝒍𝒆

Ejemplo: Lanzamos un dado normal al aire. Consideramos el suceso A “sale par”.


Calcular p(A).

15
FUNDAMENTOS DE ESTADÍSTICA
Elaboro: Alejandra Espinosa Guzmán
Claudia Espinosa Guzmán

Casos posibles hay 6, pues S = {1, 2, 3, 4, 5, 6}. Casos favorables al


suceso A = {2, 4, 6}.
3 1
Por tanto 𝑝(𝐴) = 6 = 2 = 0.5 = 50%. El 50% de que salga par

(Notemos que la probabilidad siempre es un número positivo y menor, o a lo


sumo igual a 1)

Ejemplo 2

El primero de febrero de 2003 exploto el transbordador espacial Columbia. Este


fue el segundo desastre en 113 misiones espaciales de la NAZA. Con base esta
información. ¿Cuál es la probabilidad de que una futura misión concluya con
éxito?
𝒏𝒖𝒎𝒆𝒓𝒐 𝒅𝒆 𝒗𝒖𝒆𝒍𝒐𝒔 𝒆𝒙𝒊𝒔𝒕𝒐𝒔𝒐𝒔
𝒑𝒓𝒐𝒃𝒂𝒃𝒊𝒍𝒊𝒅𝒂𝒅 𝒅𝒆 𝒒𝒖 𝒆𝒍 𝒗𝒖𝒆𝒍𝒐 𝒕𝒆𝒏𝒈𝒂 𝒆𝒙𝒊𝒕𝒐 =
𝒏𝒖𝒎𝒆𝒓𝒐 𝒕𝒐𝒕𝒂𝒍 𝒅𝒆 𝒗𝒖𝒆𝒍𝒐𝒔
𝟏𝟏𝟏
= = 𝟎. 𝟗𝟖 = 𝟗𝟖%
𝟏𝟏𝟑

El 98% de probabilidad de que un vuelo tenga éxito.

Una muestra de 2000 conductores con licencia revelo la siguiente cantidad de


violaciones al límite de velocidad:
Cantidad de violaciones Cantidad de conductores
0 1910
1 46
2 18
3 12
4 9
5 o más 5
Total 2000

Cuál es la probabilidad de que un conductor haya cometido


𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑐𝑜𝑛𝑑𝑢𝑐𝑡𝑜𝑟𝑒𝑠 𝑞𝑢𝑒 𝑡𝑖𝑒𝑛𝑒𝑛 2 𝑣𝑖𝑜𝑙𝑎𝑐𝑖𝑜𝑛𝑒𝑠 18
a) Dos violaciones 𝑝(𝐴) = = 2000 =
𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑐𝑜𝑛𝑑𝑢𝑐𝑡𝑜𝑟𝑒𝑠
0.009 = 0.9%

9+5 14
b) 4 o más violaciones 𝑝(𝐵) = 2000 = 2000 0.007 = 0.7%

18+46+1910 1974
c) Menos de 3 infracciones 𝑝(𝐶) = = 2000 = 0.987 = 98.7%
2000

16

También podría gustarte