Está en la página 1de 11

Estadística Dr. CARDOZO Tema Nro. 4, V.

2022

MEDIDAS DE TENDENCIA CENTRAL

Población y muestra:

a) Población: 500 tejas…………………….muestra = 10 tejas


b) Población: 250000 Tejas ……………..muestra = 500 tejas

-. Población es un conjunto de datos que cuentan con todas las observaciones


posibles (o hipotéticamente posibles).

-. Si un conjunto de datos cuenta con parte de estas observaciones es llamado


muestra.

La Media.-

Es la medida más popular de ubicación o posición central. Es lo que el ciudadano


común y corriente llama “promedio”, la media de n números, es su suma dividida por
n. Es también llamada media aritmética o simple media para diferenciarla de la
media geométrica o de la media armónica.

Ejemplo: Durante los pasados 12 meses la policía reportó:

4, 3, 5, 5, 10, 8, 9, 6, 3, 4, 8 y 7 robos.

La media se obtendrá: 4 + 3 + 5 + 5 + 10 + 8 + 9 + 6 + 3 + 4 + 8 + 7 = 72

Media: = 72 / 12 = 6
𝑥1+𝑥2+𝑥3+⋯…………….𝑋𝑛
Media muestral =
𝑛

∑𝑥 ∑𝑦 ∑𝑧
𝑥̅ = ; 𝑥̅ = ; 𝑥̅ =
𝑛 𝑛 𝑛

∑𝑥
La media de una población N: µ= 𝑁

* Nos referimos a la descripción de una Población como Parámetro y a la


descripción de una Muestra como Estadístico. Parámetros son usualmente
denotados por las letras griegas µ, σ, ρ, θ, etc.

Ejemplo 1: La vida media de un lote de N = 400,000 focos de luz. Por su puesto no


examinamos todo porque no habría ninguno para vender. Pero si sacamos una
muestra 𝑥̅ , y se usa esta cantidad para estimar µ. Si n = 5 y los focos en la muestra
duran 967, 949, 940, 952 y 922 horas.
967+949+940+952+922
La media será: 𝑥̅ = = 946 hrs.
5

1
Estadística Dr. CARDOZO Tema Nro. 4, V. 2022

- Si estas duraciones constituyen una muestra en el sentido técnico, podemos


estimar la vida promedio µ de todos los 400,000 focos, como 946 horas.

*. Ejemplo 2: Tiempo promedio de los préstamos concedidos en un banco local,

*. Ejemplo 3: Interés promedio cobrado en préstamo comercial a la banca.

Propiedades de la Media.-

1.- Puede ser calculada para cualquier conjunto de datos numéricos, o sea que
siempre existe.

2.- Un conjunto de datos numéricos tiene una sola media, o sea que es única.

3.- Se presta para posterior tratamiento estadístico: Ejemplo: las medias de varios
conjunto de datos pueden ser combinadas en una media general de todos los datos.

4.- Es relativamente confiable. Las medias de varias muestras extraídas de una


misma población no varían tan ampliamente como otras medias estadísticas, usadas
para estimar la media de una población µ.

5.- Otras características que superficialmente parece deseable pero puede no serlo
es que “toma en cuenta cada elemento del conjunto de datos”

Pero a veces ocurre error, contaminación, mal función o desperfecto en la


transcripción o anotación de los datos. Ej: El ejercicio de los focos.

Equivocado (era 949)

967 + 499 + 940 + 952 + 922


𝑥̅ = = 856
5
La anterior media era 946. Ahora 946- 856 = 90 horas de diferencia.

Para evitar ser equivocados por una media afectada por un muy pequeño o por
un muy grande valor, a veces preferimos describir el medio o el centro de conjunto
de datos con una medida estadística diferente a la media. Tal vez la mediana que se
analizará luego.

MEDIA PONDERADA:

Cuando calculamos un promedio cometemos un grave error si pasamos por alto


el hecho que las cantidades no son de igual importancia con respecto al fenómeno
siendo descrito por ejemplo, si una persona hace tres inversiones que rendirán 7, 8 y

2
Estadística Dr. CARDOZO Tema Nro. 4, V. 2022

7+8+9
9%, el rendimiento promedio es = 8, porciento solo si la persona coloca la
3

misma cantidad de dinero en cada una de las inversiones. Para dar a las cantidades
promediadas en el grado de importancia de adecuado, es necesario asignar valores
ponderados (importancia relativa), y después calcular la media ponderada. En
general la media ponderada 𝑥̅ 𝑤 de un conjunto de números x1, x2, ……. y xn , cuya
importancia relativa se expresa en forma numérica por medio del correspondiente w1,
w2,…., y wn, está dada por:

𝑤1 𝑥1 + 𝑤2 𝑥2 +. . … 𝑤𝑛 𝑥𝑛 ∑ 𝑤𝑥
𝑥̅𝑤 = =
𝑤1 + 𝑤2 + ⋯ 𝑤𝑛 ∑𝑤
Donde ∑ 𝑤𝑥 es la sumatoria de productos de x por su peso wi. ∑ 𝑤 es la
sumatoria de los pesos.

(Nótese que si que los pesos son iguales esta media se reduce a la media
aritmética ya vista).

Ejemplo: en cierto año el blanquillo, surubí, ventón, palometa, pacú, han


producido a los pescadores comerciales. 54.0, 58.6, 26.6 33.9 y 61.6 Bs/Kg de
pescado, respectivamente. Dado que la pesca correspondió a 254 Kg. de
blanquillo 330 Kg. de surubí, 130 Kg. de ventón, 1120 Kg. de palometa y 279 Kg.
de pacú, ¿Cuál es el pago promedio general que recibieron los pescadores?

Solución: Al sustituir precios x1 = 54.0, x2 = 58.6, x3 = 26.6, x4 = 33.9 y x5 = 61.6


Bs/Kg, y los pesos (o cantidades) de los mismos w1 =254, w2 = 330 w3 = 130, w4 =
1120 y w5 = 279 Kg., en la fórmula de 𝑥̅ 𝑤 se obtiene:

254 (54.0)+ 330(58.6)+ 130 (26.6)+ 1120 (33.9)+279 (61.6) 9,166.4


𝑋𝑤 = = = 43.38 Bs/Kg.
254+330+130+1120+279 2113

Cifra del denominador 691, es la pesca total en miles de kilogramos; y la del


numerador 36,978.8 es el valor total de la pesca en miles de bolivianos.

Si por otra parte promediamos las cantidades 54.0, 58.6, 26.6 33.9 y 66.6, sin
utilizar los pesos (ponderaciones), se obtiene:
54.0+58.6+26.6+33.9+61.6
𝑥̅ = = 46.94 Bs/Kg.
5

Lo cual es mucho mayor que el auténtico promedio ponderado de 43.38 Bs/Kg.

3
Estadística Dr. CARDOZO Tema Nro. 4, V. 2022

Una especial aplicación donde la media ponderada ocurre cuando tenemos que
encontrar la media general o gran media sobre de k conjuntos de datos, teniendo
las medias 𝑥̅1, 𝑥̅ 2, ……….𝑥̅ 𝑘 , que consisten en n1, n2, ….. nk. medidas u
observaciones. El resultado es dado por:

n1 х̅1 + n2x̅2 + n3x̅3 + ⋯ … … … … . . nk x̅k ∑ 𝑛𝑥̅


𝑥̿ = =
n1 + n2 + n3 + ⋯ … . . +nk ∑𝑛

Lo cual es la Gran Media o Media General de Datos Combinados.

MEDIANA:

Para evitar por un muy pequeño o un muy grande valor a veces se describe el
medio o centro de un conjunto de datos aparte de la media.

“La mediana es el valor del medio cuando n es impar” y la media de los dos
valores del medio cuando n es par (con datos ordenados en forma ascendente
o descendente).

La mediana requiere que ordenemos los datos de acuerdo a tamaño:

Ejemplo 1: Siete estudiantes tomando un curso de inglés leyeron 16, 10, 13, 20,
11, 14 y 17 de los libros que fueron asignados. Encontrar la mediana.

Se arreglan los datos 10, 11, 13, 14, 16, 17, 20 la mediana es 14.

Ejemplo 2: El número de facturas emitidas en un negocio durante 12 días fueron


24, 28, 30, 32, 32, 35, 37, 37, 38, 40,40,40 Encontrar la mediana. La mediana es
36.
Ejemplo 3: Los paquetes enviados por una pequeña empresa de venta por
correo, en 25 días hábiles consecutivos fueron: 79, 39, 48, 85, 50, 56, 43, 31, 65,
93, 68, 40, 48, 72, 25, 61, 52, 54, 67, 55, 51, 47, 30, 74, y 42.
25+1
𝑛 = 2 = 13 𝑥̃= 52

2 5
3 9 1 0
4 8 3 0 8 7 2
5 0 6 2 4 5 1
6 5 1 8 7
7 9 2 4
8 5
9 3

4
Estadística Dr. CARDOZO Tema Nro. 4, V. 2022

La Mediana es el valor numérico que ocupa el puesto número 13 (contando


desde el principio o desde el final), el cual es 52.

CUARTILES, DECILES Y PERCENTILES:

La mediana no es más que uno de tantos fractiles, que en este caso divide los
datos en dos partes. Entonces: los cuartiles (3 en total) dividen el área de
rectángulos del histograma en 4 partes aproximadamente iguales. Los deciles (9
en total) dividen el área del histograma que corresponde a todos los datos en 10
partes y los centiles (99 en total) dividen el área en 100 partes aproximadamente
iguales.

Ejemplo: Las máximas temperaturas registradas en 12 ciudades


latinoamericanas en un día de junio (en °C) fueron: 40, 25, 36, 27,35, 22, 28, 29,
44, 32, 24, y 43. Arreglando las temperaturas de acuerdo a tamaño, tenemos:
22, 24, 25, 27, 28, 29, 32, 35, 36, 40, 43 y 44.

N=12 22 24 25 27 28 29 32 35 36 40 43 44

25+27 29+32 36+40


𝑄1 = = 26; 𝑄2 = = 30.5; y 𝑄3 = = 38.
2 2 2
Q2 =30.5 es también la mediana.

Si tenemos solo 11 datos (perdimos el 27)


N=11 22 24 25 28 29 32 35 36 40 43 44

Se hace un doblez y la bisagra inferior es 26.5 y la superior 38.0

25+28 36+40
𝑄1 = = 26.5 ; 𝑄3 = =38 ; y 𝑄2 = 32 y también es la mediana.
2 2

Ejemplo: El pulso de 9 personas después de haber hecho ejercicio extenuante, fué:


104, 100, 98, 111, 91, 94, 103, 96 y 108. Encontrar los cuartiles.
9 +1
Para n = 9, la mediana es = 5.
2
5+1
La posición del punto medio o la bisagra baja es = 3 y el punto medio o la bisagra
2
superior es el tercer valor del otro final. Arreglando los datos de acuerdo a tamaño,
tenemos:

91, 94, 96, 98, 100, 103, 104, 108, 111


1111111111

5
Estadística Dr. CARDOZO Tema Nro. 4, V. 2022

Es el punto medio o la bisagra inferior es 96 = Q1; la mediana es 100 =Q2. El punto


medio o la bisagra superior es 104 = Q3.

LA MODA.-

La moda es el “el valor que ocurre con más frecuencia y más de una vez”.

Ejemplo: A las 20 reuniones de un Club de radioaficionados, asistieron 26, 25, 28,


23, 25, 24, 24, 21, 23, 26, 28, 26, 24, 32, 25, 27, 29, 23, 24 y 22 de sus miembros.
Hallar la moda.

Ocurren una vez: 21, 22, 27, y 32. Ocurre dos veces: 28, y ocurre 4 veces 24. 24 es
la moda de asistencia.

La moda tiene un raro uso de la estadística y puede no existir cuando no hay dos
valores iguales.

MEDIA GEOMÉTRICA.- De n números positivos es la nesima raíz de su producto.

Ejemplo: La media geométrica de 3 y 12 es: √3 ∙ 12 = √36 = 6.

3 1
Ejemplo: La media geométrica de 1/3, 1 y 81 es: √3 ∙ 1 ∙ 81 = 3.

La media geométrica es usada principalmente para promediar relaciones, tasas de


cambio, índices económicos y similares, se representa por 𝑥̅𝑔 .

Ejercicio: a) Hallar la media geométrica de 8 y 32. b) Hallar la media geométrica de


1, 2, 8, y 16.

MEDIA ARMÓNICA.- De n números x1, x2 ………………. y 𝑥𝑛 , se refiere como n


dividido entre la suma de los recíprocos de los n números ó:

𝑛
𝑥̅ℎ = 1 .

𝑥

La media armónica tiene limitado uso, pero es apropiada en algunas


ocasiones especiales.

Ejemplo 1: Si una persona para llegar a su trabajo maneja 10 kilómetros en una


carretera a 60 kilómetros/hora y otros 10 kilómetros de la carretera a 30 km/hora, el
60+30
no habrá promediado = 45 km/hora.
2

El habrá manejado 20 km en un total de 30 minutos, su velocidad promedio es 40


km/hora como se demuestra a continuación: n=2 ; x1 = 60 km/hr. ; x2 = 30 km/hr.

6
Estadística Dr. CARDOZO Tema Nro. 4, V. 2022

2
2 2 1 2∙60 120 𝐾𝑚
𝑥̅ℎ = 1 1 = 1+2 = 3 = = = 40.0 .
+ 1∙3 3 ℎ𝑟
60 30 60 60

Ejemplo 2: Un inversionista compra Bs. 9,000,000 del stock de una compañía a Bs.
20 la acción y Bs. 9,000,000 a Bs. 30 la acción. Hallar la media harmónica (precio
promedio de la acción). n=2 ; x1= 20 Bs/acción ; x2 = 30 Bs/acción.

2
2 2 2 ∙ 60 120 𝐵𝑠
𝑥̅ℎ = = = 1 = = = 24
1 1 3+2 5 1∙5 5 𝑎𝑐𝑐𝑖ó𝑛
+
20 30 60 60
Ejemplo 3: Si una panadería compra 36 Bs. de un ingrediente a 0.10 Bs/Lb., otros
36 Bs. a 0.20 Bs/Lb., y otros 36 Bs. a 0.30 Bs/Lb. Hallar la media harmónica (Precio
promedio/Lb). n = 3 ; x1 = 60 ; x2 = 72 ; x3 = 90

3
3 3 1 3∙60 180
𝑥̅ℎ = 1 1 1 = 6+3+2 = 11 = 1∙11 = = 16.36 ₡/𝐿𝑏
+ + 11
10 20 30 60 60

DESCRIPCION DE DATOS AGRUPADOS:


En el pasado, considerable atención fue dada a la descripción de datos
agrupados porque era generalmente ventajoso agrupar datos antes de calcular
varias descripciones estadísticas. Este no es el caso actualmente donde todos los
cálculos necesarios son hechos en razón de minutos con la ayuda de computadoras
o inclusive calculadoras manuales. Desde que algunos datos, publicados por el
gobierno, por ejemplo, son publicados en la forma de distribuciones de frecuencia,
aquí se tratara el asunto de datos agrupados.

Como ya hemos visto, el agrupamiento de datos implica alguna perdida de


información. Cada ítem pierde su identidad, por así decirlo; nosotros solo conocemos
cuantos ítem hay en cada clase, entonces, debemos estar satisfechos con
aproximaciones.

Para determinar la media, nosotros podemos usualmente obtener una buena


aproximación al asignar a cada ítem que cae dentro de cada clase el valor de su
correspondiente marca de clase.

Ejemplo: En el caso de los datos de las emisiones de óxidos sulfurosos,


consideramos los tres valores en la primera clase como si todos fueron 10.95 y así

7
Estadística Dr. CARDOZO Tema Nro. 4, V. 2022

sucesivamente hasta llegar la última clase con sus 2 valores como si estos fueran
30.95.

Para dar una fórmula general para la media de una distribución con k clases,
expresamos las sucesivas marcas de clases por x1, x2,………, y xk y las
correspondiente frecuencias de clases por f1, f2, ……., y fk. Entonces, la suma de todas
las mediciones es aproximada por:

x1f1 + x2f2+ …………+xkfk = ∑ 𝑥 ∙ 𝑓 ,

Y la media de la distribución es dada por:

∑ 𝑥∙𝑓
𝑥̅ = , Esta es la fórmula de la media para datos agrupados
𝑛

Aquí n es el tamaño de la muestra, f1 + f2 + ……… + fk, y para escribir la co-


rrespondiente fórmula para la media de una población sustituimos 𝜇 por 𝑥̅ y N por n.

Ejemplo: Calcular la media de la distribución de las emisiones de óxidos de sulfuro.

Solución: Para obtener ∑ 𝑥 ∙ 𝑓, primero obtenemos los valores 𝑥 ∙ 𝑓

LRI LI x LS LRS f x*f


4.05 5 6.95 8.9 8.95 3 20.85
8.95 9 10.95 12.9 12.95 10 109.50
12.95 13 14.95 16.9 16.95 14 209.30
16.95 17 18.95 20.9 20.95 25 473.75
20.95 21 22.95 24.9 24.95 17 390.15
24.95 25 26.95 28.9 28.95 9 242.55
28.95 29 30.95 32.9 32.95 2 61.90
80 1508.00
1508.00
Entonces, la sustitución en la formula arroja: 𝑥̅ = 80
=18.85
El error de agrupamiento es solamente 18.85 – 18.896 = -0.046, el cual es muy
pequeño.

Una vez un conjunto de datos ha sido agrupado, aun podemos determinar la mayoría
de las otras medidas estadísticas además de la media, pero tal vez tengamos que
hacer presunciones especiales o modificar las definiciones. La mediana se define:

“La mediana de una distribución es tal que la mitad del área total de los
rectángulos del histograma de la distribución se ubica a su izquierda y la otra
mitad a su derecha”

8
Estadística Dr. CARDOZO Tema Nro. 4, V. 2022

Para encontrar las líneas divisorias entre las dos mitades de un histograma (cada
𝑛 𝑛
uno de los cuales representa de los items agrupados), tenemos que contar 2 de los
2
items empezando a cualquier lado de la distribución.

Ejemplo: Encontrar la mediana de la distribución de las emisiones de óxido


sulfuroso.
𝑛 80
Solución: Desde que = = 40, debemos contar 40 de los ítems empezando a
2 2
cualquier lado. Empezando en la base de la distribución (los valores mas pequeños),
encontramos que 3 + 10 +14 = 27, de los valores caen dentro de las primeras tres
clases, y que 3 +10 +14 +25 = 52 de los valores caen dentro de las primeras cuatro
clases. Entonces contaremos 40 – 27 =13 valores más por adelante del 27 el cual
cae dentro de las tres primeras clases, y sobre la presunción de que 25 valores en la
cuarta clases y están distribuido uniformemente a través de la clase, podemos hacer
13
este añadiendo 25 del intervalo de clase de 4 a 16.95, el limite real inferior de la
cuarta clase (o más correctamente el límite real superior de la tercera clase).
13
Esto nos da 𝑥̃ = 16.95 + 25 ∙ 4 = 19.03 para la mediana de la distribución.

En general si L es el límite real inferior de la clase dentro de la cual la mediana debe


caer f es su frecuencia c es el intervalo de clase, y j es el número de ítems que nos
hacen falta, cuando nosotros alcanzamos L, entonces la mediana de la distribución
j
es dada por: 𝑥̃ = L + ∙ c . Esta en la fórmula de la mediana de datos agrupados.
f

Si preferimos podemos encontrar la mediana de una distribución empezando a


contar al otro lado (empezando con sus valores más grandes) y sustrayendo una
fracción apropiada del intervalo de clase dentro del cual la mediana debe caer.

Ejemplo: Usar este acercamiento alternativo para encontrar la mediana de la


distribución de las emisiones de óxido sulfuroso.

Solución: Desde que 2+9+17 =28 de los valores caen sobre 20.95 necesitamos 40 -
28 = 12 de los 25 valores que caen en la siguiente clase para alcanzar la mediana y
12
escribamos: 𝑥̃ = 20.95 − 25 ∙ 4 = 19.03 . El resultado es por supuesto el mismo.

Debe notarse que la mediana de una distribución puede ser encontrada ya


sea que los intervalos de clases sean iguales o no. La mediana puede ser
encontrada aun cuando cualquiera de ambas de clases superior o inferior de una
distribución sea abiertas.

9
Estadística Dr. CARDOZO Tema Nro. 4, V. 2022

El método usado para encontrar la mediana de una distribución también puede ser
usado para encontrar otro fractiles.

Por Ejemplo: los cuartiles Q1, Q2 y Q3 que dividen un conjunto de datos en cuatro
más o menos parte iguales, 25% del área total de los rectángulos del histograma
está a la izquierda de Q1, 25% se ubica entre Q1 y Q2, 25% entre Q2 y Q3 y 25 % a la
derecha de Q3.

Similarmente los 9 deciles (que dividen el conjunto de datos en 10 más o menos


partes iguales) son definidos para datos agrupados de tal manera que 10% del area
total de los rectángulos de los histogramas se ubica a la izquierda de D1, 10% se
ubica entre D1 y D2…… y 10% se ubica a la derecha de D9.

Finalmente los 99 percentiles que dividen el conjunto de datos en 100 más o menos
partes iguales, son definidos para datos agrupados de tal manera que el 1% del total
del área de los rectángulos del histograma se ubica a la izquierda de P 1, 1% se ubica
entre P1 y P2 ………… y 1% se ubica a la derecha de P99.

Tomar en cuenta de que Q2, D5 y P50 son iguales a la mediana y que P25 es igual a
Q1 y que P75 = Q3.

Ejemplo: Encontrar Q1 y Q3 Para los datos de la distribución de emisiones de SO2.

Solución: Para hallar Q1 se encuentra 80/4 =20 de los ítems empezando desde el
fondo de la distribución (datos más pequeños) hay 3+10 =13 valores en la 1ra y 2da
clase tenemos que contar 20-13= 7 de los 14 valores de la 3ra clase para alcanzar
Q1.

7
𝑄1 = 12.95 + ∗ 4 = 14.95
14
Para hallar Q3 se cuenta 80/4 = 20 de los ítems. Se empieza a contar desde arriba
de la distribución. (Datos mayores) en la 7ma. Y 6ta clase hay 9+2=11 valores,
tenemos que contar 20-11=9 valores de los 17 valores de la 5ta clase para alcanzar
Q3.
9 8
𝑄3 = 24.95 + 17 ∗ 4 = 22.83 ó 𝑄3 = 20.95 + 17 ∗ 4 = 22.83

Ejemplo: Encontrar D8 y P2 para los datos de la distribución de emisiones de Óxido


de Azufre.

Solución: se cuenta 80 (0.20) = 16 de los ítems. Empezando con el valor más grande
obtenemos:

10
Estadística Dr. CARDOZO Tema Nro. 4, V. 2022

5
𝐷8 = 24.95 + 17 ∗ 4 = 23.77

Y contando 80(0.02) = 1.6 de los ítems empezando con el valor más pequeño se
tiene:
1.6
𝑃2 = 4.95 + ∗ 4 = 7.08
3

Ejercicios: Encontrar D6.- 80(0.6) = 48


21
𝐷6 = 16.95 + 25 ∗ 4 = 20.31 (descendente).
4
𝐷6 = 20.95 − 25 ∗ 4 = 20.31 (ascendente).

Encontrar P15.- 80(0.15) =12


9
𝑃15 = 8.95 +
∗ 4 = 12.55
10
Ejercicio: Los datos de los pesos de 120 de containers de explotación del mineral
estaño (Sn) a mercado de ultramar tiene un mínimo de 49.8 Ton, y un máximo de
62.7 Ton. De peso. Contando con la siguiente distribución de frecuencia
Ton / Container de Sn. Frecuencia
45.95 – 48.95 8
48.95 – 51, 95 18
51.95 – 54.95 23
54.95 – 57.95 36
57.95 – 60.95 20
60.95 – 63.95 15
N= 120

Encontrar: 1.- El Cuartil 2; 2.- El cuartil 3; 3.- El Decil 2; 4.- El Decil 6; 5.- El Decil 8;
6.- El Decil 9; 7.- El Percentil 3; 8.- El Percentil 18; 9.- El Percentil 37; 10.- El
Percentil 45; 11.- El percentil 66; 12.- El Percentil 78; 13.- El Percentil 85 y 14.- El
percentil 97.

11

También podría gustarte