Está en la página 1de 39

METODOS

CUANTITATIVOS

MEDIDAS DE TENDENCIA
CENTRAL

Prof. Levis R. Cabrera. A


MEDIDAS
DE
TENDENCIA
CENTRAL
La estadística descriptiva es la rama de la estadística que trata con la organización, el
resumen y la presentación de datos. Muchas de las técnicas de la estadística
descriptiva se han empleado desde hace más de 200 años y se han originado en
estudios y actividades de censos. La moderna tecnología de las computadoras, en
particular las gráficas por computadora` han ampliado en forma considerable el
campo de la estadística descriptiva en los últimos años. Nuevas y complejas técnicas
para la presentación de datos están emergiendo rápidamente. Las técnicas de la
estadística descriptiva pueden aplicarse ya sea a poblaciones enteras o a muestras.
Medidas de tendencia central

MEDIDAS DE POSICIÓN: SON AQUELLOS VALORES NUMÉRICOS QUE NOS


PERMITEN O BIEN DAR ALGUNA MEDIDA DE TENDENCIA CENTRAL,
DIVIDIENDO EL RECORRIDO DE LA VARIABLE EN DOS, O BIEN
FRAGMENTAR LA CANTIDAD DE DATOS EN PARTES IGUALES. LAS MÁS
USUALES SON LA MEDIA, LA MEDIANA, LA MODA, LOS CUARTILES,
QUINTILES, DECILES Y PERCENTILES. PUEDEN SER DE DOS TIPOS: DE
TENDENCIA CENTRAL O DE TIPISMO.

MEDIDAS DE DISPERSIÓN: SE LLAMAN MEDIDAS DE DISPERSIÓN AQUELLAS


QUE PERMITEN RETRATAR LA DISTANCIA DE LOS VALORES DE LA
VARIABLE A UN CIERTO VALOR CENTRAL, O QUE PERMITEN IDENTIFICAR
LA CONCENTRACIÓN DE LOS DATOS EN UN CIERTO SECTOR DEL
RECORRIDO DE LA VARIABLE. SE TRATA DE COEFICIENTES PARA
VARIABLES CUANTITATIVAS. LAS MÁS USUALES SON EL DESVÍO
ESTÁNDAR Y LA VARIANZA.
MEDIAS DE LOS DIFERENTES CONJUNTOS. 3) ES POSIBLE HALLAR LA MEDIA DE LA
IDEA DE MEDIA O PROMEDIO (TAMBIÉN LLAMADA MEDIA ARITMÉTICA)
FORMALIZA EL CONCEPTO INTUITIVO DE PUNTO DE EQUILIBRIO DE LAS
OBSERVACIONES. ES DECIR, ES EL PUNTO MEDIO DEL RECORRIDO DE LA VARIABLE
SEGÚN LA CANTIDAD DE VALORES OBTENIDOS.

LA ESE VALOR TIENE VARIAS PROPIEDADES IMPORTANTES.

SI SE SUMA LA DISTANCIA DE TODOS LOS VALORES RESPECTO DE LA MEDIA, ESA

MEDIA
SUMA DA CERO.

.
MEDIA
• UNA MEDIDA FRECUENTEMENTE UTILIZADA DEL CENTRO DE UN LOTE DE NÚMEROS. LA
MEDIA TAMBIÉN SE DENOMINA PROMEDIO. ES LA SUMA DE TODAS LAS OBSERVACIONES
DIVIDIDA ENTRE EL NÚMERO DE OBSERVACIONES (PRESENTES), LO QUE INDICA QUE
PUEDE SER AFECTADA POR LOS VALORES EXTREMOS, POR LO QUE PUEDE DAR UNA
IMAGEN DISTORCIONADA DE LA INFORMACIÓN DE LOS DATOS.
Notación

Término Description

xi i ésima observación

N número de observaciones presentes

Fórmula

𝒏
𝑿𝟏+𝑿𝟐+⋯+𝑿𝒏 𝟏 𝑿𝒊
𝑿= =
𝑵 𝑵
Ejemplo:

Suponga que el conjunto de datos es el siguiente: 1.7, 2.2, 3.9, 3.11 y 14.7. determine la media.

𝒏
𝑿𝟏+𝑿𝟐+⋯+𝑿𝒏 𝟏 𝑿𝒊 1.7+2.2+⋯+14.7
𝑿= = = = 5.12
𝑵 𝑵 5
MEDIA PONDERADA
La media ponderada de un conjunto de valores de una variable x a los que se han
asignado, respectivamente, una ponderación se calcula mediante la fórmula:
𝑛
𝑖=1 𝑋𝑖𝑃𝑖 𝑋1𝑃1 + 𝑋2𝑃2 + ⋯ + 𝑋𝑛𝑃𝑛
𝑋𝑝 = 𝑛 =
𝑖=1 𝑃𝑖 𝑃1 + 𝑃2 + ⋯ + 𝑃𝑛
EL CÁLCULO DE LA MEDIA

DADO UN CONJUNTO DE OBSERVACIONES

LA MEDIA SE REPRESENTA MEDIANTE Y SE OBTIENE DIVIDIENDO LA SUMA DE TODOS LOS


DATOS POR EL NÚMERO DE ELLOS, ES DECIR:

LA INTERPRETACIÓN DE LA MEDIA COMO CENTRO (O PUNTO DE EQUILIBRIO) DE LOS DATOS SE


APOYA EN UNA PROPIEDAD QUE AFIRMA QUE LA SUMA DE LAS DESVIACIONES

DE UN CONJUNTO DE OBSERVACIONES A SU MEDIA ES IGUAL A CERO; ES DECIR, PUEDE


PROBARSE QUE
Media aritmética (I)

La media aritmética de un conjunto de datos es el cociente entre la suma


de todos los datos y el número de estos.

Ejemplo: las notas de Juan el año pasado fueron:

5, 6, 4, 7, 8, 4, 6 Hay 7 datos

que suman 40
La nota media de Juan es:

5 + 6 + 4 + 7 + 8 + 4 + 6 40
Nota media = = = 5,7
7 7
Media aritmética (II)

Cálculo de la media aritmética cuando los datos se repiten.


1º. Se multiplican los datos por sus frecuencias absolutas respectivas, y
se suman.
2º. El resultado se divide por el total de datos.

Ejemplo. Las notas de un grupo de alumnos fueron:

Notas Frecuencia Notas x Datos por frecuencias


absoluta F. absoluta
3 5 15
5 8 40 129
6 10 60 Media = = 5,1
25
7 2 14
Total 25 129
Total de datos
MEDIANA

LA MEDIANA, A DIFERENCIA DE LA MEDIA NO BUSCA EL VALOR CENTRAL DEL


RECORRIDO DE LA VARIABLE SEGÚN LA CANTIDAD DE OBSERVACIONES, SINO QUE
BUSCA DETERMINAR EL VALOR QUE TIENE AQUELLA OBSERVACIÓN QUE DIVIDE LA
CANTIDAD DE OBSERVACIONES EN DOS MITADES IGUALES. POR LO TANTO ES
NECESARIO ATENDER A LA ORDENACIÓN DE LOS DATOS, Y DEBIDO A ELLO, ESTE
CÁLCULO DEPENDE DE LA POSICIÓN RELATIVA DE LOS VALORES OBTENIDOS. ES
NECESARIO, ANTES QUE NADA, ORDENAR LOS DATOS DE MENOR A MAYOR (O
VICEVERSA).

en caso que N sea impar


Mediana
La mediana de la muestra está en la mitad de los datos: por lo menos la mitad de
las observaciones es menor que o igual a la mediana y por lo menos la mitad de las
observaciones es mayor que o igual a la mediana. El propósito de la mediana de la
muestra es reflejar la tendencia central de la muestra de manera que no sea
influida por los valores extremos.

𝑋𝑛+1 𝑠𝑖 𝑛 𝑒𝑠 𝑖𝑚𝑝𝑎𝑟
2
෨ 1
𝑋=൞
𝑋𝑛 + 𝑋𝑛+1 𝑠𝑖 𝑛 𝑒𝑠 𝑝𝑎𝑟
2 2 2

Supongamos que usted tiene una columna que contiene N valores. Para calcular la mediana,
primero ordene los valores de los datos del más pequeño al más grande. Si N es impar, la
mediana de la muestra es el valor del medio. Si N es par, la mediana es el promedio de los
dos valores del medio.
Ejemplo:
Cuando N = 5 y usted tiene los datos x1, x2, x3, x4 y x5, la mediana = x3.

Suponga que el conjunto de datos es el siguiente: 1.7, 2.2, 3.9, 3.95 y 14.7. determine la
media.

Primer paso, organizamos los datos en orden ascendente.


1.7, 2.2, 3.9, 3.95, 14.7

𝒏+𝟏 𝟓+𝟏
𝑿= = =𝟑
𝟐 𝟐
Cuando N = 6 y usted ordenó los datos x1, x2, x3, x4, x5 y x6:

Suponga que el conjunto de datos es el siguiente: 1.7, 2.2, 3.9, 3.11, 7.5
14.7. determine la media.

donde x3 y x4 son la tercera y la cuarta observación

Primer paso, organizamos los datos en orden ascendente.


1.7, 2.2, 3.9, 4.8, 7.5, 14.7

𝒏+𝟏 𝟔+𝟏 𝟒
𝑿= = = 𝟑. 𝟓 𝟑
𝟐 𝟐

La mediana se encuentra en la posición 3 y 4,


que serían 3.9 y 4.8, por lo que el valor de la
mediana seria.
𝟑. 𝟗 + 𝟒. 𝟖
෩=
𝑿 = 𝟒. 𝟑𝟓
𝟐
Por lo que su valor es de 4.35.
La mediana

La mediana de un conjunto de datos es un valor del mismo tal que el número de


datos menores que él es igual al número de datos mayores que él.

Los pesos, en kilogramos, de 7 jugadores de un


Ejemplo:
equipo de fútbol son: 72, 65, 71, 56, 59, 63, 72

1º. Ordenamos los datos: 56, 59, 63, 65, 71, 72, 72
2º. El dato que queda en el centro es La mediana vale 65.
65.
Caso: Si el número de datos fuese par, la mediana es la
media aritmética de los dos valores centrales.

Para el conjunto 56, 57, 59, 63, 65, 71, 72, 72, la mediana es: 63 + 65
= 64
2
MODA

LA MODA, ES AQUEL DATO, AQUEL


VALOR DE LA VARIABLE QUE MÁS
SE REPITE; ES DECIR, AQUEL VALOR
DE LA VARIABLE (QUE PUEDE NO
SER UN ÚNICO VALOR) CON UNA
FRECUENCIA MAYOR.
Moda
La moda es el valor de los datos que ocurre con más frecuencia en el conjunto de datos.
Si existen múltiples modas. No depende de valores extremos, pero es más variables que
la media y la mediana. a moda es una medida de tendencia central muy importante,
porque permite planificar, organizar y producir para satisfacer las necesidades de la
mayoría.

Ejemplo:
Obtener la moda de los siguientes datos: 3, 3, 2, 0, 3, 1, 2, 4, 5, 2, 0, 1, 6, 8, 3.
Primer paso organizar los datos en forma ascendente.
0, 0, 1, 1, 2, 2, 2, 3, 3, 3, 3, 4, 5, 6, 8
El valor que mas se repite es el 3.
La moda

La moda de un conjunto de datos es el dato que más se repite.

Ejemplo. Una zapatería ha vendido en una semana los zapatos


que se reflejan en la tabla:

Nº de calzado 38 39 40 41 42 43 44 45
Nº de personas 16 21 30 35 29 18 10 7

El número de zapato más


vendido, el dato con mayor
Lo compran 35 personas
frecuencia absoluta, es el 41.

La moda es 41.
MEDIDAS DE DISPERSIÓN
El desvío estándar
Es posible identificar conjuntos de datos que A pesar de ser muy
distintos en términos de valores absolutos, poseen la misma media.
Una medida diferencial para identificar esos conjuntos de datos es la
concentración O dispersión alrededor de la media.

Una manera de evitar que los distintos signos se compensen es


elevarlas al cuadrado, de manera que todas las desviaciones sean
positivas. La raíz cuadrada del promedio de estas cantidades recibe
el nombre de desvío estándar, O desviación típica Y es representada
por la siguiente fórmula:
Desviación estándar (Desv.Est.)
La desviación estándar es la medida de dispersión más común, que indica qué tan
dispersos están los datos alrededor de la media. El símbolo σ (sigma) se utiliza
frecuentemente para representar la desviación estándar de una población, mientras
que s se utiliza para representar la desviación estándar de una muestra. La variación que
es aleatoria o natural de un proceso se conoce comúnmente como ruido.
A mayor valor del coeficiente del desvío estándar, mayor dispersión de los datos con respecto a su
media. Es un valor que representa los promedios de todas las diferencias individuales de las
observaciones respecto a un punto de referencia común, que es la media aritmética. Se entiende entonces
que cuando este valor es más pequeño, las diferencias de los valores respecto a la media, es decir, los
desvíos, son menores y, por lo tanto, el grupo de observaciones es más “homogéneo” que si el valor de la
desviación estándar fuera más grande. O sea que a menor dispersión mayor homogeneidad y a mayor
dispersión, menor homogeneidad.

La varianza

El cuadrado de la desviación estándar recibe el nombre de varianza y se representa por . la suma de


los cuadrados de los desvíos de la totalidad de las observaciones, respecto de la media aritmética de la
distribución, es menor que la suma de los cuadrados de los desvíos respecto de cualquier otro valor que
no sea la media aritmética.

Si observamos, veremos que la varianza no es más que el desvío estándar al cuadrado. Precisamente la
manera de simbolizarla es.

Por lo mismo, el desvío estándar puede definirse como la raíz cuadrada de la varianza
Notación
Término Description
Xi i ésima observación
media de las observaciones
N número de observaciones presentes
Fórmula
Al momento de aplicar la formula debemos tener en cuenta si se está analizando la
muestra o la población.

Ejemplo
En caso de que se analice la población:
2
𝑛
1 ቀ𝑋𝑖 − 𝑋ሻ
𝑆=
𝑁
Un ingeniero se interesa en probar el “sesgo” en un medidor de pH. Los datos se
recaban con el medidor mediante la medición del pH de una sustancia neutra (pH =
7.0). Se toma el total de los datos que ofrece el instrumento obteniendo los siguientes
resultados:
7.07 7.00 7.10 6.97 7.00 7.03 7.01 7.01 6.98 7.08.
Primer paso se busca la media
luego se procede a buscar la diferencia que existe entre cada valor individual con
respecto a la media, posteriormente esta diferencia se eleva al cuadrado y se procede
a sumarla, para luego dividirla entre tamaño de la poblacion.

𝒏
𝑿𝟏+𝑿𝟐+⋯+𝑿𝒏 𝟏 𝑿𝒊 7.07+7.00+7.10+⋯+7.08
𝑿= 𝑵
= 𝑵
= 10
= 7.025
𝑛 2
1 (𝑋𝑖
− 𝑋) 7.07 − 7.025ሻ2 + 7.00 − 7.025ሻ2 + ⋯ + 7.08 − 7.025ሻ2
𝑆= = = 0.001745
𝑁−1 10
= 0.04178
En caso de que se analice la muestra:

𝑛 2
1 𝑋𝑖 − 𝑋ሻ
𝑆=
𝑁−1

Ejemplo
Un ingeniero se interesa en probar el “sesgo” en un medidor de pH. Los datos se
recaban con el medidor mediante la medición del pH de una sustancia neutra (pH =
7.0). Se toma una muestra de tamaño 10 y se obtienen los siguientes resultados:
7.07 7.00 7.10 6.97 7.00 7.03 7.01 7.01 6.98 7.08.
Primer paso se busca la media
luego se procede a buscar la diferencia que existe entre cada valor individual con
respecto a la media, posteriormente esta diferencia se eleva al cuadrado y se procede a
sumarla, para luego dividirla entre tamaño de la muestra menos 1.
8 cms.

Aquí tenemos 9 rectángulos cuya altura es de 8 centímetros (y todos


tienen la misma base).

¿Existe alguna variación respecto de su altura entre estos rectángulos?

¿Cuál es el promedio de la altura de estos rectángulos?

8+8+8+8+8+8+8+8+8 72
= =8
9 9
10 cms

6 cms

8 cms.

El quinto rectángulo y el octavo rectángulo en un acto de rebeldía


cambiaron su altura. El quinto rectángulo, ahora de color rojo, mide 10
centímetros, y el octavo rectángulo, de color azul, mide 6 centímetros?
¿Cuál es el nuevo promedio de estos 9 rectángulos?

8 + 8 + 8 + 8 + 10 + 8 + 8 + 6 + 8 72
= =8
9 9
... ¡el mismo promedio! Pero... ¿ha habido variación?
10 cms

6 cms

8 cms.

El rectángulo rojo tiene +2 centímetros sobre el promedio, y el


rectángulo azul tiene –2 centímetros bajo el promedio. Los otros
rectángulos tienen cero diferencia respecto del promedio.
Si sumamos estas diferencias de la altura respecto del promedio,
tenemos
0+0+0+0+2+0+0–2+0 =0

Este valor nos parece indicar que ¡no ha habido variabilidad! Y sin
embargo, ante nuestros ojos, sabemos que hay variación.
10 cms

6 cms

8 cms.

Una forma de eliminar los signos menos de aquellas diferencias que


sean negativas, esto es de aquellos mediciones que estén bajo el
promedio, es elevar al cuadrado todas las diferencias, y luego sumar...

02 + 02 + 02 + 02 + 22 + 02 + 02 + (– 2)2 + 02 = 8

Y este resultado repartirlo entre todos los rectángulos, es decir lo


dividimos por el número de rectángulos que es 9

02 + 02 + 02 + 02 + 22 + 02 + 02 + (– 2)2 + 02 = 8
= 0,89
9 9
10 cms

6 cms

8 cms.

Se dice entonces que la varianza fue de 0,89

Observemos que las unidades involucradas en el cálculo de la varianza


están al cuadrado. En rigor la varianza es de 0,89 centímetros cuadrados.
De manera que se define
0,89 = 0,943
La raíz cuadrada de la varianza se llama desviación estándar
10 cms

6 cms

8 cms.

Que la desviación estándar haya sido de 0,943 significa que en promedio la


altura de los rectángulos variaron (ya sea aumentando, ya sea
disminuyendo) en 0,943 centímetros.
Es claro que esta situación es “en promedio”, puesto que sabemos que
los causantes de la variación fueron los rectángulos quinto y octavo.
Esta variación hace repartir la “culpa” a todos los demás rectángulos
que se “portaron bien”.
La desviación estándar mide la dispersión de los datos respecto del
promedio
10 cms
8 cms. 8 cms.8 cms. 8 cms. 8 cms.
7 cms.
6 cms
4 cms

¿Cuál es la varianza y la desviación estándar de las alturas de los rectángulos?


En primer lugar debemos calcular el promedio

8 + 4 + 8 + 8 + 10 + 8 + 7 + 6 + 8
= 7,44
9

Luego debemos calcular la varianza


10 cms
8 cms. 8 cms. 8 cms. 8 cms. 8 cms.
7 cms.
6 cms
4 cms

0,56 2,56 0,56 -0,44 -1,44


0,56
-3,44
0,56 0,56

7,44

Promedio

0,562 + (-3,44)2 + 0,562 + 0,562 + 2,562 + 0,562 + (-0,44)2 + (-1,44)2 + 22,2224


=
0,562 9 9

Este es el valor de la varianza = 2,469


10 cms
8 cms. 8 cms. 8 cms. 8 cms. 8 cms.
7 cms.
6 cms
4 cms

7,44

Promedio

Si la varianza fue de 2,469, entonces la desviación estándar es de...

2, 469 = 1,57
Lo que significa que, en promedio, los rectángulos se desviaron más o
menos (más arriba o más abajo) en 1,57 centímetros.
MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN PARA
DATOS SIMPLES.
𝒏
𝑿𝟏+𝑿𝟐+⋯+𝑿𝒏 𝟏 𝑿𝒊 7.07+7.00+7.10+⋯+7.08
𝑿= = = = 7.025
𝑵 𝑵 10

𝑛 2
1 (𝑋𝑖
− 𝑋) 7.07 − 7.025ሻ2 + 7.00 − 7.025ሻ2 + ⋯ + 7.08 − 7.025ሻ2
𝑆= = = 0.001939
𝑁−1 10 − 1
= 0.044
PARA MAS DETALLES y EXPLICACIONES ver:

Extracto para las clases de Métodos cuantitativos parte


estadística
Bibliografia

Devore, Jay. (2008). Probabilidad y Estadística Para Ingeniería y


Ciencias. Editorial Cengage. Séptima Edición.
Walpole, Ronald; Myers, Raymond. (2007). Probabilidad y Estadística Para
Ingenieros. Editorial Prentice-Hall. Octava Edición.
Ross, Sheldom. (2002). Probabilidad y Estadística para Ingeniería y Ciencias.
Editorial McGraw-Hill. Segunda Edición.
Miller, Irwin; Freund, John y Johnson, Richard. (1997). Probabilidad y Estadística
para Ingenieros. Editorial Prentice Hall. Cuarta Edición.
Montgomery, Douglas. (1996). Probabilidad y Estadística Aplicadas a la
Ingeniería. Editorial McGraw-Hill. Segunda Edición.
http://www.cca.org.mx/cca/cursos/estadistica/html/m9/medidas_tendencia_cen
tral.htm
https://es.calameo.com/books/00503854227d71f701939

También podría gustarte