Está en la página 1de 15

ESTADISTICA I

MEDIDAS DE TENDENCIA CENTRAL

Es un valor representativo que representa a toda la información. La mayor parte de los conjuntos de
datos muestran una tendencia a agruparse alrededor de un valor central. Estos valores se llaman
medidas de tendencia central. Entre ellos tenemos:

a) MEDIA ARITMETICA.

 Media aritmética para datos no agrupados.- Es una de las medidas de tendencia central, que
representa un valor con respecto a toda la información. Para  denotar la media de una población
utilizaremos   y x  cuando se trate de la media de una muestra. La media de una muestra es
igual a

x
x i

Ejem. Hallar la nota promedio (media aritmética) de un alumno que registro las siguientes
calificaciones:

10, 09, 18, 10, 07, 19, 05, 14, 12, 13

es decir, un valor representativo del conjunto de valores es  

10+ 9+18+10+........+13 117


 X́ = = =11.7
10 10

En excel considerar el comenado = promedio(valores)

Estadísticos
Notas
N Válido 10
Perdidos 0
Media 11,7000

En IBM SPSS: Analizar/ estadisticos descriptivos/ tablas de frecuencias

Pá gina 1
ESTADISTICA I

 Media aritmética para un conjunto de datos agrupados. -La media para datos agrupados es la
1 m
x   xi f i
siguiente: n i 1

Ejemplo: Los siguientes datos corresponden al número de hijos registrado en 15 familias. Encontrar
el número promedio de hijos.

N de hijos
xi  fi  xifi
1 3 3 La obtención de la media finalmente se convierte en
2 2 4
1 m
 xi f i 42
3 6 18
x
4 3 12 n i 1 = 15 = 2.8 = 3 hijos
5 1 5
Total n = 15 42
Rspta. El promedio de hijos por familia es de 3.

NOTA.- Debido a que el cálculo de la media aritmética se basa en todas las observaciones,
cualquier valor extremo afecta mucho su resultado; distorsionando así el resultado de la
información; entonces las media no es el mejor promedio para describir o resumir un conjunto
de datos que tiene valores extremos.

Media ponderada.- La media ponderada es una medida de tendencia central, que se construye
asignando a cada clase un peso, y obteniendo un promedio para los pesos.

x́=
∑ w i xi
∑ wi

Donde

wi = valor de peso para xi o ponderación

xi = dato

Ejemplo:

En una materia dada se asignan pesos de importancia, de la siguiente forma: Unida I (20% de
la calificación), Unidad II (25% de la calificación), Unidad III (20%  de la calificación), Unidad
IV (15% de la calificación), Unidad V (20% de la calificación). Si las calificaciones de un
alumno son 18 en la primera unidad, 15 en la segunda, 13 en la tercera unidad, 10 en la
cuarta unidad y 8 en la última unidad. Es decir, se tienen la siguiente tabla:

Unidad Ponderación (Wi) Datos (xi)


I 20% = 18
II 25% = 15

Pá gina 2
ESTADISTICA I

III 20% =   13
IV 15% = 10
V 20% = 8

x́=
∑ w i x i = 20∗18+25∗15+20∗13+15∗20+20∗8 = 1305 =13.05
∑ wi 100 100

La nota promedio ponderado es de 13.05

b) MEDIANA

Mediana para datos no agrupados.- La mediana de un conjunto finito de valores es aquel valor
que divide al conjunto en dos partes iguales, de forma que el número de valores mayor o igual a
la mediana es igual al número de valores menores o igual a estos. Su aplicación se ve limitada ya
que solo considera el orden jerárquico de los datos y no alguna propiedad propia de los datos,
como en el caso de la media.

A continuación se muestran los criterios para construir la mediana. Se puede construir los
siguientes criterios:

Lo primero que se requiere es ordenar los datos en forma ascendente o descendente,


cualquiera de los dos criterios conduce al mismo resultado.

Sean ordenados lo datos en orden ascendente x1 , x 2 , x3 ,  , x n

- Si el número de valores es impar, la mediana es el valor medio, el cual corresponde al dato

Me= X n+1
2

Cuando el número de valores en el conjunto es par, no existe un solo valor medio, si no que
existe dos valores medios, en tal caso, la mediana es el promedio de los valores, es decir, la
mediana es numéricamente igual a

X n +X n
+1
2 2
Me=
2

Podemos describir algunas propiedades para la mediana:

1.- Es única.

2.- Es simple.

3.- Los valores extremos no tienen efectos importantes sobre la mediana, lo que si  ocurre con la
media aritmética.

La notación mas usual que se utiliza para representar a la mediana es: Me

Ejemplo:
Pá gina 3
ESTADISTICA I

Dados los siguientes datos: 1, 2, 3, 4, 0, 1, 4, 3, 1, 1, 1, 1, 2, 1, 3 Hallar la mediana.

para la obtención de la mediana se deberán de ordenar.

 Ordenar: 0, 1, 1, 1, 1, 1, 1, 1, 2, 2, 3, 3, 3, 4, 4

N = 15 (impar ) Me= X n+1 =¿  X 15 +1 =X 8 Me = 1


2 2

Dados los siguientes datos: 10, 21, 13, 44, 20, 17, 42, 13 Hallar la mediana.

Ordenar: 44, 42, 21, 20, 17, 13, 13, 10

N=8 ( par )

X n +X n X 8+ X 8 X 4 + X 5 20+17
+1 +1
 Me= 2 2
= 2 2 = = = 18.5
2 2 2 2

En Excel: El comando es mediana (valores)

Estadísticos
Diashospitaliación
N Válido 14
Perdidos 0
Mediana 1,0000

En IBM SPSS: Analizar/ estadisticos descriptivos/ tablas de frecuencias

Pá gina 4
ESTADISTICA I

Geométricamente la mediana se encuentra en el valor X que divide al histograma en dos partes de


áreas iguales.

c) MODA

Moda para datos no agrupados.-La moda es la medida que se relaciona con la frecuencia con
que se presenta el dato o los datos con mayor incidencia, con lo que se considera la posibilidad
de que exista más de una moda para un conjunto de datos. La notación mas frecuente es: Mo .
Esta medida se puede aparecer tanto para datos cualitativos como cuantitativos. Se dice que
cuando un conjunto de datos tiene una moda la muestra es unimodal, cuando tiene dos modas
bimodal, cuando la muestra contiene más de un dato repetido se dice que es multimodal y un
último caso es cuando ningún dato tiene una frecuencia, en dicho caso se dice que la muestra es
amodal.

Ejemplos:

1.- Determinar la moda del siguiente conjunto de datos:

a).- 1, 2, 3, 3, 4 , 5, 6, 7, 7, 3, 1, 9, 3

la moda de este conjunto de datos es igual a_____ y se considera _____

b).- 1, 2, 3, 4, 4, 5, 2, 1, 3, 4, 2, 3, 4, 6, 3, 3,4

Pá gina 5
ESTADISTICA I

Las modas de este conjunto de datos son ____ y ___ya que ambas tienen la mas alta
frecuencia, por lo que la muestra es ______

c).- 1, 2, 3, 4, 5, 6, 7, 8, 9

La muestra ___ contiene ningún dato repetido por lo que se considera que la muestra es ___

no tiene moda.

Gráficamente eso se puede reflejar mediante el análisis de un histograma de frecuencias.

En Excel el comando es moda(valor)

El valor predominante (frecuencia) es de 19

Clases de Distribuciones

1.- Distribución simétrica.- Se presenta si todas las observaciones están concentradas en


un solo valor de la variable; en este caso la media, la mediana y la moda coincidirán en el
mismo valor.

X́ = Me = Mo

2.- Distribución asimétrica sesgada a la izquierda.- En este caso el valor de la media


aritmética es menor que la mediana y esta a su vez menor que la moda.

X́ < Me < Mo

Pá gina 6
ESTADISTICA I

3.- Distribución asimétrica sesgada a la derecha.- En este caso el valor de la media


aritmética es mayor que la mediana y esta a su vez mayor que la moda.

Mo< Me< X́

Para nuestro ejemplo:

La estatura en 20 personas dio como resultado los siguientes valores, halle el tipo de distribución

X́ = 1.50
Me = 1.63
Mo = 1.65

Rpta: _La distribución de los datos es sesgada a la izquierda_______________

MEDIDAS DE DISPERSIÓN

La dispersión mide cuan alejados están un conjunto de valores respecto a su media aritmética. Así cuanto
menos disperso sea el conjunto más cerca del valor medio se encontrarán sus valores. Este aspecto es de vital
importancia para el estudio de múltiples sistemas. Entre las medidas de dispersión se tiene:

Pá gina 7
ESTADISTICA I

a) Rango o recorrido.- Es la medida más simple de dispersión. Es la diferencia entre el valor más grande y el
más pequeño de un conjunto de valores. Esta medida presenta problemas que la hacen poco apta para usos
estadísticos. Puede verse afectada por valores extremos, poco representativos. Además, esta medida al
aumentar el número de valores aumenta o se queda igual pero nunca disminuye.

R = Xmax – Xmin

Ejem.

Se quiere medir la variabilidad respecto a las notas de dos secciones, observando que en la seccion A las
notas varian de 10 a 16 puntos, mientras que en la sección B las notas varian de 12 a 16 puntos. ¿ En cual de
las secciones existe menor variabilidad en cuanto a las notas?

Solucion

Seccion A Xmax = 16 Sección B Xmax = 16

X min = 10 X min = 12

RA = 16 – 10 = 6 RB = 16 – 12 = 4

Rpta:_En la sección B existe menor varibilidad en referencia a las notas__________


____________________________

b) Varianza (S2).-Es un estadístico de dispersión, que indica la variabilidad de los datos. Este valor tiene
unidades cuadráticas por consiguiente no puede ser interpretado.

- Varianza para datos no agrupados.- Su cálculo (para datos simples) se verifica según la fórmula:
2
2 ∑ ( x i− X́ )
S=
n−1

donde:

– xi son las observaciones de la serie (i = 1,…, n).


– : media aritmética de la serie; n: total de observaciones.

– Varianza para datos discretos.- Cuando se tiene datos discretos con sus respectivas frecuencias absolutas,
el cálculo de la varianza se realiza mediante la fórmula:
2
2 ∑ f i ( xi − X́ )
S=
n−1
xi: datos de la variable

Pá gina 8
ESTADISTICA I

- Varianza para datos agrupados .- Si los datos están agrupados, el cálculo de la varianza se realiza
mediante la fórmula:
2
2∑ f i ( X i− X́ )
S=
n−1

Donde Xi: marca de clase

Esta medida logra describir adecuadamente la dispersión del conjunto de datos, pero tiene un inconveniente: su
resultado se expresa en unidades cuadradas, algo difícil de entender en la mayoría de las situaciones prácticas, y
por demás disonante en relación con la medida de tendencia central utilizada. Sería algo así como años
cuadrados, o pesos cuadrados.

c) Desviación Estándar.-Es la raíz cuadrada positiva de la varianza, cuya respuesta se da en las unidades
originales, es la medida de variación más utilizada en el mundo de las estadísticas. También conocida como
desviación típica, es una medida de dispersión usada en estadística que nos dice cuánto tienden a alejarse los
valores puntuales del promedio en una distribución. De hecho, específicamente, la desviación estándar es "el
promedio de la distancia de cada punto respecto del promedio". Su símbolo es S (por ser la raíz cuadrada de la
varianza).

Expresión de la desviación estándar muestral: S= √ S2

Ejm.

1. Los siguientes datos corresponden al tiempo que 5 alumnos utilizan el internet para investigar cierto
tema, las horas utilizadas fueron: 2.3 3.1 2.9 1.3 2.6 horas. Halle la desviación
estándar.

X́ =
∑ xi = 12.2 = 2.44
n 5

Varianza Desviación estándar


2
2 ∑ ( x i− X́ ) 1.992 = 0.498 S =√ 0.498=0.70569
S= =
n−1 5−1

Pá gina 9
ESTADISTICA I

Interpretación puntual: El tiempo promedio que utilizan 5 estudiantes para investigar es de 2.44 horas____

X́ ± S : 2.44 ± 0.71  [2.44 – 0.71; 2.44 + 0.71]

= [1.73; 3.15]

Interpretación Intervalar: _El tiempo que es utilizado para investigar por 5 estudiantes esta entre 1.73 horas
hasta 3.15 horas.__________

2. Los siguientes datos corresponden a la temperatura en 6 días registrado en la ciudad del Cusco, los
cuales fueron: 18°C, 17°C, 12 °C, 8 °C, 13 °C, 15°C. Halle la desviación estándar.

X́ =
∑ xi =¿13.83
n
2
∑ ( X i− X́ )
=13.36 Desviación estandar S =√ 13.36=3.65
2
S=
n−1

Interpretación puntual: La temperatura promedio registrada en 6 dias en la ciudad del Cusco es de


13.83°C_____________________________ __

X́ ± S=¿ 13.83 ± 3.65 = [ 13.83 – 3.65; 13.83 + 3.65]

[ 10.18; 17.48]

Interpretación Intervalar: La temperatura registra en 5 dias en la ciudad del Cusco varía entre 10.18°C hasta
17.48°C___________________________________________________________ _________

d) Coeficiente de variación.- Este coeficiente sirve para comparar la dispersión entre dos o más conjuntos de
datos, y además la comparaciones da aun cuando las variables tienen diferentes unidades de medida. El
coeficiente de variación (CV), que expresa a la desviación típica como porcentaje de la media, se realiza
mediante:

Pá gina 10
ESTADISTICA I

Donde S es la desviación típica. Se puede dar en tanto por ciento calculando:

Ejemplo tiempo CV = 0.70569/ 2.44 *100 = 28.92%

Medidas de localización. - Son los valores que dividen a la distribución en 100, 10 y 4 partes iguales.

Cuartiles.- Es el valor que divide a la distribución en 4 partes iguales, donde:

Q1 divide al 25%

nk
Q2 divide al 50% Qk=Li+ C (
4
−F i−1
fi )
Q3 divide al 75%

Deciles.- Es el valor que divide a la distribución en 10 partes iguales, donde:

D1 divide al 10%

nk
D2 divide al 20% Dk=Li+ C (
10
−Fi −1
fi )
D9 divide al 90%

Percentiles.- Es el valor que divide a la distribución en 100 partes iguales, donde:

P1 divide al 1%

nk
P23 divide al 23% Pk=Li +C (
100
−Fi−1
fi )
P99 divide al 99%

NOTA: Me = Q2 = D5 = P50 ubican al 50% de la información

Ejercicios

Con la base de datos coronaria.sav


Utilizando las variables, edad, colesterol HDL, triglicéridos, peso talla, Hallar las interpretaciones
intervalares y las medidas de localización adecuadas.

Pá gina 11
ESTADISTICA I

Para las interpretaciones intervalares X́ ± S


Edad
Estadísticos Media: La edad promedio de los pacientes evaluados es de 55.1
edad años
N Válido 70
Mediana: El 50% de los pacientes evaluados tienen 55.5 años.
Perdidos 0
Media 55,100 Moda. La mayor cantidad de pacientes evaluados tiene 58 años.
Mediana 55,500
Moda 58,0 Interpretación intervalar
Desv. Desviación 7,0959
X́ ± S = 55.1 ± 7.09 = [ 55.1 - 7.09; 55.1 + 7.09]
[48.01 – 62.19]
Varianza 50,352
La edad de los pacientes se encuentra entre 48.01 años
Percentiles 25 49,000 hasta 62.19 años.
50 55,500
75 60,250 Q1 = P25 Menos del 25% de los pacientes tienen la edad
de 49 años
Q2 = P50 Menos del 50% de los pacientes tienen la edad
de 55.5 años.
Q3 = P75  Menos del 75% de los pacientes tienen la
edad de 60.25 años

colesterol HDL Media: El índice de colesterol HDL en promedio de los pacientes


evaluados es de 42.27 mg/dL
Estadísticos
colesterol HDL
Mediana: El 50% de los pacientes evaluados presentan un indie
N Válido 70 de colesterol de 43 mg/dL.
Perdidos 0
Moda. La mayor cantidad de pacientes evaluados presentan un
Pá gina 12
indie de colesterol de 45 mg/dL.
ESTADISTICA I

Media 42,2714
Mediana 43,0000
Moda 45,00
Desv. Desviación 7,77570
Varianza 60,461
Mínimo 26,00
Máximo 60,00
Percentiles 10 32,0000
20 36,0000
30 38,0000
40 39,0000
50 43,0000
60 44,6000
70 45,0000
80 48,0000
90 54,0000

Triglicéridos

Estadísticos Media: El índice trigliceridos en promedio de los


triglic
pacientes evaluados es de 139.157 mg/dL
N Válido 70
Mediana: El 50% de los pacientes evaluados
Perdidos 0 presentan un indie de triglicéridos de 130 mg/dL.
Media 139,1571
Mediana 130,0000 Moda. La mayor cantidad de pacientes evaluados
presentan un indie de triglicéridos de 120 mg/dL.
Moda 120,00
Desv. Desviación 37,77724 Tipo de distribución
Varianza 1427,120
Percentiles 12 100,5200
27 110,3400
49 130,0000
82 175,2200

P12. Menos de 12% de los pacientes tienen un


índice de triglicéridos de 100.53 mg/dL.

P49. Menos de 49% de los pacientes tienen un


índice de triglicéridos de 130 mg/dL.

Utilizando la base de datos Mundo 95. Sav, completar los espacios en blanco

Pá gina 13
ESTADISTICA I

Estadísticos

Mortalidad
infantil
(muertes por Tasa de
Esperanza Personas 1000 natalidad
Esperanza de de vida Alfabetizadas nacimientos Ingesta diaria (por 1.000
vida femenina masculina (%) vivos) de calorías habitantes)
N Válidos 109 109 107 109 75 109
Perdidos 0 0 2 0 34 0
Media 70.16 64.92 78.34 42.313 2753.83 25.923
Mediana 74.00 67.00 88.00 27.700 2653.00 25.000
Desv. típ. 10.572 9.273 22.883 38.0792 567.828 12.3609
Varianza 111.762 85.984 523.640 1450.027 322428.334 152.792
Asimetría -1.109 -1.080 -.994 1.090 .170 .446
Error típ. de asimetría .231 .231 .234 .231 .277 .231
Curtosis .213 .336 -.160 .365 -1.207 -1.147
Error típ. de curtosis .459 .459 .463 .459 .548 .459
Mínimo 43 41 18 4.0 1667 10.0
Máximo 82 76 100 168.0 3825 53.0
Percentiles 25 66.50 61.00 62.00 9.250 2247.00 14.000
50 74.00 67.00 88.00 27.700 2653.00 25.000
75 78.00 72.50 98.00 64.500 3236.00 35.000

En la tabla se observa que la esperanza de vida femenina promedio es de 70.16 años; mientras que en los
varones es de 64.92 ±9.27 años, se registró un mínimo del 18% de personas alfabetizadas y un máximo del
100% de alfabetizados; Menos del 25% de la mortalidad infantil es de 9.250 muertes por 1000 nacimientos
vivos, el 50% tiene una indigesta diaria de 2653 calorías.

Gráficos: Histograma

Esperanza de vida masculina


Esperanza de vida femenina

20
20

15
15
Frecuencia
Frecuencia

10 10

5 5

Media =70,16 Media =64,92


Desviación típica =10, Desviación típica =9,273
572 N =109
N =109 0
0
40 50 60 70 80 90 40 50 60 70 80

Esperanza de vida femenina Esperanza de vida masculina

a) Analizar las variables salario actual, salario inicial , meses de contrato y experiencia previa

Estadísticos
Meses desde el Experiencia
Salario actual Salario inicial contrato previa (meses)
N Válido 474 474 474 474
Perdidos 0 0 0 0
Media $34,419.57 $17,016.09 81,11 95,86
Mediana $28,875.00 $15,000.00 81,00 55,00
a
Moda $30,750 $15,000 81 0
Desv. Desviación $17,075.661 $7,870.638 10,061 104,586

Pá gina 14
ESTADISTICA I

Mínimo $15,750 $9,000 63 0


Máximo $135,000 $79,980 98 476
Percentiles 25 $24,000.00 $12,450.00 72,00 19,00
50 $28,875.00 $15,000.00 81,00 55,00
75 $37,162.50 $17,617.50 90,00 140,00
80 $41,100.00 $19,500.00 92,00 171,00
a. Existen múltiples modos. Se muestra el valor más pequeño.

En la tabla se observa que el salario actual promedio es de $_34.419.57_; el 50% de los trabajadores recibieron

un salario inicial de $_15,000__, frecuentemente se contrataron __81____ meses, La experiencia previa de los

trabajadores en promedio fue de _95.86__ meses, con una desviación de _104.586__meses. El 80% de los

trabajadores presento un salario inicial de $_19,500______, el 75% _17,617_ y el 25%_12,450__. La experiencia

mínima previa fue de __0__meses y un máximo de __476____meses; al 50% de los trabajadores los contrataron

__81__meses.

Pá gina 15

También podría gustarte