Está en la página 1de 19

ESTADISTICA APLICADA

Unidad II: Análisis Univariable

Medidas de Tendencia Central para datos no agrupados


Son índices de localización central empleados en la descripción de las distribuciones de frecuencia.

Media Aritmética: Es la suma de todos los valores de la variable dividida entre el número de datos (Se dice que la media es un
promedio).

Media para datos No agrupados


Se dice que son no Agrupados porque los datos no se presentan en clases ni intervalos.

Media de la población

Xi
 con Xi: valor que toma la variable y N: cantidad total del elementos.
N

Media de la muestra
con Xi: valor que toma la variable y n: cantidad de elementos de la muestra.

Se tienen los pesos de 10 jugadores de futbol, los cuales se va a determinar la media. Los valores son:

X1 50
X2 55
X3 65
X4 67
X5 70
X6 58
X7 73
X8 89
X9 88
X10 64
N 10
SUMA XI 679
PROMEDIO 67,9

La media de los pesos de los jugadores es 67,9


Media Aritmética para datos no agrupados repetidos
Se debe tomar en cuenta cada valor de la variable Xi, ya que se repite tantas veces como indique su frecuencia (fi).

En consecuencia, la media aritmética para este caso será.

Donde n: es el número de observaciones que será igual a la sumatoria de todas las fi.

Es decir,

En la construcción del Centro Comercial Ciudad Egipcia de Ciudad Bolívar se tiene que 2 obreros tienen 1 hijo; 4
obreros tienen 2 hijos, 6 obreros tienen 3 hijos y 8 obreros tienen 4, Determinar el promedio de los hijos de los
obreros que laboran en dicha construcción:

Cantidad Nro de Xi*fi


de Hijos Obreros (fi)
(Xi)
1 2 2
2 4 8
3 6 18
4 8 32
TOTAL 20 60

La media es de 3

Promedio de los hijos de los obreros que laboran en dicha construcción.

Mediana
Medida que se utiliza para representar la tendencia central de una serie estadística. Para su determinación se ordenan los valores,
generalmente de menor a mayor, siendo el valor de la mediana igual al valor CENTRAL si la serie es IMPAR, si la serie es PAR se
conviene en tomar como mediana la media aritmética de los TERMINOS CENTRALES.

X ( n / 2 )  X ( n / 2 )1
X ( n1) / 2 Si n es IMPAR Si n es PAR
2

Con X1, X2, …, Xn representan una muestra aleatoria de tamaño n.

Se tienen el número de paquete que llega a Mrw en 5 días: 5, 11, 9, 20, 10


CASO IMPAR X ( n1) / 2

N=5, Será 5+1/2=3 entonces el valor que se encuentra en X 3 será la mediana.

Lo primero que se debe hacer es ordenar los valores, para buscar la mediana en la posición X 3.

X1 X2 X3 X4 X5
5 9 10 11 20

La mediana es el valor 10, que se encuentra en la posición X 3.

X ( n / 2 )  X ( n / 2 )1
CASO PAR
2

Ejemplo: Se tienen el número de paquete que llega a Mrw en 6 días: 5, 11, 9, 20, 10,15.

X 3  X 4 10  11
Para este caso n=6.   10,5
2 2

Ordenando loa valores se tiene que:

X1 X2 X3 X4 X5 X6
5 9 10 11 15 20

La mediana es 10,5

Moda
Es aquel valor que más se repite en un conjunto de datos.

La moda puede NO existir y cuando existe no necesariamente es única.

Distribución BiModal: Cuando se repiten 2 modas.

Distribución Multimodal: Cuando se repiten más de 2 modas.

Se tienen los siguientes 10 números los cuales ya están ordenados para ubicar cuál es el o los valores que más
se repiten.

E1 E2 E3 E4 E5 E6 E7 E8 E9 E10
1 2 2 3 3 3 4 4 4 6

Se visualiza que 3 se repite y el 4 se repite el mismo número de veces. Allí se dice que se presenta una
distribución bimodal.

Para este caso, se presentan 10 números, se ordenan para ver cuál o cuáles se repiten.
E1 E2 E3 E4 E5 E6 E7 E8 E9 E10
5 5 5 6 10 10 10 11 11 11

Se visualiza que 5 se repite, el 10 se repite y el 11 se repite el mismo número de veces. Allí se dice que se
presenta una distribución multimodal.

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS

Se muestran las calificaciones obtenidas durante el lapso pasado en la asignatura de Introducción a la


Programación de una sección 1 de la carrera de Ingeniería Civil de la UDO Núcleo Bolívar.

68 79 65 67 89
73 65 78 75 67
61 86 78 88 73
66 84 62 75 73
96 79 80 82 82
Lo primero que se debe haber es ordenar los valores de menor a mayor.

Quedando de la siguiente manera:

61 67 73 79 84
62 67 75 79 86
65 68 75 80 88
65 73 78 82 89
66 73 78 82 96

Se deben aplicar las siguientes formulas:

1.- Determinar el rango o amplitud de variación (∆v). ∆v=V Max- V Min= 96-61=35

2.- Calcular el número de clases (Regla de Sturges). N_Clase= 1+ 3,322LogN (APROXIMAR AL ENTERO)

Donde N: Tamaño de la muestra, para este caso son 25 estudiantes, quedando la fórmula:

N_Clase= 1+ 3,322Log25=5,64 se aproxima a 6. Así se realizará en la tabla de distribución de frecuencia 6


clases.

3 y 4.- Determinar el intervalo de Clase (I.C.) IC  V


NRO  CLASE =35/6=5,83333
Cuando ya se han determinado el valor del rango, el número de clases y el intervalo de clases, se procede a
empezar a realizar la tabla de distribución de frecuencia.

CENTRO FREC FREC


DE FREC ABS FREC REL
Clase LINF LSUP CLASE ABSUL ACUMUL REL ACUM
Factor de 1 61 66,83 63,915 5 5 20 20
Corrección 2 66,84 72,67 69,755 3 8 12 32
0,01 3 72,68 78,51 75,595 7 15 28 60
4 78,52 84,35 81,435 6 21 24 84
5 84,36 90,19 87,275 3 24 12 96
96,03
6 90,2 93,115 1 25 4 100

Media Aritmética para datos agrupados

Donde X1, X2, X3, … , Xn: son los centros de clase o marca de clase. (Columna Centro de Clase)

f1, f2, f3, … , fn: son las correspondientes frecuencias (Columna frecuencia absoluta).

Xi * fi 63,915 * 5  69,755 * 3  75,595 * 7  81,435 * 6  87,275 * 3  93,115 *1


   76,06
N 25
Mediana para datos agrupados
Cuando los datos han sido agrupados en una distribución de frecuencia.

(n  1) / 2  ( F  1)
Mediana= * w  lm
fm

Para determinar en qué clase esta la mediana se aplica la fórmula de (n+1)/2 para el caso de este ejercicio la n=25, así que seria
26/2=13 ese valor de 13 vamos a ubicarlo en la columna de Frecuencia Absoluta Acumulada (Fa) para ver en qué clase esta la
MEDIANA. Ese valor 13 está en la tercera Clase, de allí escogeremos todos los valores.

CENTRO FREC
FREC FREC FREC REL
Clase LINF LSUP DE ABS
ABSUL REL ACUM
  CLASE ACUMUL
Factor de 1 61 66,83 63,915 5 5 20 20
Corrección
2 66,84 72,67 69,755 3 8F 12 32
0,01
72,68
3 78,51 75,595 7 fm 15 28 60
lm
4 78,52 84,35 81,435 6 21 24 84
5 84,36 90,19 87,275 3 24 12 96
6 90,2 96,03 93,115 1 25 4 100

Datos

25 Con n: número total de elementos en la distribución.

8 F: suma de todas las frecuencias de la clase, pero sin incluir las de la clase que contiene a la mediana.

7 fm: frecuencia de la clase que contiene la mediana.

5,83 w: Ancho del intervalo de la clase que contiene a la mediana.

Se puede obtener restando el límite superior-límite inferior

72,68 lm: Límite inferior del intervalo de la clase, que contiene a la mediana.

(n  1) / 2  ( F  1) (25  1) / 2  (8  1)
* w  lm  * 5,83  72,68  76,01
fm 7

Este valor de 76,01 debe ubicarse entre el límite inferior y superior de la clase 3 y es lo que nos indica que los cálculos están correctos.

Moda para datos agrupados


Con la tabla de distribución efectuada, se procede a escoger cual es la clase modal que es el valor más alto que se encuentra en la
frecuencia absoluta (fa).

 d1 
Moda= lmo    * w
 d1  d 2 

En este caso la clase modal es la clase 3 que tiene el valor 7. De esa clase se escogerán todos los
valores respectivamente.

72,68 Donde lmo: Límite inferior de la clase modal.

7-3=4 d1: Frecuencia de la clase modal menos la frecuencia de la clase anterior.

7-6=1 d2: Frecuencia de la clase modal menos la frecuencia de la clase posterior.

5,83 w: Amplitud de la clase modal.

 d1 
 * w  72,68  
4 
lmo    * 5,83  77,34
 d1  d 2   4 1

Este valor de 77,34 debe ubicarse entre el límite inferior 72,68 y superior 78,51 de la clase 3 y es lo que nos indica que los cálculos
están correctos.
MEDIDAS DE POSICION
Las medidas de posición nos facilitan información sobre la serie de datos que se esta analizando. La descripción de un conjunto de
datos, incluye como un elemento de importancia la ubicación de estos dentro de un contexto de valores posible.

Una vez definido los conceptos básicos en el estudio de una distribución de frecuencia de una variable, se estudiará las distintas formas
de resumir dichas distribuciones mediante Medidas de Posición.

Son indicadores usados para señalar que porcentaje de datos dentro de una distribución de frecuencia superan estas expresiones, cuyo
valor representa el valor del dato que se encuentra en el centro de la distribución de frecuencia, por lo que también se les llama
“Medidas de tendencia Central”.

Las medidas de posición de una distribución de frecuencia han de cumplir determinadas condiciones para que sean verdaderamente
representativas de la variable a la que resume. Toda síntesis de una distribución se considerará como operativa si intervienen en su
determinación todos y cada uno de los valores de la distribución, siendo única para cada distribución de frecuencias, calculable y fácil de
obtención.

Las más comunes son:

CUARTILES: Hay 3 cuartiles que dividen a una distribución en 4 partes iguales: primero, segundo y tercer cuartil.

DECILES: Hay 9 deciles que la dividen en 10 partes iguales (primero al noveno decil).

PERCENTILES: Hay 99 percentiles que dividen a una serie en 100 partes iguales (Del primero al noventa y nueve percentil).

CUARTILES.

PRIMER CUARTIL

Es el valor en el cual o por debajo del cual queda el (25%) de los valores de la sucesión ordenada.

N
1.   fi
Q1  Li  4 * Ic
f abs Q1

El 25% de 25 es 6,25 nos ubicamos en la columna de frecuencia absoluta acumulada, para ver en qué clase
pertenece, para este caso está en la clase 2.

66,84 Li: Límite inferior de la frontera de clase.

25 n: Cantidad de elementos de la distribución.

5  fi : Sumatoria de las frecuencias absolutas antes del Q 1

5,83 Ic: Intervalo de Clase.

3 FabsQ1: Frecuencia absoluta de Q1.


Sustituimos los valores:

N
1.   fi 1. 25
Q1  Li  4 * Ic  66,84  4  5 * 5,83  69,26
f absQ1 3

El 25% de las calificaciones de los estudiantes se encuentran por debajo de 69,26

SEGUNDO CUARTIL

Es el valor en el cual o por debajo del cual queda el (50%) de los valores de la sucesión ordenada.

N
2.   fi
Q2  Li  4 * Ic
f abs Q2

El 50% de 25 es 12,5 nos ubicamos en la columna de frecuencia absoluta acumulada, para ver en qué clase
pertenece, para este caso está en la clase 3.

72,68 Li: Límite inferior de la frontera de clase.

25 n: Cantidad de elementos de la distribución.

8  fi : Sumatoria de las frecuencias absolutas antes del Q 2

5,83 Ic: Intervalo de Clase.

7 FabsQ1: Frecuencia absoluta de Q2..


Sustituimos los valores:

N
2.   fi
4 2 * 25 / 4  8
Q2  Li  * Ic  72,68  * 5,83  76,42
f absQ2 7

El 50% de las calificaciones de los estudiantes se encuentran por debajo de 76,42

TERCER CUARTIL

Aquel valor, dato o término que supera el (75%) de los valores de la sucesión ordenada.

N
3.   fi
Q3  Li  4 * Ic
f abs Q3

El 75% de 25 es 18,75 nos ubicamos en la columna de frecuencia absoluta acumulada, para ver en qué clase
pertenece, para este caso está en la clase 4.

78,52 Li: Límite inferior de la frontera de clase.

25 n: Cantidad de elementos de la distribución.

15  fi : Sumatoria de las frecuencias absolutas antes del Q3

5,83 Ic: Intervalo de Clase.

6 FabsQ1: Frecuencia absoluta de Q3


Sustituyendo los valores:

N
3.   fi
4 3 * 25 / 4  15
Q3  Li  * Ic  78,52  * 5,83  82,16
f absQ3 6

El 75% de las calificaciones de los estudiantes se encuentran por debajo de 82,16

DECILES.

Son ciertos números que dividen la sucesión de datos ordenados en 10 partes porcentualmente iguales.

Son los 9 valores que dividen al conjunto de datos ordenados en 10 partes iguales.

Se denotan D1, D2, D3,,…, D9 que se leen primer decil, segundo decil, …., noveno decil, etc.

PRIMER DECIL

Es el valor en el cual o por debajo del cual queda el (10%) de los valores de la sucesión ordenada.

N
1.   fi
D1  Li  10 * Ic
f abs D1

El 10% de 25 es 2,5 nos ubicamos en la columna de frecuencia absoluta acumulada, para ver en qué clase
pertenece, para este caso está en la clase 1

61 Li: Límite inferior de la frontera de clase.

25 n: Cantidad de elementos de la distribución.

0  fi : Sumatoria de las frecuencias absolutas antes del D 1

5,83 Ic: Intervalo de Clase.

5 FabsD1: Frecuencia absoluta de D1.


Sustituyendo los valores:

N
1.   fi
10 1* 25 / 10  0
D1  Li  * Ic  61  * 5,83  63,915
f abs D1 5

El 10% de las calificaciones de los estudiantes se encuentran por debajo de 63,915

SEGUNDO DECIL

Es el valor en el cual o por debajo del cual queda el (20%) de los valores de la sucesión ordenada.

N
2.   fi
D2  Li  10 * Ic
f abs D2

Li: Limite inferior de la frontera de clase.

N: Cantidad de elementos de la distribución.

 fi : Sumatoria de las frecuencias absolutas antes del D 2.

Ic: Intervalo de Clase.

FabsD2: Frecuencia absoluta de D2.

NOVENO DECIL
Es el valor en el cual o por debajo del cual queda el (90%) de los valores de la sucesión ordenada.

N
9.   fi
D9  Li  10 * Ic
f abs D9

Li: Limite inferior de la frontera de clase.

N: Cantidad de elementos de la distribución.

 fi : Sumatoria de las frecuencias absolutas antes del D 9.

Ic: Intervalo de Clase.

FabsD9: Frecuencia absoluta de D9.

PERCENTILES.

Dividen los datos de 1 en 1.

Es la medida más utilizada para propósitos de ubicación y clasificación de las personas cuando atienden características tales como:
peso, estatura, etc.

Los percentiles son ciertos números que dividen la sucesión de datos ordenados en cien partes porcentualmente iguales. Estos son los
99 valores que dividen en 100 partes iguales al conjunto de datos ordenados.

Los percentiles (P1, P2, …, P99)son leidos primer percentil, segundo percentil, … , noventa y nueve percentil.

PRIMER PERCENTIL.

Es el valor en el cual o por debajo del cual queda el (1%) de los valores de la sucesión ordenada.

N
1.   fi
P1  Li  100 * Ic
f abs P1

El 1% de 25 es 0,25 nos ubicamos en la columna de frecuencia absoluta acumulada, para ver en qué clase
pertenece, para este caso está en la clase 1

61 Li: Límite inferior de la frontera de clase.

25 n: Cantidad de elementos de la distribución.

0  fi : Sumatoria de las frecuencias absolutas antes del P 1

5,83 Ic: Intervalo de Clase.

5 FabsP1: Frecuencia absoluta de P1


Sustituyendo los valores:

N
1.   fi
100 1* 25 / 100  0
P1  Li  * Ic  61  * 5,83  61,29
f abs P1 5

El 1% de las calificaciones de los estudiantes se encuentran por debajo de 61,29

QUINCE PERCENTIL.

Es el valor en el cual o por debajo del cual queda el (15%) de los valores de la sucesión ordenada.

N
15.   fi
P15  Li  100 * Ic
f abs P15

Li: Limite inferior de la frontera de clase.

N: Cantidad de elementos de la distribución.

 fi : Sumatoria de las frecuencias absolutas antes del P 15

Ic: Intervalo de Clase

FabsP15: Frecuencia absoluta de P15.


Medidas de Dispersión para datos agrupados.
Las medidas de Dispersión permiten medir el grado de variabilidad (dispersión) de los valores de la serie con relación al valor central
que las representa. Cuantifican la separación, la dispersión y variabilidad de los valores de la distribución respecto al valor central. Si
el valor de estas medidas de dispersión es pequeño, nos indica que los datos están estrechamente agrupados alrededor de la media,
entonces la media se considera representativa de los datos, la media es Promedio Confiable. Inversamente una medida de dispersión
grande indica que la media, No Es Confiable, es decir no es representativa para los datos.

Del ejercicio: Se muestran las calificaciones obtenidas durante el lapso pasado en la asignatura de Introducción a
la Programación de una sección 1 de la carrera de Ingeniería Civil de la UDO Núcleo Bolívar.
Desviación media para datos agrupados:

Los datos son:

5 3 7 6 3 1 f: frecuencia (Columna de frecuencia absoluta)

63,915 69,755 75,595 81,435 87,275 93,115 Xj: Marca de Clase o Centro de Clase

25 n: Cantidad de elementos

76,06 : Media Aritmética.

5 * 63,915  76,06  3 * 69,755  76,06  7 * 75,595  76,06  6 * 81,435  76,06  3 * 87,275  76,06  1 * 9

25
 6,634

Desviación Estándar para datos agrupados. Desviación: es la diferencia que se observa entre el valor de variable y la media aritmética.
La Desviación estándar es la raíz cuadrada de la varianza, que expresa la dispersión de la distribución.

PARA DATOS AGRUPADOS

Los datos son:

5 3 7 6 3 1 f: frecuencia (Columna de frecuencia absoluta)

63,915 69,755 75,595 81,435 87,275 93,115 Xj: Marca de Clase o Centro de Clase

25 n: Cantidad de elementos

76,06 : Media Aritmética.


5 *  63,915  76,06  3 *  69,755  76,06  7 *  75,595  76,06  6 *  81,435  76,06  3 *  87,275  76,06 
2 2 2 2 2

25

 8,24

Medidas de Dispersión para datos no agrupados

Las medidas de Dispersión permiten medir el grado de variabilidad (dispersión) de los valores de la serie con relación al valor central
que las representa. Cuantifican la separación, la dispersión y variabilidad de los valores de la distribución respecto al valor central. Si
el valor de estas medidas de dispersión es pequeño, nos indica que los datos están estrechamente agrupados alrededor de la media,
entonces la media se considera representativa de los datos, la media es Promedio Confiable. Inversamente una medida de dispersión
grande indica que la media, No Es Confiable, es decir no es representativa para los datos.

Rango: Llamado Recorrido o Amplitud Total.

El Rango de una muestra aleatoria X 1, X2, X3, …, Xn se define por el estadístico Rango  X n  X 1 ,
Donde X1 es la observación más pequeña y Xn es la observación más grande.

Se tienen los siguientes datos, por favor ordenarlo para proceder a determinar el rango.

DATOS   ORDENADOS
23 X1 18
24 19
20 20
30 21
22 22
18 23
19 23
21 24
23 28
32 30
28 Xn 32
RANGO =32-18=14

Desviación Media: Medida que nos da el grado de dispersión de una serie de valores observados con relación a su media.

PARA DATOS NO AGRUPADOS

Xj: Cada uno de los datos del conjunto.

n: cantidad de elementos.

: Media Aritmética

Se tienen los datos, que pertenecen a la cantidad de vehículos que se guardan por 6 días en el Estacionamiento A y en el
Estacionamiento B.
  ESTACIONAMIENTO A ESTACIONAMIENTO B
  1 2
  5 1
  3 2
  5 1
  3 4
  10 2
MEDIA 4,5 2

Aplicándole la fórmula de Desviación media al Estacionamiento A

1  4,5  5  4,5  3  4,5  5  4,5  3  4,5  10  4,5


  2,16
6

Aplicándole la fórmula de Desviación media al Estacionamiento B

2  2  1 2  2  2  1 2  4  2  2  2
  0,66
6

Más disperso es el estacionamiento A, Se puede visualizar que los datos del estacionamiento a están más separados o dispersos.

Varianza Muestral: Considera la posición de cada observación con relación a la media muestral.

Si X1, X2, …, Xn representa una muestra aleatoria de tamaño n, entonces la Varianza Muestral se define por el estadístico.

S2: Se define como el promedio de los cuadrados de las desviaciones que las observaciones tienen con respecto a su media.

n-1: Para poder realizar la estimación más precisa.

Determinar la varianza para el estacionamiento A.

1  4,5 2   5  4,5 2   3  4,5 2   5  4,5 2   3  4,5 2  10  4,5


2

  9,50
6 1

Desviación Estándar. Desviación: es la diferencia que se observa entre el valor de variable y la media aritmética. La Desviación
estándar es la raíz cuadrada de la varianza, que expresa la dispersión de la distribución.
  ESTACIONAMIENTO A ESTACIONAMIENTO B
  1 2
  5 1
  3 2
  5 1
  3 4
  10 2
MEDIA 4,5 2

Aplicándole la fórmula de Desviación estándar al Estacionamiento A

1  4,5 2   5  4,5 2   3  4,5 2   5  4,5 2   3  4,5 2  10  4,5


2

  2,81
6

Los valores de la variable se dispersan en promedio 2,81 con respeto a la media.

Aplicándole la fórmula de Desviación estándar al Estacionamiento B

(2  2) 2  (1  2) 2  (2  2) 2  (1  2) 2  (4  2) 2  (2  2) 2
 1
6

Los valores de la variable se dispersan en promedio 1 con respeto a la media.


Coeficiente de Variación: Es una medida de dispersión relativa de los datos y se calcula dividiendo la desviación estándar muestral por
la media y multiplicando el cociente por 100. Su utilidad radica en que nos permite comparar la dispersión o variabilidad de dos o más
grupos, aun cuando estén expresados en distintas unidades de medidas.

A Mayor % Mayor Dispersión.

S: desviación Estándar

: Media Aritmética

Siguiendo con el ejemplo del Estacionamiento A y Estacionamiento B, se tiene que:

Para el estacionamiento A

2,81
 * 100  62,52
4,5

Para el estacionamiento B

1
 * 100  50
2

Más disperso es el estacionamiento A.

También podría gustarte