Está en la página 1de 46

9

Dra. Yeanny Marcano

ESTADÍSTICA I

CAPITULO II
ANALISIS DESCRIPTIVO DE UNA VARIABLE

TEMA 1: DESCRIPCIÓN DE DATOS


DISTRIBUCIÓN DE FRECUENCIAS Y GRÁFICOS ESTADÍSTICOS

DISTRIBUCIÓN DE FRECUENCIAS: En estadística existe una relación con cantidades,


números agrupados o no, los cuales poseen entre sí características similares. Existen
investigaciones relacionadas con los precios de los productos de la dieta diaria, la estatura y
el peso de un grupo de individuos, los salarios de los empleados, los grados de temperatura
del medio ambiente, las calificaciones de los estudiantes, otros, que pueden adquirir
diferentes valores gracias a una unidad apropiada, que recibe el nombre de variable. La
representación numérica de las variables se denomina dato estadístico.
La distribución de frecuencia es una disposición tabular de datos estadísticos, ordenados
ascendente o descendentemente, con la frecuencia (fi) de cada dato. Las distribuciones de
frecuencias pueden ser para datos no agrupados y para datos agrupados o de intervalos de
clase.
DATOS BRUTOS: Son los datos estadísticos obtenido y observados luego de su
recolección, sin haberlos tabulado. Estos pueden ser, la información obtenida al corregir un
examen, al lazar un dado, una moneda, de una encuesta, un cuestionario, unas mediciones.
Sea el siguiente ejemplo: La empresa QC Oil Company tiene varias sucursales en la capital.
El número de cambios de aceite en la sucursal de la calle principal en los pasados 20 días
fueron:
65 98 55 62 79 59 51 90 72 56
62 70 66 80 94 79 63 73 71 85

DATOS TABULADOS: Son aquellos datos, ya distribuidos con sus respectivas frecuencias,
es decir

DATOS AGRUPADOS: Cuando la variable estadística toma un conjunto muy extenso de


valores distinto, es muy laborioso construir su distribución; imaginemos la variable
“Calificación obtenida” de un examen sobre la base de 100 puntos, tendría que construirse
las frecuencias de los valores 01,02....100. En estos casos se agrupan los datos en
“Clases”; en el ejemplo anterior podríamos agruparlos así: (01-10), (11-20), (21-30);...(91-
100) lo cual nos reduce el trabajo a diez clases distintas de la variable.
FRECUENCIAS ABSOLUTAS, RELATIVAS Y FRECUENCIAS ACUMULADAS.
Frecuencia absoluta: Llamaremos así al número de repeticiones que presenta una
observación. Se representa por f.
Ejemplo:

Dra. Yeanny Marcano


10
Dra. Yeanny Marcano

ESTADÍSTICA I

La suma de las frecuencias absolutas es igual al número total de datos, que

se representa por N mayúscula cuando se estudia a la población y por n minúscula

cuando estudiamos la muestra.

Población Muestra

Resumidamente estas sumas seria:

Ejemplo
X Fi 0
12 5 0,16 15,63 5
13 12 0,38 37,50 17
14 8 0,25 25,00 25
15 7 0,22 21,88 32
32 1,00 100,00

Frecuencia
Edad
Absoluta
X
Fi
12 5
13 12
14 8
15 7

n = 32
Frecuencia relativa: Es la frecuencia absoluta dividida por el número total de datos, se
suele expresar en tanto por uno, siendo su valor -iésimo
ni
f r=
n
La suma de todas las frecuencias relativas, siempre debe ser igual a la unidad (1).

Dra. Yeanny Marcano


11
Dra. Yeanny Marcano

ESTADÍSTICA I

Frecuencia Porcentual: Se obtiene multiplicando por 100 la frecuencia relativa; esto es


F% = 100 x Fr
Frecuencia absoluta acumulada: es la suma de los distintos valores de la frecuencia absoluta
tomando como referencia un individuo dado. Se la suele representar con la notación: f a ↓
La última frecuencia absoluta acumulada es igual al nº de casos:
f 1=f 1
f 2=f 1+ f 2
f n=f 1+ f 2+ . .. . ..+ f n−1+ f n=n
Frecuencia relativa acumulada, es el resultado de dividir cada frecuencia absoluta
acumulada por el número total de datos, se la suele representar con la notación: f ra ↓
De igual forma, también se puede definir a partir de la frecuencia relativa, como suma de los
distintos valores de la frecuencia relativa, tomando como referencia un individuo dado. La
última frecuencia relativa acumulada es igual a la unidad.
TABLA DE FRECUENCIAS PARA UNA VARIABLE DISCRETA.
Datos Tabulados: Son aquellos datos, ya distribuidos con sus respectivas frecuencias.
Ejemplo de esto lo son las tablas 2.1 y 2.2.
Una distribución de frecuencias es la asignación de un valor de frecuencia para cada
conjunto de datos iguales entre sí. Ejemplo: En un grupo de 45 estudiantes de
administración, 27 son mujeres y 18 son hombres; la distribución de frecuencia es:
Tabla Nº 1.1
Distribución de frecuencia de la variable sexo
Sexo Frecuencia
Hombres 18
Mujeres 27
Ejemplo: En un examen de matemática se obtuvo
la siguiente distribución n = 45 de frecuencia de las
calificaciones.
Tabla Nº 1.2
Distribución de frecuencia de la variable calificación
Calificación Frecuencia
08 4
09 6
10 12
11 19
12 10
13 15
n = 66

Dra. Yeanny Marcano


12
Dra. Yeanny Marcano

ESTADÍSTICA I

Calculo de una distribución de frecuencia para datos tabulados


Ejemplo 1: El gobierno desea averiguar si el número promedio de hijos por familia ha
descendido respecto de la década anterior. Para ello ha encuestado a 50 familias respecto al
número de hijos, y ha obtenido los siguientes datos:
Tabla Nº 1.3
Data Nº de Hijos
2 4 2 3 1 2 4 2 3 0 2 2 2 3 2 6 2 3 2 2 3 2 3 3 4
3 3 4 5 2 0 3 2 1 2 3 2 2 3 1 4 2 3 2 4 3 3 2 2 1
Se pide:
a) ¿Cuál es la población objeto de estudio?
b) ¿Qué variable estamos estudiando?
c) ¿Qué tipo de variable es?
d) Construir la tabla de distribución de frecuencias con su respectiva frecuencia absoluta,
relativa, porcentual absoluta ascendente y descendente y porcentual ascendente y
descendente.
e) ¿Cuál es el número de familias que tiene como máximo 2 hijos?
f) ¿Cuántas familias tienen más de 1 hijo, pero como máximo 3?
g) ¿Qué porcentaje de familias tiene más de 3 hijos?
Solución:
a) La población objeto de estudio es el conjunto de familias de un determinado país.
b) La variable que estamos estudiando es el número de hijos por familia
c) El tipo de variable es discreta ya que el número de hijos solo puede tomar determinados
valores enteros (es imposible tener medio o un cuarto de hijo).
d) Para construir la tabla de frecuencias se deben clasificar a las familias determinando el
número de hijos. Se observa que el número de hijos, toma los valores existentes entre 0
hijos, los que menos y 6 hijos, los que más y tienen.

Tabla Nº 1.4. Distribución de frecuencias número promedio de hijos por familia

Xi f f a↓ fr f ra ↓ f% f a% ↓
0 2 2 0,04 0.04 4 4
1 4 6 0,08 0.12 8 12
2 21 27 0,42 0.54 42 54
3 15 42 0,3 0.84 30 84
4 6 48 0,12 0.96 12 96
5 1 49 0,02 0.98 2 98
6 1 50 0,02 1 2 100

Dra. Yeanny Marcano


13
Dra. Yeanny Marcano

ESTADÍSTICA I

n = 50 ∑ ¿1,00 ∑ ¿100

e) El número de familias que tienen dos o menos hijos es: 4 + 21 = 25


f) El número de familias que tienen más de un hijo pero tres como máximo es: 21 + 15 = 36
Por último el porcentaje de familias que tiene más de tres hijos, son aquellos que tienen 4; 5
y 6 es
6+1+1=8
El porcentaje será el tanto por uno multiplicado por cien es decir, la frecuencia relativa de
dichos valores multiplicado por 100: (0.12 + 0.02 + 0.02) * 100 = 0,16 * 100 = 16 % ó la
suma de los porcentajes 12% + 2% + 2% = 16%

DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS AGRUPADOS:


Datos Agrupados: Cuando la variable estadística toma un conjunto muy extenso de
valores distinto, es muy laborioso construir su distribución; imaginemos la variable
“Calificación obtenida” de un examen sobre la base de 100 puntos, tendría que construirse
las frecuencias de los valores 01,02....100. En estos casos se agrupan los datos en
“Clases”; para este ejemplo podrían agruparse así: (01-10), (11-20), (21-30);...(91-100) lo
cual nos reduce el trabajo a diez clases distintas de la variable.
Cuando nos encontramos con una distribución con un gran número de variables, se suelen
agrupar en intervalos para facilitar la comprensión de los datos. Esta práctica tiene en
cambio un inconveniente: se pierde información sobre la propia distribución.
¿
Se indica por Li-1 al extremo inferior del intervalo denominado límite inferior del intervalo y
por Li al extremo superior denominado límite superior. Cerramos el intervalo por la izquierda
y abrimos por la derecha. Es una manera de organizarse, pudiendo ser al contrario.
Para operar utilizaremos la marca de clase, el punto medio de un intervalo la cual se denota
por Ẋ . Para calcularla podemos definirla como la semisuma de los valores extremos del
intervalo, esto es sumar los extremos, y dividir entre 2.
La amplitud del intervalo, sería la longitud del intervalo, se representa por: a=Li −Li−1
¿Cómo obtener, a partir de los datos, una tabla de frecuencias agrupada?
Nº de intervalos puede determinarse según los criterios siguientes:
1. A partir de la raíz cuadrada del número de datos, decidimos, redondeando el número de
intervalos.
2. Criterio de Sturges: El número de clases que se construya dependerá fundamentalmente
del número de datos que se procesa, se estima que el menor número de clases permisibles
es cuatro (4) y el número de clases mayor es quince (15). El criterio de Sturges permite
determinar o estimar el número de clases que debe tener una serie estadística de datos
agrupados.
K = 1 + 3,32 log (n)
Con K: número de clases

Dra. Yeanny Marcano


14
Dra. Yeanny Marcano

ESTADÍSTICA I

3. Criterio propio del investigador.


Recorrido ó Rango: Valor mayor, menos valor menor de los datos.
R=X n− X 1
Amplitud: División entre el Recorrido y el número de intervalos que hayamos decidido. Se
puede redondear también.
R
a i=
N º de Intervalos
Calculo de una distribución de frecuencia para datos agrupados
Ejemplo 2: Un nuevo hotel va a abrir sus puertas en cierta ciudad. Antes de decidir el precio
de sus habitaciones, el gerente investiga los precios por habitación de 40 hoteles de la
misma categoría de esa ciudad. Los datos obtenidos en Bs.
Tabla Nº 1.5. Data precios de habitaciones
390 470 375 560 430 490 500 610 510 450
530 390 430 500 600 470 510 420 440 580
325 430 410 580 440 480 610 430 530 450
400 540 390 470 330 450 470 420 450 480
Se pide:
¿Cuál es la población objeto de estudio?
¿Qué variable estamos estudiando?
¿Qué tipo de variable es?
¿Qué problema plantea la construcción de la tabla de frecuencias?
Construir la tabla de distribución de frecuencias calculando el rango, el numero de clases,
limites inferiores y superiores, punto medio o marca de clases con su respectiva frecuencia
absoluta, relativa, porcentual absoluta ascendente y descendente y porcentual ascendente y
descendente.
¿Cuántos hoteles tienen un precio entre 325 y 380?
¿Cuántos hoteles tienen un precio entre 325 y 390?
¿Cuánto hoteles tienen un precio superior a 470?
¿Qué porcentaje de hoteles cuestan como mucho 430?
SOLUCIÓN:
a) La población objeto de estudio son los hoteles de una ciudad.
b) La variable que estamos estudiando es el precio.
c) El tipo de variable es continua.
d) El problema que plantea es que existen muchos valores diferentes, por tanto es bueno
agrupar la serie en intervalos.
La manera de hacerlo sería la siguiente: primero, calculamos el recorrido o rango
1. Rango:

Dra. Yeanny Marcano


15
Dra. Yeanny Marcano

ESTADÍSTICA I

R = xn– x1= 610 – 325 = 285


2. numero de intervalos o numero de clases.
Cuando no se nos dice nada el nº de intervalos, se obtiene de tres maneras posibles:
a) Calculando la raíz cuadrada del nº de datos observado.

Nº de intervalos=√ 40=6,32
Veremos que la raíz cuadrada de 40 es igual a 6,32 por lo tanto tomaremos 6 intervalos.
b) Si se calcula según el criterio de Sturges se tiene:
K = 1 + 3,32 * log (40)
K = 1 + 3.32 * 1,60
K = 1 + 5,31883917
K = 6,32 por lo tanto tomaremos 6 intervalos.
c) Criterio Propio: Construir 6 intervalos o clases
3. Amplitud:
R
a i=
N º de Intervalos
Como el recorrido o rango es 285 se divide por el nº de intervalos y así se obtiene la
amplitud de cada uno de ellos y así:
285
a i= =47,5 ≈ 48
6
La amplitud es de 48 podemos tomar un valor inferior de la variable y también incluir
valores superiores a la misma, en este caso el rango termina en 613
Tabla Nº 1.6. Distribución de frecuencias datos agrupados precios de habitaciones de
hoteles

¿ f Ẋ ¿ f a↓ fr f ra ↓ f% f a% ↓
(325 –
2 349 (324,5 – 373,5) 2 0,05 0,05 5,0 5,0
373)
(374 –
8 397 (373,5 – 421,5) 10 0,20 0,25 20,0 25,0
421)
(422 –
10 445 (421,5 – 469,5) 20 0,25 0,50 25,0 50,0
469)
(470 –
11 493 (469,5 – 517,5) 31 0,28 0,78 27,5 77,5
517)
(518 –
4 541 (517,5 – 565,5) 35 0,10 0,88 10,0 87,5
565)
(566 –
5 589 (565,5 – 613,5) 40 0,13 1,00 12,5 100,0
613)

n = 40 ∑ ¿1,00 ∑ ¿100

Dra. Yeanny Marcano


16
Dra. Yeanny Marcano

ESTADÍSTICA I

e) R = 3
f) R = 10
g) R = 20
h) R = 75 %
En la distribución se pueden observar las siguientes características
a) Número de clases: Existe un total de 6 clases

b) Limites de clases: Son los valores extremos de cada clase. Para la primera clase se
tienen los limites siguientes: límite superior = 373 límite inferior = 325
c) Limites reales: La zona que no pertenece a ninguna clase se distribuye entre las clase
contiguas para evitar la ambigüedad con respecto a la ubicación de algún dato que, por
alguna razón, cayese en dicha zona. Así se originan los límites reales de clase. P.e. para
la primera clase, estos límites son:

Lrs = 373.5 (limite real superior)


Lri = 325.5 (limite real inferior)
d) Intervalo de clase: es la parte real o numérica que ocupa una clase, p.e. para la primera
clase se tiene el intervalo [325 ; 373], es decir todos los números entre 325 y 373
e) Marca de Clase o Punto Medio: para efectos de cálculo, es necesario disponer de un
número representante de cada clase. Este representante es el punto medio de la clase,
el cual se obtiene por la semi-suma de los extremos o limites, p.e. para la primera clase
se tiene que el punto medio es:
325+ 373 698
Ẋ = = =349
2 2

Ẋ =349
f) Amplitud de las clases: es el tamaño de determinada clase. Se sugiere que todas las
clases tengan el mismo tamaño. Para calcular la amplitud se restan los limites reales de
la clase, por ejemplo, para la primera clase la amplitud es
C = 373 – 325 = 48,
C = 48
g) Rango de la distribución: es la amplitud de toda la distribución completa. Se calcula
mediante la diferencia entre el limite real superior de la mayor o última de las clases y el
limite real inferior de la primera o menor de todas las clases; para el caso que se está
tratando, se tiene
R = 610 – 325 = 285
h). Número de clases en los datos agrupados: En la práctica, se tiene el conjunto de datos
brutos, en el cual se determinan el dato mayor y el dato menor, así se obtiene el rango total.
Este rango total se divide entre el número de clases deseado. Se recomienda entre 6 y 15 el
número de clases.

Dra. Yeanny Marcano


17
Dra. Yeanny Marcano

ESTADÍSTICA I

EJERCICIO PARA RESOLVER


Ejercicio 1: Llenar la tabla con los datos estadísticos siguientes:
7 7 7 9 8 8 8 8 9
9 9 6 9 6 0 4 5 0 79 86
8 7 8 9 7 8 9 8 9
6 6 9 0 8 7 1 0 6 91 78
9 8 8 7 7 8 8 9 7
7 2 6 7 9 5 5 0 9 90 86

Tabla Nº 1.7.

¿ ¿ Ẋ f fr f% f a↓ f a% ↓

n = ∑ ¿1,00 ∑ ¿100

Ejercicios 2: Un grupo de 51 empleados del departamento de contabilidad de una gran


compañía recibe un curso intensivo de programación de ordenadores. De los varios
ejercicios distribuidos durante el curso, he aquí el número de ejercicios completados
satisfactoriamente por los miembros del grupo:
Tabla Nº 1.8.
Data numero de ejercicios entregados
0 0
09 11 13 14 05 08 11 13 12 15 09 13 18 09 12
5 6
1 1
16 03 10 19 09 09 05 12 18 15 09 11 21 11 12
5 8
0 1
16
2
14 10 10
7
08 15 11 12 12 16 07 12 13 06 09

Se pide:
a) ¿Cuál es la población objeto de estudio?
b) ¿Qué variable estamos estudiando?
c) ¿Qué tipo de variable es?
d) Construir la tabla de frecuencias

Dra. Yeanny Marcano


18
Dra. Yeanny Marcano

ESTADÍSTICA I

e) ¿Cuántos entregaron ejercicios por debajo de 9?


f) ¿Cuántos entregaron más de 5, pero como máximo 12?
¿Qué porcentaje representa entre 10y 19?
Ejercicio 3: He aquí los salarios netos ganados durante una semana por 30 empleados
temporales colocados por una agencia de empleo especializada en personal de este tipo.
Tabla Nº 1.9.
Data numero de salarios netos
680 260 430 299 350 320 300 330 440 250
490 300 630 320 260 580 380 480 410 314
390 380 300 370 420 260 350 260 260 470

Se pide:
a) ¿Cuál es la población objeto de estudio?
b) ¿Qué variable estamos estudiando?
c) ¿Qué tipo de variable es?
d) ¿Construya una tabla de frecuencias para datos agrupados?
e) ¿Cuántos empleados tienen un salario entre 250 y 305?
f) ¿Cuántos empleados tienen un salario entre 320 y 400?
g) ¿Cuánto empleados tienen un salario superior a 450?
h) ¿Qué porcentaje empleados tienen un salario superior a 500?

GRÁFICOS ESTADÍSTICOS: son representaciones gráficas cuyo objetivo es conseguir que


un simple análisis visual ofrezca la mayor información posible. Un grafico permite apreciar de
manera visual la magnitud o posición de las variables, para ello se pueden emplear
símbolos, barras, polígonos y sectores, de los datos contenidos en las tablas de distribución
de frecuencias. Los sistemas de gráficos más usuales son:
Diagrama de sectores El área de cada sector es proporcional a la frecuencia que se
quiera representar, sea absoluta o relativa.
Para calcularlo podemos decir que el área depende del ángulo central, mediante la
siguiente proporción:
fi /n =  / 360
α=fr∗360
fi /n = Fr tendremos que
Como resulta

Grafico Nº 1.1

Diagrama de Pastel o de Sectores

Dra. Yeanny Marcano


19
Dra. Yeanny Marcano

ESTADÍSTICA I

Este diagrama se utiliza para cualquier tipo de variable. Tomando como ejemplo la
distribución de frecuencia de la tabla 1.1 de la variable sexo se tiene:

Tabla Nº 1.10
Distribución de frecuencia de la variable sexo

Sexo Frecuencia Fr F% α=fr∗360


Hombres 18 0,40 40,00 144
Mujeres 27 0,60 60,00 216
n = 45 1,00 100,0 360

Gráfico de Pastel Nº 1.2

Sexo de los alumnos de la sección de estadística del Programa Administración

VARIABLE SEXO

Hombres
40%

Mujeres
60%

Dra. Yeanny Marcano


20
Dra. Yeanny Marcano

ESTADÍSTICA I

VARIABLE SEXO

Hombres
40%

Mujeres
60%

Diagrama de barras: se utiliza para frecuencias absolutas o relativas, acumuladas o no,


de una VARIABLE DISCRETA. En el eje de abscisas, situaremos los diferentes valores de la
variable. En el eje de ordenadas la frecuencia. Levantaremos barras o columnas separadas
de altura correspondiente a la frecuencia adecuada.
Nota: Si la variable es cualitativa (rubio, moreno, alto bajo, etc.) se suelen utilizar más los
diagramas de sectores o pictogramas
Si la variable es cuantitativa podemos tener dos casos: Variable discreta o variable
continua.
En el primer caso: variable discreta utilizaremos si no piden nada concreto, el diagrama
de barras cuando se refiera a la representación gráfica de la frecuencia absoluta (¿)
Distribución de frecuencia de la variable calificación
Calificación Frecuencia
08 4
09 6
10 12
11 19
12 10
13 15
n = 66

Grafico Nº 1.3

Diagrama de Barras

Dra. Yeanny Marcano


21
Dra. Yeanny Marcano

ESTADÍSTICA I

CALIFICACIONES
20
18
16
14
12 CALIFICACIONES
10
8
6
4
2
0
8 9 10 11 12 13

Histograma: Igual que el anterior en cuanto al tipo de frecuencias que se pueden utilizar.
La diferencia: es para variables CONTINUAS. Si la amplitud del intervalo es la misma, se
elevan columnas UNIDAS, a altura la frecuencia correspondiente. Si la amplitud del intervalo
es diferente, el área del rectángulo columna será proporcional a la frecuencia representada.
Esto es, los rectángulos tienen sus bases sobre el eje horizontal, con centro en las marcas
de clase, de anchos igual al tamaño del intervalo de cada clase y de altura igual a la
frecuencia de la clase.
Ejemplo: De la tabla siguiente
Tabla Nº 1.11
Distribución de Frecuencias

¿ f Ẋ ¿ f a↓ fr f ra ↓ f% f a% ↓
(325 –
2 349 (324,5 – 373,5) 2 0,05 0,05 5,0 5,0
373)
(374 –
8 397 (373,5 – 421,5) 10 0,20 0,25 20,0 25,0
421)
(422 –
10 445 (421,5 – 469,5) 20 0,25 0,50 25,0 50,0
469)
(470 –
11 493 (469,5 – 517,5) 31 0,28 0,78 27,5 77,5
517)
(518 –
4 541 (517,5 – 565,5) 35 0,10 0,88 10,0 87,5
565)
(566 –
5 589 (565,5 – 613,5) 40 0,13 1,00 12,5 100,0
613)

n = 40 ∑ ¿1,00 ∑ ¿100

Dra. Yeanny Marcano


22
Dra. Yeanny Marcano

ESTADÍSTICA I

Se tiene el histograma:

Grafico Nº 1.4
HISTOGRAMA

PRECIO DE LAS HABITACIONES DE HOTEL


12
10
8
Axis Title 6
4
2
0
(325 – 373) (374 – 421) (422 – 469) (470 – 517) (518 – 565) (566 – 613)
Axis Title

Cuando nos estemos refiriendo a la frecuencia absoluta acumulada optaremos por el


diagrama de escalera o histograma. Tal como se muestra en el siguiente grafico:

Grafico Nº 1.5
Histograma
Diagrama de Escalera o

Dra. Yeanny Marcano


23
Dra. Yeanny Marcano

ESTADÍSTICA I

Polígono de frecuencia: Se construye uniendo los puntos medios de los techos de


los rectángulos del histograma, mediante segmentos rectos, es la recta que une los
extremos de las variables de una distribución, un ejemplo clásico es el de la evolución de la
temperatura de un paciente
Ejemplo: Del histograma anterior tenemos:

Grafico Nº 1.6
POLÍGONO DE FRECUENCIA:

POLIGONO DE FRECUENCIAS
12

10

8
POLIGONO DE FRECUENCIAS
6

0
349 397 445 493 541 589

Dra. Yeanny Marcano


24
Dra. Yeanny Marcano

ESTADÍSTICA I

Grafico Nº 1.7

POLÍGONO DE FRECUENCIAS

Obsérvese que el polígono se extiende hasta las clases supuestas inferior y superior
inmediatos a la distribución, de frecuencia cero.

Pictograma: se suele utilizar para expresar un atributo. Se suelen utilizar iconos que se
identifiquen con la variable (ejemplo un coche) y su tamaño suele guardar relación con la
frecuencia, números de árboles plantados, número de habitantes, otros.

Grafico Nº 1.8

PICTOGRAMAS

Dra. Yeanny Marcano


25
Dra. Yeanny Marcano

ESTADÍSTICA I

Cartograma, se representa mediante un diagrama convencional insertado en un mapa


geográfico de una zona. Por ejemplo en un mapa de la Comunidad Valenciana se puede
utilizar el diagrama de tortas para representar la producción industrial, agrícola etc.

Grafico Nº 1.9

CARTOGRAMA

LA OJIVA: Se construye basada en las frecuencias acumuladas de los limites reales


superiores de cada clase, mediante la unión de estos por segmentos rectos. De la
siguiente tabla se obtiene la siguiente tabla de frecuencias acumuladas.
Tabla Nº 1.12
Distribución de Frecuencias
Clases Limites reales superiores Frecuencia Frecuencia Acumulada
10.000-10.999 10.999,50 9 9
11.000-11.999 11.999,50 20 29
12.000-12.999 12.999,50 40 69
13.000-13.999 13.999,50 21 90
14.000-14.999 14.999,50 10 100

Grafico Nº 1.9

Dra. Yeanny Marcano


26
Dra. Yeanny Marcano

ESTADÍSTICA I

LA OJIVA

OJIVA
45
40
35
30
OJIVA
25
20
15
10
5
0
350 400 450 500 550 600 650

OJIVA
45
40
35
30
25 OJIVA

20
15
10
5
0
300 350 400 450 500 550 600

Dra. Yeanny Marcano


27
Dra. Yeanny Marcano

ESTADÍSTICA I

Observe que la ojiva comienza con frecuencia cero en el límite superior de la clase inferior
supuesta. También se puede construir la ojiva de la frecuencia acumulada descendente.
Ejercicio: Construir el histograma, el polígono de frecuencias y las ojivas de las
frecuencias acumuladas ascendente y descendente, de la siguiente distribución:
Tabla Nº 1.13
Distribución de Frecuencias
CLASES FRECUENCIAS
2.000-2.400 200
2.500-2.900 350
3.000-3.400 400
3.500-3.900 380
4.000-4.400 300
4.500-4.900 250

TEMA 2
MEDIDAS DE TENDENCIA CENTRAL

Dra. Yeanny Marcano


28
Dra. Yeanny Marcano

ESTADÍSTICA I

TENDENCIA CENTRAL: Las medidas de tendencia central indican hacia qué valor tienden
a agruparse los datos en una distribución, es decir, el centro de la agrupación. Entre las
medidas de tendencia central tenemos: La media aritmética, la moda y la mediana. A
continuación un estudio de cada una de ellas.
MEDIA ARITMÉTICA: Es una de las medidas más importante en la estadísticas, por su
gran utilidad y operacionabilidad. Se define como la suma de todos los valores de la
variable, dividida por el número o cantidad (n) de valores, su fórmula de cálculo es:
x 1 + x 2+ x 3 +…+ xn
X=
n
Usando el símbolo de sumatoria, la media aritmética se escribe así:
n

∑ xi
X = i=0
n
MEDIA ARTMÉTICA EN DATOS NO PROCESADOS
Cuando los datos están no procesados, la media aritmética se calcula, simplemente
sumando todos los datos sin importar el orden, y luego dividir esa suma entre el número total
de ellos. La formula anterior es utilizada en datos brutos.
Ejemplo:
La compañía Componentes H&G, C.A., tiene fondos de reserva en valores negociables a
corto plazo. El saldo diario de cierre (en millones de Bs.) de la cuenta de valores negociables
en un lapso de dos semanas es el que se muestra a continuación:
Semana Nº 1 Bs. 1.973 1.970 1.972 1.975 1.976
Semana Nº 2 Bs. 1.969 1.892 1.893 1.887 1.895
¿Cuál fue la cantidad promedio invertida en valores negociables durante
a) La primera semana
1.973+1.970+ 1.972+1.975+1.976 9.866
X= = =1.973
5 5
Interpretación: la empresa mantuvo en el periodo de la primera semana un saldo promedio
de 1.973 millones de bolívares en valores negociables.
b) La segunda semana
1.969+1.892+1.893+1.887+ 1.895 9.536
X= = =1.907
5 5
Interpretación: la empresa mantuvo en el periodo de la segunda semana un saldo promedio
de 1.907 millones de bolívares en valores negociables.
c) En el periodo de las dos semanas
1.973+1.970+ 1.972+1.975+1.976 +1.973+1.970+1.972+1.975+1.976
X=
10
19.402
X= =1.940
10

Dra. Yeanny Marcano


29
Dra. Yeanny Marcano

ESTADÍSTICA I

Interpretación: la empresa mantuvo en el periodo de las dos semanas un saldo promedio de


1.940 millones de bolívares en valores negociables.
MEDIA ARITMÉTICA EN DATOS TABULADOS.
Cuando los datos están Tabulados basta utilizar la fórmula siguiente
n

∑ xi∗f i
i=0
X=
n
Donde: Xi * Fi es el producto de un dato por su frecuencia, es decir por las veces que el
dato aparece repetido
Ejemplo: Las siguientes son las calificaciones de Estadística tomadas de una muestra de
20 alumnos:
Tabla Nº 2.1
Distribución de frecuencia de la variable calificaciones de Estadística
Calificacion
es f
4 3
5 2
6 3
7 1
8 6
9 1
10 4
Total 20

¿Cuál fue la calificación promedio? Considera usted, que es un buen promedio tomando
en cuenta que el rango de evaluación es del 1 – 10.
Solución: En la práctica se le agrega a la distribución la columna del producto F.X, se
suma esta columna, finalmente se divide la suma entre n, cuyo valor es igual a la suma de
las frecuencias absolutas.
Tabla Nº 2.2
Distribución de frecuencia de la variable calificaciones de Estadística
Calificacione
s f X*f
4 3 12
5 2 10
6 3 18
7 1 7
8 6 48
9 1 9
10 4 40

Dra. Yeanny Marcano


30
Dra. Yeanny Marcano

ESTADÍSTICA I

Total n = 20 ∑ X∗F=144
12+10+18+ 7+48+ 9+40 144
X= = =7,2
20 20
n

∑ xi∗f i 144
i=0
X= = =7,2
n 20
Tomando el rango de evaluación de 1-10 se considera que para la muestra tomada de 20
alumnos es un buen promedio de calificación en la asignatura estadística.
MEDIA ARITMÉTICA EN DATOS AGRUPADOS.
Cuando los datos están agrupados se utiliza la misma fórmula para calcular el
promedio, pero cambiando el símbolo de la variable Xi por el de punto medio o marca
de clase ẋ ,quedando así:
n

∑ ẋi∗f i
i=0
X=
n
Ejemplo: La siguiente distribución de frecuencia representa los pesos en kilogramos
de una muestra de paquetes transportados por una pequeña empresa de transporte:
Calcular la media de la muestra para determinar el peso promedio en kilogramos de
los paquetes transportados
Tabla Nº 2.3 
Distribución de frecuencia de la variable pesos en kilogramos de los paquetes
transportados
Pesos ¿

Li – Ls
x F F . Ẋ

10,0 – 10,9 10,45 1 10,45


11,0 – 11,9 11,45 4 45,8
12,0 – 12,9 12,45 6 74,7
13,0 – 13,9 13,45 8 107,6
14,0 – 14,9 14,45 12 173,4

n = 31 ∑ Ẋ∗F=411,95

∑ ẋi∗f i 411,95
X = i=0 = =13,3
n 31

Dra. Yeanny Marcano


31
Dra. Yeanny Marcano

ESTADÍSTICA I

Interpretación: el peso promedio de los paquetes transportados por la empresa es de 13,3


kilogramos
PROPIEDADES DE LA MEDIA ARITMÉTICA
La media aritmética tiene dos propiedades muy importantes, las cuales tienen su
aplicación en la posterior formula de tipificación de variables de la distribución normal de la
unidad v.
±
1. Al sumar o restar ( ) a una serie estadística, una cantidad constante K , se obtiene
±
una nueva serie cuya media es igual a la de la serie original ( X ), más o menos ( ) la
cantidad constante K. En notación matemática se tiene
X k =X ± k
Ejemplo: sea la serie estadística: 3, 4, 5, cuya media es X =4 . Si a esta serie se le suma
la constante K = 7, entonces se obtiene la nueva serie 10, 11, 12, cuya nueva media es
X k =11. Obsérvese la relación 11 = 4 + 7.
b) Si una serie se multiplica por una cantidad constante, se obtiene una nueva, con
media igual al producto de la media original multiplicada por la constante.
X k =k∗X
Ejemplo: del ejemplo anterior, si la serie se multiplica por 5, se obtiene la nueva serie 15,
20, 25, cuya media es 20. Nótese la relación 20 = 5x4, donde 4 es el valor promedio de la
serie original.
MODA (M0): Es el valor de la variable que más veces se repite, es decir, aquella cuya
frecuencia absoluta es mayor. No tiene porque ser única, puede ser unimodal, bimodal o
multimodal
Figura Nº 3

Ejemplo:
a) La serie 2, 2, 3, 3, 3, 3, 4, 4, 5, 6, 6, 7, 8, 8 , tiene por moda: M o = 3.
b) La serie 20,21,21,21,22,23,23,24,24,24,25,26,26 , es bimodal : M o1= 21 y Mo2 =24

MODA EN DATOS NO PROCESADOS


Cuando los datos no están procesados, no siempre es posible ver a priori cual es la
moda, sobre todo cuando la cantidad de datos es numerosa. Si los ejemplos anteriores
tuvieran más datos, tal vez no sería posible ver cuál es la moda, por ejemplo, en la siguiente
serie es muy difícil ver a simple vista cual es la moda.
1, 2, 3, 2, 3, 1, 1, 2, 3, 2, 3, 2, 3, 1, 1, 2, 2, 2, 1, 1, 3, 2, 1, 2, 1, 1, 2, 3, 2,

Dra. Yeanny Marcano


32
Dra. Yeanny Marcano

ESTADÍSTICA I

2, 1, 1, 2, 3, 2, 3, 3, 3, 2, 2, 2, 1, 2, 1, 1, 1, 1, 1, 1, 2, 2, 3, 3, 3, 3, 3, 3, 3.

MODA EN DATOS TABULADOS


Cuando se tiene una tabla de distribución de datos tabulados, la moda es el dato que
tiene la mayor frecuencia.
Ejemplo: siguiendo con el ejemplo de la tabla Nº 3.2 de distribución de frecuencia de las
calificaciones de estadística, la moda es el numero: Mo = 8

Tabla Nº 2.4
Distribución de frecuencia de la variable calificaciones de Estadística
Calificaciones F
4 3
5 2
6 3
7 1
8 6
9 1
10 4
Total n = 20

El dato con mayor frecuencia (f = 6) es el 8, por lo tanto la moda es Mo = 8


MODA EN DATOS AGRUPADOS
Cuando los datos están agrupados, se aplica la siguiente fórmula de cálculo a la clase
modal, es decir a la clase que tiene la mayor frecuencia.

M o=L RI +
( Fmodal −F anterior
)
2 F modal −( F anterior + F siguiente )
∗C (amplitud)

Donde:
Lri = limite real inferior
F modal = frecuencia de la clase modal
F anterior = frecuencia anterior a la clase modal
F siguiente = frecuencia siguiente a la clase modal
Amplitud de la clase modal
Ejemplo: siguiendo con el ejemplo de la tabla Nº 3.3 de distribución de frecuencia de
los pesos en kilogramos de una muestra de paquetes.
Tabla Nº 2.5

Dra. Yeanny Marcano


33
Dra. Yeanny Marcano

ESTADÍSTICA I

Distribución de frecuencia de la variable pesos en kilogramos de los paquetes


transportados
Pesos
F
Li – Ls
10,0 – 10,9 1
11,0 – 11,9 4
12,0 – 12,9 6
13,0 – 13,9 8
14,0 – 14,9Clase modal
12
n = 31

Lo primero es observar cuál es la clase que tiene la mayor frecuencia, para este caso se
tiene que la clase con mayor frecuencia (clase modal) es el intervalo de: (14,0 – 14,9) cuya F
= 12. Entonces, en esa clase se encuentra incluido el valor de la moda, por lo tanto se le
aplica la formula anterior a esa clase, donde se tienen los valores siguientes:
Lri = 13.95
Fmodal = 12
Fanterior = 8
Fsiguiente = 0
Amplitud de la clase modal = C modal = 13,95 - 14,95 = 1
Sustituyendo en la formula de la moda se tiene

M o=L RI +
( Fmodal −F anterior
)
2 F modal −( F anterior + F siguiente )
∗C (amplitud)

M o=13,95+
( 2∗12−
12−8
( 8+0 ) )∗1=13,95+
4
24−8
∗1=¿

4
M o=13,95+ ∗1=¿
16
M o=13,95+ 0,25∗1=¿

M o=13,95+ 0,25=¿

M o=14,2
El dato que más se repite es 14,2 kilogramos
MEDIANA (Me): es el valor que separa por la mitad las observaciones ordenadas de
menor a mayor, de tal forma que el 50% de estas son menores que la mediana y el otro
50% son mayores. Si el número de datos es impar la mediana será el valor central, si es par
tomaremos como mediana la media aritmética de los dos valores centrales.
Figura Nº 4

Dra. Yeanny Marcano


34
Dra. Yeanny Marcano

ESTADÍSTICA I

MEDIANA EN DATOS NO PROCESADOS


Cuando los datos no se han procesado es casi imposible determinar cuál es el valor de la
mediana, es necesario, por lo menos ordenarlos, luego ver cual o que numero ocupa el lugar
central ( Lm) que viene dado por la formula:
n+1
L Me=
2
Ejemplo: Determinar la mediana de la siguiente serie: 1,3,3,5,2,5,3,4,1,1,2
Ordenando los datos, se tiene
Datos: { 1 ,1 , 1 ,2 , 2 ,3 , 3 , 3 , 4 , 5 ,5 , }
Lugares: 1o 2o 3o 4o 5o 6o 7o 8o 9o 10o 11o
El lugar de la mediana es:
11+1 12
L Me= = =6
2 2
El lugar que ocupa la mediana es el puesto Nº 6
Luego la mediana es: Me = 3
Cuando la serie de datos es par, ocurre que la mediana no es ningún dato, sino el valor
intermedio entre los dos datos centrales.
Ejemplo: sea la serie:
Datos: { 1 ,1 , 1 ,2 , 2 ,3 , 3 , 3 , 4 , 5 ,5 ,6 }
Lugares: 1o 2o 3o 4o 5o 6o 7o 8o 9o 10o 11o 12o
El lugar de la mediana es:
12+1 13
L Me= = =6,5
2 2
La mediana ocupa el lugar 6.5, es decir está entre los datos que ocupan los lugares Nº 6
y Nº 7, para obtener el valor de la mediana se suman estos dos datos 3 y 3.

3+3 6
Me= = =3
2 2
La mediana es: Me = 3
MEDIANA EN DATOS TABULADOS

Dra. Yeanny Marcano


35
Dra. Yeanny Marcano

ESTADÍSTICA I

Cuando los datos están tabulados, se calculan las frecuencias acumuladas que indican
los lugares que ocupan cada dato, luego se observa cual ocupa el lugar central.
Ejemplo: siguiendo con el ejemplo de las calificaciones de estadística se tienen la
siguiente distribución de frecuencia:
Tabla Nº 2.6
Distribución de frecuencia de la variable calificaciones de Estadística

Calificaciones F Fa
4 3 3
5 2 5
6 3 8
7 1 9
8 6 15
9 1 16
10 4 20
Total n = 20

La mediana ocupa el lugar:


20+1 21
L Me= = =10,5
2 2
Note en las frecuencias acumuladas que el 4 ocupa los primeros 3º lugares, el 5 ocupa
los lugares desde el 4o hasta el 5o, el dato 6 ocupa los lugares 6 o hasta 8o, el dato 7 ocupa el
lugar 9o, el dato 8 ocupa los lugares 10 o hasta 15o. Este último dato ocupa el lugar de la
mediana 10.5, luego ese dato es la mediana, es decir Me = 8
Lugar de la mediana = 10,5
La Me = 8
MEDIANA EN DATOS AGRUPADOS.
Cuando los datos están agrupados, se aplica la formula siguiente a la clase mediana, es
decir la que contiene el lugar central según las frecuencias acumuladas

( )
n
−Facumulada anterior
2
M e =LRI + ∗C( amplitud)
F mediana

Ejemplo: tomando el mismo ejemplo anteriormente presentado en la tabla Nº 3.3 de


distribución de frecuencia de los pesos en kilogramos de una muestra de paquetes, se
presenta la siguiente tabla:
Tabla Nº 2.7
Distribución de frecuencia de la variable pesos en kilogramos de los paquetes
transportados

Dra. Yeanny Marcano


36
Dra. Yeanny Marcano

ESTADÍSTICA I

Pesos
F F. acumulada
Li – Ls
El primer paso 10,0 – 10,9 1 1 es calcular el
lugar que ocupa la
mediana en la 11,0 – 11,9 4 5 distribución de
frecuencias de 12,0 – 12,9 6 11 los datos
agrupados:
Clase mediana 13,0 – 13,9 8 19
14,0 – 14,9 12 31
n = 31

31+1 32
L Me= = =16
2 2
Como se observa la clase mediana es (13,0 – 13,9), donde:
Lri = 12,95
F acumulada anterior = 11
F mediana = 19
Amplitud de la clase mediana = C mediana = 12,95 - 13,95 = 1
Sustituyendo en la formula de la mediana, se tiene

( )
n
−Facumulada anterior
2
M e =LRI + ∗C( amplitud)
F mediana

( )
31
−11
2
M e =12,95+ ∗1
19

M e =12,95+ ( 15,5−11
19 )
∗1

M =12,95+(
19 )
4,5
e ∗1

M e =12,95+0,237∗1
M e =12,95+0,237
M e =13,187

La mediana de la distribución de pesos en kilogramos de los paquetes es:


Me=13,187

Dra. Yeanny Marcano


37
Dra. Yeanny Marcano

ESTADÍSTICA I

EJERCICIOS PARA RESOLVER


Sean las siguientes distribuciones de datos agrupados a), brutos b), tabulados c) y
agrupados d), se pide calcular la media, la moda y la mediana para cada caso:
a) Tabla Nº 2.8
Distribución de frecuencia de la variable X
Clases Frecuencia Fa
12-16 12 12
17-21 14 26
22-26 19 45
27-31 13 58

b) {5, 5, 6, 7, 5, 7, 7, 7, 5, 6, 8, 5, 2, 2, 3, 4 }

Media:

Moda:

Mediana:

c) Tabla Nº 2.9
Distribución de frecuencia de la variable X
X F
25 15
26 23
29 38
30 12

Espacio para la respuesta

Dra. Yeanny Marcano


38
Dra. Yeanny Marcano

ESTADÍSTICA I

c) Tabla Nº 2.10
Distribución de frecuencia de la variable X

CLASE FRECUENCIA
56-60 12
61-65 35
66-70 16

Espacio para la respuesta

TEMA 4

TEMA 3
MEDIDAS DE ORDEN O DE POSICIÓN
Indican la acumulación de los datos ordenados hasta un punto determinado,
generalmente expresado en términos de porcentaje.

Sea S={X 1 , X 2 , X 3 , ..., Xn } una serie estadística, tal que:


X 1 X 2 X 3 .... Xn , es decir los datos están ordenados. El subconjunto formado por los
primeros k-elementos ordenados
Sk ={ x 1 , x 2 , x 3 , … . , x k } , con k ≤ n

Representa un porcentaje de datos con respecto al total (n) del conjunto S. Si se considera
n igual al 100% de los datos y a k igual al Pk %, se obtiene la regla de tres siguiente

n → 100 %
k→ Pk
Despejando k y Pk se obtienen las ecuaciones:

P k∗n
k=
100

k∗100
pk =
n

Dra. Yeanny Marcano


39
Dra. Yeanny Marcano

ESTADÍSTICA I

Con estas ecuaciones se pueden resolver problemas como los que plantean las
siguientes preguntas:
1.- ¿Cuántos elementos (k) conforman el Pk % del total general (n) ?
2.- ¿Qué porcentaje representan los primeros k-elementos del total general n ?

Sin embargo, estas formulas son insuficientes en algunos casos.


Ejemplo: sea la serie {47 , 49 , 51, 57 , 63 , 63 }. La mediana de esta serie es
(51+57)/2=54 y ocupa el lugar 3,5. Además, recuérdese que la mediana divide a la serie
en dos partes iguales: 50% a la derecha y 50% a la izquierda, aparte de esto podemos decir
que hasta el 51 se concentra el 50%, lo cual es contradictorio con el concepto de mediana.
Por otro lado, no siempre el lugar buscado es un número entero o el punto medio entre dos
números.
Por ejemplo, de la serie anterior, ¿hasta dónde se acumula el 40%?. En general, se
puede decir que las ecuaciones anteriores son efectivas cuando el caso se refiere a números
discretos, mas no así cuando la variable es continua. Para resolver estas insuficiencias se
hace uso de artificios matemático y se construyen dos ecuaciones correspondientes a
conceptos estadísticos como lo son Percentil y Rango Percentil.

PERCENTIL: Sea XP el punto que acumula el p% de los datos en una serie ordenada.
Supóngase a este punto ubicado entre dos elementos de la serie, llámese X i al elemento
inferior y XS al superior. Llámese Lx I al lugar que ocupa X I y Lx S el lugar de X S , donde
la diferencia entre ellos es uno (Lxs−Lxi=1), por ser lugares consecutivos, y llámese Lxp
el lugar de X p .
Figura Nº 5

Por proporción, se tiene


X P−X i X s−X i
=
LX P−L X i LX s−L X i

Considerando que LxS - LxI = 1 y despejando Xp se obtiene la ecuación del punto


denominado Percentil.
X P= X i+ ( X s−X i )∗(LX P−L X i )

Dra. Yeanny Marcano


40
Dra. Yeanny Marcano

ESTADÍSTICA I

Por otro lado se tiene que el percentil ocupa un lugar en la serie y ese lugar se determina
mediante la siguiente ecuación
np
LX P = +1/2
100
Donde
n = tamaño de la serie
P = porcentaje acumulado
Para obtener el valor de un percentil se deben realizar dos pasos: i) se calcula el lugar que
ocupa el percentil mediante la ecuación 3.5, y ii) se calcula el valor del percentil mediante la
ecuación 3.4
Ejemplo: Dada la serie S = {40, 42, 45, 47, 49}, ¿qué valor acumula a su izquierda el 36%
de los datos?
Solución: Se debe calcular el percentil 36 ( X36 )
5∗36 1
i) L xp= + =2,3
100 2

ii) Como el valor buscado ocupa el lugar 2.3, entonces está ubicado entre el segundo y
tercer elemento de la serie, es decir está entre 42 y 45 (entre el segundo y tercer lugar),
luego se tiene que

X I =42
Lx I =2
X S=45
Sustituyendo en la ecuación
X p =X I + ( X S− X I )∗( L XP−L XI ) :

X 36=42+(45−42)∗(2.3−2)=42.9
Interpretación: A la izquierda del 42.9 se acumula el 36% de los datos de la serie, ese es
el valor del percentil 36.
Ejemplo: Calcular X 21,33 y X 50 en la distribución siguiente
Tabla Nº 3.1
Distribución de frecuencia de la variable X
X F
1 3
2 2
7 4
9 3
10 3

Dra. Yeanny Marcano


41
Dra. Yeanny Marcano

ESTADÍSTICA I

Solución: a) cálculo de X21.33:


i) Lx 21.33=(15 x 21.33)/100+½=3.7 (el percentil buscado está entre el tercer y
cuarto lugar)
ii) El percentil buscado está entre X I =1 y X S=2

X 21.33=1+(2 – 1).(3.7 – 3)=1.7


Interpretación: El valor X 21,33=1.7 acumula a su izquierda el 21.33 %.
b) cálculo de X50:
i) Lx 50=(15 x 50)/100+½=8

ii) El percentil buscado está entre el 7 que ocupa el séptimo lugar y el 7 que ocupa el
noveno lugar, entonces el valor buscado es X50 = 7.
Para identificar mejor los lugares puede construir la columna de las frecuencias acumuladas.
Otra manera de ver las cosas: i) escríbase cada uno de los valores ordenados, ii) obsérvese
el número que ocupa el octavo lugar

S={1 ,1 , 1 ,2 , 2 ,7 , 7 , 7 , 7 , 9 ,9 , 9 , 10 , 10 ,15 }(valores )


1 23 4 5 6 7 8 910 11 1213 14 15(lugares )

DECILES Y CUARTILES: Algunos percentiles notables toman valores particulares. Los


percentiles P10 , P20 , P30 ,... se denominan Decil Uno (D1), Decil Dos (D2). Decil Tres, ...Los
que acumulan el 25%, el 50% y el 75%, se denominan Cuartil Uno (Q1), Cuartil Dos(Q2) Y
Cuartil Tres (Q3), respectivamente.
Ejercicio: Calcular Q1 en la serie S={2 ,5 , 7 , 8 , 9 , 10 ,15 }

Espacio para la respuesta

Dra. Yeanny Marcano


42
Dra. Yeanny Marcano

ESTADÍSTICA I

PERCENTILES EN DATOS AGRUPADOS: Cuando los datos están agrupados se entiende


que la variable es continua y en la ecuación que define el lugar del percentil, se elimina el ½,
quedando así la ecuación siguiente
n∗p
L xp=
100
La ecuación que determina el valor del percentil se obtiene haciendo las siguientes
consideraciones: el valor buscado está en una de las clases cuyo límite inferior llamaremos
Li y limite superior Ls; las frecuencias acumuladas indican los lugares de los datos, entonces
se consideran los cambios: LxI por Fai (frecuencia acumulada anterior o inferior a la clase
donde está el percentil) y Lxs por Fas (frecuencia acumulada siguiente o superior...).
Figura Nº 6

La distancia o amplitud del intervalo (C) se obtiene restando los límites reales
C=Ls – Li

La frecuencia de la clase que contiene el percentil, es igual a la diferencia entre las


frecuencias acumuladas superior e inferior
F=Fa s−Fai
Por proporciones, de la Figura anterior se tiene
x p−Li LS−Li
=
L x p−F aI F aS −F a I
Sustituyendo las ecuaciones anteriores, se tiene
x p−Li C
=
L x p−F aI F
Despejando Xp:
xp
−F aI
100
x p=Li + ∗C
F
Ejemplo: Calcular X30 en la siguiente distribución
Tabla Nº 3.2
Distribución de frecuencia de la variable X
X F Fa

Dra. Yeanny Marcano


43
Dra. Yeanny Marcano

ESTADÍSTICA I

20-24 12 12
25-29 16 28
30-34 18 46
35-39 15 61
40-44 10 71

Solución: Buscar el lugar que ocupa el percentil


Lx p=(71 x 30)/ 100=21.3

Por el lugar que ocupa el percentil, éste está ubicado en la segunda clase: (25-29), donde
Li=24.5
Fai=12
F=16
C=29.5−24.5=5
Sustituyendo en la ecuación
xp
−F aI
100
x p=Li + ∗C
F

21,3−12
x 30=24,5+ ∗27,41
16
Ejercicio: De la distribución anterior, calcular
a) X 50
b) X2
c) X 86

Espacio para la respuesta

Dra. Yeanny Marcano


44
Dra. Yeanny Marcano

ESTADÍSTICA I

RANGO PERCENTIL: Desde el punto de vista de la teoría de funciones, el rango percentil


es la función inversa del percentil. Con este concepto se pretende dar respuesta a la
segunda pregunta, esto es, determinar el porcentaje de acumulación hasta un punto dado.
Para ello bastara con despejar la incógnita P de la ecuación del percentil, según sea el
caso.
a) Para datos sin agrupar se obtiene la siguiente ecuación, combinando las ecuaciones
para el cálculo de los percentiles estudiados con anterioridad:

P=
100
n ( X − XI
Lx i+ P
X S −X I
−1 /2
)
Ejemplo: De la serie S={40 , 42 , 45 , 47 , 49 }, ¿qué porcentaje acumula el punto
Xp=42.9 ?

Solución: el punto 42.9 está ubicado entre el 42 y el 45 de la serie, es decir entre el segundo
y tercer lugar, entonces
Lxi=2
Xp=42.9
Xi=42
Xs=45
n=5
Sustituyendo en la ecuación, se tiene

P=
100
n ( X − XI
Lx i+ P
X S −X I
−1 /2
)
P=
100
5 (
2+
42,9−42
45−42
−1/2 =36 %)
Interpretación: El punto 42.9 acumula a su izquierda, el 36% de los datos
b) Para datos agrupados se tiene la ecuación la siguiente ecuación:

P=
100
n (
X −LI
Fai+ P
C
∗F )
Dra. Yeanny Marcano
45
Dra. Yeanny Marcano

ESTADÍSTICA I

Ejemplo: Calcular P 27, 41 en la distribución siguiente


Tabla Nº 3.3
Distribución de frecuencia de la variable X
X F Fa
20-24 12 12
25-29 16 28
30-34 18 46
35-39 15 61
40-44 10 71

Solución: El punto Xp = 27.41 está ubicado en la clase segunda (25-29); sustituyendo se


tiene:

P=
100
71 (
12+
27,41−24,5
5
∗16 =30 % )
Interpretación: El punto 27.41 acumula a su izquierda, el 30% de la información.

Cuadro Nº 1 Resumen De Formulas

Concepto Datos Agrupados


Datos Directos]

np np
Lx P = + 1/ 2 Lx P=
Localización 100 100
np
100
−Fai
Percentil X p = X I +( X S−X I ).(Lx P−Lx I )
Xp=Li+ .C
F

100 Xp−Xi 100 Xp−Li


P= (Lx i + −−−1/2) P= (Fai + xF )
Rango Percentil
n Xs−Xi n C

EJERCICIOS PARA RESOLVER:


I) La cantidad de autos vendidos por 10 vendedores en un determinado mes fue 2, 4, 7, 10,
10, 10, 12, 12, 14, 15.
Determinar:
a) la mediana de la distribución
b) el percentil X60
c) el cuartil Q1

Dra. Yeanny Marcano


46
Dra. Yeanny Marcano

ESTADÍSTICA I

d) el rango percentil P8
II) Calcular P 32 en la distribución siguiente
Tabla Nº 3.14
Distribución de frecuencia de la variable X
X F Fa
20-24 12 12
25-29 16 28
30-34 18 46
35-39 15 61
40-44 10 71

Espacio para la respuesta

TEMA 4

MEDIDAS DE DISPERSIÓN.

Las medidas de tendencia central o de posición nos indica donde se sitúa un grupo de
datos. Los de variabilidad o dispersión nos indican si estos están próximos entre sí o por el

Dra. Yeanny Marcano


47
Dra. Yeanny Marcano

ESTADÍSTICA I

contrario está muy dispersos. Observe que el conjunto A de puntos, es menos disperso que
el B, pero ¿cómo medir esta dispersión?
Figura Nº 7

Co
nju nto
A Conjunto B

Entre las medidas de dispersión tenemos el rango, los desvíos, la desviación media, la
varianza, la desviación estándar y el coeficiente de variación de Pearson
RANGO: Es la diferencia entre el valor máximo y el valor mínimo de un conjunto de datos,
es fácil de calcular y sus unidades son las mismas que las de la variable. Posee algunos
inconvenientes; no utiliza todas las observaciones (solo 2 de ellas), también puede verse
afectada por alguna observación extrema. Es la distancia que ocupa la serie estadística. Se
define operacionalmente como la diferencia entre el dato mayor y el dato menor
R = dato mayor – dato menor
DESVÍO: Es la distancia entre un dato y el centro de la distribución, que en general, se toma
la media aritmética como dicho centro.
D i=X i−X
Nota: Una propiedad importante de los desvíos es que la suma de todos los desvíos es cero
¡Compruébelo!
DESVIACIÓN MEDIA: Es el promedio o media aritmética de todos los valores absolutos de
los desvíos
n

∑|X i−X|
D m = i=0
n
VARIANZA: Mide la distancia existente entre los valores de la serie y la media. La varianza
siempre será mayor que cero. Mientras más cerca se encuentren los valores de cero, estos
valores están más concentrados alrededor de la media; además es el cuadrado de la
desviación estándar o también puede definirse como la media aritmética de los cuadrados de
los desvíos

∑ ( X i−μ )2 (Varianza poblacional)


2 i=0
σ =
N

Dra. Yeanny Marcano


48
Dra. Yeanny Marcano

ESTADÍSTICA I

∑ ( X i−x )2 (Varianza muestral)


2 i=0
S=
n−1
DESVIACIÓN TÍPICA O ESTÁNDAR: Es la diferencia entre el valor de un dato y el valor de
la media de su distribución, también mide la variabilidad de las observaciones con respecto a
la media, es igual a la raíz cuadrada de la varianza. Esta medida de dispersión siempre es
positiva. Su fórmula es.


n (Desviación Típica Poblacional)
∑ ( X i−μ ) 2

2 i=0
σ =
N


n (Desviación Típica Muestral)
∑ ( x i−x ) 2

2 i=0
S=
n−1

COEFICIENTE DE VARIACIÓN DE PEARSON: es la proporción de la desviación estándar


con respecto a la media aritmética, expresada en términos de porcentaje.
Se calcula como cociente entre la desviación estándar y la media, multiplicado por 100
σ
C . V = ∗100
x

Ejemplo: Las medidas de dispersión de la serie 1, 3, 4, 5, son


a) El Rango: R=5 – 1=4
b) Los Desvíos:
Primero se calcula la media aritmética:
1 + 3 + 4 + 5 13
X= = = 3 , 25
4 4
D 1=1 – 3 . 25=−2 . 25

D 3=3 – 3 .25=−0 . 25

D 4=4 – 3 . 25=0 .75

D 5=5 – 3 . 25=1. 75
c) La Desviación Media:

Dra. Yeanny Marcano


49
Dra. Yeanny Marcano

ESTADÍSTICA I

2 , 25+0 , 25+0 , 75+1 ,75 5


Dm = = =1 , 25
4 4

d) La varianza

( 2 , 25 )2 + ( 0 , 25 )2 + ( 0 ,75 )2+ (1 , 75 )2
σ 2=
4
2 5 , 0625+0 ,0625+ 0 ,5625+3 , 0625 8 , 75
σ = = =2 ,1875
4 4
σ 2=2 ,1875

e) La Desviación Estándar:

σ =√ 2 ,1875=1 , 4790
f) El Coeficiente De Variación:
1 , 4790
C . V .= =0 , 455
3 , 25
CALCULO DE LA VARIANZA:
Tanto la varianza como la desviación típica son las medidas de dispersión más importantes
por el uso que tienen. Indican cuan están los datos separados del centro de la distribución.
Para calcular la varianza se estila agregar columnas a la tabla de distribución según las
exigencias de la formula que se esté utilizando.
Ejemplo: calcular la varianza en la siguiente distribución {2, 3, 5, 6, 7, 8}
Solución: Se desea utilizar la fórmula de cálculo rápido.

N ∑ X 2− ( ∑ X )
2
2
σ = 2
N
Basta agregar la columna de X2 y hacer las sumas de las dos columnas x y x 2
Tabla Nº 4.1
Distribución de frecuencia
X X2
2 4
3 9
5 25
6 36
7 49
8 64

Dra. Yeanny Marcano


50
Dra. Yeanny Marcano

ESTADÍSTICA I

x=31 x 2=187

Finalmente se sustituye en la fórmula de cálculo

6∗187−( 31 )2 1 . 122−961 161


σ 2= = = =0 , 63
(16 )
2
256 256
Cuando los datos están tabulados con su respectiva frecuencia se utiliza la formula

N ∑ F . X −( ∑ F . X )
2 2
2
σ = 2
N
Ejemplo: Calcular la varianza en la distribución que se presenta a continuación

Tabla Nº 4.2
Distribución de frecuencia
X F
2 5
3 7
4 6
5 4

Se deben agregar las columna de X 2 , F . X y F . X 2

Tabla Nº 4.3
Distribución de frecuencia
X F X2 F.X F.X2
2 5 4 10 20
3 7 9 21 63
4 6 16 24 96
5 4 25 20 100

F . X =75 , F . X 2=279

Sustituyendo en la fórmula de cálculo:

Dra. Yeanny Marcano


51
Dra. Yeanny Marcano

ESTADÍSTICA I

2
2 22∗279− (75 ) 6 . 138−5 . 625 513
σ = 2
= = =1, 0599
( 22 ) 484 484

Cuando los datos están agrupados se aplica el procedimiento inmediato anterior, solo que se
utiliza el punto medio en sustitución de la variable X, es decir se debe abrir, previamente a
las columnas de X 2 , F . X y F . X 2 y la columna del punto medio

Ejercicio: Calcular la varianza de la distribución siguiente

Tabla Nº 4.4
Distribución de frecuencia
Clase X
10-14 5
15-19 12
20-24 11
25-29 9

Espacio para la respuesta

PROPIEDADES DE LA MEDIA, LA VARIANZA Y DE LA DESVIACIÓN ESTÁNDAR:

Dada una serie estadística s0 ={X 1 , X 2 , . . ., Xn }, de Media X, 2


Varianza σ 0 y
Desviación Estándar σ 0, se tienen las siguientes propiedades:
PROPIEDAD 1.
Si a todos los elementos de la serie se incrementan (suma o resta) una cantidad constante
k , se obtiene la nueva serie derivada s d =\{ X 1 K , X 2 K ,..., Xn K \}, entonces:

Dra. Yeanny Marcano


52
Dra. Yeanny Marcano

ESTADÍSTICA I

a) La Media X de la nueva serie es igual a la media de la serie primitiva incrementada en


la constante
X d =X o ± K

Ejemplo: Si la serie S o = \{ 3 , 4, 5, 6, 7 \}, que tiene por media X d=5 , se incrementa en


K =2 unidades, se obtiene la nueva serie S d = \{ 5, 6, 7, 8, 9 \} , cuya media es
X d=5+7=2
b) La Varianza y la Desviación Estándar no salen afectadas
Ejercicio: Considere el ejemplo anterior, compruebe que las dos series ( S o y S d ¿ tienen la
misma Varianza y Desviación Estándar

Espacio para la respuesta

PROPIEDAD 2.
Si todos los elemento de la serie S o se multiplican o dividen por una cantidad constante K
se obtiene la nueva serie derivada Sd ={ X 1∗K , X 2∗K , ... Xn∗K }, donde la operación
asterisco (*) significa multiplicar o dividir, entonces
a) La media de la nueva serie sale afectada (multiplicada o dividida, según sea el caso) por
esa constante

X d= X 0∗k
Ejemplo: Si la serie S o =\{ 3, 4, 5, 6, 7 \}, que tiene por media X 0=5, se multiplica por

K =2, se obtiene la nueva serie S d = \{ 6, 8, 10, 12, 14 \}, cuya media es

Dra. Yeanny Marcano


53
Dra. Yeanny Marcano

ESTADÍSTICA I

X d =5* 2=10
La nueva serie Sd tiene por
Varianza
2 2 2
σ d=k ∗σ 0
Desviación Estándar

σ d=k∗σ 0

Ejemplo: La serie S0 =\{ 3, 4, 5, 6, 7 \} tiene por Varianza σ 2d=2 y por Desviación


Estándar σ 0=√ 2.
La nueva serie S d = \{ 6 , 8, 10, 12, 14 \}, que se obtuvo multiplicando por K =2 , tiene
por Varianza y Desviación Estándar

2 2
σ d=2 ∗2=4∗2=8
σ 0=2∗ √2=2,8284

EJERCICIOS PARA RESOLVER


Ejercicio 1: Los datos siguientes corresponden a las calificaciones de 40 alumnos del curso
Intensivo 2012 en la asignatura Matemática II del Programa Administración de la UNERMB.
5 5 6 6 7 7 8 9 10 10
10 10 10 10 11 11 11 11 12 12
12 12 12 12 12 13 13 14 14 14
15 15 15 15 15 16 16 16 17 18
Actividades:
a) Tabular los datos sin agruparlos y calcular la media, la moda, la mediana. La varianza, la
desviación estándar, el coeficiente de variación, el percentil 50 y el rango percentil 10

Espacio para la respuesta

Dra. Yeanny Marcano


54
Dra. Yeanny Marcano

ESTADÍSTICA I

b) Agrupar los datos en las siguientes clases: {04-06, 07-09, 10-12, 13-15, 16-18 }.
Calcular los mismos estadísticos de la parte a) anterior

Espacio para la respuesta

Dra. Yeanny Marcano

También podría gustarte