Está en la página 1de 12

ACTIVIDAD DE SEGUIMIENTO 2 DEL CORTE 2 DE IDD

Yesid Angulo Mendoza


Realice loe siguientes ejercicios

Hallar el 68- esimo percentil y el tercer cuartil Para una muestra de los siguientes datos correspondiente a
las notas de 20 estudiantes las cuales se expresan a continuacin
5.0 4.5 4.2 4.3 3.8 2.7 4.6 2.8 4.0 4.2 4.7 5.0 3.5 1.5 2.4 2.2 2.3 2.2 3.2
3.3 0.0 (por copin)

2. determinar

El 38-esimo numero percentil y el primer cuartil de los datos agrupados.

edades Frecuencia
11.5 - 14.5 2

14.5 - 17.5 8

17.5 - 20.5 11

20.5 - 33.5 10

32.5 - 26.5 8

26.5 - 29.5 1

3) explicar que son medidas de posicin relativas. Descrbalas y explique qu significa cada una de ellas

4) Explique que son medidas de dispersin que indican y describa cada una de ellas
DESARROLLO

R1.
5.0 4.5 4.2 4.3 3.8 2.7 4.6 2.8 4.0 4.2 4.7 5.0 3.5 1.5 2.4 2.2 2.3 2.2
3.2 3.3
Se ordenan los datos:
1.5 2.2 2.2 2.3 2.4 2.7 2.8 3.2 3.3 3.5 3.8 4.0 4.2 4.2 4.3 4.5 4.6 4.7
5.0 5.0

Calculo del tercer cuartil:


Posicin:
= 3 = 20
( + 1)
3 =
4
3 (20 + 1)
3 =
4
3 = 15.75

Tercer cuartil:
= . + (. . ). = .

Calculo del 68- esimo percentil:


Se ordenan los datos:
1.5 2.2 2.2 2.3 2.4 2.7 2.8 3.2 3.3 3.5 3.8 4.0 4.2 4.2 4.3 4.5 4.6 4.7
5.0 5.0

Posicin:
= 68 = 20
( + 1)
68 =
100
68 (20 + 1)
68 =
100
68 = 14.28

68- esimo percentil:


= . + (. . ). = .
R2.
edades X f F

11.5 - 14.5 13 2 2
14.5 - 17.5 16 8 10
17.5 - 20.5 19 11 21
20.5 - 23.5 22 10 31
23.5 - 26.5 25 8 39
26.5 - 29.5 28 1 40
40

Calculo del primer cuartil:



1
= + ( 4 )
1

Posicin:

4
1 40
1 = 10
4
= = .

Calcular el 38-esimo percentil:



1
= + (100 )
1

Posicin:

100
38 40
38 = 15.2
100
= 21
1 = 10
= 17.5
=3
15.2 10
55 = 17.5 + 3 ( )
21 10
= .
R3.
Medidas de posicin

Las medidas de posicin relativa se llaman en general cuantiles y se pueden clasificar en tres grandes
grupos: Cuartiles, quintiles, deciles, percentiles. Las medidas de posicin como los cuartiles, quintiles,
deciles y percentiles dividen a una distribucin ordenada en partes iguales. Para calcular las medidas de
posicin es necesario que los datos estn ordenados de menor a mayor.

a - Los Cuartiles (Qn):

son los tres valores de la variable de una distribucin que la dividen en cuatro partes iguales, es
decir, al 25%, 50% y 75%. Para calcular el valor de uno de los cuatro Cuartiles, se utiliza la formula:

Qk = k (n/4)

En donde:

Qk = Cuartil nmero 1, 2, 3 4
n = total de datos de la distribucin.

Se advierte que la posicin del segundo cuartil corresponde a la ubicacin de la mediana, es decir que el
segundo cuartil ser siempre igual a la mediana.

Para calcular los cuartiles (datos no agrupados) debes seguir los siguientes pasos:

1 Se ordenan los datos de menor a mayor.


2 Se determina la posicin que ocupa cada cuartil mediante la frmula: Qk = k (n/4)

Para que te quede ms claro:

El primer cuartil (Q1) es el valor de la variable que supera a lo ms el 25 % de los datos y es superado por
a lo ms el 75 % de ellos en la distibucin ordenada de menor a mayor.

El segundo cuartil (Q2) es un valor que supera a lo ms el 50 % de los datos y es superado por a lo ms el
50 % de ellos, es decir, Q2 coincide con la mediana.

El tercer cuartil (Q3) es un valor que supera a lo ms al 75 % de los datos y es superado por a lo ms el 25
% de ellos.
Ejemplos:
a) Dado el siguiente conjunto de datos: 2 ; 5 ; 9 ; 3 ; 13 ; 10 ; 11 ; 6 ; 7. Cul es el valor del tercer cuartil?

1 ordenamos los datos de menor a mayor:

2; 3; 5; 6; 7; 9; 10; 11; 13

n= 9

2 Se determina la posicin que ocupa cada cuartil mediante la frmula: Qk = k (n/4)

Q3 = 3 (9 /4)
Q3 = 6,75; En caso de ser un nmero decimal se aproxima al entero ms cercano superior, que sera 7. Este
valor indica la posicin del cuartil 3.

En nuestro caso el 7 valor sera:

2; 3; 5; 6; 7; 9; 10; 11; 13

Respuesta: el valor del tercer cuartil sera 10

b) Dadas las siguientes tablas de datos. Calcule los cuartiles Q1,Q2,Q3

Respuesta:

En la primera serie el nmero total de datos es n = 70, por lo que:

Q1 1(n/4) = 1( 70/4 ) = 17,5 (indica la posicin en que se encuentra el Q1)


Q2 2 (n/4) = 2 (70/4) = 35 (indica la posicin en que se encuentra el Q2)
Q3 3 (n/4) =3 (70/4) = 52,5 (indica la posicin en que se encuentra el Q3)

Y se desprende directamente de la tabla de frecuencias absolutas que:

Q1 = 5, ya que si nos fijamos en la tabla el nmero 17,5 se encuentra contenido en el nmero 32 de la tabla.
Q2 = 7, ya que si nos fijamos en la tabla el nmero 35 se encuentra contenido en el nmero 52 de la tabla.
Q3 = 10, ya que si nos fijamos en la tabla el nmero 52,5 se encuentra contenido en el nmero 66 de la tabla.

En la segunda serie el nmero total de datos es n = 64, por lo que:

Q1 1(n/4) = 1( 64/4 ) = 16
Q2 2 (n/4) = 2 (64/4) = 32
Q3 3 (n/4) =3 (64/4) = 48
Y se desprende directamente de la tabla de frecuencias absolutas que:

Q1 = 5
Q2 = (5+7) / 2 = 6
Q3 = 7

b - Los Deciles: Corresponden a los 9 valores que dividen a estos en 10 partes iguales es decir, al 10%, al
20%... y al 90%. Los Deciles se designan por D1, D2,..., D9

c- Los percentiles (Pn): son los noventa y nueve valores de la variable de una distribucin que la dividen
en cien partes iguales es decir, al 1%, al 2%... y al 99% de los datos. Los percentiles se designan por P1,
P2,... P99
P50 coincide con la mediana.

El percentil p (Pp) es un valor de la variable tal que el p% de la muestra est por debajo y el (100p) % est
sobre.

Al tener una tabla de frecuencias, el percentil de orden K (Pk) se calcula siguiendo los siguientes pasos:

1 Se determina el intervalo al cual pertenece el percentil por calcular en la tabla de frecuencias:

En donde:
K = {1, 2, , 99}
n es el nmero de datos. Si es decimal se aproxima al entero ms cercano superior.

Buscamos este valor en la columna de la frecuencia acumulada. El cul es el primer valor de x cuya
frecuencia acumulada sobrepasa el resultado de este clculo.

2 Luego, Para calcular el percentil Pk correspondiente al k% de los datos se puede utilizar la siguiente
frmula:

Donde:

Li es el lmite inferior del intervalo donde se encuentra el k% de los datos.


ai es la amplitud del intervalo donde se encuentra el k% de los datos.
fi es la frecuencia absoluta del intervalo donde se encuentra el k% de los datos.
Fi-1 es la frecuencia acumulada anterior al intervalo donde se encuentra el k% de los datos.
n es el total de datos.
R4.
Desviacin media o desviacin promedio:
La desviacin media o desviacin promedio es la media aritmtica de los valores absolutos de las
desviaciones respecto a la media aritmtica.

Propiedades:
Guarda las mismas dimensiones que las observaciones. La suma de valores absolutos es relativamente sencilla
de calcular, pero esta simplicidad tiene un inconveniente: Desde el punto de vista geomtrico, la distancia que
induce la desviacin media en el espacio de observaciones no es la natural (no permite definir ngulos entre
dos conjuntos de observaciones). Esto hace que sea muy engorroso trabajar con ella a la hora de hacer
inferencia a la poblacin.

Cuando mayor sea el valor de la desviacin media, mayor es la dispersin de los datos. Sin embargo, no
proporciona una relacin matemtica precisa entre su magnitud y la posicin de un dato dentro de una
distribucin. La desviacin media al tomar los valores absolutos mide una observacin sin mostrar si la misma
est por encima o por debajo de la media aritmtica.

Mtodos de clculo

Para Datos No Agrupados:

Se emplea la ecuacin:

Ejemplo ilustrativo:
Calcular la desviacin media de la distribucin: 3, 8, 8, 8, 9, 9, 9, 18

Solucin:
Se calcula la media aritmtica.

Se calcula la desviacin media.

Para Datos Agrupados en Tablas de Frecuencia:

Se emplea la ecuacin:
Ejemplo ilustrativo: Calcular la desviacin media en base a la siguiente tabla sobre las calificaciones de un
estudiante en 12 asignaturas evaluadas sobre 10.

Solucin:
Se calcula la media aritmtica.

Para Datos Agrupados en Intervalos:

Se emplea la ecuacin:

Donde xm es la marca de clase.


Ejemplo ilustrativo: Calcular la desviacin media de un curso de 40 estudiantes en la asignatura
de Estadstica en base a la siguiente tabla:

Solucin:
Para calcular la media aritmtica se llena la siguiente tabla:

Calculando la media aritmtica se obtiene:


Varianza y desviacin estndar:

La varianza es la media aritmtica de los cuadrados de las desviaciones respecto a la media aritmtica, es
decir, es el promedio de las desviaciones de la media elevadas al cuadrado. La desviacin estndar o
desviacin tpica es la raz de la varianza.
La varianza y la desviacin estndar proporcionan una medida sobre el punto hasta el cual se dispersan las
observaciones alrededor de su media aritmtica.

Propiedades:
- La varianza y desviacin estndar (o cualquier otra medida de dispersin) indican el grado en que estn
dispersos los datos en una distribucin. A mayor medida, mayor dispersin.

- La varianza es un nmero muy grande con respecto a las observaciones, por lo que con frecuencia se vuelve
difcil para trabajar.

- Debido a que las desviaciones son elevadas al cuadrado y la varianza siempre se expresa en trminos de los
datos originales elevados al cuadrado, se obtiene unidades de medida de los datos que no tiene sentido
o interpretacin lgica. Por ejemplo, si se calcula la varianza de una distribucin de datos medidos en metros,
segundos, dlares, etc, se obtendr una varianza mediada en metros cuadrados, segundos cuadrados, dlares
cuadrados, respectivamente, unidades de medida que no tienen significado lgico respecto a los datos
originales.

- Para solucionar las complicaciones que se tiene con la varianza, se halla la raz cuadrada de la misma, es
decir, se calcula la desviacin estndar, la cual es un nmero pequeo expresado en unidades de los datos
originales y que tiene un significado lgico respeto a los mismos.

A pesar de lo anterior, es difcil describir exactamente qu es lo que mide la desviacin estndar. Sin embargo,
hay un resultado til, que lleva el nombre del matemtico ruso Pafnuty Lvovich Chebyshev, y se aplica a todos
los conjuntos de datos. Este teorema de Chebyshev establece que para todo conjunto de datos, por lo menos
1- 1/k2 de las observaciones estn dentro de k desviaciones estndar de la media, en donde k es cualquier
nmero mayor que 1. Este teorema se expresa de la siguiente manera:

As por ejemplo, si se forma una distribucin de datos con k =3 desviaciones estndar por debajo de la
media hasta 3 desviaciones estndar por encima de la media, entonces por lo menos

Interpretacin: El 88,89% de todas las observaciones estarn dentro 3 desviaciones de la media.


Mtodos de clculo:

Para datos no agrupados:

La varianza para una poblacin se calcula con:

Notas:

1) Para el clculo de la varianza de una muestra se divide por n-1 en lugar de N, debido a que se tiene n-1
grados de libertad en la muestra. Otra razn por la que se divide por n-1 es debido a que una muestra
generalmente est un poco menos dispersa que la poblacin de la cual se tom. Al dividir para n-1 en lugar de
N se cumple con la tendencia y sentido lgico de que la varianza y desviacin estndar de la muestra deben
tener un valor ms pequeo que la varianza y desviacin estndar de la poblacin.

2) En la realidad, salvo indicacin expresa, no se calcula la varianza y la desviacin estndar de la poblacin,


ya que para ahorrar tiempo, esfuerzo, dinero, etc. es mejor trabajar con datos que representan a la muestra.

Ejemplo ilustrativo N 1

Considere que los siguientes datos corresponden al sueldo de una poblacin: $350, $400, $500, $700 y $1000

1) Calcular la desviacin estndar.


2) Cul es el intervalo que est dentro de k = 2 desviaciones estndar de la media?. Qu porcentaje de las
observaciones se encuentran dentro de ese intervalo?
Solucin:

1) Para la calcular la desviacin estndar se sigue los siguientes pasos:

a) Se calcula la media aritmtica.

b) Se aplica la respectiva frmula para calcular la varianza

Se calcula la desviacin estndar:

También podría gustarte