Está en la página 1de 9

Medidas de Posicin. Cuantiles.

Adems de las medidas de Tendencia Central, Dispersin, tambin hay algunas medidas
tiles de posicin no central que suelen utilizarse al resumir o describir propiedades
de un conjunto de datos, sobre todo si ste es numeroso. A estas medidas se les
denomina cuantiles. Algunos de los cuantiles ms utilizados son los Deciles, que
dividen los datos ordenados en dcimos y los Percentiles que dividen los datos
ordenados en centsimos.
Percentiles.
Para introducir la definicin de percentil, ordenemos el conjunto de datos x1 , x2 ,..., xt ,
de tal manera que x(1) sea el menor, x(2) sea el que le sigue y as sucesivamente hasta
tener el mayor valor x( t ) . As se tiene que x(1) <= x(2) <= ..<= x( t ) . Cada nmero
dentro del parntesis indica la posicin del dato. (donde t indica el total de datos, es
decir, puede ser igual al total de datos poblacionales, N, o al total de datos muestrales,
n)
Notacin. Los percentiles se denotan con PK.
Definicin.
El percentil Pk, es un valor en el recorrido de la variable con posicin (tk/100)+0.5.
Cuando el valor de la posicin no es un nmero entero, el percentil se halla como el
promedio de los datos cuyas posiciones estn prximas a la posicin hallada.
Ejemplo.
Los siguientes datos corresponden a las notas del curso de Clculo I de 12 Alumnos:
12, 8, 11, 13, 9, 8, 12, 10, 14, 13, 15, 9.
Cul es el valor del percentil 30 (P30)?
Solucin.
1. Se ordenan los datos de menor a mayor.
8, 8, 9, 9, 10, 11, 12, 12, 13, 13, 14, 15.
2. Se halla la posicin de P 30 en el conjunto de datos. Como el total de datos, t = N =
12, entonces, la posicin del dato es: [12*30/100] + 0.5 = 4.1.
3. El valor del percentil 30 es: P30 = ( x(4) + x(5) )/2 = (9+10)/2 = 9.5
Podemos observar que debajo del valor 9.5 aproximadamente quedan el 30% de los
datos.
Calculo de Percentiles para datos agrupados
Para hallar el percentil Pk, contando con la tabla de frecuencias se sigue un
procedimiento similar para calcular la mediana. Se tiene en cuenta que debajo de P k
existe el k% de los datos aproximadamente.
1. Se ubica el intervalo [a, b) en donde esta el percentil Pk.
2. El valor del percentil es aproximadamente:
(k /100) H a
Pk a (b a)
Hb Ha

Lic. Mara A. Zacaras Daz


Pgina 52

Ejemplo.
La siguiente tabla de frecuencias corresponde a los datos de la variable, tiempo que
emplearon (X) los alumnos ingresantes del 2002 del curso de Estadstica de la EAPE de
la UNMSM, en rendir una prueba en la que deban emplear a lo ms 30 minutos.
Xi-1 - X'i
"7 - 10
"10 - 13
"13 - 16
"16 - 19
"19 - 22
"22 - 25
"25 - 28

fi
1
4
5
7
9
11
3
40

Hi
0.025
0.125
0.25
0.425
0.65
0.925
1

Cul es el valor mximo necesario para que un alumno sea considerado en el percentil
10?
Solucin.
UO: Alumno del curso de Estadstica, ingresante a la EAPE de la UNMSM del ao
2002
Variable X: Tiempo que emplearon en rendir una prueba.
Conjunto de Unidades de observacin: Todos los alumnos del curso de Estadstica
constituyen la poblacin.
Tipo de variable: cuantitativa continua.
Conjunto de datos: vienen a ser los datos poblacionales.
1. El percentil 10, es decir P10, se encuentra en el intervalo [10 - 13)
2. Luego Pk = 10 + 3(0.1 0.025)/(0.125 0.025) = 12.25 minutos.

Medidas de Forma. Indicadores de Asimetra y Apuntamiento.


Cuando se tiene ms de 30 datos y estos han sido resumidos en una tabla de frecuencias,
y se ha construido su correspondiente grfica, por lo tanto podemos observar la forma
de la distribucin de los datos, es decir, el comportamiento de la variable, entonces es
posible hablar de las caractersticas de Asimetra y Apuntamiento.
Indicadores de Asimetra.
La posicin relativa de los indicadores de Tendencia central depende de la forma de la
distribucin de los datos, as: si la distribucin es simtrica, es decir, si se observa
perfecta simetra respecto de un eje central, la media, mediana y moda coinciden.

Lic. Mara A. Zacaras Daz


Pgina 53

En el caso de distribuciones no simtricas, la posicin relativa de la media, mediana y


moda depende del tipo de asimetra. Existen dos tipos de asimetra, as:
Asimetra positiva, si la distribucin tiene una rama extendida, cola hacia la derecha,
ocasionada por valores extremadamente grandes, la moda ser menor que la media
aritmtica. La mediana por el hecho de dividir al conjunto de datos en dos partes iguales
quedar comprendida entre ambas. Grficamente visualizamos la ubicacin de la media,
mediana y moda.

Asimetra negativa, si la distribucin tiene una rama extendida, cola hacia la izquierda,
ocasionada por valores extremadamente pequeos, el valor de la moda ser mayor que
el de la media aritmtica. La mediana estar ubicada entre la moda y la media.
La asimetra de los grficos de distribuciones unimodales se mide con el ndice de
sesgo de Pearson. Este ndice se calcula teniendo en cuenta que en este tipo de curvas
la media aritmtica tiende a ubicarse, con respecto de la moda, al mismo lado de la cola
ms larga, por lo que una medida para el sesgo se obtiene con la diferencia de la media
moda. Si la diferencia es positiva, la distribucin tiene una cola hacia la derecha; si la
diferencia es cero la distribucin es simtrica; si la diferencia es menor que cero la
distribucin tiene una cola hacia la izquierda.
La medida obtenida depende de las unidades de la variable, por ello para comparar la
simetra de dos o ms distribuciones es necesario estandarizar los sesgos y esto se logra
con el Sesgo de Pearson cuya definicin es:
3(media mediana )
Sesgo de Pearson =
Desviacion es tan dar
El sesgo de Pearson se denotar con As si este se obtiene a partir de los datos
poblacionales, y con as si se obtiene a partir de datos muestrales.
Indicadores de Apuntamiento
El coeficiente de curtosis, es una medida del apuntamiento o aplastamiento de la curva
de comportamiento de la variable o del polgono de frecuencias y esta definido como:

Lic. Mara A. Zacaras Daz


Pgina 54

K=

0.5( P75 P25 )


, en donde P75 es el percentil 75, etc.
P90 P10

Cuando el coeficiente de curtosis tiende a 0.5; esto es, si las diferencias P75 P25 y
P90 P10 son aproximadamente iguales, la curva se llama leptocurtica.
Si el coeficiente de curtosis tiende a cero; esto es, cuando la diferencia P75 P25 es
pequea, respecto de P90 P10 , la curva se llama Platicrtica.
Si el coeficiente de curtosis es aproximadamente 0.25; esto es, si P90 P10 es
aproximadamente el doble de P75 P25 , la curva se llama mesocurtica.
Representacin Grfica.

Definicin de Conceptos Bsicos.


PARMETRO.
A las medidas resumen obtenidas a partir de todos los datos poblacionales se les llama
parmetros, es el caso de las medidas resumen obtenidas para los problemas dados
lneas arriba.
ESTADGRAFO.
A las medidas resumen obtenidas a partir de los datos muestrales se les llama
estadgrafos.
ESTADSTICA.
Definicin: Estadstica es la ciencia que proporciona mtodos por medio de los cuales
podemos recolectar, clasificar, presentar, resumir y analizar datos numricos relativos a
un conjunto de individuos u objetos, tambin nos permite extraer conclusiones vlidas y
efectuar decisiones lgicas basadas en dichos anlisis.
Dentro de la estadstica se puede considerar:
Lic. Mara A. Zacaras Daz
Pgina 55

A. Estadstica Descriptiva.
Esta relacionada con la recoleccin, tabulacin, presentacin de datos y el clculo de
medidas resumen que permiten obtener informacin estadstica, a partir de sta se
obtendr conclusiones sea a nivel de la poblacin o la muestra. Se ha aplicado
estadstica descriptiva en los problemas.
B. Estadstica Inferencial
Relacionada con el proceso de generalizar conclusiones respecto de la poblacin total,
s la informacin con la que se cuenta ha sido obtenida de una parte o muestra de la
poblacin. Esta generalizacin podr hacerse, s el tamao de muestra y la seleccin de
los individuos integrantes de la muestra han sido seleccionados utilizando mtodos
estadsticos.
Ejemplo.
1.

El propietario de una fabrica de corbatas, desde hace 2 aos cuenta con 50 trabajadores.
Posee informacin respecto de la produccin diaria de ellos, esta algo satisfecho, sin
embargo cree que s introduce algunas modificaciones, la produccin podra mejorar. Es as
que divide el grupo de trabajadores en dos, en el saln A ubica a 25 trabajadores, quienes
trabajan en las mismas condiciones de siempre, en el saln B ubica a los otros 25
trabajadores, en este ambiente establece nuevas condiciones de trabajo: Msica de
ambiente, alfombra y mejor iluminacin. Al da siguiente, despus de un mes de esta
modificacin, registro la produccin de cada trabajador y los resultados son los siguientes:
Saln A
12
24
28
26
32

a.
b.
c.
d.
e.

21
32
25
29
31

13
16
33
35
30

Saln B
16
18
26
45
40

18
20
30
59
30

36
45
46
51
56

41
45
48
51
52

40
44
49
53
55

44
42
50
54
52

47
48
49
54
59

Observe los datos, A que conclusin llega?


Estadsticamente, A que conclusin llega?
Qu le dira al propietario?
Las medidas resumen que ha utilizado que nombre tienen?
Utiliz estadstica descriptiva o inferencial?

2. Al da siguiente despus de un mes de la modificacin, se selecciono una muestra de 10


trabajadores de cada saln y se registro la produccin de cada uno de ellos, siendo los datos
los siguientes:

12
24

a.
b.
c.
d.
e.

21
32

Saln A
13 16
16 18

18
20

36
45

41
45

Saln B
40 44
44 42

47
48

Observe los datos, A qu conclusin llega?


Estadsticamente, A qu conclusin llega?
Que le dira al propietario?
Las medidas resumen que ha obtenido, qu nombre tienen?
La informacin estadstica que ha obtenido, en cuanto a su ocurrencia en qu situacin
se encuentra?

Lic. Mara A. Zacaras Daz


Pgina 56

f. Utiliz estadstica descriptiva o inferencial?


Solucin.
Considerando los datos poblacionales
1.a. En el saln A la produccin ms baja es de 12 corbatas y la produccin ms alta es de 59
corbatas, pero este ltimo dato es el nico, en realidad la produccin esta oscilando entre
12 y 45 corbatas.
En el saln B, la produccin de corbatas oscila entre 36 y 59 corbatas.
De la informacin anterior podramos concluir, que los trabajadores del saln B tienen una
produccin ms homognea y es mayor que la de los trabajadores del saln A.
1.b. Obtenemos las medidas resumen.
Tendencia Central
Saln
A
B

X
27.56 Corb.
48.44 Corb.

Dispersin

Med
LoR
28 Corb. 47 Corb. 105.29 Corb2.
49 Corb. 23 Corb. 29.21 Corb2.
2
X

X
10.26 Corb.
5.404 Corb.

CoV
0.370
0.112

El coeficiente de variacin, nos indica que la produccin de corbatas en el saln A


es medianamente disperso y esto se debe a la presencia de unos pocos valores
altos, por lo que, elegimos a la mediana como medida resumen de los datos, por
otro lado el coeficiente de variacin de la produccin de corbatas del saln B es
poco disperso, por lo que elegimos a la media, como medida resumen de los datos,
pero para comparar la produccin de corbatas de ambos salones debemos utilizar
la mediana, y como el valor de la mediana del saln B, 49 corbatas, es mayor que
el valor de la mediana del saln A, 28 corbatas, por lo tanto concluimos que la
produccin de corbatas de los trabajadores del saln B es mucho mayor que la de
los trabajadores del saln A.
1.c. Al propietario le dira, que del anlisis anterior, vemos que la produccin de
corbatas de los trabajadores del saln B es ms pareja, adems la produccin
promedio de este grupo de trabajadores es mucho mayor que los trabajadores del
grupo A, por lo que concluimos que las condiciones de ambiente han influido en la
produccin y se debe implementar las mismas condiciones en el saln A.
1.d. Las medidas resumen que se ha obtenido se llaman parmetros, porque se han
calculado a partir de todos los datos poblacionales.
1.e. Las medidas resumen obtenidas proporcionan informacin respecto a la dispersin
y la tendencia central de la produccin de corbatas de todos los trabajadores de la
fbrica, por lo que se ha utilizado la Estadstica Descriptiva.
2. Considerando los datos de la muestra.
2.a. La produccin de la muestra de los trabajadores del saln B es ms pareja y oscila
entre 36 y 48 corbatas, mientras que la produccin de la muestra de los
trabajadores del saln A es ms dispersa y oscila entre 12 y 32 corbatas, a partir de
estas cantidades podemos deducir que la muestra de trabajadores del saln B
produce ms que la muestra de trabajadores del saln A.
Lic. Mara A. Zacaras Daz
Pgina 57

2.b. Las medidas resumen para estos datos muestrales son:


Saln
A
B

19
43.2

Mediana

Moda

18
44

Long.
Recorrido

20
12

Varianza

33.77
12.62

Desv.
Estandar

5.81
3.56

Coef.
Variacin

0.31
0.082

El coeficiente de variacin indica que la muestra de datos de la produccin del


saln A estn medianamente dispersos, en cambio la muestra de datos de la
produccin de los trabajadores del saln B estn poco dispersos, y el indicador de
tendencia central, despus de observar la muestra de datos originales de la
produccin del saln A, vemos que no hay datos extremos, entonces la media es el
indicador de tendencia central adecuado, es decir la produccin media de los
trabajadores de la muestra es de 19 corbatas, y la de los trabajadores de la
muestra del saln B es de 43.2 corbatas, por lo que concluimos que los
trabajadores de la muestra del saln B producen mucho ms que los trabajadores
de la muestra del saln A.
Que a nivel de muestras los trabajadores del saln B producen mucho ms que los
del saln A.
Las medidas resumen obtenidas tienen el nombre de Estadgrafos.
Las medidas resumen obtenidas estn en situacin de incertidumbre, ya que se han
obtenido a partir de una parte de la poblacin.
Se utiliz estadstica descriptiva, para utilizar la estadstica inferencial se debe
hacer uso de probabilidades, dado que las medidas resumen estn en situacin de
incertidumbre.

2.c.
2.d.
2.e.
2.f.

Media

Ejemplo.
En los siguientes enunciados identifique si en su contenido se encuentra, un estadgrafo,
un parmetro o un dato e indique el nombre, justifique su respuesta. Asimismo diga si se
esta utilizando Estadstica descriptiva o inferencial. Interprete la informacin que
proporciona cada enunciado.
a. De los 7 mil 108 docentes que obtuvieron nota aprobatoria en el ltimo examen
de la Carrera Pblica Magisterial, 3 mil 122, es decir el 44%, recibi antes
capacitacin por parte del Ministerio de Educacin, lo que evidencia que las
clases de actualizacin, que se imparten de manera gratuita, han permitido una
mejora en el conocimiento de los maestros y la ms alta nota fue de 19 puntos.
b. Siete de cada diez mujeres no denuncia el maltrato que recibe de su pareja
debido a que siente vergenza, miedo a ms agresin, temor al divorcio, culpa, o
no sabe a dnde ir, inform el director del Instituto Guestalt de Lima, Manuel
Saravia Oliver, quien indic que "la violencia familiar es un grave problema de
salud pblica".
Solucin a
Subpoblacin constituida por 7108 docentes que aprobaron el ltimo examen de
la Carrera Pblica Magisterial.
U.E: profesor que aprob el ltimo examen de la carrera pblica magisterial.
Variable. X: Recibi o no recibi Capacitacin antes del examen por parte del
Ministerio de educacin.
Lic. Mara A. Zacaras Daz
Pgina 58

Datos: {1, 0, 0, 0, , 1, 0, 0, 0} son 7108 datos donde: 0 = No recibi


capacitacin y 1 = si recibi capacitacin.
Informacin obtenida.

Distribucin de los profesores de acuerdo


A si recibi o no Capacitacin.
Capacitacin Profesores
Si
No

3122
3986

A partir de este cuadro obtenemos el porcentaje de profesores que recibieron


capacitacin,
P = 0.44 es decir 44%, estadsticamente este es un parmetro porque se ha obtenido a
partir de todos los datos poblacionales y su nombre es Proporcin Poblacional.
SE ha utilizado estadstica descriptiva, porque se recopila, procesa y se obtiene
informacin, la cual permite analizar y tomar decisiones, en este caso, de este grupo de
profesores el 56 % no ha recibido capacitacin, y para ver el efecto de la capacitacin se
debiera contar con la distribucin de las notas de los profesores que recibieron
capacitacin y los que no recibieron asimismo con las notas promedio.
Para este mismo conjunto de datos tambin se cuenta con la caracterstica, Y: Nota
Obtenida, pero slo proporcionan la nota ms alta obtenida por uno de los profesores
que es 19 puntos, en este caso slo se cuenta con un dato.
Solucin b
Suponemos que el Instituto Guestalt ha llevado a cabo una encuesta por muestreo y no
un censo porque la poblacin constituida por mujeres peruanas que tienen pareja es muy
grande. La muestra es de tamao n.
U.E es la mujer peruana que tiene pareja.
De la muestra de tamao n de mujeres que tienen pareja, se considera a la submuestra
de mujeres de tamao n1 que son maltratadas y en estas se mide la variable, X: Si
denuncia o no denuncia el maltrato que recibe de su pareja.
Datos, {1, 0, 1, 0, 0, 0} donde 0= No denuncia que recibe maltrato de su pareja, 1=
si denuncia que recibe maltrato.
Informacin obtenida.
Distribucin de Mujeres Maltratadas por
su pareja de acuerdo a si denuncian o
no el maltrato.
Denuncia de Porcentaje de
Lic. Mara A. Zacaras Daz
Pgina 59

Maltrato

Mujeres

Si
No

30
70

A partir de este cuadro obtenemos la proporcin de mujeres de la submuestra, que No


denuncian que reciben Maltrato, p = 70 %. Estadsticamente, tenemos que esta medida
resumen es un estadgrafo porque su valor se obtuvo a partir de datos muestrales su
nombre es proporcin muestral.
Se hizo uso de la Estadstica descriptiva, pero suponemos que el instituto recurri a un
Estadstico para que determine el tamao de muestra y la forma de seleccin de la
muestra y un mtodo adecuado de Estimacin del parmetro, lo que no incluyo es la
medida de probabilidad con la que hace la estimacin, bajo estas consideraciones
podemos decir que utiliz estadstica inferencial.

Lic. Mara A. Zacaras Daz


Pgina 60

También podría gustarte