P. 1
METODOS PARA EL ANÁLISIS DESCRIPTIVO DE DATOS

METODOS PARA EL ANÁLISIS DESCRIPTIVO DE DATOS

|Views: 878|Likes:
estadistica
estadistica

More info:

Published by: Yuly Gonzalez Tarrillo on Sep 08, 2011
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOC, PDF, TXT or read online from Scribd
See more
See less

06/05/2013

pdf

text

original

31

TERCERA SEMANA

METODOS PARA EL ANÁLISIS DESCRIPTIVO DE DATOS
Después de estudiar como construir todo tipo de distribución de frecuencias para cualquier tipo de dato, nos damos cuenta, que éstas, deben resumirse para propósitos descriptivos, de análisis o de comparación. Es aquí cuanto notamos que es necesario un análisis de los datos obtenidos. Al igual que con anterioridad, este análisis debe realizarse tomando en cuenta el tipo de variable que está bajo estudio, así, obtenemos: 1. 2. METODO PARA EL ANÁLISIS DESCRIPTIVO DE DATOS CUALITATIVOS. METODO PARA EL ANÁLISIS DESCRIPTIVO DE DATOS CUALITATIVOS.

METODO PARA EL ANÁLISIS DESCRIPTIVO DE DATOS CUALITATIVOS.
Muchas de las veces, valores obtenidos como las frecuencias absolutas relativas no son suficientes para la mayor parte de las necesidades a que se destinan los datos, en particular datos cualitativos, siendo necesario calcular las distribuciones de frecuencias relativas. La importancia de las frecuencias relativas radica en que ellas ponen más fácilmente en evidencia, las relaciones que existen entre dos o más cifras de los datos que se estudian, facilitando la comparación de los diversos resultados. Se incluyen bajo esta denominación: a) b) c) d) RAZONES INDICES PROPORCION PORCENTAJE DE CAMBIO DE ERROR e) TASAS BRUTA ESPECIFICAS 31 TASA =
Número de veces que ocurre un fenómeno

R= a / b I = (a / b) x 100 P = ( a / a + b) PORCENTAJE = P X 100 = ( a / a + b) X 100

x 10 n

Población en la cual ocurrió

32

METODO PARA EL ANÁLISIS DESCRIPTIVO DE DATOS CUANTITATIVOS.
A diferencia que en el análisis de las variables cualitativas; en el análisis de las cuantitativas se hace necesario un análisis encontrar medidas en base a datos de muestras (subconjunto de una población), llamadas estadígrafos o estadísticos, que nos permitirán hacer un análisis más profundo de nuestros datos. Estadísticamente, para facilitar el análisis comparativo de variables cuantitativas, utilizamos las medidas de resumen (Estadígrafos). Definimos cuatro tipos de Estadígrafos: A) 1) 2) B) C) D) De Posición o Tendencia Central. Estadígrafos de Tendencia Central. Estadígrafos de Localización. De Dispersión o Variabilidad. De Deformación o Asimetría. De Apuntamiento o Kurtosis.

ESTADÍGRAFOS DE POSICIÓN O TENDENCIA CENTRAL
Hospital Barnes St. Louis, Missouri El Hospital Barnes del Centro Médico de la Universidad de Washington, fue fundada en 1914 y es el principal centro de salud para los habitantes de St. Louis y áreas vecinas. Tiene reconocimiento nacional como uno de los mejores en Estados Unidos. El programa de asilo del hospital mejora la calidad de vida para pacientes terminales y sus familias. Su equipo lo forma un director médico, un coordinador, un supervisor de atención, personal de atención en el hogar y de internos, auxiliares de salud del hogar, trabajadores sociales, capellanes, dietistas, voluntarios capacitados, y profesionales de otros servicios auxiliares de acuerdo con las necesidades. A través de las actividades coordinadas del personal del hospicio, a los pacientes y a sus familias se les proporciona la guía y el respaldo necesarios para manejar las tensiones creadas por enfermedades graves, separaciones y muertes. En el programa de coordinación y administración del asilo se cuenta con informes mensuales y resúmenes trimestrales para supervisar los servicios. Los resúmenes estadísticos de datos de funcionamiento se usan como base para planeación y para implementar cambios de política. Por ejemplo, se reúnen datos acerca del tiempo que pasan los pacientes en el programa hospitalario. En una muestra de 67 registros de pacientes se vio que el tiempo en el programa iba de 1 a 185 días.

32

33 Una distribución de frecuencias ayudó a resumir y comunicar los datos de duración de la estancia. Además se usaron las siguientes cantidades numéricas de la estadística descriptiva para obtener informes valiosos acerca del tiempo que requieren los pacientes en el programa Promedio 35.7 días Mediana 17 días Moda 1 día
Al interpretar estas estadísticas se vio que el tiempo promedio que pasa un paciente en el programa es de 35.7 días, poco más de un mes. Sin embargo, la mediana indica que la mitad de los pacientes están 17 días o menos, y la otra mitad, 17 días o más. La moda de un día es el valor más frecuente en los datos, e indica que muchos de los pacientes tienen una estancia corta en el programa. Hay otros resúmenes estadísticos acerca del programa hospitalario, que comprenden la cantidad de admisiones, la de días pasados en casa en función de la cantidad de días en la unidad hospitalaria, la cantidad de salidas de la unidad hospitalaria y la cantidad de muertes de pacientes en casa y en la unidad. Esos resúmenes se elaboran de acuerdo con la edad del paciente y la cobertura del seguro médico. En general la estadística proporciona valiosas informaciones de los servicios hospitalarios, que les permiten planificar y estar preparados para atender según la demanda que se es revelada; espacios, personal, medicina y programas.

Los estadísticos de posición o de tendencia central, describen la posición que ocupa una distribución de frecuencias respecto a un valor de la variable. Son valores que de manera condensada representan en un solo valor a una serie de datos y describen resumidamente al conjunto de observaciones. Se distinguen dos tipos:

Los Estadígrafos de Tendencia Central
Sus valores tienden a ocupar posiciones centrales o intermedias entre el valor máximo y el valor mínimo que toma la variable en estudio; brindando información sobre el centro de la distribución. Los más frecuentes son: • • • • La Media Aritmética. La Mediana. La Media Geométrica, y La Media Armónica.

Los Estadígrafos de Localización
Como su nombre lo indica, son estadígrafos que señalan la localización de los valores más frecuentes o de valores extremos. Entre ellos tenemos: • Los Cuartiles. • Los Deciles. • Los Percentiles. • La Moda. Para comprender mejor la aplicación y utilidad de cada uno de ellos, sigamos la ilación con los siguientes ejemplos:

33

34

ESTADÍGRAFOS DE POSICIÓN O TENDENCIA CENTRAL
Para DATOS NO AGRUPADOS Ejemplo 01: Durante los 12 meses del año 2008, el departamento de policía de una conocida zona de la ciudad de Lima, registró: 4, 3, 5, 5, 10, 8, 9, 6, 3, 4, 8, y 7 asaltos a mano armada. Ejemplo 02: El Gerente del Supermercado “El Centro” de la ciudad de Chiclayo, desea estudiar la “concurrencia” a su tienda durante los pasados cinco días. Para ello cuenta con la 7 siguiente información: El total de personas que entró al supermercado durante los cinco días anteriores son 295, 1002, 941, 768, y 1283.

Para VARIABLES CUANTITATIVAS CON POCAS CATEGORÍAS AGRUPADAS EN TABLA DE FRECUENCIA.

Ejemplo 03: La siguiente información corresponde al número de supervisores que laboran en las plantas de embotellamiento de la empresa Backus en el Perú. Tabla Nº 04 Número de supervisores por planta de embotellamiento de la empresa Backus en el Perú en Diciembre del 2008. Nº de Supervisores Xi 2 3 4 5 6 total
Fuente: Oficina de Control Interno.

Fi Nº de Plantas Embotelladoras 1 3 7 6 3 20

LA VARIABLE ES EL NUMERO DE SUPERVISORES Y LA UNIDAD DE ANALISIS ES UNA PLANTA DE EMBOTELLAMIENTO.

34

35 Para VARIABLES CUANTITATIVAS CON AGRUPADAS EN TABLA DE FRECUENCIA. MUCHAS CATEGORÍAS

Ejemplo 04: Un radar policiaco vigila la velocidad de los automóviles que viajan en la Panamericana Sur del Departamento de Lambayeque. En la Tabla siguiente se presenta una distribución de frecuencias de las velocidades registradas. Tabla Nº 05 Velocidades de automóviles registradas en la Panamericana Sur del departamento de Lambayeque. 2008. Velocidad
(millas por hora)

45 - 49 50 - 54 55 - 59 60 - 64 65 - 69 70 - 74 75 - 79 total

Frecuencia fi 10 40 150 175 75 15 10 475

Fuente: Caseta de Control de la Panamericana Sur del Dpto. de Lambayeque.

LA MEDIA ARITMÉTICA
Se le conoce como simplemente media o promedio. Es el Estadígrafo de Posición más importante. Puede calcularse para datos agrupados o no agrupados, así tenemos: a) Para datos no Agrupados (Media Aritmética Simple). M(X) =

∑Xi n

o

M(X) =

1 ∑ Xi n

Con el ejemplo 01: n = 12. Ya que la información se ha tomado por cada mes del año 2008.

35

36

M(X) =

4 + 3 + 5 + 5 + 10 + 8 + 9 + 6 + 3 + 4 + 8 + 7 12

∑Xi n

M(X)

=

M(X) =

72 12

= 6

Interpretación: En la zona conocida de la ciudad de Lima el año 2008, ocurrieron en promedio 6 asaltos a mano armada mensuales. b) Para datos Agrupados en tablas de Frecuencias (Media Aritmética Ponderada). b.1) Tablas sin intervalos (variables discretas). ∑ Xi fi M(X) = n Donde: Xi : Clase o valor tomado por la variable. fi : Frecuencia absoluta simple de la clase i. En el ejemplo 03: Tabla Nº 04
Número de supervisores por planta de embotellamiento de la empresa Backus en el Perú en Diciembre del 2008.

Nº de Supervisores Xi 2 3 4 5 6 total

Nº de Plantas Embotelladoras fi 1 3 7 6 3 n = 20

X i * fi 2 9 28 30 18 ∑ Xi * fi = 87
87 20

Fuente: Oficina de Control Interno.

M(X) =

∑ Xi n

fi

=

= 4.35

Interpretación: Se espera que en cada planta embotelladora de la Backus del Perú, existan 4 supervisores en promedio en el mes de Diciembre del 2008. (No puede ser 4.35 trabajadores pues es una variable discreta). b.2) Tablas con intervalos (variables continuas). ∑Yi ni M(Y) = n 36

37 Donde: Yi : fi : Ejemplo 04: Tabla Nº 05 Velocidades de automóviles registradas en la Panamericana Sur del departamento de Lambayeque. 2008. Velocidad
(millas por hora)

Marca de Clase del Intervalo i. Frecuencia absoluta simple de la clase i.

45 - 49 50 - 54 55 - 59 60 - 64 65 - 69 70 - 74 75 - 79 total

Marcas de Clase Yi 47 52 57 62 67 72 77

Frecuencia fi 10 40 150 175 75 15 10 n = 475

Yi * fi 470 2080 8550 10850 5025 1080 770 ∑Yi * fi = 28825

Fuente: Caseta de Control de la Panamericana Sur del Dpto. de Lambayeque.

El cálculo de las marcas de Clase es de la siguiente manera: • Para 45 –49: (45 + 49) / 2 = 47 la marca de clase es 47.

Con los datos ya calculados en la tabla, entonces procedamos a obtener el promedio. M(Y) = M(Y) =

∑Yi ni n
28 825 = 60.684 475

Interpretación: La velocidad promedio de los automóviles registrada en la Panamericana Sur del departamento de Lambayeque en el 2008 fue de 60.684 millas por hora.

LA MEDIANA O VALOR MEDIANO (Me)
Es aquel valor que no es superado, ni supera a más de la mitad de las n observaciones, arregladas en magnitud de orden creciente o decreciente. Es el valor de la variable que divide al total de observaciones (n), en dos partes de igual tamaño: 50% < Me < 50% Generalmente se usa cuando tenemos necesidad de tener un valor de localización y tenemos en nuestros datos, valores extremos. 37

38

a) Para datos no Agrupados. El lugar de la mediana se calcula con: Observemos el ejemplo 01:
n

+ 1 2

Durante los 12 meses de 2008, el departamento de policía de una conocida zona de la ciudad de Lima, registró: 4, 3, 5, 5, 10, 8, 9, 6, 3, 4, 8, y 7 asaltos a mano armada. Primero debemos ordenar los datos en forma ascendente, esto sería: 3, 3, 4, 4, 5, 5, 6, 7, 8, 8, 9, 10. a.1) Número impar de observaciones. Me = Valor de la posición (
n + 1 ) 2

Es decir. El valor que toma la variable en la posición Mediana. a.2) Número par de observaciones. La mediana es el promedio de los dos valores centrales. Me =
Valor de la posición (

n

+ 1 , es la 2

n  n  ) + Valor de la posición ( ) + 1 2  2  2

Donde: n : Número de observaciones. El número de observaciones en nuestro ejemplo es par. Entonces ubiquemos los dos valores centrales en nuestra serie ordenada: 3, 3, 4, 4, 5, 5, 6, 7, 8, 8, 9, 10.
Valor de la posición ( 12  12  ) + Valor de la posición ( ) + 1 2  2  2

Me =

Me = Me =

Valor de la posición (6) + Valor de la posición (7) 2
5 +6 = 5.5 2

Interpretación: El 50% de los meses ocurren menos de Me 6 asaltos, el otro 50% superan este número de asaltos. b) Para datos Agrupados.

38

39 El lugar de la mediana se calcula con: Absolutas acumuladas. b.1)
n y se trabaja con las Frecuencias 2

Para Variables Cuantitativas con pocas categorías agrupadas en tablas de frecuencia:
Se ubica a la menor frecuencia absoluta acumulada Ni que supere a n/2. Es decir:
n < Ni 2

Donde: Ni es el i – ésimo valor de N.

Entonces la mediana se calcula como sigue: Yi Me = Yi-1 + Yi Si
n = Ni - 1 2

Si

n > Ni - 1 2

2 Donde: Yi : Clase o valor tomado por la variable en la posición i; correspondiente a la Frecuencia absoluta acumulada Ni. En el ejemplo 03: Tabla Nº 04
Número de supervisores por planta de embotellamiento de la empresa Backus en el Perú en Diciembre del 2008.

Nº de Supervisores Xi 2 X2=3 X3=4 5 6 total

Nº de Plantas Embotelladoras fi 1 3 7 6 3 n = 20

Fi 1 4 11 17 20

Fi-1 n/2 Fi

Fuente: Oficina de Control Interno.

Aquí, n = 20, entonces n/2 = 10. Luego la mayor frecuencia acumulada que supera a 10 es F3 = 11, entonces: i=3 i-1 = 2 Fi = F3 = 11 Fi-1 = F2 = 4

Ahora, como n/2 > Fj-1 es decir 10 > 4, entonces: Me = Yi = Y3 = 4 Me = 4

39

40 Interpretación: El 50% de las plantas embotelladoras de la Backus del Perú, tienen 4 o menos supervisores, y el otro 50% de las plantas tiene más de 4 supervisores en el mes de Diciembre del 2008. b.2) Para Variables Cuantitativas con muchas categorías agrupadas en

Tablas de Frecuencia:
Se ubica a la menor frecuencia absoluta acumulada Fi que supere a n/2. Es decir:
n < Ni 2

Donde: Fi es el i – ésimo valor de N.

Se ubica al Intervalo Mediano (IMe). El intervalo mediano es aquel que corresponde a Fi. Se llama intervalo mediano porque el valor de la Mediana está ubicado en ese intervalo. i) Si
n no coincide con algún Fi. 2

Se tiene: Fi-1 < Entonces: Me = Li + C
n  1  2 − Fi −    1 Fi − Fi −     

n < Fi 2

Donde: n : Número total de datos u observaciones. Fi : Es la frecuencia absoluta acumulada inmediata superior a n/2. Fi-1 : Es la frecuencia absoluta acumulada inmediata inferior a n/2. Li : Extremo inferior del Intervalo Mediano. C : La amplitud del Intervalo mediano.
n coincide con algún Fi. 2

ii) Si

Se tiene: Fi-1 =
n < Fi 2

Entonces: Me = Li del Intervalo Mediano. Donde: Li : Extremo inferior del Intervalo Mediano. IMe: Es el intervalo que corresponde a Fi cuyo extremo inferior es Li.

40

41 Ejemplo 04: Tabla Nº 05 Velocidades de automóviles registradas en la Panamericana Sur del departamento de Lambayeque. 2008. Velocidad
(millas por hora)

45 - 49 50 - 54 55 - 59 60 - 64 65 - 69 70 - 74 75 - 79 total

Frecuencia fi 10 40 150 175 75 15 10 n = 475

Fi 10 50 200 375 450 465 475

Fi-1 n/2 Fi

Fuente: Caseta de Control de la Panamericana Sur del Dpto. de Lambayeque.

Calculamos la posición de n/2: Esta sería: n/2 = 475/2 = 237.5 De acuerdo a esto, observamos si coincide con alguna frecuencia absoluta acumulada, en nuestro caso no coincide, entonces ubicamos:

n : Fi : Fi-1 Li : C :

Número total de datos u observaciones.

475
Es la frecuencia absoluta acumulada inmediata superior a n/2. 375 : Es la frecuencia absoluta acumulada inmediata inferior a n/2.

200
Extremo inferior del Intervalo Mediano. 60 La amplitud del Intervalo mediano.

5 pues abarca 5 números: (60, 61, 62, 63, 64, 65)
Entonces reemplazamos en: Me = Li + C
n  1  2 − Fi −    1 Fi − Fi −      237 .5 − 200 

Me = 60 + 5  375 − 200    Me = 61.0715 Interpretación: El 50% de las velocidades de automóviles registradas en la Panamericana Sur del departamento de Lambayeque, superan los 61.072 millas por hora.

ESTADÍGRAFOS DE LOCALIZACION
41

42

LOS CUARTILES (Qi)
Se aplica mucho en la construcción de valores especiales (sobre todo en investigaciones psicológicas para la construcción de baremos). Son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el 25% de los resultados.

Q1 corresponde al 25% de los datos. En otras palabras, el 25% de las observaciones
tienen valores inferiores o iguales a Q1, en tanto que el 75% restante tienen valores superiores a este cuartil. Q2 corresponde al 50% de los datos. Llamada también cuartila mediana pues coincide con la mediana. Q3 corresponde al 75% de los datos. Es un valor que supera a no más del 75% de las n observaciones y que es superado por no más del 25% de las n observaciones. a) Para datos no Agrupados. Los cuartiles toman los valores de la posición calculadas por las fórmulas correspondientes. Se calcula de la siguiente manera: Q1 = valor tomado por la posición n/4

Q2 = Q3 =

valor tomado por la posición n/2 valor tomado por la posición 3n/4 Entonces en nuestro ejemplo sería 3, 3, 4, 4, 5, 5, 6, 7, 8, 8, 9, 10.

Q1 =

valor tomado por la posición n/4 12/4 = 3 Y el valor ubicado en la posición 3, es el 4. Por lo tanto: Q1 = 4 En el 25% de los meses ocurren menos de 4 asaltos a mano armada.

b) Para datos Agrupados en intervalos. El procedimiento que se emplea para calcular los cuartiles es similar al seguido para la Mediana, con la diferencia que en vez de considerar n/2 se reemplaza por: n/4 para Q1 n/2 para Q2 3n/4 para Q3 • • Si coincide con algún Ni, entonces toma el valor del límite inferior del intervalo cuartil correspondiente. Si no coincide con algún Ni, el procedimiento es el siguiente:

42

43 Así tenemos:

Q1 = Li + C

n  1  4 − Fi −    1 Fi − Fi −     

Donde: n : Número total de datos u observaciones. Fi : Es la frecuencia absoluta acumulada inmediata superior a n/4. Fi-1 : Es la frecuencia absoluta acumulada inmediata inferior a n/4. IQ1 : Intervalo cuartil-uno que corresponde a Ni. Li : Extremo inferior del Intervalo Cuartil –uno (IQ1). C : La amplitud del Intervalo cuartil-uno. Luego para:
n  1  2 − Fi −    1 Fi − Fi −     

Q2 = Li + C

Donde: n : Número total de datos u observaciones. Fi : Es la frecuencia absoluta acumulada inmediata superior a n/2. Fi-1 : Es la frecuencia absoluta acumulada inmediata inferior a n/2. IQ2 : Intervalo cuartil-dos que corresponde a Ni. Li : Extremo inferior del Intervalo Cuartil –dos (IQ2). C : La amplitud del Intervalo cuartil-dos. Ejemplo 04: Tabla Nº 05 Velocidades de automóviles registradas en la Panamericana Sur del departamento de Lambayeque. 2008. Velocidad
(millas por hora)

45 - 49 50 - 54 55 - 59 60 - 64 65 - 69 70 - 74 75 - 79 total

Frecuencia fi 10 40 150 175 75 15 10 n = 475

Fi 10 50 200 375 450 465 475

Fi-1 n/2 Fi

Fuente: Caseta de Control de la Panamericana Sur del Dpto. de Lambayeque.

Calculamos la posición de n/2: Esta sería: n/2 = 475/2 = 237.5 Donde:

43

44

n : Fi :

Número total de datos u observaciones.

475
Es la frecuencia absoluta acumulada inmediata superior a n/2.

375 Fi-1 : Es la frecuencia absoluta acumulada inmediata inferior a n/2. 200 IQ2 : Intervalo cuartil-dos que corresponde a Fi. 60 - 64 Li : Extremo inferior del Intervalo Cuartil –dos (IQ2). 60 C : La amplitud del Intervalo cuartil-dos. 5
Luego reemplazamos en:

Q2 = 60 + 5 Q2 = 60 + 5 Q2 = 61.072
Y por último tenemos:

237 .5 − 200   375 − 200    237 .5 − 200   375 − 200   

Q3 = Li + C

3n  1  4 − N i−    1 N i − N i −     

Donde: n : Número total de datos u observaciones. Ni : Es la frecuencia absoluta acumulada inmediata superior a 3n/4. Ni-1 : Es la frecuencia absoluta acumulada inmediata inferior a 3n/4. IQ3 : Intervalo cuartil-tres que corresponde a Ni. Li : Extremo inferior del Intervalo Cuartil –tres (IQ3). C : La amplitud del Intervalo cuartil-tres.

¿CUÁNTO ES......?

44

45

LOS DECILES (Di)
Estadígrafos de Localización; son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados. Lo primero que debe hacerse es ordenar los datos en forma ascendente o descendente.

D1 corresponde al 10% de los datos. En otras palabras, el 10% de las observaciones
tienen valores inferiores o iguales a D1, en tanto que el 90% restante tienen valores superiores a este Decil. D2 corresponde al 20% de los datos. D3 corresponde al 30% de los datos. Es un valor que supera a no más del 30% de las n observaciones y que es superado por no más del 70% de las n observaciones.
• • •

D9 corresponde al 90% de los datos. Es un valor que supera a no más del 90% de las n observaciones y que es superado por no más del 10% de las n observaciones.
a) Para datos no Agrupados. Los deciles toman los valores de la posición calculadas por las fórmulas correspondientes. Se calcula de la siguiente manera: D1 = valor tomado por la posición n/10 D2 = valor tomado por la posición 2n/10 D3 = valor tomado por la posición 3n/10
• • •

D9 =

valor tomado por la posición 9n/10

b) Para datos Agrupados en intervalos. El procedimiento que se emplea para calcular los deciles es similar al seguido para los cuartiles, considerando in/10 para cada decil i: n/10 para D1 2n/10 para D2 3n/10 para D3 4n/10 para D4 5n/10 para D5
• • •

9n/10

para D9

• Si coincide con algún Ni, entonces toma el valor del límite inferior del intervalo decílico correspondiente. • Si no coincide con algún Ni, el procedimiento es el siguiente:

45

46 Así tenemos:

D1 = Li + C

n  1 1 − N i −  0   1 N i − N i −     

Donde: n : Número total de datos u observaciones. Ni : Es la frecuencia absoluta acumulada inmediata superior a n/10. Ni-1 : Es la frecuencia absoluta acumulada inmediata inferior a n/10. ID1 : Intervalo decíl-uno que corresponde a Ni. Li : Extremo inferior del Intervalo Decil –uno (ID1). C : La amplitud del Intervalo Decil-uno.
• • •

Hasta llegar al:

D9 = Li + C

9n  1 1 − N i −  0   1 N i − N i −     

Donde: n : Número total de datos u observaciones. Ni : Es la frecuencia absoluta acumulada inmediata superior a 9n/10. Ni-1 : Es la frecuencia absoluta acumulada inmediata inferior a 9n/10. ID9 : Intervalo decíl-nueve que corresponde a Ni. Li : Extremo inferior del Intervalo Decil –nueve (ID9). C : La amplitud del Intervalo Decil-nueve.

¿HALLE LOS VALORES DE LOS EJEMPLOS DADOS AL INICIO DE LA SEPARATA......?

46

47

LOS PERCENTILES O CENTILAS (Pi)
Estadígrafos de Localización; son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados. Los percentiles se aplican cuando existen numerosos valores de la variable con una alta frecuencia total. Lo primero que debe hacerse al igual que los casos anteriores es ordenar los datos en forma ascendente o descendente.

P1 corresponde al 1% de los datos. En otras palabras, el 1% de las observaciones
tienen valores inferiores o iguales a P1, en tanto que el 99% restante tienen valores superiores a este Percentil. P2 corresponde al 2% de los datos. P3 corresponde al 3% de los datos. Es un valor que supera a no más del 3% de las n observaciones y que es superado por no más del 97% de las n observaciones.
• • •

P99 corresponde al 99% de los datos. Es un valor que supera a no más del 99% de las
n observaciones y que es superado por no más del 1% de las n observaciones. a) Para datos no Agrupados. Los percentiles toman los valores de la posición calculadas por las fórmulas correspondientes. Se calcula de la siguiente manera: P1 = valor tomado por la posición n/100
• • • • • • • • •

P62 = P83 = D99 =

valor tomado por la posición 62n/100

valor tomado por la posición 83n/100

valor tomado por la posición 99n/100

b) Para datos Agrupados en intervalos. El procedimiento que se emplea para calcular los percentiles es similar al seguido para los casos anteriores, considerando in/100 para cada percentil i: n/100 para P1 2n/100 para P2 3n/100 para P3 4n/100 para P4 5n/100 para P5
• • •

99n/100

para P99

47

48

• Si coincide con algún Ni, entonces toma el valor del límite inferior del intervalo Percentil correspondiente. • Si no coincide con algún Ni, el procedimiento es el siguiente: Así tenemos:
 n  1 1 0 − N i −  0   1  N i − N i−     

P1 = Li + C

Donde: n : Número total de datos u observaciones. Ni : Es la frecuencia absoluta acumulada inmediata superior a n/100. Ni-1 : Es la frecuencia absoluta acumulada inmediata inferior a n/100. IP1 : Intervalo percentil-uno que corresponde a Ni. Li : Extremo inferior del Intervalo Percentil –uno (IP1). C : La amplitud del Intervalo Percentil-uno.
• • •

Hasta llegar al:

P99 = Li + C

9 9 n  1 1 0 − N i −  0   1  N i − N i−     

Donde: n : Número total de datos u observaciones. Ni : Es la frecuencia absoluta acumulada inmediata superior a 99n/100. Ni-1 : Es la frecuencia absoluta acumulada inmediata inferior a 99n/100. IP99 : Intervalo percentil-noventa y nueve que corresponde a Ni. Li : Extremo inferior del Intervalo percentil-noventa y nueve (IP99). C : La amplitud del Intervalo percentil-noventa y nueve.

¿HALLE LOS VALORES DE LOS EJEMPLOS DADOS AL INICIO DE LA SEPARATA......?

48

49

LA MODA O VALOR MODAL (Mo)
Simplemente es el valor más frecuente de una variable. Es el valor de la variable que le corresponde la mayor frecuencia absoluta (ni). Es también llamado Modo; Valor Modal o Promedio Típico. La Moda no siempre existe y no siempre es única, en general se tiene que: • La distribución que no tiene Moda se llama Amodal. • La distribución que tiene una moda se llama Unimodal. • La distribución que tiene dos modas se llama Bimodal. • La distribución que tiene más de dos modas se llama Multimodal. a) Para datos no Agrupados. La moda está dada por los valores de la variable en estudio que más se repiten en la distribución. b) Para datos Agrupados en intervalos. b.1) Tablas sin intervalos (variables discretas). El valor se determina por el valor de la clase (Yi) que más se repite. Mo = Valor de clase con mayor ni. b.2) Tablas con intervalos (variables contínuas). Cuando se tiene una tabla con intervalos, al igual que la mediana se determina el Intervalo Modal (IMo), que es el intervalo que corresponde a la mayor frecuencia ni . Para calcular la moda existen diversas fórmulas tal como:

Mo = Li + C    ni −1 + ni +1 
Donde:

ni +1

ni : ni-1 : ni+1 : IMo : Li : C :

Es la mayor o más alta frecuencia absoluta. Es la frecuencia absoluta inmediata inferior a ni. Es la frecuencia absoluta inmediata superior a ni. Intervalo modal, que corresponde a ni. Extremo inferior del Intervalo Modal (IMo). La amplitud del Intervalo Modal.

Interpretación: La moda indica que el sueldo más frecuente en los 20 trabajadores de una empresa es de Mo dólares. ¿HALLE LA MODA DE LOS EJEMPLOS DADOS AL INICIO DE LA SEPARATA......? 49

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->