Está en la página 1de 44

Medidas de Dispersin

"No se puede entender cabalmente la historia de un pueblo si no se conoce la dinmica de su pueblo. Y no se puede planificar y tomar decisiones sabias en un pas (municipio, comunidad o grupo), si no se considera cuidadosamente su situacin demogrfica y sus perspectivas futuras".
Dr. Jos Vzquez Calzada

Una de las funciones de la estadstica se relaciona con el clculo de la variabilidad. Conocer las medidas de dispersin (variacin) es de suma importancia, ya que la no consideracin de diferencias puede conducir a errores de juicio en la toma de decisiones (Snchez, 1992). Una medida particular de tendencia central da lugar a una puntuacin que, en cierto sentido, "representa" a todas las puntuaciones de un grupo (Glass & Stanley, 1974). Sin embargo, cuando se usa cualquier medida de tendencia central, sta nos da slo un cuadro incompleto de un conjunto de datos y, por consiguiente, podra conducir a conclusiones errneas o distorsionadas (Levin, 1979), porque este proceso pasa por alto las diferencias entre las puntuaciones en s (Glass & Stanley, 1974). Sera incorrecto concluir que dos (2) conjuntos de datos son iguales slo porque tienen la mismas medidas de tendencia central, es decir, que el valor de la media aritmtica sea el mismo para ambos conjuntos, cuando la distancia de los datos de ambos conjuntos se distribuyen de una forma diferente (Elorza, 1987). Para describir una distribucin en forma ms completa o para interpretar con ms detalle una calificacin, necesitamos informacin adicional acerca de la dispersin de las calificaciones con respecto a nuestra medida de tendencia central (Haber & Runyon, 1992). Es necesario un ndice de cmo estn diseminados los puntajes alrededor del centro de la distribucin. A tales distancias se les suele

154

Arnaldo Torres Degr y Evelyn Afanador Mejas

denominar medidas de dispersin o variacin. Las medidas de dispersin, tambin conocidas como medidas de variacin o variabilidad, indican el grado en que los sujetos se dispersan respecto al centro de la distribucin. A travs de las mismas el investigador verifica cun homogneos, parecidos o estables son los elementos bajo estudio, en contraste con otros grupos de inters (Snchez, 1992). Si todos los valores son los mismos, no existe dispersin; si no todos son los mismos, hay dispersin en los datos. La magnitud de la dispersin puede ser pequea, cuando los valores, aunque diferentes, estn prximos entre s. Si los valores estn ampliamente separados, la dispersin es mayor. Este captulo trata slo de la medidas de dispersin o variabilidad ms conocidas: el recorrido (rango) y la desviacin estndar. Estas tcnicas estarn enmarcadas segn la composicin de los datos, es decir, arreglo de datos, datos no agrupados y datos agrupados. Adems, se evaluar la tcnica de coeficiente de variacin para variables cuantitativas y cualitativas, tales como: coeficiente de variacin e ndice de dispersin cuantitativo.

[6.1] Tipos de Medidas de Dispersin


Cuando nuestro inters se centra en las medidas de dispersin, debemos buscar un ndice de variabilidad que indique la distancia a lo largo de la escala de calificaciones (Runyon & Haber, 1992). El recorrido y la desviacin estndar realizan dicha labor.

Recorrido
Una manera de medir la variacin en un conjunto de valores es calculando el recorrido. El recorrido es la ms sencilla y directa de las medidas de dispersin (Runyon & Haber, 1992), y a la vez la menos confiable de las medidas de variacin (Snchez, 1992). Se trata simplemente de la distancia entre el valor menor y el valor mayor en un conjunto de observaciones. El hecho de que slo tome en consideracin dos (2) valores, hace que la medida sea muy pobre. Ntese que si hay un valor extremo en la distribucin, se tendr la impresin de que la dispersin es grande cuando, en realidad, si hiciramos caso omiso de esa calificacin, podramos

Medidas de Dispersin

155

encontrar que dicha distribucin es, por el contrario, una distribucin "compacta". El recorrido refleja nicamente las dos (2) calificaciones extremas de la distribucin (Runyon & Haber, 1992), es decir, solamente dos (2) puntuaciones exactas de un grupo son las que los determina, ignorando as, todas las dems puntuaciones, a excepcin de los extremos (Glass & Stanley, 1974). El recorrido no puede darnos una idea precisa con respecto a la dispersin y, en el mejor de los casos, debe considerarse slo como un ndice preliminar o muy aproximado (Levin, 1977). Puede expresarse de la siguiente manera:

R = Vmax - Vmin
donde;

R = Recorrido, rango o amplitud Vmax = Valor mximo de los datos de un conjunto Vmin = Valor mnimo de los datos de un conjunto

Varianza y Desviacin Estndar


La desviacin estndar (DE) es la medida de dispersin ms adecuada para la estadstica descriptiva (Haber & Runyon, 1992). Tanto en la escalas de intervalo como en las de razones, la varianza y la desviacin estndar son las mejores medidas de dispersin. Toman en consideracin todos los puntajes y controlan por el efecto de valores extremos. La DE permite una interpretacin precisa de las calificaciones dentro de una distribucin (Runyon & Haber, 1992). Si todos los sujetos son iguales en una caracterstica (por ejemplo, ndice acadmico), entonces el resultado ser igual a cero. Por el contrario, si aumentan las diferencias, aumentar el ndice, alejndose ms y ms del punto cero. La varianza se define como las desviaciones cuadradas medias respecto a la media. La desviacin estndar es la raz cuadrada de la varianza. La desviacin estndar estar formulada de la siguiente manera:

156

Arnaldo Torres Degr y Evelyn Afanador Mejas

Frmulas para poblacin


()
Desviacin estndar para arreglos de datos usando el universo

=
N
donde:

x (x)

=
N
donde:

Desviacin estndar para datos no agrupados y datos agrupados usando el universo

Frmulas para muestras


()
Desviacin estndar para arreglos de datos usando muestra

s=
donde:

n n-1

x (x)

s=
n-1
donde:

Desviacin estndar para datos no agrupados y datos agrupados usando muestra

Medidas de Dispersin

157

= Desviacin estndar de la poblacin. s = Desviacin estndar de la muestra = Sumatoria de los valores que toma la variable (x), cuando estamos trabajando con datos no agrupados. Para los datos agrupados el smbolo cambia a x. = Sumatoria de los valores que toma la variable (x) al cuadrado, cuando estamos trabajando con datos no agrupados. Para los datos agrupados el smbolo cambia a x. N = Tamao del universo o la poblacin n = Tamao de la muestra n-1 = Tamao de la muestra menos uno (1)

[6.2] Anlisis de Dispersin a partir de los Arreglos de Datos


Para poder evaluar este tpico retomaremos el ejemplo de datos hipotticos del captulo 5, seccin 5.2 (ver pgina 116). Uno de los primeros paso en el formato de arreglo de datos es acomodar los datos de una forma til. El mismo consiste en organizar los datos obtenidos de una forma ordenada, de menor a mayor o viceversa. Con esta estructura establecida, podemos con facilidad aplicar diversos mtodos

158

Arnaldo Torres Degr y Evelyn Afanador Mejas

estadsticos para poder entender mejor el conjunto de datos en estudio.

Si

quisiramos realizar un anlisis de dispersin sobre la edad inicial del uso de Internet entre los estudiantes de ciencias polticas de la Universidad Pitirre de Puerto Rico del ao acadmico 2003-2004, el primer paso sera organizar los porcentajes de mayor a menor o viceversa (ver figura 6.1).
Figura 6.1 Edades organizadas de menor a mayor

10 10 10 12 12 12 12 13 13 13 13 13 13 15 15 15 15 15 15 15 16 16 16 16 16 16 18 18 18 21 21 21 21 22 22 23 23 23 23 23
N= 40 datos hipotticos

Recorrido
El recorrido sera la distancia que existe entre la edad mas alta vs. la edad ms baja sobre el inicio en el Internet en los estudiantes de ciencias polticas de la Universidad Pitirre de Puerto Rico para el ao acadmico 2003-2004. Es recomendable que se organicen las categoras de la variable de inters de menor a mayor o viceversa. En la figura 6.1 las edades de inicio en el Internet entre los estudiantes de ciencias polticas de la Universidad Pitirre de Puerto Rico para el ao acadmico 2003-2004 fueron organizados de menor a mayor. Si observamos detenidamente las edades organizadas (ver figura 6.1), notaremos que el dato ms alto fue la edad 23 aos, mientras que el dato ms bajo fue la edad 10 aos. Con esta informacin podemos obtener el recorrido de la siguiente manera:

R = edad ms alta edad ms baja R = 23 10 R = 13

Medidas de Dispersin

159

Podemos indicar que en la Universidad pitirre de Puerto Rico para el ao acadmico 2003-2004 la diferencia de la edad de inicio en el Internet entre los estudiantes de ciencias polticas fue de 13 aos.

Desviacin Estndar
Para buscar la desviacin estndar entre las edades sobre el inicio del Internet en los estudiantes de ciencias polticas de la Universidad Pitirre de Puerto Rico para el ao acadmico 2003-2004 es necesario elaborar una nueva columna conocida como (). La columna se obtiene elevando al cuadrado a la frecuencia () como observamos en la figura 6.2. Una vez realizado dicha operacin se suman por separado ambas columnas, para obtener: (sumatoria de las edades) y (sumatoria de las edades al cuadrado).

Figura 6.2 Desarrollo de los datos para establecer la Desviacin Estndar

[10] [10] [10] [12] [12] [12] [12] [13] [13]

100 100 100 144 144 144 144 169 169

[13] [13] [13] [13] [15] [15] [15] [15] [15]

169 169 169 169 225 225 225 225 225

[15] [15] [16] [16] [16] [16] [16] [16] [18]

225 225 256 256 256 256 256 256 324

[18] [18] [21] [21] [21] [21] [22] [22] [23]

324 324 441 441 441 441 484 484 529

[23] [23] [23] [23]

529 529 529 529

= 654 =11,350

Con la columna establecida (ver figura 6.2) podremos buscar la desviacin estndar () de la siguiente manera:

160

Arnaldo Torres Degr y Evelyn Afanador Mejas

11,350 (654) 40 40 11,350 427,716 40 40 11,350 10,692.9 40 657.1 40 16.4275 4.0530852 4.05

= = =

Podemos concluir que en la Universidad pitirre de Puerto Rico para el ao acadmico 2003-2004 la desviacin estndar de la edad de inicio en el Internet entre los estudiantes de ciencias polticas fue de 4.05 aos.

Medidas de Dispersin

161

Ejercicios de Dispersin
segn arreglo de datos
Favor de identificar las hojas de ejercicios y elaborar todos los problemas segn lo establecido en el texto. Desprenda las hojas de ejercicios y entrguelas al profesor, SI FUESE NECESARIO.

NOMBRE: NUMERO DE ESTUDIANTE:

FECHA: _______________ SECCION: ___________

Ejercicio 6.2.1 Favor de utilizar los datos para calcular y analizar el recorrido y la desviacin estndar segn el formato de arreglo de datos.

Estudiantes de pre-jurdico sobre la edad de inicio en el consumo de bebidas alcohlicas, Universidad Pitirre, Puerto Rico: 2000

10 23 19 17 15 23 19 16 10 16 19 23 17 19 10 23 19 16 10 19 17 10 16 19 15 10 15 14 23 16 19 16 10 16 19 15 17 19 10 23 19 19 15 17 10 17 19 23 16 14 17 23 10
Casos hipotticos

162

Arnaldo Torres Degr y Evelyn Afanador Mejas

Ejercicio 6.2.2 Favor de utilizar los datos para calcular y analizar el recorrido y la desviacin estndar segn el formato de arreglo de datos.

Estudiantes de ciencias polticas respecto al gasto en dlares diario de gasolina, Universidad Pitirre, Puerto Rico: 2000

12 20 15 10 22 15 10 12 09 22 09 12 08 10 15 10 22 10 12 09 08 15 05 22 05 15 08 10 20 09 20 12 08 15 09 12 05 20 12 10 22 20 12 15
Casos hipotticos

Medidas de Dispersin

163

Ejercicio 6.2.3 Favor de utilizar los datos para calcular y analizar el recorrido y la desviacin estndar segn el formato de arreglo de datos.

Estudiantes de economa con respecto a la cantidad de hermanos en su familia, Universidad Pitirre, Puerto Rico: 2000

2 1 4 3 6 2 7 3 5 1 2 6 3 5 1 3 4 1 2 3 1 4 3 1 3 4 2 8 3 2 5 7 3 2 9 3 1 1 5 3 8 5 1 3 4 3 5 2 1 4 6
Casos hipotticos

164

Arnaldo Torres Degr y Evelyn Afanador Mejas

Ejercicio 6.2.4 Favor de utilizar los datos para calcular y analizar el recorrido y la desviacin estndar segn el formato de arreglo de datos.

Estudiantes de antropologa con respecto a la cantidad de crditos acumulado de concentracin, Universidad Pitirre, Puerto Rico: 2000

18 12 15 20 15 21 27 18 14 16 27 21 24 15 15 27 15 12 18 15 15 18 14 18 16 27 16 18 21 15 18 12 15 27 15 12 18 16 12 15 20 18 16 13 21 15 27 18 12 14 18 27 20 15 14 27 18 20 16 15
Casos hipotticos

Medidas de Dispersin

165

[6.3] Anlisis de Dispersin a partir de los Datos no Agrupados


En Puerto Rico para el ao 1993 se registraron 12,820 nacimientos que provienen de madres adolescentes. Los nacimientos se El orden de ubicaron segn el orden de embarazo de la madre adolescente (ver cuadro 6.1). embarazo supone la posicin que ocupar el infante con respecto a sus hermanos(as). Ejemplo, podemos observar en el cuadro 6.1 que 8,709 nacimientos representan el primer hijo(a) para las madres adolescentes 12 nacimientos representan el sexto hijo(a) adolescentes. para las madres Cuadro 6.1
Nacimientos por Orden de embarazo por madres adolescentes

Puerto Rico, 1993 Orden de embarazo (x) 1 2 3 4 5 6 7+ nacimientos () 8,709 2,958 903 195 37 12 6

Recorrido

Fuente: Cuadro elaborado por el Dr. Arnaldo Torres Degr con datos obtenido del Departamento de Salud de Puerto Rico, 1992. Informe Anual de Estadsticas Vitales de Puerto Rico: 1990. Nacimientos Vivos, tabla 15, pg. 68.

Si su inters como estudioso es realizar un anlisis de dispersin al orden de embarazo que representa dicho nacimiento en la mujer ocurrido en Puerto Rico para el ao 1990, podramos buscar el recorrido y la desviacin estndar. El recorrido, es decir, la distancia que existe entre el orden de embarazo mayor menos el orden de embarazo menor, sera: R = Orden de embarazo mayor R=7 1 R=6 Orden de embarazo menor

166

Arnaldo Torres Degr y Evelyn Afanador Mejas

Podemos interpretar que en Puerto Rico para el ao 1993 la distancia observada o el recorrido entre el orden de embarazo de los nacimientos de las madres adolescentes fue de seis (6).

Desviacin Estndar
Para buscar la desviacin estndar entre el orden de embarazo de los nacimientos de las madres adolescentes ocurridos en Puerto Rico para el 1993 es preciso elaborar varias columnas adicionales a las establecidas en el cuadro 6.1. Como observamos en la figura 6.3, las columnas adicionales para elaborar la desviacin estndar son (x) y (x). La columna x se obtiene multiplicando las categoras de la variable (x) con su frecuencia () correspondiente. La columna x se obtiene multiplicando la columna (x) por la categora (x) correspondiente. Notemos, que no estamos elevando al cuadrado la columna (x). De realizar dicho clculo se invalida el resultado. La poblacin o universo (N) es obtenido por la suma de la columna de la frecuencia ().
Figura 6.3. Procedimiento para obtener x y x, segn los datos del cuadro 6.1
Orden de embarazo x 1 por Nacimientos 8,709 por 2 por 2,958 por 3 4 5 6 7+ por 903 195 37 12 6 N 12,820 = 2,709 780 185 72 42 x 18,413 8,127 3,120 925 432 294 33,439 = 5,916 = 11,832

x = 8,709

x = 8,709

Medidas de Dispersin

167

Con la columna establecida (ver figura 6.3) podremos buscar la desviacin estndar () de la siguiente manera:

33,439 (18,413) 12,820 12,820 33,439 26,446.066 12,820 6,992.9338 12,820 .5454707 .7385599 .74

= = = = =

Podemos concluir que en Puerto Rico para el ao 1990 la desviacin estndar entre el orden de embarazo de las madres adolescentes fue de .74

168

Arnaldo Torres Degr y Evelyn Afanador Mejas

Medidas de Dispersin

169

Ejercicios de Dispersin
segn datos no agrupados
Favor de identificar las hojas de ejercicios y elaborar todos los problemas segn lo establecido en el texto. Desprenda las hojas de ejercicios y entrguelas al profesor, SI FUESE NECESARIO.

NOMBRE: NUMERO DE ESTUDIANTE:

FECHA: _______________ SECCION: ___________

Ejercicio 6.3

Favor de utilizar los datos que reflejan la cantidad menores contra quienes se presentaron querellas por sexo y edad, Puerto Rico, ao fiscal 1991-1992.

Sexo Edad 9 aos 10 aos 11 aos 12 aos 13 aos 14 aos 15 aos 16 aos 17 aos 18 aos TOTAL Hombres 25 34 73 141 316 536 884 1,160 1,428 144 4,741 Mujeres 3 4 6 24 62 117 120 134 106 18 594

Ambos Sexos TOTAL 28 38 79 165 378 653 1,004 1,294 1,534 162 5,335

Fuente: Tribunal Superior de Puerto Rico, Asunto de Menores

170

Arnaldo Torres Degr y Evelyn Afanador Mejas

[6.3.1] Favor de calcular y analizar el recorrido de la edad de las menores (mujeres) contra quienes se le presentaron querellas en el Tribunal Superior de Puerto Rico para el ao fiscal 1991-1992.

[6.3.2] Favor de calcular y analizar la desviacin estndar de la edad de las menores (mujeres) contra quienes se le presentaron querellas en el Tribunal Superior de Puerto Rico para el ao fiscal 1991-1992. Incluya una tabla con las columnas necesarias para completar el ejercicio.

Medidas de Dispersin

171

[6.3.3] Favor de calcular y analizar el recorrido de la edad de los menores (hombres) contra quienes se le presentaron querellas en el Tribunal Superior de Puerto Rico para el ao fiscal 1991-1992.

[6.3.4] Favor de calcular y analizar la desviacin estndar de la edad de los menores (hombres) contra quienes se le presentaron querellas en el Tribunal Superior de Puerto Rico para el ao fiscal 1991-1992. Incluya una tabla con las columnas necesarias para completar el ejercicio.

172

Arnaldo Torres Degr y Evelyn Afanador Mejas

[6.3.5] Favor de calcular y analizar el recorrido de la edad total de los menores (ambos sexos) contra quienes se le presentaron querellas en el Tribunal Superior de Puerto Rico para el ao fiscal 1991-1992.

[6.3.6] Favor de calcular y analizar la desviacin estndar de la edad total de los menores (ambos sexos) contra quienes se le presentaron querellas en el Tribunal Superior de Puerto Rico para el ao fiscal 1991-1992. Incluya una tabla con las columnas necesarias para completar el ejercicio.

Medidas de Dispersin

173

[6.4] Anlisis de Dispersin a partir de los Datos Agrupados


Cuadro 6.2 Frecuencia de muertes por SIDA y edad Puerto Rico, 1993 Edad (clase) x 0-4 5-9 10-14 15-19 20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64 65-69 70-74 75-79 80-84 85-89

El Departamento de Salud de Puerto Rico inform que para el ao 1993 murieron 1,148 personas debido al virus de inmunodeficiencia humana (SIDA). El cuadro 6.2 refleja las muertes ocurridas por SIDA ubicadas por grupos de edades. Si usted suma todas las defunciones por SIDA ubicadas en grupos de edades notar una diferencia de doce (12) casos. Dicha diferencia se debe a los casos que no informaron o se desconoce la edad. Para este ejercicio se tomar en cuenta todos los casos que informaron la edad, es decir, 1,139 defunciones. Si su inters como investigador es analizar la dispersin o variabilidad de la edad de las personas que murieron por SIDA en Puerto Rico para el ao 1993, podramos buscar el recorrido y la desviacin estndar. Para obtener el recorrido y la desviacin estndar segn la configuracin de datos agrupados es necesario elaborar tres (3) columnas adicionales: (Pt); (x) y (x). 5.4). La columna (Pt) y (x) ya han sido explicadas y elaboradas en el captulo 5 (ver tpico La columna x se obtiene mediante la multiplicacin de la columna x por la columna Pt.

14 4 0 0 20 118 237 268 214 115 65 32 14 19 6 6 5 2

Fuente: Cuadro elaborado por el Dr. Arnaldo Torres Degr con datos obtenidos del Departamento de Salud de Puerto Rico, 1995. Informe Anual de Estadsticas Vitales: Puerto Rico, 1993. Mortalidad, tabla 15a: pg. 187; Existen 12 casos sin especificar las edades

174

Arnaldo Torres Degr y Evelyn Afanador Mejas

Figura 6.4 Columnas necesarias como Pt, x y x, segn los datos del cuadro 6.2

Edades| (clases) 0-4 5-9 10-14 15-19 20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64 65-69 70-74 75-79 80-84 85-89

14 4 0 0 20 118 237 268 214 115 65 32 14 19 6 6 5 2

Pt x 2 7 12 17 22 27 32 37 42 47 52 57 62 67 72 77 82 87

x 28 28 0 0 440 3,186 7,584 9,916 8,988 5,405 3,380 1,824 868 1,273 432 462 410 174

x 56 196 0 0 9,680 86,022 242,688 366,892 377,496 254,035 175,760 103,968 53,816 85,291 31,104 35,574 33,620 15,138

N= 1,139

x =44,389 x =1,871,336

Recorrido
El recorrido, es decir la diferencia de la edad mayor vs. la edad menor de las personas que murieron por SIDA, debe conseguirse en el punto medio (Pt) de la clase de edad mayor vs. la clase de edad menor. Si observamos la figura 6.4 el punto medio de la clase mayor (85 - 89) es 87 aos, mientras que el punto medio de la clase menor (0 - 4) es 2 aos. Con estos elementos el recorrido podr obtenerse de la siguiente forma:

Medidas de Dispersin

175

R = Pt de la clase mayor R = 87 2 R = 85 aos

Pt de la clase menor

Podemos indicar que el recorrido observado en la edad de las personas que murieron por SIDA en Puerto Rico para el ao 1993 fue de 85 aos.

Desviacin Estndar
Como configuracin necesario hemos de establecido, agrupados (2) para es obtener la desviacin estndar segn la datos dos

= = =

elaborar

columnas

1,871,336 (44,398) 1,139 1,139 1,871,336 1,730,625.5 1,139 140,710.54 1,139 123.53866 11.114795 11.12 aos

adicionales: (x) y (x). La columna x es obtenida mediante la multiplicacin de la columna frecuencias () por la columna del punto medio (Pt). La columna x es obtenida mediante la multiplicacin de la columna x por la columna Pt. Con estas columnas realizadas en la figura 6.4 podemos buscar la varianza y luego la desviacin estndar. Podemos afirmar que en Puerto Rico para el ao 1993 la desviacin estndar de la edad por defunciones debido al SIDA fue de 11.12 aos.

= = =

176

Arnaldo Torres Degr y Evelyn Afanador Mejas

Medidas de Dispersin

177

Ejercicios de Dispersin
segn datos agrupados
Favor de identificar las hojas de ejercicios y elaborar todos los problemas segn lo establecido en el texto. Desprenda las hojas de ejercicios y entrguelas al profesor, SI FUESE NECESARIO.

NOMBRE: NUMERO DE ESTUDIANTE:

FECHA: _______________ SECCION: ___________

Ejercicio 6.4 Favor de utilizar los datos que reflejan la cantidad de defunciones por accidentes de trfico de vehculos de motor por edad, Puerto Rico: 1980, 1985 y 1990.

Grupo de edad 5 - 14 15 - 24 25 - 34 35 - 44 45 - 54 55 - 64 65 - 74 75 - 84 85 - 94

Aos naturales 1980 44 145 97 65 67 47 53 20 10 1985 53 129 110 90 65 55 42 27 5 1990 43 107 84 87 67 62 52 33 8

Fuente: Departamento de Salud, 1993. Estadsticas Vitales de Puerto Rico: Resumen de una dcada 1980 al 1990. San Juan, P.R.: pg. 108.

178

Arnaldo Torres Degr y Evelyn Afanador Mejas

[6.4.1] Favor de calcular y analizar el recorrido de la edad por defunciones en accidentes de trfico por vehculos en Puerto Rico para el ao 1980.

[6.4.2] Favor de calcular y analizar la desviacin estndar de la edad por defunciones en accidentes de trfico por vehculos en Puerto Rico para el ao 1980. Incluya una tabla con las columnas necesarias para completar el ejercicio.

Medidas de Dispersin

179

[6.4.3] Favor de calcular y analizar el recorrido de la edad por defunciones en accidentes de trfico por vehculos en Puerto Rico para el ao 1985.

[6.4.4] Favor de calcular y analizar la desviacin estndar de la edad por defunciones en accidentes de trfico por vehculos en Puerto Rico para el ao 1985. Incluya una tabla con las columnas necesarias para completar el ejercicio.

180

Arnaldo Torres Degr y Evelyn Afanador Mejas

[6.4.5] Favor de calcular y analizar el recorrido de la edad por defunciones en accidentes de trfico por vehculos en Puerto Rico para el ao 1990.

[6.4.6] Favor de calcular y analizar la desviacin estndar de la edad por defunciones en accidentes de trfico por vehculos en Puerto Rico para el ao 1990. Incluya una tabla con las columnas necesarias para completar el ejercicio.

Medidas de Dispersin

181

[6.5] Funcin de la Desviacin Estndar


Una vez obtenida la desviacin estndar, conforme uno de los tres (3) tipos de organizacin de datos, la pregunta inminente es qu implicacin o funcin tiene dicha medida?. Al principio de este captulo indicamos que el objetivo de las medidas de dispersin es indicar el grado en que los sujetos se dispersan (se alejan o se acercan) respecto al centro (la media) de una distribucin. La desviacin estndar cumple a cabalidad con dichos objetivos. A mayor la desviacin estndar mayor es la dispersin o a menor la desviacin estndar menor es la dispersin de los sujetos, con respecto a la media. Como funcin de la desviacin estndar podemos encontrar cun homogneos, parecidos o estables son los sujetos bajo estudio cuando estos son comparados con otro(s) grupo(s) de inters. Por ejemplo, en dos (2) secciones del curso de estadstica social la edad media fue igual, es decir, 21.4 aos de edad. La desviacin estndar para la seccin 1 fue de 10 aos y la desviacin estndar de la seccin 2 fue de 2 aos. Qu podemos inferir de las resultados obtenidos tanto de la seccin 1 como de la seccin 2? Primeramente, debemos sealar que la comparacin de la desviacin estndar de ambas secciones es posible, nica y exclusivamente, porque la media es igual. Al comparar la desviacin estndar notamos una diferencia. La desviacin estndar de la seccin 1 (10 aos) es mayor que la seccin 2 (2 aos). Esto sugiere que en la seccin 2 del curso de estadstica social los estudiantes son ms homogneos (parecidos) en la edad que los estudiantes de la seccin 1. Otro ejemplo, para visualizar la utilidad de la desviacin estndar es el siguiente. Se le someti a dos grupos profesionales una situacin determinada y se le tom el tiempo en resolver dicha encomienda. El grupo de criminlogos obtuvo un media de 45 minutos, con una desviacin estndar de 3 minutos. El grupo de trabajadores sociales obtuvieron una media de 45 minutos con una desviacin estndar de 11 minutos. Notemos, que la media es la misma para ambos grupos profesionales. No obstante, la desviacin estndar es diferente para ambos grupos. Dicha diferencia nos sugiere que el tiempo en terminar de resolver el problema en cuestin fue ms homogneo o ms parecido en el grupo de criminlogos que el tiempo obtenido en el grupo de trabajadores sociales. Como hemos observado, las comparaciones que se han realizado en este tpico son posibles porque la media

182

Arnaldo Torres Degr y Evelyn Afanador Mejas

aritmtica de cada distribucin ha sido igual. Pero, qu pasara si al comparar dos distribuciones las medias son diferentes? Sencillamente, no podramos analizar la homogeneidad como lo hemos hecho en este tpico. Sin embargo, es posible realizar la comparacin utilizando un coeficiente de variacin. En el tpico siguiente se desarrollar el coeficiente de variacin.

[6.6] Coeficiente de Variacin


La desviacin estndar DE es til como medida de la variacin dentro de un conjunto de datos. Mas an, si las medias son iguales se pueden comparar directamente las dos DE (Snchez, 1992). Sin embargo, cuando se desea comparar la dispersin en dos conjuntos de datos, comparar las DE pueden conducir a resultados sin sentido, si las medias difieren o si las unidades de medicin son diferentes. Esto es as, puesto que cada DE se obtiene a partir de la media particular que corresponde a cada conjunto (Snchez, 1992). Lo que se necesita en situaciones como sta es una medida de variacin relativa, en lugar de una variacin absoluta (Daniel, 1985). La medida que nos puede resolver este problema es el coeficiente de variacin (C.V.), llamado de Pearson, que es la relacin entre la DE y la media aritmtica (Elorza, 1987). Se multiplica adems por 100, para considerar el resultado en forma de porcentaje. A mayor el porcentaje, mayor es la variacin y viceversa. La frmula est dada por:

C.V. = s x (100)
donde:

s = Desviacin estndar de una muestra

x = media aritmtica de una muestra

Medidas de Dispersin

183

C.V. = (100)
donde:

= Desviacin estndar de la poblacin = Media aritmtica de la poblacin Para poder entender el coeficiente de variacin analizaremos la siguiente situacin hipottica. Supongamos que la Universidad Pitirre de Puerto Rico en el semestre de agosto a diciembre del 2002 se ofrecieron tres (3) curso de estadstica social. Una vez finalizado los cursos se pudo obtener la media de notas generales, la desviacin estndar de notas generales y la cantidad de estudiantes por cada curso.

Parmetros

Promedios finales de tres cursos de estadstica social, Universidad Pitirre, agosto-diciembre del 202

Sec. 01 Poblacin (N) Media () Desviacin Estndar () 25 90 12.6

Sec. 02 20 78.2 11.2

Sec. 03 28 62.9 9.6

Si nuestro inters es indagar entre las secciones de estadstica social, cul de ellos, con respecto a las notas, tiende ha ser ms homognea o ms parecidas, debemos incursionar en la dispersiones de las notas. Recuerde que sealamos que a mayor dispersin de los valores de una poblacin de estudio, menos se paren los valores sugiriendo que hay poca homogeneidad. Lo inverso sugiere que a menor dispersin de los valores de una poblacin de estudio, ms se paren los valores sugiriendo que hay mucha homogeneidad. Notemos que para establecer la comparacin de homogeneidad en el ejercicio que nos compete, la media de las tres (3) secciones de estadstica social no son iguales. Este factor es muy importante, previo al manejo de la homogeneidad, porque teniendo las medias diferentes, no es posible obtener el grado de homogeneidad utilizando como punto de referencia la desviacin estndar.

184

Arnaldo Torres Degr y Evelyn Afanador Mejas

Por ejemplo, si no tomramos en consideracin la disparidad de las medias y analizramos nica y exclusivamente la desviacin estndar para conseguir el grado de homogeneidad, podramos concluir, dado que la desviacin estndar es menor en la seccin 3 ( =9.6) con respecto a la seccin 2 ( =11.2) y la seccin 1 ( =12.6), que las notas de la seccin 3 del curso de estadstica social tienden hacer ms parecidas (homogneas) que entre las dems secciones. Sin embargo, esta conclusin adolece de veracidad porque cuando las medias en una comparacin no son iguales, no se puede utilizar la desviacin estndar para obtener el grado de homogeneidad. Para resolver el dilema, sugerimos que se busque el coeficiente de variacin en todos los grupos de inters y luego sera posible concluir sobre el grado de homogeneidad, veamos:

Seccin 01

= 12.6 90

(100)

= 14.00 % Seccin 02 = 11.2 (100) 78.2 = 14.32 % Seccin 03 = 9.6 (100) 62.9 = 15.26 % Si analizamos los resultados de los coeficiente de variacin nos percataremos que la seccin 01 de estadstica social obtuvo el resultado ms bajo (14.00 %) con respecto a las otras dos secciones. Recuerde, mientras ms bajo es la dispersin, una vez se compara con los dems grupos de inters, el mismo sugiere alto grado de homogeneidad. Podemos concluir que las notas entre los estudiantes del curso de estadstica social de la seccin 01, tienden a ser ms parecidas (homogneas) que entre las secciones 02 y 03 del mismo curso de la Universidad Pitirre de Puerto Rico para el semestre de agosto a diciembre del 2002.

Medidas de Dispersin

185

Ejercicios Coeficiente de Variacin


Favor de identificar las hojas de ejercicios y elaborar todos los problemas segn lo establecido en el texto. Desprenda las hojas de ejercicios y entrguelas al profesor, SI FUESE NECESARIO.

NOMBRE: NUMERO DE ESTUDIANTE:

FECHA: _______________ SECCION: ___________

[6.6.1] Favor de buscar la media aritmtica y la desviacin estndar de las edades por suicidio para los aos 1980, 1990 y 2000 segn los datos del cuadro 4.1 de la pgina 105. Luego calcule y analice el coeficiente de variacin para todos los aos.

186

Arnaldo Torres Degr y Evelyn Afanador Mejas

[6.6.2] Favor de buscar la media aritmtica y la desviacin estndar de los ejercicios 5.4.1.a pgina 145 y 5.4.2 de la pgina 147. Luego calcule y analice el coeficiente de variacin.

Medidas de Dispersin

187

[6.6.3] Favor de buscar la media aritmtica y la desviacin estndar de las edades de los varones y mujeres segn el ejercicio 6.3 de la pgina 169. Luego calcule y analice el coeficiente de variacin.

188

Arnaldo Torres Degr y Evelyn Afanador Mejas

[6.6.4] Favor de buscar la media aritmtica y la desviacin estndar de las edades por defunciones para cada anoo segn el ejercicio 6.4 de la pgina 177. Luego calcule y analice el coeficiente de variacin.

Medidas de Dispersin

189

[6.7] ndice de Dispersin Cualitativa


Normalmente en el campo de las ciencias sociales se utilizan o manejan muchas variables cualitativas. Se puede observar previamente que dichas variables pueden variar de clase o cantidad. La premisa sera cun diferentes son esas observaciones. Utilizando el coeficiente de variacin cualitativa o un ndice de dispersin podemos encontrar dichas diferencias en las observaciones. El ndice de dispersin flucta entre cero (0) y uno (1), donde cero (0) implica homogeneidad perfecta y uno (1) representa heterogeneidad perfecta. Si los casos o sujetos estn distribuidos entre las categoras de una forma equitativa, es decir, que para cada categora de la variable existe la misma cantidad de casos, podemos indicar que existe una distribucin heterognea (equitativa) en las categoras de la variable de inters. Por el contrario, si todos los casos estn ubicados en una sola categora podemos indicar que existe una distribucin homognea (desproporcional). El ndice de dispersin cualitativo se expresa de la siguiente manera:

D=
donde:

k [ (n) () ] [ (n) (k-1) ]

D = ndice de dispersin cualitativo k = nmero de categoras = suma de frecuencias cuadradas () de cada categora n = total de casos Tomemos dos (2) municipios de Puerto Rico y analicemos la distribucin de matrimonios conforme los tipos de celebraciones. Segn el cuadro 6.3 podemos observar tanto para el municipio de Loza como para el municipio de Hormigueros la cantidad () de matrimonios celebrados segn el tipo de celebrantes.

190

Arnaldo Torres Degr y Evelyn Afanador Mejas

Cuadro 6.3 Cantidad de matrimonios por tipo de celebracin en Loza y Hormigueros, Puerto Rico: 1993.

Celebrantes Sacerdotes Ministros Juez TOTAL

Loza 8 122 11 141

Hormiguero 30 48 43 121

Fuente: Departamento de Salud de Puerto Rico, 1996. Informe Anual de Estadsticas Vitales de Puerto Rico: 1993. Matrimonios y Divorcios, tabla 5, pg. 331-334.

Para buscar el ndice de dispersin cualitativo necesitamos (ver figura 6.5) elevar la frecuencia () de cada categora al cuadrado ().

Figura 6.5 Procedimiento para obtener la columna ,segn los datos del cuadro 6.3

Loza

Hormiguero

Celebrantes Sacerdotes Ministros Juez TOTAL

8 122 11

64 14,884 121

30 48 43 121

900 2,304 1,849


5,053

141 15,069

Medidas de Dispersin

191

Con la columna de () debidamente elaborada (ver figura 6.5) podemos calcular el ndice de dispersin cualitativo para los dos (2) municipios.

Loza D = 3[ (141) - 15,069 ] [ (141) (3-1)] = 3[ 19,881 - 15,069 ] [ (19,881) (2) ] = 3[ 4,812 ] 39,762 = 14,436 39,762 = .3630602 = .36

Hormiguero D = 3[ (121) - 5,053 ] [ (121) (3-1) ] = 3[ 14,641 - 5,053 ] [ (14,641) (2) ] = 3[ 9,588 ] 29,282 = 28,764 29,282 = .9823099 = .98

Analizando los resultados de los ndices de dispersin para ambos municipios podemos inferir lo siguiente: _ _ En Loza, Puerto Rico para el ao 1993 el ndice de dispersin cualitativa por tipos de celebraciones fue de .36. En Hormigueros, Puerto Rico para el ao 1993 el ndice de dispersin cualitativa por tipos de celebraciones fue de .98. Cuando comparamos los dos (2) municipios observamos que los matrimonios

ocurridos en Hormigueros tienden a ser ms heterogneos conforme a los tipos de celebraciones que los matrimonios ocurridos en el municipio de Loza, Puerto Rico. Si analizamos el cuadro 6.3 podemos notar que los matrimonios ocurridos en Loza,

192

Arnaldo Torres Degr y Evelyn Afanador Mejas

Puerto Rico para el ao 1993 estn mayormente concentrados en el tipo de celebracin con ministros. Para el municipio de Hormigueros, Puerto Rico, para el ao 1993 los matrimonios tienden a distribuirse casi equitativamente entre los tres (3) tipos de celebrantes.

Medidas de Dispersin

193

Ejercicios de ndice de dispersin cualitativa


Favor de identificar las hojas de ejercicios y elaborar todos los problemas segn lo establecido en el texto. Desprenda las hojas de ejercicios y entrguelas al profesor, SI FUESE NECESARIO.

NOMBRE: NUMERO DE ESTUDIANTE:

FECHA: _______________ SECCION: ___________

Ejercicio 6.7 Favor de utilizar los datos que reflejan la cantidad de matrimonios por tipo de celebracin en Villalba, Utuado y Ponce Puerto Rico: 1993.

Villalba

Utuado

Ponce

Celebrantes Sacerdotes Ministros Juez TOTAL

74 14 50

82 116 111

532 360 743

Fuente: Departamento de Salud de Puerto Rico, 1996. Informe Anual de Estadsticas Vitales de Puerto Rico: 1993. Matrimonios y Divorcios, tabla 5, pg. 331-334.

194

Arnaldo Torres Degr y Evelyn Afanador Mejas

[6.7.1] Favor de calcular y analizar el ndice de dispersin de los matrimonios ocurridos en el municipio de Villalba, Puerto Rico para el ao 1993 conforme el tipo de celebracin. Desarrolle las columnas necesarias para completar el ejercicio.

[6.7.2] Favor de calcular y analizar el ndice de dispersin de los matrimonios ocurridos en el municipio de Utuado, Puerto Rico para el ao 1993 conforme el tipo de celebracin. Desarrolle las columnas necesarias para completar el ejercicio.

[6.7.3] Favor de calcular y analizar el ndice de dispersin de los matrimonios ocurridos en el municipio de Ponce, Puerto Rico para el ao 1993 conforme el tipo de celebracin. Desarrolle las columnas necesarias para completar el ejercicio.

Medidas de Dispersin

195

[6.8] Frmulas
Recorrido
R = Vmax - Vmin

Desviacin Estndar para poblacin


() x (x)

=
N

=
N

Arreglos de datos

Datos no agrupados Datos agrupados

Desviacin Estndar para muestras


() x (x)

s=

n n-1
Arreglos de datos

s=

n n-1
Datos no agrupados Datos agrupados

Coeficiente de Variacin
C.V. = s x (100)
muestra

C.V. = (100)
poblacion

ndice de dispersin cualitativa


D= k [ (n) () ] [ (n) (k-1) ]

196

Arnaldo Torres Degr y Evelyn Afanador Mejas

[6.9] Ejercicios Adicionales


Arreglo de datos [6.9.1] Favor de buscar y analizar el recorrido y la desviacin estndar de la nota del primer examen de los atletas de la Universidad Pitirre para el ao 2004 en el curso de primeros auxilios: datos hipotticos 56; 78; 78; 75; 77; 72; 75; 79; 79; 80; 72; 73; 74; 72; 75; 73; 72; 70; 72; 80; 77; 75; 72; 90; 88; 72; 74; 78; 80; 66; 72; 76; 83; 90; 72; 77; 79. [6.9.2] Favor de buscar y analizar el recorrido y la desviacin estndar de la cantidad de horas semanales viendo televisin entre los atletas de la Universidad Pitirre para el ao 2004: datos hipotticos 15; 10; 20; 10; 10; 27; 22; 10; 16; 16; 09; 17; 28; 19; 15; 15; 15; 18; 10; 10; 10; 14; 17; 20; 13; 12; 12; 18; 20; 08; 09; 10; 12; 14; 20; 16; 12. Favor de buscar y analizar el recorrido y la desviacin estndar de la cantidad en dlares por concepto en compra de libros para estudios entre los atletas de la Universidad Pitirre para el ao 2004: datos hipotticos 95; 76; 50; 88; 50; 89; 74; 90; 56; 86; 89; 90; 69; 150; 120; 120; 90; 96; 89; 100; 89; 58; 90; 60; 100; 58; 88; 79; 90; 100; 120; 90; 99; 87; 90; 99; 130.

[6.9.3]

Datos no agrupados [6.9.4] Favor de buscar y analizar el recorrido y la desviacin estndar de la edad de las mujeres menores quienes se les presentaron querellas en Puerto Rico para el ao fiscal 1991-1992, segn los datos registrados en el ejercicio 6.3 de la pgina 169. [6.9.5] Favor de buscar y analizar el recorrido y la desviacin estndar de la edad de las varones menores quienes se les presentaron querellas en Puerto Rico para el ao fiscal 1991-1992, segn los datos registrados en el ejercicio 6.3 de la pgina 169.. Favor de buscar y analizar el recorrido y la desviacin estndar de la edad de todos los menores quienes se les presentaron querellas en Puerto Rico para el ao fiscal 1991-1992, segn los datos registrados en el ejercicio 6.3 de la pgina 169.

[6.9.6]

Datos agrupados [6.9.7] Favor de buscar y analizar el recorrido y la desviacin estndar de la edad por suicidio en Puerto Rico para el ao 1980, segn los datos registrados en el cuadro 4.1 de la pgina 105. [6.9.8] Favor de buscar y analizar el recorrido y la desviacin estndar de la edad por suicidio en Puerto Rico para el ao 1990, segn los datos registrados en el cuadro 4.1 de la pgina 105. Favor de buscar y analizar el recorrido y la desviacin estndar de la edad por suicidio en Puerto Rico para el ao 2000, segn los datos registrados en el cuadro 4.1 de la pgina 105.

[6.9.9]

También podría gustarte