Está en la página 1de 62

Cap tulo 1 Estad stica Descriptiva

1.1.
1.1.1.

Conceptos Generales
Introduccin. o

Este capitulo tiene como propsito establecer el marco de referencia para el estudio de o la estad stica. En el mismo se destacar la importancia y campo de accin de esta. Se a o introducen algunas deniciones bsicas que permiten comprender en forma intuitiva y a real lo que es Estad stica Descriptiva.

1.1.2.

Origen.

Durante mucho tiempo se considero que el campo propio del estudio cient co era exclusivo de fenmenos que bajo las mismas condiciones producen los mismos resultados, o es decir, de fenmenos deterministicos. Sin embargo, aquellos fenmenos o situaciones o o donde est presente la incertidumbre en cuanto a lo que va a ocurrir, es decir, fenmenos a o aleatorios, son de gran importancia y su estudio corresponde a la Estad stica. Algunos 1

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA

ejemplos de fenmenos aleatorios son: o

1. Lanzamiento de un dado. 2. Cantidades vendidas en un Supermercado en d sucesivos. as 3. La duracin de los equipos elctricos en un lote producido por determinada emo e presa

La ciencia Estad stica tiene su origen en las siguientes corrientes histricas: o

1. Recopilacin de datos en forma de Censo. o 2. Juegos de azar. 3. Conocimiento inductivo. Paso de lo particular a lo general.

Estad stica Cuando hablamos de Estad stica, tradicionalmente nos referimos a nmeros presentau dos ordenada y sistemticamente. Esta idea es consecuencia del concepto popular que a existe sobre esta ciencia y que cada vez se extiende ms debido a la inuencia de nuestro a entorno. Sin embargo cuando profundizamos en el campo de la investigacin podemos o entender que la estad stica no solo son nmeros, sino que representa la unica herrau mienta que permite dar luz y obtener informacin en cualquier tipo de investigacin, o o cuyo comportamiento no puede ser abordado desde el punto de vista deterministico. Podr amos decir entonces, que la estad stica es la ciencia que permite determinar como usar la informacin referente a una investigacin y como actuar en situaciones practicas o o donde esta presenta la incertidumbre.

1.1. CONCEPTOS GENERALES

Denicin 1.1 (Estad o stica) Es la ciencia de coleccionar, ordenar, presentar y describir la informacin relativa a un fenmeno en el cual esta presente la incertidumbre o o para su estudio, con el objeto de deducir la ley que rige dicho fenmeno y as poder o tomar decisiones y obtener conclusiones. Para el estudio de un fenmeno, necesitamos o contar con informacin relacionada con el mismo. o Esta informacin obtenida bien sea experimentalmente o, mediante la observacin, esta o o dada por datos. Estos datos son el resultado de medir en un conjunto de elementos o individuos, una o varias caracter sticas a ser analizadas en una investigacin. o Denicin 1.2 (Elemento) Es un ser vivo, objeto o cosa que posee caractersticas o que se desean investigar. En sentido estad stico un elemento puede ser algo con existencia real, como un automvil o una casa, o algo ms abstracto como la temperatura, un voto, o un intervalo o a de tiempo. Denicin 1.3 (Universo Estad o stico) Se denomina universo estad stico a un conjunto nito o innito de seres vivos o cosas, sobre las cuales estn denidas las caraca tersticas que interesan analizar. Ejemplo 1.4 1. Los Habitantes de la ciudad de Mrida. e

2. Los estudiantes de la Facultad de Ciencias Econmicas y Sociales. o 3. Los trabajadores de una empresa. 4. Los animales en un bosque. 5. Los carros que entran en un estacionamiento al da.

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA

Cada elemento del universo tiene una serie de caracter sticas que pueden ser objeto del estudio estad stico. As por ejemplo si consideramos como elemento a una persona, podemos distinguir en ella los siguientes caracteres: Sexo, Edad, Nivel de estudios, Profesin, Peso, Altura, Color del cabello, etc. o Por lo tanto, de cada elemento del universo podremos estudiar uno o ms aspectos a cualidades o caracteres. El universo puede ser segn su tamao de dos tipos: u n Universo nito: cuando el nmero de elementos que la forman es nito, por ejemu plo el nmero de alumnos de un centro de enseanza, o grupo clase. u n Universo innito: cuando el nmero de elementos que la forman es innito, o tan u grande que pudiesen considerarse innitos. Por ejemplo si se realizase un estudio sobre los productos que hay en el mercado. Hay tantos y de tantas calidades que este universo podr considerarse innito. a Denicin 1.5 (Poblacin) Es el conjunto de todas las posibles mediciones que pueo o den hacerse de una caracterstica en estudio de los elementos del universo. Por lo tanto, la poblacin est constituida por valores o datos bien sea numricos o no. o a e Ejemplo 1.6 : 1. El sexo de los habitantes de la ciudad de Mrida e 2. La edad de los estudiantes de la Facultad de Ciencias Econmicas y Sociales. o 3. El sueldo de los trabajadores de una empresa. 4. El color de ojos de los animales en un bosque.

1.1. CONCEPTOS GENERALES 5. La marca de los carros que entran en un estacionamiento al da.

Se puede notar que un Universo puede estar constituido por una o varias poblaciones. Adems, al igual que el universo, la poblacin puede ser nita o innita, dependiendo a o del nmero de valores que la constituyen. En el caso de que la poblacin sea nita, se u o dice que esta tiene tamao N. n Denicin 1.7 (Muestra) Es una parte de una poblacin. o o Ejemplo 1.8 : 1. El sexo de los habitantes de la ciudad de Mrida mayores a 60 aos. e n 2. La edad de los estudiantes de la Facultad de Ciencias Econmicas y Sociales que o tienen un promedio mayor a 15 puntos. 3. El sueldo de los trabajadores de una empresa que son mujeres. 4. El color de ojos de los animales en un bosque que se encontraron en un da. 5. La marca de los carros tipo sedan que entran en un estacionamiento al da. Denicin 1.9 (Parmetro) Es una funcin de los valores de la poblacin que sirve o a o o para sintetizar alguna caracterstica relevante de la misma. Ejemplos de parmetros a son: La media poblacional, La proporcin poblacional, la varianza poblacional, entre o otros. Denicin 1.10 (Estad o stico) Es una funcin de los valores de la muestra que sirve o para sintetizar alguna caracterstica relevante de la misma. Ejemplos de parmetros a son: La media muestral, La proporcin muestral, la varianza muestral, entre otros. o

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA

Como se ha dicho anteriormente, la estad stica se encarga del estudio de un fenomeno a travs del manejo de la informacin que se tiene sobre una o ms caracter e o a sticas del mismo. En el lenguaje estad stico al igual que en el matemtico a las caracter a sticas se les conocen como variables y a las distintas formas en que pueden presentarse, modalidades o valores de las variables. Denicin 1.11 (Variable) Una variable es una caracterstica que poseen los eleo mentos del universo que pueden o no variar entre cada uno de ellos. Ejemplo 1.12 El color de ojos de las personas.

La edad de las personas. El sueldo de un emplead. La raza de los perros. La nota de los alumnos de Mtodos Estad e sticos I. Al conjunto de las modalidades o valores de una variable se le denomina Escala de Medida. Las Escalas de Medida pueden clasicarse de acuerdo a las relaciones que existen entre los valores y las operaciones aritmticas que pueden realizarse entre las e mismas en: Nominal, Ordinal, De Intervalos, De Razn y Absolutas. o 1. Escala Nominal: Son aquellas en que la unica relacin que se dene entre sus o valores es la igualdad o diferencia, es decir solo podemos decir que dos valores de una variable son iguales o diferentes. No hay operaciones aritmticas denidas, e por lo tanto, los nmeros no tienen sentido como magnitudes. u

Ejemplo 1.13

El grupo sangu neo.

1.1. CONCEPTOS GENERALES El sexo. El color de ojos. El estado civil. Los nmeros que llevan los atletas en la espalda u

2. Escala Ordinal: Son aquellas en que entre sus valores estn denidas las relaciones a de igualdad, diferencia, mayor que o menor que, es decir solo podemos decir que dos valores de una variable son iguales, diferentes y en el caso de que sean diferentes se puede establecer un orden entre ellos. No hay operaciones aritmticas e denidas. Ejemplo 1.14 Dureza de los minerales.

Grado de satisfaccin. o Intensidad de un dolor. Rango militar. Nivel de educacin. o 3. Escala De Intervalo: Los valores de las variables son nmeros y entre ellos tienen u sentido las relaciones de igualdad, de orden y de las distancias. La resta es la unica operacin aritmtica denida. Esta escala posee dos propiedades de gran o e importancia. Existe una unidad de medida cuyo signicado se mantiene constante para todos los valores. Posee un cero u origen relativo. El cero no signica ausencia de la caracter stica.

8 Ejemplo 1.15 La temperatura.

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA Puntuacin obtenida en una evaluacin. o o

La distancia sobre el nivel del mar.

4. Escala de Razn o Escala proporcional: Los valores de la variable son nmeros o u y entre ellos tienen sentido las relaciones de igualdad, orden y estn denidas a las operaciones aritmticas de suma, diferencia y proporciones (mltiplos). Estas e u escalas tienen un cero absoluto, el cual representa la ausencia de la caracter stica.

Ejemplo 1.16

El Sueldo de los habitantes del Estado Mrida. e

La edad de los alumnos de Mtodos Estad e sticos I. El nivel de hemoglobina.

5. Escala Absoluta: Los valores que puede tomar la variable son el resultado de un conteo, por lo tanto, esta escala est constituida por todos los nmero enteros a u positivos y el cero.

Ejemplo 1.17

Nmero de accidentes automovilsticos el n de semana. u

Nmero de integrantes de una familia. u Numero de alumnos en un saln de clase. o

Tipos de Variables Las variables se clasican de acuerdo a su escala de medida en cualitativas y cuantitativas.

1.1. CONCEPTOS GENERALES

Denicin 1.18 (Variable Cualitativa) Son aquellas cuya escala de medida es noo minal u ordinal, es decir, na variable es cualitativa si sus valores representan una cualidad o atributo del elemento en estudio. Por ejemplo: El sexo de las personas. El Tipo de sangre. La nacionalidad. El color de los ojos. Denicin 1.19 (Variable Cuantitativa) Hablamos de variables cuantitativas cuano do los valores posibles son cantidades numricas con las que podemos hacer operaciones e aritmticas. Es decir, son aquellos cuya escala de medidas es de intervalos, proporcional e o absoluta. Por ejemplo: El Sueldo de los habitantes del Estado Mrida. e La edad de los alumnos de Mtodos Estad e sticos I. Nmero de integrantes de una familia. u Las variables cuantitativas pueden dividirse en discretas y continuas. Denicin 1.20 (Variables Cuantitativas Discretas) Son aquellas formadas por o un conjunto numerable de puntos, es decir, se puede establecer correspondencia entre los valores que puede tomar la variable y el conjunto de los nmeros reales, por lo u tanto, son variables que no admiten valor alguno entre dos valores consecutivos de las mismas. Por ejemplo:

10

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA La edad en aos de los alumnos de Mtodos Estad n e sticos I. Nmero de integrantes de una familia. u Nmero de pares de zapatos que compran las mujeres al mes. u

Denicin 1.21 (Variables Cuantitativas Continuas) Son aquellas formadas por o un conjunto numerable de puntos, es decir, se puede establecer correspondencia entre los valores que puede tomar la variable y el conjunto de los nmeros reales, por lo u tanto, son variables que no admiten valor alguno entre dos valores consecutivos de las mismas. Por ejemplo: La edad en aos de los alumnos de Mtodos Estad n e sticos I. Nmero de integrantes de una familia. u Nmero de pares de zapatos que compran las mujeres al mes. u Clasicacin de la Estad o stica La Estad stica puede clasicarse de acuerdo a su funcin en el tratamiento de los datos o en estad stica descriptiva y estad stica inferencial. Denicin 1.22 (Estad o stica Descriptiva) Denominada tambin Estad e stica Deductiva. Es la encargada de describir, analizar y representar un conjunto de datos, utilizando mtodos numricos, tablas y grcos que resumen y presentan la informae e a cin contenida en ellos. Puede llevarse a cabo sobre una muestra o sobre toda una o poblacin. o Denicin 1.23 (Estad o stica Inferencial) Denominada tambin Inferencia Estadstie ca o Estad stica Inductiva. Es la que apoyndose en la Teora de Probabilidades y la a

1.2. ESTAD ISTICA DESCRIPTIVA

11

Teora del Muestreo, se encarga de efectuar estimaciones, permitir la toma decisiones, predicciones u otras generalizaciones sobre una poblacin partiendo del estudio de una o muestra. La estad stica descriptiva e inductiva pueden ser usadas separadas o conjuntamente. Lo usual es que en una investigacin participen las dos. o

1.2.
1.2.1.

Estad stica Descriptiva


Introduccin. o

Esta seccin tiene como propsito principal, introducir tcnicas que permitan tanto o o e matemtica como grcamente describir apropiadamente un conjunto de datos. a a

Al nalizar el tema, el estudiante debe estar en capacidad, una vez coleccionados los datos, de: Ordenarlos y clasicarlos Presentarlos a travs de cuadros estad e sticos y grcos a Calcular medidas descriptivas numricas y e Analizar la informacin obtenida en los pasos anteriores. o

1.2.2.

Organizacin de los Datos o

La organizacin de los datos consiste en una agrupacin apropiada de los mismos. Es o o importante dicha agrupacuin, ya que por lo general la informacin obtenida de un o o

12

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA

estudio implica gran cantidad de datos que no es fcil interpretar directamente. Esta a organizacin depende, como dijimos en la seccin anterior, del tipo de variable que o o se maneje. Por lo tanto, vamos a estudiar como se realiza la agruapacin cuando la o variable es cualitativa y cuando es cuantitativa.

Organizacin de Datos Cualitativos o Cuando los datos son cualitativos, la organizacin consiste en la construccin de una o o tabla, la cual contendr la enumeracin de las distintas modalidades que presenta la a o variable, el nmero de datos que corresponde a cada modalidad (frecuencia absoluta, u ) y la proporcin que cada uno de ellos representa con respecto al total (frecuencia o relativa, fri ). Esta tabla recibe el nombre de Tabla de Frecuencia. La tabla 1 muestra la estructura de una tabla de frecuencias para datos cualitativos.

Tabla 1. Tabla de Frecuencias para datos cualitativos Modalidades 1 2 . . . k donde


k

fi f1 f2 . . . fk

f ri f r1 f r2 . . . f rk

fi = n: representa el nmero total de datos. u


i=1 k

f ri =

fi n

y debe cumplirse que


i=1

f ri = 1

1.2. ESTAD ISTICA DESCRIPTIVA

13

Ejemplo 1.24 A continuacin se muestran los resultados obtenidos al aplicar una eno cuesta a 50 estudiantes de FACES donde se les pregunt sobre la carrera que estudiaban: o C E C C A E A C A C ES A A C ES C E C C A E E E C A A A C A C A C C E C C C ES A A A C A C C C A E

C C donde

A: Administracin o C: Contadura E: Econom a ES: Estad stica La variable en este ejemplo es la carrera que estian las personas, la cual es cualitativa de escala nominal, dicha variable presenta cuatro modalidades representadas por A,E,C y ES. Por lo tanto, al organizar los datos en una distribucin de frecuencia se o tiene que: Tabla 2. Distribucin de frecuencia de las carreras que se estudian en FACES o Carrera fi f ri 0.32 0.46 0.16 0.06

Administracin 16 o Contadura Econom a Estad stica 23 8 3

14

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA

La tabla anterior es utilizada cuando se est estudiando una variable. Para el caso a de dos variables, se usan comunmente las llamadas tablas de doble entrada o tablas de contingencia, pues las mismas permiten agrupar el numero de observaciones que cumplen con con las dos modalidades. Tabla 3. Tabla de Contingencia Variable B B1 B2 . . . Bk hhh A1 A2 . . .

Totales

Ak Totales

Organizacin de Datos Cuantitativos o Si los datos son cuantitativos, usamos un procedimiento similar al utilizado con los datos cualitativos, excepto, que es ms laborioso. En este caso la tabla de frecuencias a contiene los siguientes elementos: Intervalos de Clase: El intervalo total en que estn repartidas las observaciones a es dividido en intervalos parciales. A estos intervalos se les denomina intervalos de clase o, simplemente clases. L mites de Clase: Extremos de los intervalos de clase. Al menor de estos valores se le llama l mite inferior y al mayor, limite superior. Marcas de Clase (mi ): Punto medio o centro de intervalo. Es una forma abreviada de representar el intervalo.

1.2. ESTAD ISTICA DESCRIPTIVA

15

Frecuencia Absoluta (fi ): Nmero de observaciones contenidas o incluidas en u una clase. Frecuencia Relativa (f ri ): Proporcin de los datos contenidos en la clase. Se o obtiene al dividir la frecuencia absoluta entre el nmero total de observaciones. u Frecuencia Absoluta Acumulada (Fi ): Suma de frecuencias absolutas hasta la clase correspondiente. Frecuencia Relativa Acumulada (F ri ): Suma de las Frecuencias Relativas hasta la clase correspondiente. Se pueden obtener dividiendo la frecuencia absoluta acumulada entre el nmero total de observaciones. u Nota: En el caso discreto, cuando el nmero de valores diferentes que puede tomar la u variable es pequeo, entonces cada uno de ellos representa una clase. De esta forma n las marcas de clase coinciden con las clases. Lo mismo es valido en el caso continuo, cuando el nmero de datos es pequeo. u n Para construir una tabla o distribucin de frecuencias, en el caso de variables cuantio tativas debemos seguir el siguiente procedimiento: 1. Obtener los extremos del intervalo total (Vmax y Vmin). 2. Obtener el rango o recorrido de la variable, R = Vmax - Vmin. 3. Determinar el nmero de clases y la amplitud de las mismas.Para determinar el u nmero de clases no existe una regla ja. Una primera aproximacin es tomar u o

K = N de clases =

Esta aproximacin no siempre es conveniente, sobre todo cuando n es grande. o

16

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA Existe una frmula para calcular el nmero ptimo de clases, denominada frmula o u o o de Stugers

K = 1 + 3,3 log n Cuando particionamos los datos en clases, es generalmente recomendado usar entre 5 y 15 clases. Fuera de estos extremos, la organizacin resulta poco eciente. o Una vez que hemos decidido en cuanto al nmero de clases, la amplitud de las u clases, es simplemente

A=

R K

Esto nos permite en resumen, particionar los datos en K clases, cada una con amplitud A. Es importante hacer notar que, no siempre es posible contar con clases de igual amplitud. Si la amplitud de los intervalos no es constante, debemos corregir entonces las frecuencias, dividiendo las mismas por la amplitud del intervalo. 4. Construir los Intervalos de Clase: Para construir la primera clase, seleccionamos como un l mite inferior el valor m nimo (Vmin). El limite superior se obtiene al sumarle al limite inferior la amplitud, A. Para la segunda clase se tiene que el limite inferior es el limite superior de la primera clase y el limite superior, resulta de sumarle a este, A. Siguiendo este procedimiento construimos las k clases. Como el limite superior de una clase representa el limite inferior de la clase

1.2. ESTAD ISTICA DESCRIPTIVA

17

siguiente, conviene considerar las clases como intervalos del tipo [Linf - Lsup); esto es, intervalos cerrados por la izquierda y abiertas por la derecha.

5. Calcular las marcas de clase (mi ): Las marcas de clase estan representadas por los puntos medios de los intervalos de clase, es decir,

mi = LSi LIi

6. Obtener las frecuencias absolutas, relativas, absolutas acumuladas y relativa acumulada. La tabla 3 muestra la estructura de una tabla de frecuencias para datos cuantitativos

Tabla 4. Tabla de Frecuencias para datos cuantitativos Clases [li1 ls1 ) [li2 ls2 ) . . . [lik lsk ) mi m2 m2 . . . mk fi f1 f2 . . . fk f ri f ri f ri . . . f ri Fi F ri F ri . . . F ri F ri F ri F ri . . . F ri

Ejemplo 1.25 A continuacin se muestra la informacin sobre el nmero de o o u hijos que tienen 40 Mujeres extraidas al azar de la ciudad de Mrida. e

Tabla 5. Nmero de Hijos u

18

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA 1 1 1 2 2 1 4 0 2 3 3 3 2 4 1 3 3 2 2 2 4 3 3 0 4 1 3 4 4 4 4 1 1 3 4 4 5 2 1 2

Antes de organizar los datos en una distribucin de frecuencia, observemos que o la variable es disreta y adems posee pocos valores diferentes, pues su rango esta a dado por {0, 1, 2, 3, 4, 5}. Entonces las clases de la distribucin de frecuencia estan o dadas por los valores individuales de la variable. A continuacin se muestra se o muestra dicha tabla:

Tabla 6. Distribucin del N de Hijos que tienen 40 Mujeres extraidas al azar de o la ciudad de Mrida. e

N deHijos fi Fi f ri 0 2 0,050 2 1 9 0,225 11 2 9 0,225 20 3 9 0,225 29 4 10 0,250 39 5 1 0,025 40

F ri 0,050 0,275 0,500 0,725 0,975 1

Donde se observa que gran parte de las mujeres estudiadas tiene de 1 a 4 hijos de manera bastante uniforme.

Ejemplo 1.26 Se tienen los siguientes datos correspondientes a la edad de 40 estudiantes de FACES.

1.2. ESTAD ISTICA DESCRIPTIVA 30 28 30 31 18 28 35 19 24 27 22 34 27 32 19 28 28 19 20 26 34 20 25 21 26 32 29 30 30 27 32 21 34 31 29 23 30 32 19 34

19

Tabla 7. Edad de 40 estudiantes de FACES

Si organizamos los datos en una distribucin de frecuencia cuyas clases son vao lores individuales obtenemos lo siguiente:

Tabla 8. Distribucin de fracuencia de las edades en clases individuales. o N deHijos 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 34 35 fi 1 4 2 2 1 1 1 1 2 3 4 2 5 2 4 4 1 Fi f ri 0,025 1 0,100 5 0,050 7 0,050 9 0,025 10 0,025 11 0,025 12 0,025 13 0,050 15 0,075 18 0,100 22 0,050 24 0,125 29 0,050 31 0,100 35 0,100 39 0,025 40 F ri 0,025 0,125 0,175 0,225 0,250 0,275 0,300 0,325 0,375 0,450 0,550 0,600 0,725 0,775 0,875 0,975 1

Esta agrupacin de los datos es poco eciente ya que la variable edad posee muchos o valores diferentes (modalidades), lo que conlleva a no ser de fcil interpretacin. a o

20

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA Para mejorar la organizacin de los datos, es necesario considerar a las clases o como intervalos, tal como se describe a continuacin: o

a) Identicacin de los valores extremos del intervalo total. o

V max = 35 y V min = 18

b) Calculo del Rango.

R = V max V min = 35 18 = 17 c) Determinacin del Nmero de Clases (K) y de la amplitud de las clases (A) o u Para determinar el nmero de clases se usa la regla de Sturges, obteniendose: u

K = 1 + 3,3 log(n) = 1 + 3,3 log(40) = 6,28 Por lo tanto se deben tener aproximadamente 6 clases. La amplitud de las clases est dada por: a

A=

17 R = = 2,7 K 6,28

lo cual se puede aproximar a 3, ya que, se ha asumido que la variable edad es discreta. d) Construccin de los intervalos de clases. o El primer intervalo se construye utilizando como limite inferior el valor m nimo de los datos, en este caso 18, y el limite superior se obtiene al

1.2. ESTAD ISTICA DESCRIPTIVA

21

sumarle la amplitud (A) al limite inferior, es decir, 18 + 3 =21. Por lo tanto el primer intervalo es [18 21). El segundo intervalo tiene como limite inferior el limite superior de la clase anterior, es decir, 21, y el limite superior se obtiene al sumrle la amplitud al limite inferior, es decir, 21+3=24. Por lo tanto el segundo intervalo es [21 24). Los dems intervalos se obtienen de manera similar al segundo intervaa lo. El ultimo intervalo construido debe contener al valor mximo. a e) Los intervalos de clases obtenidos al seguir el procedimiento anterior son: [18 - 21) [21 - 24) [24 - 27) [27 - 30) [30 - 33) [33 - 36) f) Calculo de las marcas de clase: La marcas de clase para cada una de los intervales de clases se muestran a continuacin o Clase Marca de Clase 18+21 [18 21) = 19,5 2 21+24 [21 24) = 22,5 2 24+27 [24 27) = 25,5 2 27+30 [27 30) = 28,5 2 30+33 [30 33) = 31,5 2 33+36 [33 36) = 34,5 2

g) Calculo de las frecuencias absolutas y relativas.

22

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA Las frecuencias absolutas (fi ) representan el numero de observaciones que se encuentran en el intervalo, para el primer intervalo de clase la frecuencia absoluta (f1 ) es 7, esto quiere decir que hay 7 estudiantes con edades mayores o iguales a 18 aos pero con edad menor a 21 aos. n n Las frecuencias relativas (f ri ) se obtienen al dividir la frecuencia absoluta entre el numero de observaciones, para el primer intervalo de clase f r1 =
7 40

= 0,175. donde 40 es el nmero de observaciones. u

Las frecuencias acumuladas (fi ) se obtienen al sumar las frecuencias absolutas de esa clase con las anteriores. En este caso, la frecuencia acumulada del tercer intervalo de clase es F3 = f1 +f2 +f3 = 7+4+4 = 15 Las frecuencias relativas acumuladas (F ri ) se obtienen al sumar las frecuencias relativas de esa clase con las anteriores. En este caso, la frecuencia relativa acumulada del tercer intervalo de clase es F r3 = f r1 + f r2 + f r3 = 0,175 + 0,100 + 0,100 = 0,375. Otra manera de obener esta valor es dividir la frecuencia acumulada entre el numero de observaciones, F r3 =
15 40

= 0,375

La distribucin de frecuencia est dada en la siguiente tabla: o a

Tabla 9. Distribucin de frecuencia de las edades de 40 estudiantes. o

Esta tabla presenta los datos de manera mas resumida que la tabla 8, lo cual la hace ms fcil de interpretar. Por ejemplo, se puede decir que el 50 % de los a a estudiantes tienen edades entre 27 y 30 aos. n

1.2. ESTAD ISTICA DESCRIPTIVA Edad fi Fi f ri [18 21) 7 0,175 7 [21 24) 4 0,100 11 [24 27) 4 0,100 15 [27 30) 9 0,225 24 [30 33) 11 0,275 35 [33 36) 5 0,125 40 F ri 0,175 0,275 0,375 0,600 0,875 1

23

1.2.3.

Presentacin Grca o a

En la seccin anterior se discuti como resumir un conjunto de datos procedentes de o o una determinada poblacin. Este mtodo tiene como objetivo fundamental facilitar la o e comprensin y anlisis de ese conjunto y el resumen puede ser representado grcao a a mente, lo que permite esclarecer aun ms las caracter a sticas asociadas con la poblacin. o El uso de grcos permite captar rpidamente las caracter a a sticas fundamentales de los datos. Existe una gran variedad de grcos y la seleccin apropiada de algunos de ellos para a o la representacin de la informacin depender, entre otras cosas, del tipo de datos, la o o a preferencia e inters del investigador. La tabla 10 muestra los grcos ms apropiados e a a de acuerdo al tipo de variable. Tabla 10. Tipos de Grcos de acuerdo al tipo de variable a Variable Cualitativa Ordinal Cuantitativa Curvas, Barras, sectores Curvas (tipo cronolgico), histograma, diagrama de o l nea, pol gono de frecuencias, ojiva 1. Grcos para Variables Cualitativas a Escala Grco a

Nominal Barra, sectores

24

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA Diagrama de Barras: Graca que representa en el eje de las abcisas (X), las distintas categor de la variable y en eje de las ordenadas (Y), la freas cuencia absoluta o la frecuencia relativa asociada con cada categor A cada a. categor se le asocia una barra vertical cuya longitud es proporcional a la a frecuencia ( bien sea absoluta o relativa). Puede ser usado para comparar poblaciones.
fi

C1

C2

C3 Clases

C4

Ck

Figura 1.1: Grco de Barras a

Ejemplo 1.27 El diagrama de barras para el ejemplo 1.24 es: Pictogramas: se usan para hacer mas llamativas la representacin. En lugar o de barras, para gracar las frecuencias, se usan dibujos alusivos al tema de estudio. Cada dibujo representa un nmero determinado de unidades, por u lo tanto, debe repetirse tantas veces como sea necesario para reejar una magnitud determinada. Otra forma es representando en diferentes escalas un mismo dibujo donde las reas son proporcionales a la frecuencia. a Diagrama de Sectores: llamado tambin grco de torta. Consiste en e a dividir el circulo en tantos sectores como categor tenga la variable y donde as

1.2. ESTAD ISTICA DESCRIPTIVA

25

Estudiantes

0 Admon

10

15

20

25

Cont

Econ

Est

Carrera

Figura 1.2: Distribucin de las carreras de FACES o a cada sector se le corresponde una rea proporcional a la frecuencia absoluta a o relativa asociada con la modalidad que representa.

26

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA

C4

C3

C2

C1

Figura 1.3: Pictograma


fi

Clases

Figura 1.4: Fig.1. Ejemplo 1.28 El diagrama de sectores para el ejemplo 1.24 es: 2. Grcos para Variables Cuantitativas: a a) Grcos a utilizar cuando las clases son valores individuales: a Diagrama de L neas: para representar grcamente una variable de a tipo cuantitativo y cuyas clases son valores individuales, se usa el diagrama de l neas el cual se construye colocando en el eje de las abcisas los valores de la variable y en el eje de las ordenadas, la frecuencia absoluta

1.2. ESTAD ISTICA DESCRIPTIVA

27

C E

ES

Figura 1.5: Distribucin de las carreras de FACES o o relativa. Para cada valor se traza una l nea recta vertical cuya altura es igual a la frecuencia absoluta o relativa asociada con ese valor.
fi

C1

C2

C3 Clases

C4

Ck

Figura 1.6: Diagrama de L neas

Ejemplo 1.29 El diagrama de l nea para el ejemplo 1.25 es: Diagrama Escalonado o de Frecuencias Acumuladas: por la naturaleza de la variable, tiene forma de escalera. Cada escaln correso ponde al paso de un valor de la variable a otro (al siguiente). Para su construccin se colocan en el eje de las X los valores de las variables y o

28

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA

10

Nmero de Hijos

Figura 1.7: Distribucin del nmero de hijos por familia o u en el eje de las Y las frecuencias acumuladas. La frecuencia acumulada de cada valor se representa con una l nea horizontal que va desde ese valor hasta donde se seala el siguiente. n
Fi

C1

C2

C3

C4 Clases

Ck

C6

C7

Figura 1.8: Fig.1.

Ejemplo 1.30 El diagrama escalonado para el ejemplo 1.25 es: b) Grcos a utilizar cuando las clases son intervalos: a Los grcos que a continuacin se discuten son usados exclusivamente con a o datos cuantitativos agrupados en distribuciones de frecuencias cuyas clases

1.2. ESTAD ISTICA DESCRIPTIVA

29

40 35 30 25 20 15 10 5

Nmero de Hijos

Figura 1.9: Distribucin del nmero de hijos por familia o u son intervalos. Histograma de Frecuencias: es un diagrama de barras con la caracter stica que las barras estn juntas unas de otras. Se obtiene construa yendo sobre cada intervalo de clase de la variable, un rectngulo cuya a rea es proporcional a la frecuencia correspondiente al intervalo, como a se muestra en la gura
fi

Li1

Li2

Li3

Li4

Li5

LIk-1

Lik

Clases

Figura 1.10: Fig.1. Si deseamos comparar histogramas, la forma apropiada de construirlas es utilizando las frecuencias relativas y haciendo la altura de cada

30 barra igual a hi =

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA


f ri Ai

donde Ai es la amplitud de la clase i, cuando

A1 = A2 = . . . = Ak entonces hi coincide con fi o f ri .

Ejemplo 1.31 El histograma para el ejemplo 1.26 es:

Frecuencia

10

20

25

30

35

Edad (aos)

Figura 1.11: Distribucin de las Edades de los estudiantes de FACES o

Pol gono de Frecuencia: Consiste en unir mediante l neas rectas los puntos del histograma que corresponden a los puntos medios. Para representarlo en el primer y ultimo intervalo, suponemos que adyacentes a ellos existen otros intervalos de la misma amplitud y frecuencia cero y se unen por una l nea recta los puntos del histograma que corresponden a sus puntos medios. Ojiva o Pol gono de frecuencias acumuladas: para su construccin o se usan los limites superiores de la clase y las frecuencias acumuladas (relativas o absolutas) de la clase. Para cada l mite superior de la clase se indica con un punto su correspondiente frecuencia acumulada, lue-

1.2. ESTAD ISTICA DESCRIPTIVA


fi

31

m0

m1

m2

m3

m4

mk-1

mk

mk+1 Clases

Figura 1.12: Poligono de Frecuencia go estos puntos se unen mediante segmentos de recta obtenindose as e , una curva no decreciente. Los limites superiores se ubican en el eje de abcisas y las frecuencias acumuladas en eje de las ordenadas. Tambin e se ubica el limite inferior de la primera clase, al cual se le asigna frecuencia acumulada igual a cero. Cuando el grco es construido usando a las frecuencias relativas acumuladas, se le denomina Ojiva Porcentual.

Fi

Li1

Li2

Li3

Li4

Li5

... LIk-1

Lik

Clases

Figura 1.13: Ojiva

Ejemplo 1.32 La ojiva para el ejemplo 1.26 se muestra en la siguiente gura. La Ojiva puede ser usada para calcular grcamente el nmero o pora u

32

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA

40

30

20

10

18

21

24

27

30

33

36

Edad (Aos)

Figura 1.14: Distribucin de las Edades de los Estudiantes de FACES o

centaje aproximado de datos que son menores o, mayores e igual que un valor determinado. Si queremos conocer el nmero de datos que es u inferior a X0 , simplemente ubicamos en el eje de las abcisas a X0 y luego proyectamos una l nea perpendicular hasta la Ojiva. Desde all se traza una l nea paralela al eje de las abcisas y el punto, digamos F0 , donde esta l nea corta al eje de las ordenadas representa el nmero a u calcular.

o El valor F0 puede ser calculado algebraicamente mediante interpolacin. Supongamos que se desea calcular el nmero de valores que son menores u a a X0 . Supongamos adems que X0 esta incluido en la clase [LIr LSr ), la cual tiene frecuencia absoluta acumulada igual a Fr . Entonces F0 se obtiene al resolver la ecuacin: o F0 Fr1 X0 LIr = LSr LIr Fr Fr1 donde Fr1 representa la frecuencia absoluta acumulada de la clase an-

1.2. ESTAD ISTICA DESCRIPTIVA terior a la que contiene a X0 .


Fi

33

F0

Lir

X0

Lsr

Clases

Figura 1.15: Fig.1. De igual manera, podemos calcular mediante la ojiva aquel valor X0 , tal que un nmero o porcentaje de datos dado, sea menor o mayor que u el. Esto se logra simplemente realizando el procedimiento anterior en sentido opuesto. 3. Grcos Especiales a Hay grcos o diagramas que se utilizan con gran frecuencia que no hemos cona siderado hasta ahora por no encontrarse enmarcados en la calicacin anterior. o Diagrama de Dispersin: Grco de especial utilidad para analizar la o a relacin entre dos variables. Se construye ubicando en el eje de las abcisas o los valores de la variable X y en el eje de las ordenadas los valores de la variable Y.

Diagrama de Causa - Efecto: Son representaciones gracas que permiten identicar las posibles causas asociadas a un problema (efecto) estructuradas segn una serie de factores genricos. Reciben tambin el nombre de u e e

34

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA Diagrama de espina de pescado, Diagrama de r o Diagrama de Ishio. kawa.

Graco de Pareto: Son diagramas de barras, donde estas se representan en orden descendente en altura. De esta forma, la barra mas alta corresponde a la modalidad de mayor frecuencia. Esta representacin permite ubicar o las modalidades mas relevantes por su frecuencia.

Diagrama de Tallo y Hoja de Tukey: Tcnica que permite clasicar los e datos sin perder precisin, cuando el nmero de datos no es muy grande. o u

Diagrama de Caja: Grco que describe la distribucin de un conjunto a o de datos mediante el uso de los cuartiles como medida de posicin y el rango o intercuart lico como medida de dispersin. Representa una de las principales o alternativas en el Anlisis Exploratorio de Datos. Son especialmente utiles a si se desea comparar la distribucin de dos o ms grupos de datos. o a

1.2. ESTAD ISTICA DESCRIPTIVA

35

1.2.4.

Medidas Descriptivas Nmericas u

En la seccin anterior examinamos algunas tcnicas que permiten describir visualmente o e un conjunto de datos, es decir, procedimientos que ofrecen una idea cualitativa de las caracter sticas de un conjunto de datos. El propsito de esta seccin es el de introducir o o tcnicas que permitan la descripcin desde el punto de vista matemtico. e o a

Al concluir esta seccin debemos estar en la capacidad de denir y usar las principales o medidas de tendencia central, las medidas de posicin , las medidas de dispersin, las o o medidas de forma (Asimetr y Curtosis) de un conjunto de datos y las tcnicas para a e manipular distribuciones de frecuencias as como tcnicas de codicacin especial. e o Denicin 1.33 (Medidas Descriptivas) Son cantidades que de manera resumida o proveen informacin acerca de caractersticas importantes de un conjunto de datos. o Las medidas descriptivas las podemos clasicar de acuerdo a lo que se mide en los siguientes tres grupos: Medidas de localizacin, medidas de dispersin y medidas de o o forma. 1. Medidas de Localizacin o Tambin conocidas como medidas de tendencia central, son parmetros alrededor e a de los cuales se distribuyen los datos de la distribucin y se toman como el centro o de la misma. Algunas medidas de tendencia central son la media, la mediana y la moda. a) La Media. Es la medida de tendencia central ms popular. Existen distintos a tipos de medias:

36

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA Media Aritmtica. La media aritmtica de una variable es simplee e mente el promedio de los datos. Su clculo depende si los datos estn o a a no agrupados en una distribucin de frecuencia. o Para datos no agrupados, la media aritmtica est dada por: e a
n

xi x= donde xi representa la i-esima observacin. o el nmero de observaciones u Para datos agrupados en tablas de frecuencias, su frmula de clculo o a es:
i=1

x =

xi fi
i=1 n k

clases individuales;

mi fi
i=1 n

, clases en intervalos.

Cuando las clases son valores individuales, el valor de la media es exacto, mientras que cuando son intervalos existe una perdida de precisin o ya que se supone que todos los valores dentro de una clase son iguales al punto medio de la misma. Esta prdida de precisin es sin embargo e o despreciable.

1.2. ESTAD ISTICA DESCRIPTIVA

37

La media de una serie de datos representa el centro de gravedad o punto de equilibrio de esos datos.

La media aritmtica es fcil de obtener y explicar y tiene varias propiee a dades matemticas que hacen mas ventajosos su uso que el de las otras a medidas de tendencia central.

Propiedades: La suma de los desv de los datos con respecto a su media es nula: os
n

(xi x) = 0
i=1

Para cualquier valor k que consideremos:


n n

(xi x) <
i=1 n i=1

(xi k)2

es decir
i=1

(xi x)2 es un m nimo.

Si todos los datos son iguales a un valor constante c, entonces:

x=c Si y = a + bx y = a + bx para a, b IR; Dados r diferentes grupos de datos de tamao n1 , n2 , ..., nr , con men dias x1 , x2 , ..., xr , entonces la media de los n = n1 + n2 + ... + nr datos es:

38

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA

x=

n1 x1 + n2 x2 + ... + nr xr n

Si a cada uno de los datos x1 , x2 , ..., xk cuya media es x se le suma una constante k, entonces se obtiene una nueva coleccin de datos: o o a: x1 + k, x2 + k, ..., xn + k y la media de esta nueva coleccin ser x+k Si cada uno de los datos x1 , x2 , ..., xk cuya media es x se multiplica por una constante k, entonces se obtiene una nueva coleccin de o o a: datos: x1 k, x2 k, ..., xn k y la media de esta nueva coleccin ser xk

Ventajas

Las principales Ventajas son: Toma en cuenta todos los datos. Fcil de calcular y de operar algebraicamente. a A medida que la distribucin sea mas simtrica mayor ser la aproo e a ximacin entre el valor medio de los datos no agrupados y el valor o medio de los datos agrupados.

Desventajas

Sus principales desventajas son: Es sensible a valores extremos. No ofrece siempre una buena aproximacin cuando las distribuciones o

1.2. ESTAD ISTICA DESCRIPTIVA son asimtricas. e

39

No se puede calcular para tablas de frecuencias con intervalos de clases abiertas.

Media Aritmtica Ponderada: Existen situaciones en las que a los e valores de la variable se le asigna un peso, ponderacin o importancia. o Es decir, existen situaciones en las que los valores de una variable estn a afectadas por un factor que las modica. A este factor se le conoce con el nombre de ponderacin y, debe ser considerada al momento de calcuo lar la media aritmtica de esos valores. La media aritmtica calculada e e considerando esa ponderacin recibe el nombre de Media Aritmtica o e Ponderada y se dene de la siguiente manera:
n

xi pi x=
i=1 n

pi
i=1

donde o o pi representa la ponderacin de la i-esima observacin. Obsrvese que si los datos estn agrupados en una tabla de frecuencia, e a su media aritmtica es un caso particular de la media aritmtica pone e derada con f1 , f2 , ..., fk como ponderaciones.

Media Geomtrica e n

xG =

x1 x2 ...xn

40 Media Armnica o

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA

xa =

x2 + x2 + ... + x2 1 2 n n

b) La Mediana: La mediana de un conjunto de datos es el valor del centro de los datos, una vez que los mismos sean ordenados de menor a mayor. Esto es, la mediana es aquel valor por debajo (encima) del cual se encuentra el 50 % de los datos.

Al igual que la media el calculo de la mediana depende de si los datos estan o no agrupados en una distribun de frecuencias. o Para datos no agrupados, la mediana es el valor central del conjunto ordenado , mientras que cuando el nmero de datos es par, la medina u es el promedio de los valores centrales del conjunto ordenado, es decir:

Md =

x(n+1)/2 ,

xn/2 +Xn/2+1 , 2

si n es par; si n es impar.

Para datos agrupados en tablas de frecuencias. Si los datos estn agrupados en tablas de frecuencias y las clases a son valores individuales, el procedimiento es el siguiente: 1) Se calcula n/2. 2) Si n/2 coincide con Fa , la mediana es el promedio de ese valor de la variable y el siguiente. 3) Si n/2 no coincide con Fa , ubicamos aquella frecuencia acumulada

1.2. ESTAD ISTICA DESCRIPTIVA

41

que contiene a n/2 y la mediana es su correspondiente valor de variable. Si los datos estn agrupados en tablas de frecuencias y las clases a son intervalos, la mediana viene dada por: n/2 Fam am fm

md = LIm +

El procedimiento para su calculo es: 1) Calcular n/2. 2) Ubicar la clase cuya frecuencia acumulada es igual o superior a n/2. A esta clase se le llama clase medianal. 3) Identicar los elementos de la frmula anterior: o Fam Frecuencia Acumulada de la clase anterior a la medianal. Am Amplitud de la clase medianal. LIm Limite inferior de la clase medianal. fm Frecuencia absoluta de la clase medianal.

Calculo de la Mediana gracamente

La mediana puede ser calculada grcamente mediante el uso de la Ojiva. a El procedimiento es: 1) Localizamos 50 % en el eje de las ordenadas. 2) Desde este punto trazamos una l nea paralela al eje de lasa abcisas hasta cortar la ojiva.

42

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA 3) Desde este punto de interseccin trazamos una l o nea paralela al eje de las ordenadas hasta cortar el eje de las abcisas. Este punto de corte es la mediana.

Propiedades de la Mediana

No se ve afectada por observaciones extremas. Es de clculo rpido y de interpretacin sencilla. a a o Es funcin de los intervalos escogidos. o Puede calcularse en el caso de las clases abiertas. Su mayor defecto es las propiedades matemticas que posee. a Para cualquier conjunto de datos, la mediana es el valor mas cercano o
n

prximo a todos ellos. Esto es, o


i=1

|xi Md | es un m nimo.

c) La Moda: Es el valor ms comn entre los datos. a u Si las clases son valores individuales entonces la moda es el valor o los valores que posee(n) la(s) mayor(es) frecuencia(s) absoluta(s). Si los datos estn agrupados en tablas de frecuencias y las clases son a intervalos, la moda viene dada por: 1 Ao 1 + 2

Mo = LIo + donde:

LIo = Limite inferior de la clase con mayor frecuencia absoluta (clase modal).

1.2. ESTAD ISTICA DESCRIPTIVA

43

1 = Frecuencia absoluta de la clase modal - Frecuencia absoluta de la clase Pre - modal. 2 = Frecuencia absoluta de la clase modal - Frecuencia absoluta de la clase Post - modal. Ao = Amplitud modal.

Propiedades: Es muy fcil de calcular. a No es susceptible de operaciones algebraicas. Es la unica medida que puede ser usada para datos cualitativos. Es una medida muy imprecisa e inestable. Puede no ser unica. No siempre es una medida de tendencia central.

Cul Medida es Mejor a

La moda tiene como principal ventaja sobre el resto de medidas de tendencia central su aplicabilidad en todas las escalas de medida. Si el tamao muesn tral no es bastante grande, la moda no es una medida conable. La mediana por su lado, es una medida excelente para representar el nivel caracter stico o representativo de los datos. Es una medida ms conable que la moda. La a media tiene un error de muestreo menor que las medidas anteriores, por lo tanto es la ms conable de las tres. a

44

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA Para nes descriptivos, la mediana es la medida de tendencia central preferida mientras que para nes inferenciales, la media es la de mayor uso.

En la tabla 11 se muestran las distintas medidas de posicin y tendencia o central clasicadas de acuerdo al tipo de datos.

Tabla 11. Medidas de Posicin y Tendencia Central o

Variable Cualitativa

Escala

Medida de Localizacin o

Nominal Moda Ordinal Cuantitativa Mediana, Moda Media, Mediana y Moda

Adems del tipo de escala de medida, existen otros factores que deben cona siderarse en la seleccin de la medida a utilizar en cada caso. La naturaleza o de la distribucin de los datos, aspecto que interesa reejar, presencia de o valores extremos y alcance del estudio, son algunos de estos aspectos.

2. Medidas de Dispersin. o Son medidas que permiten medir el grado de agrupacin o disgregacin en un o o conjunto de datos. Esto es, permiten determinar si los valores estn cercanos o a separados entre si. Se pueden clasicar en absolutas y relativas. Las absolutas pueden o no, estar referidas a un valor central. En la tabla 5 se muestran las distintas medidas de dispersin. o

1.2. ESTAD ISTICA DESCRIPTIVA Medidas de Dispersin= o Absolutas = Relativas = Rango; Recorrido Intercuartilico; Desviacin Media; o Varianza; Desviacin Estndar. o a

45

Recorrido Intercuartilico Relativo; Coeciente de Variacin. o

Al igual que en el caso de las medidas de tendencia central, la seleccin de la meo dida de dispersin a utilizar, depender, entre otras cosas, del objetivo a cumplir o a en el estudio. Si se quiere tener una visin general de la variabilidad de los datos, o el rango y el recorrido intercuart lico son apropiadas. Si el objetivo es medir la variabilidad de los datos respecto de su media, entonces deben usarse medidas como la varianza, desviacin media o desviacin estndar. o o a Para comparar grupos de datos con valores promedios diferentes y unidades de medida diferentes, las mejores opciones resultan ser el coeciente de variacin y o el rango intercuart lico relativo. a) Medidas de Dispersin Absolutas o Rango o Recorrido: Medida de poco utilidad ya que puede llevar a conclusiones errneas acerca del verdadero comportamiento de los datos. o Viene dada por

R = V max V min Es decir, el rango es la diferencia entre el valor mximo y el valor m a nimo

46

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA del conjunto de datos. Recorrido Intercuart lico: Es una medida de la dispersin en la zona o intermedia de los datos. Viene dada por la diferencia entre los cuartiles 3 y 4. Esto es,

RIC = Q3 Q1 Su principal ventaja es que no se ve inuenciada por los valores extremos. Desviacin Media: Est dada por el promedio de los valores absolutos o a de las diferencias entre cada valor del conjunto de datos y su media. Mide la diferencia que hay en cualquier sentido, positivo o negativo, entre los valores de una variable y su media. Su frmula de calculo es, o
n

|xi x| DM =
i=1

Si los datos estn agrupados en una tabla de frecuencias, entonces su a frmula de clculo es: o a DM =
k

|xi x|fi
i=1 n k

Individuales;

|mi x|fi
i=1 n

, Intervalos.

Varianza: Se dene como la media de las diferencias al cuadrado de los datos respecto de su media, es decir,

1.2. ESTAD ISTICA DESCRIPTIVA


n

47

(xi x)2 n1

S2 =

i=1

Si los datos estn agrupados en una tabla de frecuencias, entonces su a frmula de clculo es: o a DM =
k

(xi x)2 fi
n1

i=1 k

Individuales;

(mi x)2 fi
n

i=1

, Intervalos.

Las siguientes frmulas son usadas comunmente por su facilidad de o clculo a DM =


k

xi 2 nx2
n1

i=1 k

No agrupados;

x2 fi nx2 i
n1

i=1 k

Individuales;

m2 fi nx2 i
n1

i=1

, Intervalos.

Dado que esta medida viene expresada en unidades al cuadrado, su interpretacin se diculta siendo esta su principal desventaja. o

Desviacin Estndar: Dada la dicultad presentada con la interpreo a tacin de la varianza, surge una medida de dispersin funcin de ella o o o y que viene expresada en las mismas unidades que la variable. Esta

48

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA medida recibe el nombre de desviacin estndar o t o a pica y esta dada por,

S=

S2

Propiedades de la Varianza y Desviacin Estndar: o a 1) La varianza y la desviacin estndar no pueden ser negativas. o a 2) Si todos los datos son iguales a una constante c, entonces S 2 = 0 y S = 0. 3) Si a cada dato original se le suma una constante k, la varianza y la desviacin estndar no se ven afectadas. o a 4) Si cada dato original se multiplica por una constante k, la varianza y la desviacin estndar del nuevo conjunto de datos estn dadas o a a por k 2 S 2 y kS . 5) Supongamos que se tiene un conjunto de datos digamos,x1 , x2 , ..., xn , o a cuya varianza es S 2 , entonces la varianza y la desviacin estndar a de a + bx1 , a + bx2 , ..., a + bxn , estn dadas por, b2 S 2 y |b|S Cuando se desea medir la dispersin o variabilidad de una variable, por o lo general, esta se mide con respecto a un valor central, es decir, se usan medidas absolutas referidas a un valor central. Son las que tiene mayor sentido cuando los datos son simtricos o tienden a una distribucin e o simtrica. e

Todas las medidas de dispersin consideran que a mayor valor de la o medida de dispersin, mayor es la variabilidad. o

1.2. ESTAD ISTICA DESCRIPTIVA b) Medidas de Dispersin Relativas o

49

Por lo general estn dados por el cociente entre una medida de dispersin y a o una medida de tendencia central y sirven para comparar la variabilidad de dos conjuntos de valores. Rango Intercuart lico Relativo: Resulta del cociente entre el rango intercuart lico y la mediana, es decir, Q3 Q1 Md

IQ =

Coeciente de Variacin: Indica el tamao relativo de la desviacin o n o estndar respecto a la media y debe ser calculado para variables cuyos a valores son todos positivos. Es la medida de dispersin relativa de mayor o uso y su frmula de calculo es o S 100 x

CV = Propiedades:

1) Si x tiene coeciente de variacin CVx = o

S x

100, entonces y = a + x
S a+x

tiene coeciente de variacin dado por CVy = o

100. Esto es, el

coeciente de variacin no es invariante ante cambios de origen. o 2) Si x tiene coeciente de variacin CVx = o
S x

100 , entonces y = bx
bS bx

tiene coeciente de variacin dado por CVy = o

100 =

S x

100 =

o CVx . Esto es, el coeciente de variacin es invariante ante cambios de escala.

3. Medidas de Forma

50

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA Hasta ahora, hemos estado analizando y estudiando la dispersin de una distribuo cin, pero parece evidente que necesitamos conocer ms sobre el comportamiento o a de una distribucin. En esta parte, analizaremos las medidas de forma. o

Las medidas de forma de una distribucin se pueden clasicar en dos grandes o grupos: medidas de asimetr y medidas de curtosis. a Estas medidas permiten evaluar la situacin de los datos desde los ejes vertical o (simetr y horizontal (curtosis). a) a) Medidas de Asimetr Las medidas de asimetr permiten saber si los a a datos se distribuyen en forma simtrica con respecto a su valor central. e

Cuando el diagrama de l neas o histograma de frecuencias de una variable presenta una forma acampanada, diremos que los datos tienen una distribucin simtrica. En caso contrario, dicha distribucin ser asimtrica o o e o a e diremos que presenta asimetr a.

Ahora bien, comparando las medidas de tendencia central, podemos establecer relaciones que permitan determinar la presencia o no, de asimetr en a un conjunto de datos. De esta forma podemos indicar que: o e Si x = M d = M o la Distribucin es simtrica. o e Si x < M d < M o la Distribucin es asimtrica negativa. o e Si x > M d > M o la Distribucin es asimtrica positiva. Otra manera de evaluar la simetr de un conjunto e datos es calculando a ciertos coecientes de asimetr a continuacin veamos los dos ms usados: a, o a

1.2. ESTAD ISTICA DESCRIPTIVA

51

Coeciente de Asimetr de Fisher: Para determinar el grado de a asimetr de un conjunto de datos una posibilidad es el coeciente de a Fisher, cuya frmula de clculo es o a Af =
n

(xi x)3
nS 3

i=1 k

Datos no agrupados;

(mi x)3 fi
nS 3

i=1

, Datos agrupados en intervalos.

o e Si Af = 0 la Distribucin es simtrica. Si Af < 0 la Distribucin es asimtrica negativa. o e o e Si Af > 0 la Distribucin es asimtrica positiva. Coeciente de Asimetr de Pearson: Mide el grado de asimetr a a en trminos de la distancia entre la media y la moda. Este coeciene te divide esta diferencia entre la desviacin estndar para eliminar la o a dimensionalidad. Su frmula de clculo es o a x Mo S

Ap =

o e Si Ap = 0 la Distribucin es simtrica. o e Si Ap < 0 la Distribucin es asimtrica negativa. o e Si Ap > 0 la Distribucin es asimtrica positiva. b) Medidas de Curtosis. Las medidas de apuntamiento (curtosis), miden el grado de apuntamiento o achatamiento de la distribucin en su parte central, es decir, miden el grado o de concentracin de datos en la regin central. o o

52

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA La distribucin de probabilidad normal tiene gran importancia al querer eso tudiar el apuntamiento o curtosis de la distribucin de los datos. Se dice que o una distribucin tiene un apuntamiento u otro, siempre en funcin de esta o o distribucin normal. La distribucin normal, corresponde a fenmenos muy o o o corrientes en la naturaleza y cuya representacin grca es una campana de o a Gauss. Esta campana responde a una funcin matemtica, que es la funcin o a o de densidad de la distribucin. Una manera de evaluar la curtosis de un o conjunto de datos es a travs del Coeciente de Curtosis de Fisher. e Coeciente de Curtosis de Fisher: Permite medir el grado de apuntamiento de la distribucin de un conjunto de datos. Est dada por o a Cf =
n

(xi x)4
nS 4

i=1 k

3,

Datos no agrupados;

(mi x)4 fi
nS 4

i=1

3, Datos agrupados en intervalos.

Al comparar con la distribucin normal, se tiene la siguiente interpretacin: o o o u a Si Cf > 0 la Distribucin es leptocrtica. Ms apuntada que la normal o u Si Cf < 0 la Distribucin es platicrtica. Menos apuntada que la normal Si Cf = 0 la Distribucin es mesocrtica. Similar a la normal. o u

1.3. EJERCICIOS

53

1.3.
1.3.1.

Ejercicios
Introduccin o

1. Se realiza un estudio en el municipio Libertador del Estado Mrida sobre el tipo e de transporte utilizado por sus residentes, para lo cual se encuesta a un grupo de ellos, obtenindose e Tipo de Transporte Particular Taxi Trolebs u Bus Otros Identique: a) Universo b) Poblacin o c) Muestra d ) Variable y tipo de variable. e) Tipo de escala. 2. Un fabricante produce tornillos para los cuales existen estrechos mrgenes de a tolerancia en sus dimetros. El departamento de Control de Calidad selecciona a la produccin de un d y la somete a proceso de control. Identique: o a a) Universo N de Residentes 45 25 50 60 10

54 b) Poblacin o c) Muestra

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA

d ) Variable y tipo de variable. e) Tipo de escala. 3. De un lote de 1000 piezas defectuosas se toman al azar 150 de ellas encontrndose a con 1,2,3 4 y ms defectos, 15, 52, 46 y 37 piezas respectivamente. o a Identique: a) Universo b) Poblacin o c) Muestra d ) Variable y tipo de variable. e) Tipo de escala. 4. Identique el tipo de variable en cada uno de los siguientes casos: a) La resistencia a la ruptura de un determinado tipo de cuerda. b) El color del cabello de los nios que estn viendo por televisin una pel n e o cula. c) El nmero de seales de trnsito en poblados con menos de 500 habitantes. u n a d ) Si una llave de lavamanos esta defectuosa o no. e) El nmero de preguntas contestadas correctamente en un examen. u f ) El tiempo que se necesita para contestar una llamada telefnica en un a o ocina de bienes ra ces.

1.3. EJERCICIOS

55

g) El resultado de la encuesta hecha a un grupo de votantes posibles acerca del candidato de su preferencia. h) El gasto en que incurre una empresa al mes en el pago de la nomina. i) El nmero de empleados del sexo femenino que hay en una empresa. u j ) El precio de un producto en el mercado.

5. Para cada uno de los tem del ejercicio 5, identique el tipo de escala ms adea cuada para realizar la medicin. o

1.3.2.

Organizacin y Presentacin o o

1. Se registro el estado civil de 50 estudiantes de FACES seleccionados aleatoriamente y los resultados obtenidos fueron

c s c

s s s

s s

s s

d c v s s

c d s s s

s s

s s

d s c s s

c s s c s

c c

s c s s s s

d v c c c s s s

Organize los datos en una distribucin de frecuencia y comente los resultados. o

2. Los siguientes datos recogen la informacin del sexo de una persona, la ocupacin o o y su opinin referente a como ha visto la participacin de Venezuela en la Copa o o Amrica 2007. e

56

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA Sexo Ocupacin Opinin o o F F M F M F M M F F F M M F M Estudiante Docente Estudiante Estudiante Empleado Docente Estudiante Obrero Empleado Docente Estudiante Estudiante Docente Estudiante Estudiante Buena Regular Buena Buena Mala Regular Mala Buena Buena Buena Regular Mala Mala Buena Mala

a) Organize los datos en una distribucin de frecuencia para cada variable por o separado. b) Construya todas las posibles tablas cruzadas. Comente los resultados. 3. Se ha realizado una encuesta a 30 personas en la que se les pregunta el nmero de u personas que conviven en el domicilio habitualmente. Las respuestas obtenidas han sido las siguientes: 1, 4, 4, 1, 3, 5, 3, 2, 4, 1, 6, 2, 3, 4, 5, 5, 6, 2, 3, 3, 2, 2, 1, 8, 3, 5, 3, 4, 7, 2, 3.

1.3. EJERCICIOS

57

a) Calcule la distribucin de frecuencias de la variable obteniendo las frecueno cias absolutas, relativas y sus correspondientes acumuladas. b) Qu proporcin de hogares est compuesta por tres o menos personas? e o a Qu proporcin de individuos vive en hogares con tres o menos miembros? e o c) Dibuje el diagrama de barras de frecuencias y el diagrama en escalones. d ) Agrupe por intervalos de amplitud 2 los valores de la variable, calcule su distribucin de frecuencias y represente el histograma correspondiente. o 4. Como control de la tica publicitaria se requiere que el rendimiento, en millas por e galn de gasolina, que los fabricantes de automviles usan con nes publicitarios, o o este basado en un buen nmero de pruebas efectuadas en diversas condiciones. u Al tomar una muestra de 50 automviles se registran las siguientes observaciones o en millas por galn: o 27.9 35.6 30.0 30.5 33.5 29.3 31.0 28.7 31.3 30.5 31.8 28.0 33.2 24.9 31.3 22.5 33.7 30.5 26.8 32.7 34.2 32.0 27.9 29.9 30.3 34.2 28.5 31.2 28.7 30.1 32.7 27.5 29.5 30.4 30.3 26.5 29.8 28.7 31.3 29.6 26.4 31.2 23.0 32.7 31.4 31.6 28.7 30.1 30.3 32.4

Construya una distribucin de frecuencia. o 5. Construir una distribucin de frecuencias con los datos dados a continuacin que o o corresponden a los sueldos mensuales de 40 funcionarios. Agrupar la informacin o en 9 clases.

Sueldo mensual en Miles de BsF.

58 1.45 1.46 1.38 1.80 1.49 1.41 1.49 1.29 1.43 1.39 1.27 1.55

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA 1.64 1.39 1.25 1.36 1.64 1.45 1.34 1.61 1.47 1.57 1.56 1.43 1.53 1.18 1.36 1.70 1.22 1.71 1.30 1.50 1.72 1.62 1.21 1.51 1.50 1.48 1.44 1.52

6. La siguiente distribucin se reere a los pesos de un grupo de 80 personas. o

Pesos (Kg) N de pers [52 56) [56 60) [60 64) [64 68) [68 72) [72 76) [76 80) 4 12 17 20 15 9 3

Calcule:

a) El porcentaje de personas con pesos inferiores a 62 kgs. b) Cuntas personas pesan entre 65 y 74 kgs?. a c) El nmero de personas con pesos superiores a 62 Kgs. u d ) Cul es el peso por debajo del cual estn el 75 % de las personas? a a

7. La distribucin del ahorro mensual de 150 personas es: o

1.3. EJERCICIOS Ahorro (miles/mes) N de pers [100 150) [150 200) [200 250) [250 300) [300 350) [350 400) [400 450) 12 18 21 48 24 15 12

59

Calcule:

a) El porcentaje de personas con ahorro menor de 200000 Bs mensuales.

b) Cuntas personas ahorran mas de 320000 Bs mensuales?. a

c) Cul es el ahorro por encima del cual estn el 50 % de las personas? a a

1.3.3.

Medidas Descriptivas Numricas e

1. Se ha realizado un estudio entre 100 mujeres mayores de 15 aos y el nmero de n u hijos de las mismas. El resultado ha sido:

60

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA N de Hijos N de mujeres 0 1 2 3 4 5 6 Se pide: a) Calcular el nmero medio de hijos, la mediana y la moda. u b) Analizar la dispersin de la distribucin. o o c) Analizar la forma de la distribucin calculando los coecientes correspono dientes. 2. La siguiente distribucin expresa el nmero de autos vendidos durante una seo u mana por cada uno de los 50 concesionarios que una determinada rma tiene en Venezuela: N de autos vendidos N de concesionarios 1 4 10 12 8 Se pide: 3 6 5 20 5 13 20 25 20 11 7 4

1.3. EJERCICIOS a) El promedio de autos vendidos, mediana y moda. b) Analizar la dispersin de la distribucin. o o

61

c) Analizar la forma de la distribucin calculando los coecientes correspono dientes. 3. Un estudio sobre remuneraciones realizado tomando como muestra 100 profesionales de una determinada especialidad, arrojo el siguiente resultado: Remuneracin (BsF/mes) N de prof o [3000 3600) [3600 4200) [4200 4800) [4800 5400) [5400 6000) [6000 6600) [6600 7200) Se pide: a) La media, mediana y moda. b) Analizar la dispersin de la distribucin. o o c) Analizar la forma de la distribucin calculando los coecientes correspono dientes. 4. Calcular las medidas descriptivas para los ejercicios de la seccin 1.3.2. o 6 10 20 22 18 14 10

62

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA

Frequency

0 1

10

15

4 jub$V1

Figura 1.16: Fig.1.

También podría gustarte