Está en la página 1de 28

1 CAPITULO 1. - PRESENTACION DE LA INFORMACION 1.1. - GENERALIDADES.

La estadstica descriptiva puede definirse como aquellos mtodos que incluyen la recoleccin, presentacin y caracterizacin de un conjunto de datos con el fin de describir apropiadamente las diversas caractersticas de ese conjunto de datos. Un objetivo importante en estadstica descriptiva es poder resumir informacin contenida en un conjunto de observaciones, tratando de no perder informacin relevante para el estudio. La estadstica inferencial puede definirse como aquellos mtodos que hacen posible la estimacin de una caracterstica de la poblacin, basndose en los resultados de una muestra, extrada de esa poblacin, cuantificando el error de la estimacin y controlando un indicador de la confiabilidad. Poblacin: Se entiende por poblacin la totalidad de elementos en los cuales puede presentarse determinada caracterstica susceptible de ser estudiada. Muestra: La muestra es un subconjunto de la poblacin, que se selecciona para su anlisis. Parmetro: Un parmetro es una medida que se calcula para describir una caracterstica de toda una poblacin. Estadstica o estadgrafo: Una estadstica o estadgrafo es una medida que se calcula para describir una caracterstica de una sola muestra extrada de la poblacin. Ejemplo: En la Universidad se desea realizar un estudio sobre obesidad, en las carreras de pregrado. Para ello se seleccionar una muestra de 350 alumnos de pregrado, a los cuales se les medir el ndice de cintura. En este caso, la poblacin es el conjunto de todos los alumnos de las carreras de pregrado de la Universidad y la muestra son los 350 alumnos elegidos. El objetivo del estudio podra ser estimar el porcentaje de alumnos de la Universidad con obesidad(parmetro) y ese parmetro podra estimarse a partir del porcentaje obtenido en la muestra(estadgrafo). Cuando en un estudio se trabaja con toda la poblacin, se dice que se trata de un censo.

Por diversas razones se prefiere trabajar con muestras: costo, tiempo, errores, experimentos destructivos etc. Lo primero que se tiene que hacer para realizar un estudio estadstico es recolectar la informacin necesaria (recolectar los datos) La informacin podra estar disponible en algn registro y entonces habra que recolectarla de esos registros. Si la informacin no est disponible habra que realizar alguna encuesta, disear algn experimento, realizar algn estudio observacional, etc. con el objeto de obtener la informacin deseada. Variable: Variable estadstica es una caracterstica de la poblacin que interesa estudiar y que puede tomar o adoptar diversos valores. El conjunto de valores que se obtiene son los datos. Una variable puede ser numrica o no numrica, en la medida que los "valores" que toma sean o no nmeros. Una variable no numrica, llamada tambin variable categrica, puede ser nominal u ordinal. Ser ordinal si es posible distinguir un orden dentro de las categoras, en caso contrario ser nominal. Una variable numrica puede ser discreta o continua. Una variable numrica es discreta si toma un nmero finito de valores o infinito numerable, en un intervalo(generalmente valores enteros). Una variable numrica es continua si puede tomar todos los valores en un intervalo (nmeros reales). En ocasiones, en vez de distinguir tipos de variables, se suele hablar de escalas de medicin de la variable, se tiene as: Escala ordinal, escala nominal, escala de intervalo discreto y escala de intervalo continuo. Ejemplos de variables: Causas de muerte, estado civil de las personas. ( variable nominal) Jerarqua de un acadmico en cierta Universidad: Profesor titular, profesor asociado, profesor asistente e instructor, gravedad de cierta enfermedad: grado1, grado 2, grado3 ( variable ordinal) Nmero de hijos de los empleados de una empresa. ( variable discreta) Peso de un nio recin nacido (variable continua).

3 Es posible que una variable continua se categorice, es decir se convierta en variable categrica, especificndose la pertenencia a cada una de las categoras. Ejemplo: Se define la variable Indice de masa corporal (IMC) como: IMC = Peso kg) .( 2 Talla (mts)

Obviamente esta variable es una variable de tipo continua. Se podra categorizar la variable de la siguiente manera: Normal , siIMC < 25 IMCA = Sobrepeso, si 25 IMC < 30 Obeso, siIMC 30 La variable IMCA resulta ser una variable Categrica Ordinal. Por ejemplo, si una persona pesa 80 Kg. y mide 172 cms., entonces: IMC = 80 80 = = 27.04 2 2.9584 1.72

Esa persona entonces(para esa variable) se puede clasificar como sobrepeso Si una variable tiene solamente dos categoras, se dice que la variable es dicotmica. Ejemplo: La variable sexo ( Masculino, femenino) 1.2. - PRESENTACION DE LA INFORMACION. Una vez recolectada la informacin, revisada, ordenada etc., se procede a su presentacin. En la presentacin de la informacin se puede usar un grfico, una tabla, un diagrama, una representacin pictrica etc. Aqu se ver la presentacin mediante grficas y tablas. Una grfica es una representacin pictrica, que proporciona visualmente un resumen de la informacin que interesa destacar y recordar. Debe ser sencilla y autoexplicativa, debe presentar fielmente los hechos y ser agradable a la vista. Una tabla estadstica o tabla de distribucin de frecuencias, es una tabla en que se presentan ordenadamente los datos en filas y columnas, agrupados y clasificados de acuerdo a algn criterio especfico.

1.2.1. - Presentacin de la informacin si se trata de una variable categrica: Se quiere presentar la informacin con relacin a la profesin de los participantes en un curso de medicina deportiva. Supongamos que se ha recolectado la informacin y se encontr que haba en ese curso 15 mdicos, 20 kinesilogos y 5 nutricionistas. La informacin podra presentarse usndose una tabla de distribucin de frecuencias: DISTRIBUCION DE LOS PARTICIPANTES EN EL CURSO DE MEDICINA DEPORTIVA ORGANIZADO POR DIGIDER, SEGN PROFESION. SANTIAGO AGOSTO DE 2003. Profesin N de partici- % de participantes pantes 20 15 5 40 50.0 % 37.5 % 12.5 % 100 %

Kinesilogos .. Mdicos .. Nutricionistas . Total

Fuente: Departamento de extensin DIGEDER. Contenido de la tabla: En la primera columna aparece la variable con sus categoras. En la segunda columna aparecen las frecuencias absolutas ( f i o n i). El total de datos es n y es igual a la suma de las frecuencias absolutas n i. La frecuencia absoluta, indica el nmero de veces que se repite la respectiva categora de la variable. En la tercera columna aparecen las frecuencias relativas ( h i ). n hi = i n Al multiplicar por 100, se tiene la frecuencia relativa expresada en tanto por ciento. hi = ni * 100. n

5 Si no se multiplica por 100, se tiene la frecuencia relativa expresada en tanto por uno. En el ejemplo, se tiene que h 1 = 20 n1 = = 0.5 . Al multiplicar por 100 se tiene 40 n

que h 1 = 50 % . Se puede decir entonces que un 50% de los participantes son kinesilogos, o que la proporcin de kinesilogos es de 0.5 Para presentar la informacin podra usarse tambin una grfica de barras: DISTRIBUCION DE LOS PARTICIPANTES EN EL CURSO DE MEDICINA DEPORTIVA ORGANIZADO POR DIGEDER, SEGN PROFESION. SANTIAGO AGOSTO DE 2003.
25 N de personas 20 15 10 5 0 Kine. Med. Nutr. Profesin 20 15

Fuente: Departamento de extensin DIGEDER El rea de los rectngulos debe ser proporcional a las frecuencias. En el caso en que los rectngulos tengan todos la misma base, la altura debe ser proporcional a la frecuencia. En este caso, los rectngulos o barras tienen todos el mismo ancho(base) y la altura corresponde a la frecuencia. En la grfica anterior, tambin se puede usar las frecuencias relativas o porcentajes, en vez de las frecuencias absolutas.

DISTRIBUCION PORCENTUAL DE LOS PARTICIPANTES EN EL CURSO DE MEDICINA DEPORTIVA ORGANIZADO POR DIGEDER, SEGN PROFESION. SANTIAGO AGOSTO DE 2003. %

60 50 40 30 20 10 0

50 37.5

12.5

Kine.

Med.

Nutr.

Profesin Fuente: Departamento de extensin DIGEDER. En una grfica como la anterior se puede tambin dibujar columnas en vez de rectngulos. DISTRIBUCION DE LOS PARTICIPANTES EN EL CURSO DE MEDICINA DEPORTIVA ORGANIZADO POR DIGEDER, SEGN PROFESION. SANTIAGO AGOSTO DE 2003.
20 15
N de 10 personas

20 15

5 0 Kine. Med.

Nutr.

Profesin

Fuente: Departamento de extensin DIGEDER. En este caso el volumen de las columnas debe ser proporcional a las frecuencias. Si todas las columnas tienen la misma base, la altura ser proporcional a la frecuencia. Tambin para presentar la informacin puede usarse una grfica llamada circular o sectorial o de pastel, en vez de una grfica de barras o columnas. DISTRIBUCION DE LOS PARTICIPANTES EN EL CURSO DE MEDICINA DEPORTIVA ORGANIZADO POR DIGEDER, SEGN PROFESION. SANTIAGO AGOSTO DE 2003.

Nutricionista 12.5%

Kinesilogo 50.0% Mdico 37.5%

Fuente: Departamento de extensin DIGEDER. En este caso el pastel se "reparte" proporcionalmente a las frecuencias. Es decir, el sector circular es proporcional a la frecuencia correspondiente.
Las grficas anteriores las puede obtener, usando el programa Word: INSERTAR ( un click) IMAGEN GRAFICO ( un click) Aparece en la pantalla una propuesta de grfico. Los nombres de los trimestres que aparecen corresponden a las categoras de la variable. En nuestro caso: Kinesilogos, Mdicos, Nutricionistas. En la primera fila, donde dice "Este" deben aparecer las frecuencias.(20, 15 y 5 respectivamente) Por lo tanto: Donde dice 1er trimestre escribir Kine. Donde dice 2do trimestre escribir Med. Donde dice 3er trimestre escribir Nutr. Suprimir la lnea "Oeste" y la lnea "Norte" Suprimir la columna "4to trim." Escribir los datos: En Kine 20 , En Med 15, En Nutr 5. Cerrar la " Hoja de datos" GRAFICO( un click) TIPO DE GRAFICO (un click) ELEGIR GRAFICA: COLUMNAS ( 1er tipo) o CIRCULAR . Y GRAFICO ( un click) OPCIONES DE GRAFICO Titulos: Aqu se puede poner el titulo del grfico: DISTRIBUCION Nombre a los ejes: Eje X : Profesin , Eje Y : N de personas Lineas de divisin: Borrar o no las lneas de divisin. Leyenda: desactivar el "mostrar leyenda" Rtulo de datos: marcar " mostrar valor "

ACEPTAR

8
Aceptar

1.2.2.-Presentacin de la informacin si se trata de una variable numrica discreta: Se desea hacer un estudio con relacin al nmero de episodios de resfro durante el ao de cada uno de los alumnos de cierto curso. Se recolecta la siguiente informacin al respecto: X : N de episodios: 0, 3, 2, 2, 1, 1, 1, 1, 0, 0, 2, 2, 1, 3, 3, 2, 4, 2, 4, 3, 3, 2, 2, 1, 1, 0, 2, 1, 4, 3. La informacin podra presentarse en una tabla de distribucin de frecuencias: DISTRIBUCION DE LOS ALUMNOS DEL CUARTO AO MEDIO A DEL LICEO B-15, POR NUMERO DE EPISODIOS DE RESFRIO EN EL AO 2003. IQUIQUE ENERO DE 2004. N de episoDios 0 1 2 3 4 Total N de alum- % de alumnos N de alum. nos Acumulados 4 8 9 6 3 30 13.3 % 26.7 % 30.0 % 20.0 % 10.0 % 100 % 4 12 21 27 30 % de alum. Acumulados 13.3 % 40.0 % 70.0 % 90.0 % 100.0 %

Fuente : Oficina de administracin del Liceo B-15 Contenido de la tabla: En la primera columna aparecen los valores que toma la variable ( los X i ) En la segunda columna aparecen las frecuencias absolutas (n i), donde n i indica el nmero de veces que se repite el respectivo valor X i . En la tercera columna aparecen las frecuencias relativas ( h i), hi = ni , donde n es el total de datos ( n = n i). n

Al multiplicar por 100 se tiene las frecuencias expresadas en tanto por ciento, en caso contrario quedan expresadas en tanto por uno. En la cuarta columna aparecen las frecuencias absolutas acumuladas ( N i).

Nj =

n
i =1

En la quinta columna aparecen las frecuencias relativas acumuladas ( H i). Hj =

h
i =1

Algunas interpretaciones: n 3 = 9, indica que hay 9 alumnos que tuvieron 2 episodios de resfro c/u. h 2 = 26.7, indica que un 26.7 % de los alumnos tuvo un episodio de resfro c/u. N 4 = 27, indica que 27 alumnos tuvieron 3 episodios o menos. H 2 = 40, indica que un 40 % de los alumnos tuvo un episodio o menos. Para presentar la informacin podra usarse tambin una grfica de barras: DISTRIBUCION DE LOS ALUMNOS DEL CUARTO AO MEDIO A DEL LICEO B-15, POR NUMERO DE EPISODIOS DE RESFRIO EN EL AO 2003. IQUIQUE ENERO DE 2004.
10 N de alumnos 8 6 4 2 0 0 1 2 3 4 N de episodios 4 9 6 3

Fuente: Oficina de administracin del Liceo B-15 Al igual que en el caso anterior, se puede usar las frecuencias relativas, en vez de las frecuencias absolutas. Tambin se puede usar columnas en vez de barras. Otra alternativa es presentar la informacin anterior en una grfica de puntos, considerando el nmero de episodios versus el nmero de alumnos.

10

10 N de alumnos 8 6 4 2 0 0 1 2 4 8

9 6 3

N de episodios

1.2.3. - Presentacin de la informacin si se trata de una variable continua: La siguiente metodologa se puede seguir, cuando se desea presentar informacin con relacin a una variable continua o cuando la variable es discreta y toma muchos(ms de 20) valores distintos. Supongamos ahora que interesa estudiar el peso de los alumnos del curso del ejemplo anterior y se recolecta los siguientes datos: 58.3, 51, 62, 67, 68, 59, 63.7, 64, 56.2, 63.3, 53, 58.5, 54, 64.8, 67, 61.6, 64, 60.2, 69.2, 66.9, 53, 53, 56, 55, 58, 62, 64, 71, 71.5, 73. La idea en este caso es agrupar los valores de la variable y proceder en forma similar al caso de una variable discreta. Una pregunta importante aqu es saber cuntos grupos formar. El nmero y amplitud de las clases estn en directa relacin con la naturaleza y el contexto del estudio, depende adems de cuanta informacin se est dispuesto a perder. Sin embargo independientemente de este hecho, hay una frmula propuesta por H. A. Sturges que sirve para decidir sobre el nmero de clases. Generalmente el nmero de grupos o clases se encuentra entre 5 y 20, dependiendo de la cantidad de datos. La frmula de Sturges para determinar el nmero de grupos es: N de grupos = 1 + 3.3 log n ( n es el nmero de datos ) Procedimiento: 1.- Se determina el valor mximo y el valor mnimo que toma la variable: X max = 73 ; X
min

= 51

2.- Se determina el rango ( R ) de la variable: R = X max -X


min

= 73 - 51 = 22

11 3. - Se decide el nmero de grupos o clases: N de grupos = M = 1 + 3.3 log 30 = 5.8 ( aproximamos a 6) 4. - Se determina la amplitud ( A ) de cada clase: A = R / M = 22 / 6 = 3.66666 Se prefiere que la amplitud sea un nmero "sencillo", entendindose como tal, un nmero que tenga el menor nmero de cifras decimales posibles. En el ejemplo consideraremos la amplitud sin decimales. La aproximacin debe ser siempre hacia arriba, por lo que en este ejemplo A = 4. 5. - Se corrige el rango, debido a que se aument la amplitud. R = A * M = 4 * 6 = 24 Como el rango aument en 2 unidades, se agregar, por ejemplo, una unidad antes de 51 y una despus de 73, por lo que la informacin se trabajar entre 50 y 74. 6. - Se forman las clases: Se formarn entonces 6 clases de amplitud 4 cada una, a partir de 50 y hasta 74 50 ---------- 54 ----------- 58 ---------- 62 ------------ 66 ----------- 70 --------- 74 Nota: Es necesario aplicar algn criterio, para decidir acerca de la clase en que se incluirn aquellos datos que coincidan con algn lmite de clase. 7. -Se construye la tabla de distribucin de frecuencias: DISTRIBUCION DE LOS ALUMNOS DEL CUARTO AO MEDIO A DEL LICEO B-15, SEGN PESO. IQUIQUE ENERO DE 2004. Peso (Kg) N de alumnos 52 56 60 64 68 72 4 4 6 8 5 3 30 % de alumnos 13.3 13.3 20.0 26.7 16.7 10.0 100 % N de al. acumul. 4 8 14 22 27 30 % de al. Acumul. 13.3 26.6 46.6 73.3 90.0 100.0

De 50 a menos de 54 De 54 a menos de 58 De 58 a menos de 62 De 62 a menos de 66 De 66 a menos de 70 De 70 a 74 Total

Fuente: Oficina de administracin del Liceo B-15.

12 Contenidos de la tabla: En la primera columna aparecen los valores de la variable agrupados en clases. Cada clase tiene un lmite inferior y un lmite superior. En la segunda columna aparecen las marcas de clase, que resultan tiles cuando se desea calcular la media aritmtica y se dispone de la informacin tabulada en clases. Se toma entonces la marca de clase como un representante de la clase. Una marca de clase es el punto medio de la clase. Marca de clase = L.I .clase + L.S .clase. 2

Tambin la marca de clase se puede calcular, Marca de clase= L.I .clase + L.I .clase.siguiente 2

Adems se tiene que: Marca de clase = Marca de clase anterior + A Las otras columnas representan lo mismo que lo visto en el caso de la variable discreta. Las clases se pueden definir, en forma equivalente, de la siguiente manera:

DISTRIBUCION DE LOS ALUMNOS DEL CUARTO AO MEDIO A DEL LICEO B-15, SEGN PESO. IQUIQUE ENERO DE 2004. Peso (Kg) N de Alumnos 52 56 60 64 68 72 4 4 6 8 5 3 30 % de alumnos 13.3 13.3 20.0 26.7 16.7 10.0 100 % N de al. acumul. 4 8 14 22 27 30 % de al. acumul. 13.3 26.6 46.6 73.3 90.0 100.0

De 50 a De 54 a De 58 a De 62 a De 66 a De 70 a

53.9 57.9 61.9 65.9 69.9 73.9

Total

Fuente: Oficina de administracin del Liceo B-15. Nota: Se debe tener cuidado, que el 74 no sea el valor de alguna de las observaciones.

13 Una distribucin de frecuencias es simtrica, si los intervalos equidistantes del intervalo central, tienen iguales frecuencias. Tambin se puede usar, para presentar la informacin, una grfica llamada Histograma. DISTRIBUCION DE LOS ALUMNOS DEL CUARTO AO MEDIO A DEL LICEO B-15, SEGN PESO. IQUIQUE ENERO DE 2004.

N de alumnos 10 8 8 6 6 4 4 2 50 54 58 62 66 Peso (Kg) 70 74 4 3 5

Fuente: Oficina de administracin del Liceo B-15. En este caso los rectngulos(barras) quedan unidos. El rea de cada rectngulo es proporcional a la frecuencia. Si todos los rectngulos tienen el mismo ancho, entonces basta con que la altura de cada rectngulo sea proporcional a la frecuencia. Se puede presentar la misma informacin, usndose una grfica de puntos
9 8 7 6 5 4 3 2 1 0 44 48 52 8 6 5 4 4 3

56

60

64

68

72

76

80

14 Si se une los puntos medios de la parte superior de cada rectngulo, agregando al comienzo y al final una clase con frecuencia cero, resulta una figura llamada polgono o poligonal de frecuencias. En el siguiente grfico aparece la poligonal dibujada en negrita.
10 N de alumnos 8 6 4 2 0 48 52 56 60 64 68 72 76 80 Peso

Propiedad. El rea del histograma es igual al rea encerrada por la poligonal y el eje horizontal. Se puede comprobar esta propiedad, aplicando propiedades de los tringulos. "Suavizando" los puntos angulosos del polgono de frecuencias se obtiene la curva de frecuencias. Algunas formas que puede tener la curva de frecuencias son: Distribuciones Simtricas:

Leptocrtica

Platicrtica

Normal Distribuciones Asimtricas:

Asimtrica positiva(sesgada a la derecha) Distribuciones Multimodales:

Asimtrica negativa(sesgada a la izquierda)

15

Bimodal Multimodal El siguiente es un ejemplo en que se quiere presentar la informacin correspondiente a una variable trabajada como discreta. Edad (en aos) de un grupo de 40 pacientes: 2, 5, 12, 12, 13, 15, 18, 19, 20, 20, 20, 21, 22, 24, 25, 25, 26, 28, 29, 29, 31, 31, 32, 32, 34, 34, 36, 36, 40, 40, 42, 42, 45, 46, 47, 53, 54, 55, 58, 58. Si bien es cierto en este caso la variable se trabaja como discreta, se observa que toma muchos valores distintos, por lo que es conveniente agruparla en clases y seguir la metodologa usada en el caso de variable continua. 1. - X max = 58 , X min = 2 2. - Rango= R= 58 - 2 = 56 3. - N de grupos = M = 1 + 3.3 log 40 = 6 4. - Amplitud = A = R / M = 56 / 6 10 5. - El rango corregido es R = 6 * 10 = 60 6. - Las clases entonces pueden ser: 0---10---20---30---40---50---60 7. - Al construir la tabla, se tiene: DISTRIBUCION DE LOS PACIENTES POR EDAD. IQUIQUE DICIEMBRE DE 2004. Edad (en aos) De 0 a menos de 10 . De 10 a menos de 20 De 20 a menos de 30 De 30 a menos de 40 De 40 a menos de 50 De 50 a 60 Total Fuente : .. Marca de N de pa % de pa clase Cientes cientes 5 2 5.0 15 6 15.0 25 12 30.0 35 8 20.0 45 7 17.5 55 5 12.5 40 100 % N de % de Pac. acu. pa. acu. 2 5.0 8 20.0 20 50.0 28 70.0 35 87.5 40 100.0

16 Atendiendo a que la variable se est presentando como entera, la tabla podra quedar de la siguiente manera: DISTRIBUCION DE LOS PACIENTES POR EDAD. IQUIQUE DICIEMBRE DE 2004. Edad (en aos) De 0 a 9 .. De 10 a 19 De 20 a 29 ... De 30 a 39 ... De 40 a 49 ... De 50 a 59 Total Fuente : Las marcas de clase se han mantenido, de manera que se puede decir que en este caso, la amplitud corresponde a la diferencia en valor absoluto, entre el lmite inferior de la clase y el lmite inferior de la clase siguiente( para la ltima clase se supone que hay una clase que comienza en 60). Al escribir abreviadamente las clases, la tabla queda: DISTRIBUCION DE LOS PACIENTES POR EDAD. IQUIQUE DICIEMBRE DE 2004. Edad (en aos) 0 - 9 .. 10 - 19 20 - 29 ... 30 - 39 ... 40 - 49 ... 50 - 59 Total Fuente : El histograma se construye de la misma forma vista anteriormente. El siguiente es un ejemplo en que las clases tienen distinta amplitud. Supongamos que se hubiera tenido la siguiente tabla de frecuencias(Por simplicidad se presenta solamente la columna de la variable y de las frecuencias). Marca de N de pa % de pa clase cientes cientes 5 2 5.0 15 6 15.0 25 12 30.0 35 8 20.0 45 7 17.5 55 5 12.5 40 100 % N de % de Pac. acu. pa. acu. 2 5.0 8 20.0 20 50.0 28 70.0 35 87.5 40 100.0 Marca de N de pa % de pa clase cientes cientes 5 2 5.0 15 6 15.0 25 12 30.0 35 8 20.0 45 7 17.5 55 5 12.5 40 100 % N de % de Pac. acu. pa. acu. 2 5.0 8 20.0 20 50.0 28 70.0 35 87.5 40 100.0

17 Edad (en aos) 0 - 4 5 - 9 10 - 14 15 - 19. 20 - 24 25 - 29 30 - 34 35 - 39 N de personas 125 100 92 84 76 69 43 20

En vez de los grupos quinquenales de edad, podra interesar los siguientes grupos: Edad (en aos) 0 - 4 5 - 14 15 - 24 25 - 39 N de personas 125 192 160 132

En este caso, para dibujar el histograma hay que tener presente que el rea de cada rectngulo o barra, debe ser proporcional a la frecuencia. Si se considera como unidad 1 ao se puede hacer lo siguiente: Como el primer rectngulo tiene 5 unidades de base, la altura puede ser 25 para que el rea sea 125. Como el segundo rectngulo tiene 10 unidades de base, la altura debe ser 19.2, para que el rea sea 192. Como el tercer rectngulo tiene 10 unidades de base, la altura debe ser 16, para que el rea sea 160. Como el tercer rectngulo tiene base 15 unidades, la altura debe ser 8.8, para que el rea sea 132. En resumen se tiene: Edad (I) 0515 25 4 14 24 39 Frecuencia ( II ) 125 192 160 132 Unidades de 1 ao ( III) 5 10 10 15 Frecuencia Ajustada(IV) 25.0 19.2 16.0 8.8

La frecuencia ajustada (IV) es igual a (II) / (III). La frecuencia ajustada indica la cantidad de personas que hay por cada intervalo de 1 ao. El Histograma queda en este caso:

18

Frecuencia por intervalo de 1 ao 30 25 20 15 10 5 0 25 19.2 16 8.8

10

15

20 25 Aos de edad

30

35

40

1.2.4. - Presentacin de la informacin en el caso de dos o ms variables: En el caso en que se quiera presentar simultneamente la informacin con relacin a dos o ms variables, se puede formalmente usar un cuadro estadstico. Un cuadro estadstico es un arreglo ordenado de columnas y filas de datos estadsticos, con el objeto de ofrecer informacin estadstica de fcil lectura, comparacin e interpretacin. Cada cuadro estadstico puede tomar una forma particular o propia, sin embargo existen recomendaciones y normas generales para su construccin, que, pretenden uniformar criterios para presentar datos estadsticos. Ejemplo: CUADRO N 1 DISTRIBUCION DE UNA MUESTRA DE ALUMNOS DE LA UNIVERSIDAD ARTURO PRAT, POR SEXO, SEGN INDICE DE MASA CORPORAL. IQUIQUE. AGOSTO DE 2004. NMERO DE ALUMNOS Sexo Total Femenino Masculino 174 107 53 14 89 60 22 7 85 47 31 7

INDICE DE MASA CORPORAL Total Normal(menor a 25) .... Sobre peso(25 a menos de 30) Obeso (mayor igual a 30)..............

Fuente: Departamento de Estadstica Universidad Arturo Prat

19 Nota: Cuando se presenta informacin para dos o ms variables, se debe tener cuidado si se desea trabajar con las frecuencias relativas. Los porcentajes de las celdas pueden calcularse sobre el total de cada fila o el total de cada columna o sobre el total general. Si por ejemplo en el caso anterior se desea trabajar sobre el total de cada columna, se tiene: CUADRO N 1 DISTRIBUCION DE UNA MUESTRA DE ALUMNOS DE LA UNIVERSIDAD ARTURO PRAT, POR SEXO, SEGN INDICE DE MASA CORPORAL. IQUIQUE. AGOSTO DE 2003. NUMERO DE ALUMNOS Sexo Total Femenino Masculino 174(100% ) 89(100%) 85(100%) 60(67.4%) 22(24.7%) 7( 7.9%) 47(55.3%) 31(36.5%) 7( 8.2%)

INDICE DE MASA CORPORAL Total

Normal(menor a 25) .... 107(61.5%) Sobre peso(25 a menos de 30) 53(30.4%) Obeso (mayor a 30).............. 14( 8.1%)

Fuente: Departamento de Estadstica Universidad Arturo Prat Segn la informacin del cuadro estadstico, se puede decir que un 67.4% de las mujeres presenta un peso normal, mientras que en los hombres hay un 55.3% con peso normal. Las partes principales que se pueden distinguir en un cuadro estadstico son: 1. -Nmero: Siempre que en un documento se presente dos o ms cuadros, es conveniente enumerarlos, para facilitar su identificacin. 2. -Ttulo: Se escribe a continuacin del nmero del cuadro. El ttulo es la descripcin resumida del contenido del cuadro; Debe ser breve, claro y completo, de modo que se pueda deducir sin ambigedad lo que contiene. Con relacin al ttulo se puede decir que: Es conveniente escribirlo con letras maysculas.

20 Se escribe la unidad de informacin a la cual se refieren los datos (alumnos, empleados, pacientes, etc.) Se indica las caractersticas o variables que se incluyen ( en el ejemplo, sexo y carrera). Se indica la forma como se presentan las variables. Despus de la palabra POR, la variable que aparece en el encabezamiento, y despus de la palabra SEGN, la variable que aparece en la columna. Se indica el lugar donde se observ el fenmeno. Se indica la fecha o perodo de referencia de la informacin. Puede ser algn momento especfico o algn perodo de tiempo. 3. -El encabezamiento: Se ubica en la parte superior del cuerpo del cuadro. Con relacin al encabezamiento se puede decir lo siguiente: Se especifica las caractersticas o variables y sus valores o categoras, contenidas en las columnas. Se especifica la unidad de medida en que se presenta la informacin (Nmero de alumnos,.). Se recomienda usar letras maysculas en las columnas que no estn cubiertas por otras indicaciones. Ordenacin de las columnas: Deben ordenarse de acuerdo a algn criterio, respecto de su contenido: Geogrfico, natural, por importancia, alfabtico, etc. Posicin de la escritura: Siempre tratar de que la escritura sea en forma horizontal, an cuando haya que cortar las palabras. 4. -Columna indicadora: Es la columna ubicada en el lado izquierdo del cuadro. Con relacin a esta columna se puede decir lo siguiente: A la indicacin que se presenta en la columna matriz, seguir una lnea punteada hasta la primera columna que contiene los datos.

21 La palabra total, los ttulos y subttulos sern descritos con letras que destaquen la indicacin de acuerdo a su importancia( Maysculas subrayada, mayscula, minscula subrayada, minscula). La ordenacin de las lneas seguir el mismo orden sealado para las columnas. En los cuadros muy largos se debe dejar en blanco cada 5 o 10 lneas, para facilitar la identificacin de los datos. 5. - El cuerpo: El cuerpo es aquella parte del cuadro que contiene los datos. Se compone de columnas y filas. La interseccin de una fila con una columna, se denomina casilla. La principal recomendacin es que ninguna casilla debe quedar en blanco. Simbologa a utilizar cuando se requiera alguna aclaracin: Indica que no existe el fenmeno estudiado para esa casilla . . . Cuando existe el fenmeno pero no se tiene la informacin(dato no disponible) P Cuando se divulga un dato que puede ser rectificado. R Para indicar que el dato sustituye a otro publicado anteriormente como provisorio. 0 Cuando el valor numrico que corresponde no alcanza a la unidad empleada en la publicacin.

X Cuando el dato se omite para evitar la individualizacin del informante. 6. - Pie: Siempre que el origen de los datos no sea obvio, se debe indicar la entidad que los ha producido o la publicacin de donde se ha obtenido ( Fuente de la informacin). Aqu tambin se puede poner alguna NOTA para aclarar en lenguaje conciso algn aspecto de carcter general. Se puede poner alguna LLAMADA, para aclarar determinados aspectos relacionados con una columna, fila o casilla( se usa un asterisco, letras o nmeros). Recomendaciones generales: El cuadro no ser cerrado lateralmente. El cuadro ser cerrado en los extremos superior e inferior, con lnea gruesa.

22

Si el cuadro contina en sentido vertical en pginas siguientes, no debe cerrarse la parte inferior y debe repetirse el ttulo y encabezamiento en las pginas en que se contina, indicndose segn corresponda "continuacin" o "contina". En los cuadros se debe totalizar y subtotalizar hacia arriba y hacia la izquierda. La informacin presentada en el cuadro estadstico, puede ser presentada tambin en una grfica de barras agrupadas. DISTRIBUCION DE UNA MUESTRA DE ALUMNOS DE LA UNIVERSIDAD ARTURO PRAT, POR SEXO, SEGN INDICE DE MASA CORPORAL. IQUIQUE. AGOSTO DE 2003.
70 Num. alumnos 60 50 40 30 20 10 0 Normal Sobrepeso Obeso Indice M asa Corporal 22 7 7 60 47 31 M uje res Hombre s

Fuente: Departamento de Estadstica Universidad Arturo Prat Tambin es posible usar barras subdivididas en vez de usar barras agrupadas. DISTRIBUCION DE UNA MUESTRA DE ALUMNOS DE LA UNIVERSIDAD ARTURO PRAT, POR SEXO, SEGN INDICE DE MASA CORPORAL. IQUIQUE. AGOSTO DE 2003.

120 100 80 60 40 20 0 Normal 60 31 22 Sobrepeso 7 7 Obeso 47 Hombres Mujeres

Indice Masa Corporal

Fuente : Departamento de Estadstica Universidad Arturo Prat

23
La grfica de barras agrupadas y la de barras subdivididas las puede obtener en el programa Word: INSERTAR ( un click) IMAGEN GRAFICO ( un click) Aparece en la pantalla una propuesta de grfico. Los nombres de los trimestres que aparecen corresponden a las categoras de la variable "Indice Masa Corporal" En nuestro caso: Normal,Sobrepeso,Obeso. En la primera fila, donde dice "Este" debe aparecer ahora "Mujeres" y enseguida las frecuencias respectivas(60,22,7) En la segunda fila, donde dice "Oeste" debe aparecer ahora "Hombres" y enseguida las frecuencias respectivas(47,31,7) Suprimir la lnea "Norte" Suprimir la columna "4to trim." Cerrar la " Hoja de datos" GRAFICO( un click) TIPO DE GRAFICO (un click) ELEGIR GRAFICA: COLUMNAS ( 1er tipo) ACEPTAR GRAFICO ( un click) OPCIONES DE GRAFICO Titulos: Aqu se puede poner el titulo del grfico: DISTRIBUCION Nombre a los ejes: Eje X : Indice de.... , Eje Y : N de alumnos Lineas de divisin: Borrar o no las lneas de divisin. Rtulo de datos: marcar " mostrar valor " Aceptar

Una variante de la grfica anterior es la siguiente grfica: PORCENTAJE DE MEJORIA DE LA ENFERMEDAD ZZZ CON TRATAMIENTO A, B, C Y D. EN LOS PACIENTES DE LA CLINICA DE INVESTIGACIONES MMM. IQUIQUE. DICIEMBRE 2003.
100 80 Porcentaje 60 40 20 0 A B C D Tratam iento 100 70 20 30 30 80 70 Igual Mejor

Fuente : Cuando se tiene una variable que se mide a travs del tiempo, resulta til para presentar la informacin, una grfica de lnea.

24 NUMERO DE ALUMNOS DE LA UNIVERSIDAD CATULIANA ENTRE LOS AOS 1999 Y 2003. SANTIAGO DICIEMBRE AO 2003

1000 N de alumnos 800 600 400 200 0 1999 2000 2001 Ao 2002 600 750 800 700

900

2003

Fuente: .

25 LABORATORIO 1

1. - En un estudio realizado en la Universidad Arturo Prat en el ao 2002, se recolect la siguiente informacin, en una muestra de 170 alumnos, clasificados de acuerdo a sexo(Sexo) y presencia de depresin(Depre). Sexo : Sexo del alumno ( 0 mujer, 1 hombre) Depre : Tiene depresin ( 0 No, 1 Si) Sexo 1 1 0 0 Depre 1 0 1 0 Frecuencia 11 71 27 61

a) Presente la informacin para cada una de las variables en una tabla de distribucin de frecuencias. b) Presente en una grfica de barras agrupadas la informacin, por Depre, segn sexo. 2.- En la misma investigacin se estim el riesgo cardiovascular segn Framingham y se encontr que en las mujeres haba 73 con 0 % de riesgo, 13 con 1% de riesgo y 2 con 2% de riesgo, mientras que en los hombres se encontr 72 con 1% de riesgo, 5 con 2% de riesgo, 3 con 3% de riesgo, 1 con 6% y 1 con 8%. a) Presente en un cuadro estadstico la informacin para el riesgo de Framingham, considerando el sexo. 3. - La base de datos que se detalla a continuacin, contiene la siguiente informacin: PAC : Paciente EDAD : Edad del paciente en aos EC : Presenta el paciente enfermedad coronaria ( 1 = s, 0 = no)

26

PAC EDAD EC 1 20 0 2 23 0 3 24 0 4 25 0 5 25 1 6 26 0 7 26 0 8 28 0 9 28 0 10 29 0 11 30 0 12 30 0 13 30 0 14 30 0 15 30 0 16 30 1 17 32 0 18 32 0 19 33 0 20 33 0 21 34 0 22 34 0 23 34 1 24 34 0 25 34 0

PAC EDAD EC 26 35 0 27 35 0 28 36 0 29 36 1 30 36 0 31 37 0 32 37 1 33 37 0 34 38 0 35 38 0 36 39 0 37 39 1 38 40 0 39 40 1 40 41 0 41 41 0 42 42 0 43 42 0 44 42 0 45 42 1 46 43 0 47 43 0 48 43 1 49 44 0 50 44 0

PAC EDAD 51 44 52 44 53 45 54 45 55 46 56 46 57 47 58 47 59 47 60 48 61 48 62 48 63 49 64 49 65 49 66 50 67 50 68 51 69 52 70 52 71 53 72 53 73 54 74 55 75 55

EC 1 1 0 1 0 1 0 0 1 0 1 1 0 0 1 0 1 0 0 1 1 1 1 0 1

PAC EDAD EC 76 55 1 77 56 1 78 56 1 79 56 1 80 57 0 81 57 0 82 57 1 83 57 1 84 57 1 85 57 1 86 58 0 87 58 1 88 58 1 89 59 1 90 59 1 91 60 0 92 60 1 93 61 1 94 62 1 95 62 1 96 63 1 97 64 0 98 64 1 99 65 1 100 69 1

a) Presente la distribucin porcentual, segn EC, usando una tabla de distribucin de frecuencias y una grfica de barras. b) Construya una tabla de distribucin de frecuencias e histograma, para la variable EDAD. c) Defina la variable GREDAD, categorizando la variable edad de acuerdo al siguiente criterio: Si edad es menor de 29, asigne a "grupo de edad" 1 Si edad est entre 30 y 34, asigne a "grupo de edad" 2 Si edad est entre 35 y 39, asigne a "grupo de edad" 3 Si edad est entre 40 y 44, asigne a "grupo de edad" 4 Si edad est entre 45 y 49, asigne a "grupo de edad" 5 Si edad est entre 50 y 54, asigne a "grupo de edad" 6 Si edad est entre 55 y 59, asigne a "grupo de edad" 7 Si edad es 60 o ms, asigne a "grupo de edad" 8 d) Presente en un cuadro estadstico la distribucin de frecuencias por EC, segn GREDAD. e) Presente lo mismo del punto d) usando ahora una grfica de barras agrupadas.

27 4.- Los siguientes datos indican el tiempo de espera (en minutos) para una muestra de 50 pacientes, antes de ser atendidos en cierto consultorio: 2 45 55 61 73 a) b) c) d) 15 46 55 61 74 17 47 58 62 75 25 47 58 65 76 28 48 59 67 78 30 48 59 68 79 32 49 60 69 80 35 49 60 70 90 40 50 61 71 95 40 50 61 72 106

Indique cul podra ser en este caso la poblacin y cul es la muestra. Indique cul es la variable y de que tipo es. Construya la tabla de distribucin de frecuencias. Construya una grfica que considere ms adecuada.

5.- En un estudio realizado a un grupo de pacientes esquizofrnicos, se le registro la siguiente informacin, para las variables indicadas:
Paciente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 edad 32 20 30 34 33 20 26 40 27 21 31 35 36 38 27 22 20 25 19 32 31 36 30 imc 25.8 20.8 22.3 39.9 29.4 28.1 36.6 25.9 23.4 37 30.1 23.7 26.6 35.3 26.3 23.2 20 29.4 35 24 34.7 34.8 29.4 col 264 119 165 204 179 155 244 210 130 229 210 162 185 213 153 94 160 229 193 168 176 165 147 sexo 1 1 0 0 1 1 1 1 1 1 0 1 1 0 1 1 1 1 1 0 1 1 1

Descripcin de las variables peso talla 2 El peso est medido en kilgramos y la talla en metros. imc = indice.de.masa.corporal = Col : colesterol medido en mgs%.

28
Sexo : sexo del paciente. 1= hombre, 0=mujer

a) Presente en una tabla de distribucin de frecuencias, la variable edad. b) Categorice la variable imc, de acuerdo al siguiente criterio: Normal, si imc < 25. Sobrepeso, si 25 imc < 30 . Obeso si imc 30 Presente en un cuadro estadstico, la distribucin de pacientes, por sexo, segn la variable imc categorizada. c) Categorice la variable col de acuerdo al siguiente criterio: Normal, si col < 200, Alto, si col 200. Presente en un cuadro estadstico, la distribucin de pacientes, por sexo, segn la variable col categorizada.

También podría gustarte