Documentos de Académico
Documentos de Profesional
Documentos de Cultura
El Mtodo Estadstico
El mtodo estadstico consiste en una secuencia de procedimientos para el manejo de los datos
cualitativos y cuantitativos de la investigacin.
Dicho manejo de datos tiene por propsito la comprobacin, en una parte de la realidad, de una o
varias consecuencias verificables deducidas de la hiptesis general de la investigacin.
Las caractersticas que adoptan los procedimientos propios del mtodo estadstico dependen del
diseo de investigacin seleccionado para la comprobacin de la consecuencia verificable en
cuestin.
El mtodo estadstico tiene las siguientes etapas:
1. Recoleccin (medicin)
2. Recuento (cmputo)
3. Presentacin
4. Sntesis
5. Anlisis
Tales etapas siempre se encuentran en el orden descrito y cada una de ellas consiste, de manera
resumida, en lo siguiente:
1.
Recoleccin (medicin)
En esta etapa se recoge la informacin cualitativa y cuantitativa sealada en el diseo de
la investigacin. En vista de que los datos recogidos suelen tener diferentes magnitudes o
intensidades en cada elemento observado (por ejemplo el peso o la talla de un grupo de
personas), a dicha informacin o datos tambin se les conoce como variables.
Por lo anterior, puede decirse que esta etapa del mtodo estadstico consiste en la
medicin de las variables.
La recoleccin o medicin puede realizarse de diferentes maneras; a veces ocurre por
simple observacin y en otras ocasiones se requiere de complejos procedimientos de
medicin; en algunas ocasiones basta con una sola medicin y en otras se requiere una
serie de ellas a lo largo de amplios perodos de tiempo.
La calidad tcnica de esta etapa es fundamental ya que de ella depende que se disponga
de datos exactos y confiables en los cuales se fundamenten las conclusiones de toda la
investigacin.
Es tan grande la importancia de esta etapa que algunas clasificaciones de las
investigaciones se basan en la forma en que ocurre la medicin; por ejemplo si la
informacin es recogida en una sola ocasin suele decirse que la investigacin es
transversal; en cambio, si la informacin es recogida a lo largo del tiempo se denomina
longitudinal a la investigacin.
En ocasiones, la recoleccin de la informacin debe ocurrir en grupos tan grandes de
individuos que se hace imprctico tratar de abarcar a todos ellos; entonces es cuando se
ponen en prctica procedimientos de muestreo. Tales procedimientos de muestreo estn
17
Recuento (cmputo)
En esta etapa del mtodo estadstico la informacin recogida es sometida a revisin,
clasificacin y cmputo numrico.
A veces el recuento puede realizarse de manera muy simple, por ejemplo con rayas o
palotes; en otras ocasiones se requiere el empleo de tarjetas con los datos y, en
investigaciones con mucha informacin y muchos casos, puede requerirse el empleo de
computadoras y programas especiales para el manejo de bases de datos.
En trminos generales puede decirse que el recuento consiste en la cuantificacin de la
frecuencia conque aparecen las diversas caractersticas medidas en los elementos en
estudio; por ejemplo: el nmero de personas de sexo femenino y el de personas de sexo
masculino o el nmero de nios con peso menor a 3 kilos y el nmero de nios con peso
igual o mayor a dicha cifra.
3.
Presentacin
En esta etapa del mtodo estadstico se elaboran los cuadros y los grficos que permiten
una inspeccin precisa y rpida de los datos.
La elaboracin de cuadros, que tambin suelen llamarse tablas, tiene por propsito
acomodar los datos de manera que se pueda efectuar una revisin numrica precisa de
los mismos.
La elaboracin de grficos tiene por propsito facilitar la inspeccin visual rpida de la
informacin.
Casi siempre a cada cuadro con datos le puede corresponder una grfica pertinente que
represente la misma informacin.
Presentar la misma informacin tanto en un cuadro como en su correspondiente grfico
permite obtener una clara idea de la distribucin de las frecuencias de las caractersticas
estudiadas.
4.
Sntesis
En esta etapa la informacin es resumida en forma de medidas que permiten expresar de
manera sinttica las principales propiedades numricas de grandes series o
agrupamientos de datos.
La condensacin de la informacin, en forma de medidas llamadas de resumen, tiene por
propsito facilitar la comprensin global de las caractersticas fundamentales de los
agrupamientos de datos.
Tales medidas de resumen, al ser comunicadas, permiten a los interlocutores evocar de
una misma manera la esencia de los datos; por ejemplo, cuando alguien informa que el
promedio de calificaciones de un grupo de alumnos es 9.6, en una escala que va del 0 al
10, la imagen que se transmite es la de un grupo con buen aprovechamiento escolar;
igualmente, cuando se dice que el porcentaje de defunciones con una cierta tcnica
quirrgica es de 80%, las personas que escuchan se imaginan que se trata de un
procedimiento peligroso.
18
Anlisis
En esta etapa, mediante frmulas estadsticas apropiadas y el uso de tablas
especficamente diseadas, se efecta la comparacin de las medidas de resumen
previamente calculadas; por ejemplo, si antes se han calculado los promedios de peso de
dos grupos de personas sometidas a diferentes dietas, el anlisis estadstico de los datos
consiste en la comparacin de ambos promedios con el propsito de decidir si parece
haber diferencias significativas entre tales promedios.
Existen procedimientos bien establecidos para la comparacin de las medidas de resumen
que se hayan calculado en la etapa de descripcin. Tales procedimientos, conocidos como
pruebas de anlisis estadstico cuentan con sus frmulas y procedimientos propios.
Cada prueba de anlisis estadstico debe utilizarse siempre en funcin del tipo de diseo
de investigacin que se haya seleccionado para la comprobacin de cada consecuencia
verificable deducida a partir de la hiptesis general de investigacin.
En los primeros prrafos se mencion que el mtodo estadstico es una secuencia ordenada de
procedimientos para el manejo de los datos en las investigaciones. Luego de haber revisado las
caractersticas y propsitos de las diversas etapas del mtodo, parece quedar claro que tal
secuencia guarda siempre el orden descrito.
Es lgico efectuar el recuento de la informacin ( 2a. etapa, Recuento) solo hasta que
previamente fue recogida ( 1a. etapa, Recoleccin o Medicin). Antes de condensar la
informacin en la etapa de sntesis ( 4a. etapa) siempre conviene haberla comprendido a travs
de la elaboracin de cuadros y grficos ( 3a. etapa Presentacin).
Desde luego es impensable efectuar anlisis estadstico ( 5a. etapa, Anlisis) para comparar
medidas de resumen si antes estas no han sido calculadas ( 4a. etapa, Sntesis)
Por lo anterior, puede considerarse a la estadstica como una disciplina que posee su propio
mtodo. Tal disciplina emplea conocimientos de otras ciencias como la lgica y la matemtica y
por ello se dice que la estadstica es una forma razonable de emplear el sentido comn y la
aritmtica para el manejo de los datos en las investigaciones.
19
En la siguiente ilustracin se esquematiza la relacin que existe entre la estadstica y las etapas de
la investigacin cientfica:
Conocimiento
Problema
Hiptesis
Deduccin de
consecuencias
verificables
Diseo de
investigacin
2.
3.
4.
5.
6.
Mtodo Estadstico
Recoleccin
Recuento
Presentacin
Sntesis
Anlisis
Realidad
20
Conocimiento
Problema
La mortalidad de los mdicos por cncer pulmonar
en relacin con el hbito de fumar
A manera de recordatorio, en el siguiente esquema, con los nmeros 1. al 5. se muestran las etapas del
Mtodo Estadstico :
Conocimiento
Problema
Hiptesis
Conocimiento
Deduccin de
consecuencias
verificables
Diseo de
investigacin
1.
2.
3.
4.
5.
Mtodo Estadstico
Recoleccin
Recuento
Presentacin
Sntesis
Anlisis
Realidad
Con el mismo sistema de enumeracin empleado en el esquema anterior, identifique las etapas del
Mtodo Estadstico que se encuentren presentes en el siguiente relato y anote las letras
correspondientes en los recuadros de los prrafos (algunos recuadros pueden quedar vacios):
Sin saber el por qu de tal relacin, en un estudio de numerosos casos de cncer pulmonar se
observ que alrededor del 70% de los enfermos eran antiguos fumadores.
Esto hizo pensar que el consumo de tabaco pudiera ser un factor favorecedor o causal del cncer
pulmonar.
Luego de discutir si convena formar un grupo de mdicos fumadores y seguirlo a lo largo de varios
aos o formar un grupo de mdicos fumadores y uno de no fumadores, se resolvi hacer la investigacin
enviando un cuestionario a un nico pero numeroso grupo de mdicos del Reino Unido.
21
De ellos, se solicitaron datos individuales sobre, edad y hbitos de fumar por medio del cuestionario
de referencia. Dicho cuestionario fue puesto a prueba para comprobar que meda con precisin las diversas
variables en estudio. Se establecieron adems conexiones con el Registro de Defunciones para asegurar la
informacin sobre la mortalidad por cncer pulmonar que fuera ocurriendo en los mdicos a quienes se incluy
en el estudio.
El resumen de la informacin obtenida se expres en tasas de mortalidad por cada mil mdicos.
Las tasas de mortalidad por cada mil mdicos fueron comparadas para averiguar si parecan existir
diferencias significativas, desde el punto de vista estadstico entre quienes murieron por cncer pulmonar
segn el antecedente de si fumaban o no.
Los resultados mostraron que el riesgo de morir fue 14 veces mayor en fumadores que en no
fumadores. Tambin se observ que en los fumadores la frecuencia de stas muertes aument cuando la
cantidad de tabaco que se consuma era mayor.
22
23
24
establecieran dos jornadas de descanso en el curso del da, c) incrementaran los sueldos de los
trabajadores, y d) realizaran dos cursos anuales y obligatorios sobre prevencin de accidentes.
Preguntas:
a. Qu entrenamiento, adems de los estudios regulares de medicina, debiera tener el
responsable de un programa de prevencin y control de enfermedades y accidentes en una fbrica
de espejos?
b. Que procedimiento de recoleccin de informacin utiliz el pasante? Debi haber utilizado
otro procedimiento?
Problema 2. En contra de lo que se supona, un profesor de primaria pensaba que no era cierto
que los escolares aplicados siempre se sientan en las primeras filas de asientos. El opinaba que
esos lugares suelen ser ocupados por los nios que no oyen o ven bien.
Para comprobar lo anterior, compr una carta de optotipos como las que se usan en las pticas y
un viejo y ruidoso reloj de cuerda y clasific la visin y audicin tanto de los nios de las primeras
filas como de los de las ltimas.
Preguntas:
a. Cules fueron los instrumentos de medicin? El investigador debi haber utilizado otros
instrumentos? Cules seran?
b. Cules son los nombres de las tres caractersticas medidas por el investigador en los nios?
Problema 3. En nuestro pas se realizan censos de poblacin cada 10 aos ( el ltimo se realiz
apenas en 1990). Tales censos se aplican en la inmensa mayora de las casas y es raro que
existan familias que no recuerden tal evento, pues la cobertura de los censos se ha incrementado
dcada con dcada.
Interrogue a sus familiares acerca de las preguntas que se les hicieron en el ltimo censo y haga
una lista de ellas. Una vez que disponga de la lista, califique a cada pregunta segn si fue
respondida con exactitud o no. En el caso de las preguntas para las que se otorgaron respuestas
inexactas seale las posibles razones.
Problema 4. Identificndose como estudiante que realiza una prctica escolar acuda a la ptica
ms cercana a su domicilio y averige lo siguiente:
el optometrista
el paciente
el equipo
el procedimiento de medicin
el registro de los resultados de la medicin
25
26
Con frecuencia tan solo con conocer el nombre de una variable resulta posible clasificarla; por
ejemplo: la variable nacionalidad debe ser cualitativa nominal pues al pensar en los resultados de
haberla medido en grupos de personas solo vienen a la mente trminos tales como nacional y
extranjero o trminos como mexicano, peruano, costarricense, etc. De ninguna manera se le
ocurre a uno pensar que en tales escalas existe jerarqua y por ello la variable no podra ser
cualitativa ordinal. La variable nacionalidad tampoco podra ser cuantitativa, pues la nacionalidad
no admite cuantificaciones de ningn tipo. En algunas ocasiones el nombre otorgado a algunas
variables es indicativo muy aproximado de su clasificacin; por ejemplo: la variable nmero de
embarazos es susceptible de ser clasificada como cuantitativa discreta y no como cuantitativa
continua pues no existe tal cosa como 2.5 3.75 embarazos.
En otras ocasiones el nombre de la variable no permite fcilmente su clasificacin; por ejemplo: la
variable disminucin de peso puede ser clasificada por algunos como cualitativa ordinal y por otros
como cuantitativa continua; en el primer caso la escala que se supuso pudo ser: excelente, buena,
regular, mala y nula; en el segundo caso la escala pudo haber sido supuesta como: menos de
3.000 kgrs, 3.000 a 5.999 kgrs, 6.000 a 8.999 kgrs., etc.
3.0 Otra clasificacin de las variables
La anterior clasificacin de las variables sirve a propsitos estadsticos y se basa en el nivel de
medicin al que ha podido llegarse al medir a la variable.
Otra clasificacin de utilidad es la que clasifica a las variables desde un punto de vista
metodolgico en independientes y dependientes.
Es independiente una variable que antecede u origina a otras. Por otro lado, una variable se
denomina dependiente si es consecuente a otras.
Esta clasificacin es muy conveniente para analizar el modo en que se relacionan diversas
variables entre s. A manera de ejemplo se presenta una hiptesis de investigacin que contiene
ambos tipos de variables: Es probable que la desnutricin infantil est ms intensamente
condicionada por el nivel de ingresos de las familias que por el nivel educativo de sus integrantes;
obsrvese el esquema que se ha elaborado para clasificar metodolgicamente a las variables:
Variables independientes
Variables dependientes
27
Nombre de la variable
ESTADO CIVIL
Solteros
Casados
Su escala de modalidades
Viudos
Divorciados
En Unin Libre
Nombre de la variable
Posicin en el empleo
Gerentes
Supervisores
Su escala de modalidades
Jefes de Departamento
Oficinistas
Auxiliares
Como se puede apreciar, la escala de las variables cualitativas, tanto nominales como ordinales,
estn constituidas por renglones denominados modalidades.
Nombre de la variable
4a7
Su escala de intervalos
(Sinnimo de intervalos:
Pacientes atendidos
por jornada laboral
0a3
8 a 11
12 a 15
clases)
16 a 19
28
Su escala de intervalos
(Sinnimo de intervalos:
Duracin de
las consultas
10.0 a 14.9 minutos
clases)
PESO DE UN GRUPO DE
ADOLESCENTES (KGRS.)
30 a 34
Regular
35 a 39
Mala
40 a 44
Muy mala
50 a 54
55 a 59
Falta la clase 45 a 49
PESO DE UN GRUPO DE
ADOLESCENTES (KGRS.)
30 a 34
Excelente
33 a 39
Buena
40 a 44
Regular
45 a 49
Mala
50 a 54
29
La clase 33 a 39 se traslapa
con la de 30 a 34; porque un
individuo de 34 kgrs. podra
ubicarse tanto en una como en
otra clase.
3. La escala debe contener modalidades o clases pertenecientes a una nica variable. Lo anterior
significa que no deben mezclarse modalidades de o clases de una escala con las de otra, aunque
sean sumamente parecidas. En los siguientes ejemplos se aprecian modalidades o clases que no
pertenecen a una misma variable:
TIPO DE DIETA
Hipocalrica
Normocalrica
Hipercalrica
Equilibrada
Las tres modalidades relativas a caloras pueden pertenecer a la escala de una sola caracterstica
y la modalidad Equilibrada puede pertenecer a otra escala perteneciente a otra diferente
caracterstica. As, despejando la mezcla de escalas y modalidades, las escalas de dos diferentes
caractersticas o variables pueden quedar de la siguiente manera:
Normocalrica
Desequilibrada
Hipercalrica
Como puede observarse, aunque son muy parecidas, las caractersticas que se desea medir son
diferentes y a cada una de ellas le corresponde su propia escala de modalidades.
30
6.0 Problemas
Problemas de clasificacin de variables
Clasifique a cada variable marcando con una cruz en la columna correspondiente
Nombre de la variable
y escala correspondiente
1
10
Cualitativa
nominal
31
Cualitativa
ordinal
Cuantitativa
discreta
Cuantitativa
continua
1. Identifique a las variables contenidas en el siguiente relato y clasifquelas tanto desde el punto
de vista de su nivel de medicin como desde el punto de vista metodolgico.
Un investigador supona que la presencia o la ausencia de microcefalia poda
estar determinada porque la madre hubiera o no tenido rubola durante el
embarazo.
2. Identifique a las variables contenidas en el siguiente cuadro y clasifquelas tanto desde el punto
de vista de su nivel de medicin como desde el punto de vista metodolgico.
Obreros segn intensidad del esfuerzo fsico laboral desarrollado
y participacin en el equipo deportivo de la empresa
Intensidad del
esfuerzo fsico
laboral
Ocasional
Nula
Totales
Ligero
47
12
56
115
Moderado
10
80
12
102
Intenso
74
14
106
194
411
32
Estado Civil
Grado Militar
Agilidad
Soltero
Jefes
Excelente
Casado
Oficiales
Buena
Viudo
Tropa
Regular
Divorciado
Capitanes
Mala
Unin Libre
Psima
Pareja
Torpe
Material de
construccin de
los techos de las
viviendas
Tipo de
dependencia
acadmica en la
UNAM
Cemento
Escuelas
Autorizar
Madera
Facultades
Prohibir
Lmina metlica
Centros de
investigacin
Sin opinin
Permitir
Opinin sobre el
estado de salud
luego de una
ciruga
Mejor
Resultados de una
votacin
Resultado en un
examen
A favor
No se presentaron
En contra
Reprobaron
Peor
Abstencin
Sin opinin
De acuerdo
Aprobaron con
mencin honorfica
33
10 Nmero de hijos
11
Habitantes de un
grupo de ciudades
12
Pesos de un grupo
de nios en
gramos
1a3
0 a 9,999
0 a 2,999
4a6
10,000 a 19,999
3,000 a 5,999
8a9
20,000 a 39,999
6,000 a 9,999
10 a 12
40,000 a 49,999
8,999 a 11,999
12,000 a 14,999
Convulsiones al
13 mes en un grupo
de epilpticos
Nmero de votos
14 obtenidos por el
jefe de grupo
15
Concentracin de
glucosa en sangre
0a2
Escasos
Menos de 60
mgrs/ml
3a5
Abundantes
60 a 89 mgrs/ml
6a8
Ms de 30
90 a 119 mgrs/ml
7 a 10
11 a 14
16
Concentracin de
glucosa en sangre
Personas segn
17 edad (en salud
pblica)
18
Grupos de edad
(en salud pblica)
Menos de 60
mgrs/ml
0 a menos de 1 ao
Infantil
60 a 89 mgrs/ml
1 a menos de 5 aos
Preescolar
90 a 119 mgrs/ml
5 a menos de 15 aos
Escolar
15 a menos de 25
aos
Preproductiva
25 a menos de 45
aos
Productiva
Ms de 160 mgrs/ml
45 a menos de 65
aos
Posproductiva
65 y ms aos
Ancianidad
34
Diseo de cuestionarios
Introduccin
La primera etapa del mtodo estadstico, denominada recoleccin, puede llevarse a cabo a travs de
diversos procedimientos de medicin. En algunas ocasiones las variables se miden con equipamiento
instrumental; por ejemplo: la estatura se mide con un escalmetro, el peso con una bscula, la
temperatura con un termmetro y la presin arterial con un baumanmetro. En otras ocasiones las
variables se miden con la simple observacin; por ejemplo: el tipo de actitud que adoptan los pacientes,
su manera de caminar o su color de piel solo requieren inspeccin visual. Algunas veces la medicin de
variables requiere del interrogatorio; por ejemplo: para saber si un paciente est orientado temporal y
espacialmente basta con hacerle una serie de preguntas.
En todos los anteriores casos la informacin obtenida debe ser registrada por escrito para luego proceder
a su recuento. Casi siempre, de la calidad del registro escrito depende la calidad de las conclusiones
obtenidas luego de aplicar procedimientos estadsticos a las variables medidas.
Por convencin a los registros escritos suele denominrseles genricamente cuestionarios. El diseo de
un cuestionario implica que, previamente, se ha realizado una correcta definicin de las variables en
estudio y que para cada una se ha construido su correspondiente escala en trminos de modalidades o
intervalos. Si la definicin de variables o la construccin de sus escalas son imperfectas, el diseo del
cuestionario dar lugar a un defectuoso instrumento de recoleccin.
1. Comprobacin de requisitos
Al inicio del diseo de un buen cuestionario conviene comprobar los siguientes aspectos:
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
35
Cuestionarios autoadministrados
Trasladar al respondiente la responsabilidad de completar el cuestionario tiene importantes implicaciones
en el diseo del cuestionario. El respondiente se har cargo de llenar cuidadosamente un cuestionario
que considere valioso, interesante, explcito, corto y estticamente bien presentado. En ocasiones habr
que considerar la conveniencia de ofrecer al respondiente un estmulo o recompensa por su esfuerzo; por
ejemplo: conviene ofrecerle un ejemplar del reporte del estudio. En lo posible hay que tratar de usar un
lenguaje muy personal, aunque la encuesta sea de tipo annimo; para lograr lo anterior hay que pensar
acerca de cmo le gustara a uno mismo que se dirigieran por escrito. Cuando sea posible hay que pedir
algunos datos personales no confidenciales como el sexo, la edad y la ocupacin, ya que se ha
observado que con ello se logra establecer un mejor nivel de confianza y un aumento en la tasa de
respuesta.
Variable
Escala
La experiencia influye en la
decisin de estudiar un curso
de posgrado en
administracin?
36
1 a 3 aos
4 a 6 aos
7 a 9 aos
5. Tipos de preguntas
En el diseo de un cuestionario se pueden usar diversos tipos de preguntas: abiertas o cerradas, de
seleccin sencilla o de seleccin mltiple, de asignacin de orden o de asignacin de valor.
37
Plantear una pregunta como la anterior tiene desventajas y ventajas. Como principal desventaja se
encuentra que habr que destinar bastante tiempo para clasificar la amplia variedad de respuestas que
se les ocurran a los respondientes para construir, a posteriori, una escala para la variable involucrada a
fin de poder efectuar un recuento preciso. Como ventajas se encuentran que la gama de respuestas
puede ser ms rica que la que a uno se le pudiera haber ocurrido y que la variedad de respuesta refleja
mejor la opinin de los respondientes. En cuanto a la disposicin de las preguntas abiertas, conviene
reservar suficiente espacio para que se anote sin dificultad la respuesta manuscrita del respondiente y
prever un rea para su posterior clasificacin y codificacin. A continuacin se muestran dos ejemplos:
Mal
Cul considera que es la principal razn para que los adolescentes pinten con
aerosol las fachadas de las casa ajenas? ______________________________
Bien
Cul considera que es la principal razn para que los adolescentes pinten con
aerosol las fachadas de las casa ajenas?
En el caso de que para una variable como la anterior solo interese que el respondiente ubique su opinin
en una escala preestablecida, podra redactarse la pregunta a modo de pregunta cerrada con opciones
mltiples de la siguiente manera:
Cul considera que es la principal razn para que los adolescentes pinten con
aerosol las fachadas de las casa ajenas? (marque con una X en un solo
recuadro)
Falta de valores cvicos en la familia
El ejemplo de otros adolescentes
El ejemplo de programas de televisin
Debilidad de las autoridades
En el caso de establecer una escala con opciones mltiples como la anterior, hay que asegurarse de que
es exhaustiva y de que las opciones son mutuamente excluyentes entre s.
Preguntas de seleccin sencilla y preguntas de seleccin mltiple
En la modalidad de pregunta cerrada es necesario decidir si se requiere que el respondiente marque una
sola opcin (seleccin sencilla) o si conviene que marque todas las que desee (seleccin mltiple).
Observe la diferencia entre una y otra forma:
38
Seleccin sencilla
Cul considera que es las principal razn para que los adolescentes pinten con
aerosol las fachadas de las casa ajenas? (marque con una X en un nico
recuadro)
Falta de valores cvicos en la familia
El ejemplo de otros adolescentes
El ejemplo de programas de televisin
Debilidad de las autoridades
Seleccin mltiple
Cules considera que son las principales razones para que los adolescentes
pinten con aerosol las fachadas de las casa ajenas? (marque con una X en los
recuadros que expresen su opinin)
Falta de valores cvicos en la familia
El ejemplo de otros adolescentes
El ejemplo de programas de televisin
Debilidad de las autoridades
39
Asignacin de valor
En este tipo de preguntas se utilizan escalas tipo Lickert de la siguiente forma:
Otorgue un valor a las siguientes razones para que los adolescentes pinten con
aerosol las fachadas de las casa ajenas (marque con una X los recuadros que
expresen su opinin)
Muy
importante
Importante
Poco
importante
Nada
importante
En la anterior escala de importancia puede apreciarse que no se ha incluido una columna que permita
asignar un valor neutro como por ejemplo Sin opinin debido a la tendencia que tienen muchos
respondientes para escoger opciones que no los comprometen.
Preguntas dobles
Algunas preguntas implican dobles cuestiones que deben evitarse; por ejemplo:
Cree usted que los adolescentes debieran comer menos y hacer ms ejercicio?
Para evitar este tipo de preguntas conviene redactar dos preguntas separadas de la siguiente forma:
Marque con una cruz en el recuadro que exprese su opinin
Si
Cree usted que los adolescentes debieran comer menos?
Cree usted que los adolescentes debieran hacer ms ejercicio?
40
No
Preguntas negativas
Evite preguntas con redaccin negativa que suelen causar confusiones como las siguientes:
Si
No
Si
No
Exactitud
En caso de no existir restricciones, procure pedir respuestas precisas. Por ejemplo, en lugar de preguntar
as:
Su edad corresponde a:
18 a 24 aos
25 a 44 aos
45 a 64 aos
pregunte as:
Al 1. De noviembre de 2004 su edad era de _____ aos cumplidos
En el ejemplo anterior podra considerarse que era suficiente con obtener la edad en grupos; sin embargo
existen varias razones para obtener cifras exactas en lugar de cifras agrupadas:
Existe menor riesgo de equivocacin al anotar un nmero que al marcar con cruz en algn
recuadro
Las cifras exactas pueden agruparse a posteriori en intervalos del tamao deseado
Mantener las cifras exactas permite actualizar posteriormente la informacin, particularmente las
edades, con algn programa de cmputo
Ciertos clculos estadsticos y algunos paquetes de cmputo requieren la informacin sin agrupar
41
Hay que evitar forzar al respondiente a contestar en contra de su voluntad con preguntas como la
siguiente:
Esta usted de acuerdo, al igual que la gran mayora de los buenos profesores, en que los estudiantes
destinan cada vez menos tiempo a la preparacin de sus exmenes?
Si No
Igualmente, hay que procurar ser cuidadoso al pedir opiniones situando al respondiente en situaciones
hipotticas sumamente irreales o pidindole que marque opciones extremadamente polarizadas
Por ejemplo, en vez de redactar as:
Si usted fuera el director de la facultad de medicina reducira la duracin de los estudios a solo 3 aos?
Si
No
42
Probablemente
si
Probablemente
no
Seguramente
no
Prueba piloto
Por ms que parezca perfecto un cuestionario siempre requiere probarse por anticipado, particularmente
en lo referente a los siguientes aspectos:
Legibilidad del documento, tamao y color del papel y de la letra, formato (hojas engrapadas o
cuadernillo). Identificacin del cuestionario (numeracin consecutiva, nmero o fecha de versin).
43
Alumno No.
Preparatoria de origen
19
Privada
CCH UNAM
Bachilleres
Sexo
(B)
(U)
Vocacional IPN
(VI)
No presento
(NP)
No aprobado
(NA)
Suficiente
(S)
(MB)
No presento
(NP)
No aprobado
(NA)
Suficiente
(S)
(B)
Muy bien
(MB)
Femenino
(F)
Masculino
(M)
44
(B)
Muy bien
Bien
(C)
Prepa UNAM
Bien
4
(P)
Edad
17 - 21 aos
Otras ocupaciones
22 - 26 aos
(2)
27 y ms
(3)
Otra carrera
Trabaja
Solo esta carrera
Lugar de estudio
(C)
(T)
(S)
0 - 1 horas
(1)
2 - 3 horas
(2)
4 o ms horas
9
(1)
(3)
Biblioteca
(B)
Casa propia
(P)
Casa de amigos
(A)
Otros lugares
(O)
19
Como puede verse, se han ocupado el centro, las esquinas y las partes medias de cada borde de la
tarjeta para anotar los cdigos contenidos en el formulario. Los sitios donde se anota cada cdigo se
determinan previamente mediante la elaboracin de una tarjeta modelo.
En el ejemplo citado, la tarjeta modelo fue elaborada con el siguiente formato:
TARJETA MODELO
Prepa de
origen
Calificacin
1er. examen
Lugar de
estudio
Nmero
del
alumno
Tiempo de
estudio
Otra
ocupacin
Calificacin
2o. examen
Sexo
Edad
Para proceder al cmputo, simplemente se separan las tarjetas en paquetes diferentes, de acuerdo a las
diversas modalidades o clases de una variable, y se cuentan las tarjetas resultantes.
45
Por ejemplo, si se deseara contar a los individuos segn su escuela de origen se procedera A separar
las tarjetas formando paquetes de la siguiente manera:
C
P
C
C
B
C
B
B
B
B
VI
U
VI
U
VI
U
U
U
U
En caso necesario, cuando se desea realizar el cmputo de individuos clasificados bajo dos criterios, se
procede a una nueva separacin de los grupos de tarjetas resultantes de la primera clasificacin para
proceder a su cmputo.
Por ejemplo, para el caso que est sirviendo de ilustracin, si se deseara conocer cuntos de los
individuos que proceden del Colegio de Ciencias y Humanidades son hombres y cuntas son mujeres
(esto es: si se desear conocer a los individuos segn escuela de origen y sexo simultneamente) se
procedera segn el siguiente esquema:
C
C
C
C
C
C
C
F
M
El sistema de recuento por medio de tarjetas simples es til para contar con comodidad hasta 500 casos,
siempre y cuando cada caso contenga a lo sumo ocho variables.
46
la primera fila de una hoja de clculo debe destinarse a la anotacin de los nombres de las
variables medidas, preferentemente con no ms de ocho caracteres,
cada una de las siguientes filas deben corresponder a cada uno de los casos,
cada columna debe destinarse a la anotacin de los datos correspondientes a cada caso.
Una vez capturados todos los datos y salvado el archivo se procede de acuerdo a los siguientes pasos:
1. Definir el rea que contiene los datos y asignarle un nombre
Colquese en la celdilla que est en la esquina superior izquierda del rea de datos, oprima
con su mano izquierda la tecla de maysculas y, sin soltarla, oprima repetidas veces la
tecla del cursor derecho hasta que aparezcan sombreadas las celdillas A1, B1 y C1.
Estas celdillas contienen los encabezados de las columnas.
Todava sin soltar con su mano izquierda la tecla de maysculas, oprima una vez la tecla Fin
e inmediatamente la tecla del cursor inferior . Observe que aparece sombreada toda el
47
rea que contiene a los datos. Ahora puede soltar la tecla de maysculas.
Asegrese de que est sombreada el rea de datos. Con el puntero del ratn oprima una vez
la flecha que est al lado derecho de la ventana Cuadro de nombres. Observe que el
letrero A1 de la ventana se sombrea con color azul. En este momento puede sobreescribir un
nombre. Por ejemplo escriba con minsculas la palabra misdatos. Oprima la tecla
Asegrese de que est sombreada el rea de datos. Con el puntero del ratn despliegue el
men Datos y seleccione la opcin Ordenar. Al aparecer un cuadro denominado Ordenar,
que contiene tres ventanas y algunos botones, oprima la flecha que est al lado derecho de
la ventana superior y escoja el nombre de alguna de las columnas. En este caso escoja la
columna Sexo (columna B). Oprima el botn Aceptar. Observe que ahora la columna Sexo
muestra a los datos ordenados. Primero aparecen letras f y luego se muestran letras m.
Para ordenar los datos segn el contenido de alguna otra columna asegrese de que primero
est sombreada toda el rea de datos. Practique el ordenamiento de cada una de las otras
columnas
48
3. Contar los subtotales de una columna (en este caso la columna sexo)
Asegrese de que tiene ordenados los casos segn la columna sexo. Vaya al men Datos y
escoja la opcin Subtotales. Observe que aparece un cuadro llamado Subtotales que
contiene tres ventanas y algunos botones. Oprima la flecha del lado derecho de la ventana
superior denominada Para cada cambio en: y escoja la columna sexo. En la ventana de en
medio, denominada Usar funcin: deje la opcin Contar. En la ventana inferior, denominada
Agregar subtotal a: marque la columna sexo; asegrese de que las dems columnas no
estn marcadas. Oprima el botn Aceptar.
En este momento, si usted recorre de arriba a abajo la columna sexo, notar que al terminar
las letras f se encuentra un subtotal y que al terminar las letras m se encuentra, tanto el
subtotal para la letras m, como el total de todos los casos.
49
Antes de efectuar otro recuento de subtotales es necesario realizar lo siguiente: vaya al men Datos y
seleccione la opcin Subtotales. Al aparecer el cuadro Subtotales quite las marcas de cualquier columna
que estuviera marcada en la ventana inferior denominada Agregar subtotal a: y despus oprima el botn
Quitar todos.
4. Ordenar los datos segn dos columnas y contar los subtotales
Observe que en la columna sexo se han ordenado los datos y que hay un segmento de letras
f y luego uno de letras m.
Observe que tanto para el segmento de letras f como para el segmento de letras m se
50
encuentran ordenados los datos de la columna apgar apareciendo primero los valores
menores de cada segmento de la columna sexo.
Ahora vaya al men Datos y escoja la opcin Subtotales. Al aparecer el cuadro Subtotales
realice lo siguiente:
Primero. En la ventana Por cada cambio en: seleccione la columna apgar.
Segundo. En la ventana Agregar subtotal a: marque la columna apgar
Tercero. Oprima la tecla
Recorra las columnas sexo y apgar y tome nota de los subtotales.
51
Apgar
Sexo
Femenino
Masculino
Ejercicios:
En las siguientes pginas encontrar un listado con los datos de 120 personas que asistieron a una
comida. En el evento se ofrecieron tres alimentos: sopa, arroz y mole. Los invitados pudieron o no haber
comido uno, dos o tres de los alimentos. El mismo da algunas personas presentaron diarrea.
Luego de efectuar el recuento de la informacin, tanto con el procedimiento de tarjetas simples como con
el uso del programa Excel llene los siguientes cuadros:
Ingestin
de sopa
Cuadro 1
Presentacin de diarrea
No
Si
Totales
Cuadro 2
Presentacin de diarrea
No
Si
Totales
Cuadro 3
Presentacin de diarrea
No
Si
Totales
No
Si
Ingestin
De arroz
No
Si
Ingestin
de mole
No
Si
52
Caso
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
Sopa
S
N
S
S
S
N
S
S
S
N
S
S
N
S
S
N
S
S
S
S
S
S
S
S
S
N
S
N
S
S
N
S
S
S
S
S
N
S
S
Arroz
N
S
N
N
N
S
S
S
N
S
S
S
S
S
N
N
S
S
N
N
N
N
N
N
S
N
N
S
S
S
S
N
N
N
S
S
N
N
N
53
Mole
N
N
N
S
N
S
N
S
S
S
N
N
N
N
S
S
N
N
S
S
N
N
S
S
S
N
S
N
N
S
N
S
S
S
N
N
N
N
S
Diarrea
S
N
N
S
S
N
S
S
N
S
S
S
N
S
S
N
S
S
S
S
S
S
S
S
S
S
S
N
S
S
N
S
S
S
S
S
N
N
N
Caso
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
Sopa
S
N
N
S
N
N
S
N
S
S
N
N
N
N
S
N
N
S
S
N
S
S
N
S
S
S
N
S
S
S
N
S
S
N
S
S
N
S
S
S
Arroz
S
N
S
S
N
N
N
S
N
S
S
N
S
N
S
N
N
S
N
N
S
N
S
N
N
N
S
S
S
N
S
S
S
S
N
N
N
S
S
N
54
Mole
N
S
N
N
N
N
S
N
S
N
N
N
N
S
N
S
N
S
S
N
S
N
N
N
S
N
S
N
S
S
S
N
N
N
N
S
S
N
N
S
Diarrea
S
N
N
S
N
N
N
N
S
N
N
N
N
N
S
N
N
N
S
N
N
S
S
N
S
S
N
S
S
N
N
S
S
N
S
S
N
S
S
S
Caso
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
Sopa
S
S
S
S
S
N
N
S
N
S
S
N
S
S
S
S
S
S
S
S
S
N
N
S
N
N
S
N
S
S
S
N
S
N
S
N
S
S
S
N
S
Arroz
N
N
S
N
N
S
N
N
S
S
S
S
N
N
N
S
S
N
N
N
S
N
S
S
N
N
S
S
N
S
S
N
N
N
S
N
N
S
N
N
S
55
Mole
S
N
N
S
S
S
N
S
N
N
S
N
S
S
S
N
N
N
N
S
N
S
S
N
S
N
S
N
S
S
N
N
S
S
N
S
S
S
S
N
S
Diarrea
S
S
S
S
S
N
S
S
N
S
S
N
S
S
S
S
S
N
N
N
S
N
N
S
N
N
N
S
S
S
N
N
S
N
S
N
S
N
S
N
N
Ingestin
de sopa
Cuadro 1
Presentacin de diarrea
No
Si
Totales
No
34
39
Si
17
64
81
120
Ingestin
De arroz
Cuadro 2
Presentacin de diarrea
No
Si
Totales
No
28
36
64
Si
23
33
56
120
Ingestin
de mole
Cuadro 3
Presentacin de diarrea
No
Si
Totales
No
27
36
63
Si
24
33
57
120
56
Introduccin
En el mtodo estadstico, luego de las etapas de recoleccin y de recuento, se desarrolla la etapa
denominada presentacin. En ella se elaboran y describen los datos de los estudios o investigaciones a
travs de cuadros y grficos con el propsito de comprender su estructura, organizacin y tendencias.
A travs de los siguientes ejemplos se podr apreciar la importancia de esta etapa.
Supngase que se lee o se escucha la siguiente descripcin: De 120 trabajadores de una fbrica de
gabinetes metlicos que fueron seguidos a lo largo de la dcada 1981-1990, en la poblacin de San
Garabato, 81 estaban expuestos regularmente a ruido intenso; de estos, casi tres cuartas partes
presentaron diversos grados de sordera al cabo del perodo de observacin.
Por otra parte, de 39
trabajadores que solo se exponan espordicamente al ruido, la gran mayora casi no presentaban
manifestaciones de sordera al final del perodo de observacin..
Salvo pocas excepciones, la gran mayora de las personas no logra captar de primera intencin la
magnitud de las cifras y el modo en que se distribuyen las variables a las que se est haciendo
referencia. Es casi seguro que una importante proporcin de las personas tendr que releer la
descripcin dos o ms veces para emitir una opinin respecto a la informacin leda o escuchada.
En cambio, al disponer de un cuadro en el que se presenta dicha informacin, la comprensin de los
datos es casi automtica y las magnitudes numricas se comparan de manera sumamente gil.
Obsrvese el efecto que se logra con la presentacin tabular de la informacin:
Presencia
de sordera
SI
NO
Exposicin
al ruido
Regular
Espordica
Totales
60
(74%)
21 (26%)
81 (100%)
7 (18%)
32 (82%)
39 (100%)
Si bien los cuadros permiten efectuar comparaciones precisas de tipo numrico, tambin se hace
necesario disponer de una forma de presentacin que facilite la revisin visual rpida de las
caractersticas esenciales de los datos.
Obsrvese cmo el grfico que corresponde a la tabla anterior propicia una fcil comprensin de la
informacin con la sola inspeccin visual:
57
Si
100
No
75
50
25
Regular
Espordica
Exposicin al ruido
Cada cuadro debe tener un ttulo completo que responda a las preguntas
Qu se est presentando?,
Cmo se est presentando?,
De donde provienen los datos? y
De cundo son los datos?
Las variables deben tener un nombre exacto que est acorde con la escala de clases o
modalidades que se hayan definido para dichas variables.
La escala de cada variable debe tener modalidades o clases que sean exhaustivas y
mutuamente excluyentes.
En vista de que los cuadros tienen por propsito presentar las caractersticas numricas de los
datos, los clculos deben ser exactos.
Sexo
Nm.
Femenino
199
53.6
Masculino
172
46.4
Totales
371
100.0
Columna de frecuencias
absolutas
58
Columna de
frecuencias
relativas
Cada grfico debe tener un ttulo completo que responda a las preguntas
Qu se est presentando?,
Cmo se est presentando?,
De donde provienen los datos? y
De cundo son los datos?
Para no distorsionar la apreciacin visual de las variables que se estn presentando, la relacin
entre el eje vertical (ordenada) y el eje horizontal (abscisa) de los grficos debe ser de 1 a 1.5;
por ejemplo: si la ordenada mide 3 centmetros, la abscisa medir 4.5
La escala de cada variable debe tener modalidades o clases que sean exhaustivas y
mutuamente excluyentes.
En vista de que los grficos tienen por propsito agilizar la captacin visual de las caractersticas
esenciales de los datos sin distorsiones de ningn tipo, debe evitarse el uso de colores o de
efectos tridimensionales de volumen.
Escolares segn estado de higiene oral, Primaria
Republica de Bolivia, 1999
1600
1200
800
400
0
Muy bueno
Bueno
Regular
Malo
Estado de higiene oral
Muy malo
Se considera que el arsenal mnimo que se debe poseer en cuanto a capacidades para la elaboracin de
cuadros y grficos debe permitir la presentacin de:
1.
2.
3.
4.
5.
59
700
600
500
400
300
200
100
0
Excelente
Bueno
Regular
Malo
Psimo
Pacientes epilpticos
segn nmero de convulsiones diarias
Hospital Francs
1992
Nm.
14
12
10
8
6
4
2
0
1a3
4a6
7a9
10 a 12
60
1er paso:
Trazado de histograma
provisional
Trazado de uniones entre
centros de clase
600
500
400
300
200
100
0
0 a 20
21 a 40
41 a 60
Porcentaje de Aciertos
61 a
80
81 a 100
Alumnos
Segn porcentaje de aciertos
Examen final de anatoma
1992
No.
2o. paso
Eliminacin de barras
subyacentes
(VERSION FINAL)
700
600
500
400
300
200
100
0
0 a 20
21 a 40
41 a 60
61 a 80
Porcentaje de Aciertos
61
81 a 100
Invitados a la boda
Segn ingestin de mole y presencia de diarrea
San Garabato
1991
%
100
80
Diarrea
60
No
Si
40
20
0
SI
NO
Ingestin de mole
52
51
Talla
50
49
48
47
46
2500
2700
2900
3100
3300
Peso
62
3500
3700
15 a 24
5 a 14
1a4
menos de1
0
2000
4000
6000
8000
10000
12000
Hombres
Mujeres
80
60
40
20
0
2499
2999
3499
63
3999
4499
Estado
Civil
Solteros
Estado Civil
Hospital Francs
1992
Nmero
46
22.2
Casados
84
40.6
Viudos
25
12.1
Divorciados
16
7.7
Unin Libre
36
17.4
Pareja
14
6.8
Total
407
100.0
Nmero
Solteros
46
22.2
Casados
84
40.6
Viudos
25
12.1
Divorciados
16
7.7
Unin Libre
36
17.4
Total
207
100.0
64
Tipo de
Paciente
Nmero
Radical
226
23.3
Conservadora
452
66.7
Total
678
100.0
Nmero
Radical
226
33.3
Conservadora
452
66.7
Total
678
100.0
65
Nmero
38
2.75
Bueno
124
8.96
Regular
246
17.77
Malo
356
25.72
Psimo
620
44.80
1,384
100.0
Excelente
Total
Nmero
Excelente
38
2.75
Bueno
124
8.96
Regular
246
17.77
Malo
356
25.72
Psimo
620
44.80
1,384
100.0
Total
66
Calificacin
Nmero
MB
12
13.3
32
35.6
14
15.6
NA
8.9
NP
2.2
Psimo
22
24.4
Nmero
MB
12
17.6
32
47.1
14
20.6
NA
11.8
NP
2.9
Total
68
100.0
67
Estado Civil
Nmero
1 a 3
21.4
4 a 6
14
50.0
6 a 10
17.9
10 a 12
10.7
Total
38
100.0
Convulsiones
diarias
Nmero
1 a 3
21.4
4 a 6
14
50.0
7 a 9
17.9
10 a 12
10.7
Total
28
100.0
68
Nmero
de
familias
1a2
232
29.5
3a4
452
57.5
4a6
78
9.9
7a8
24
13.1
Total
100.0
Nmero
de
familias
1a2
232
29.5
3a4
452
57.5
5a6
78
9.9
7a8
24
3.1
Total
786
100.0
69
Sexo
Nmero
de
alumnos
0 a 10
38
2.75
11 a 20
124
8.96
21 a 30
246
17.77
31 a 40
356
25.72
41 a
620
50
Total
1,384
100.00
Nmero
de
alumnos
0 a 10
38
2.75
11 a 20
124
8.96
21 a 30
246
17.77
31 a 40
356
25.72
41 a
620
44.80
1,384
100.00
Total
50
70
Nmero
de
alumnos
0 a 20
38
42.75
21 a 40
124
8.96
41 a 60
246
17.77
61 a 80
356
25.72
81 a 100
620
44.80
1,384
100.00
Total
Nmero
de
alumnos
0 a 20
38
2.75
21 a 40
124
8.96
41 a 60
246
17.77
61 a 80
356
25.72
81 a 100
620
44.80
1,384
100.00
Total
71
Razones
Proporciones
Tasas
RAZONES
Definicin: Una razn es una medida de resumen para variables cualitativas que consiste en la
comparacin, a travs de una divisin, entre dos conjuntos.
Ejemplo: Se desea condensar la siguiente informacin: en un hospital rural existen 18 residentes que se
encargan de la atencin de 126 pacientes; por otra parte, en un hospital urbano existen 8 residentes que
se encargan de atender a 32 pacientes.
72
Procedimiento: de acuerdo a la definicin de razn deben dividirse dos grupos de elementos. En este
caso, para el hospital rural se divide el nmero de pacientes entre el nmero de residentes:
Razn
pacientes
126
en hospital rural =
=7
residentes
18
En cuanto al hospital urbano, se divide tambin el nmero de pacientes entre el nmero de residentes de
dicho hospital:
Razn
pacientes
32
en hospital urbano =
=4
residentes
8
Interpretacin:
Para el caso del hospital rural: Existen siete pacientes a atender por cada residente.
Para el caso del hospital urbano: Existen cuatro pacientes a atender por cada residente.
En conclusin: parece haber mayor cantidad de trabajo para los residentes del hospital rural.
PROPORCIONES
Definicin: Una proporcin es una medida de resumen para variables cualitativas que consiste en la
comparacin, a travs de una divisin, entre un subconjunto y el conjunto al que pertenece.
124,352
422,350
73
= 0.29
206,876
= 0.12
1'721,215
Interpretacin:
Para el caso del pas subdesarrollado: La importancia del subconjunto de muertes de menores de un
ao, en relacin con el conjunto total de muertes en el pas es de 0.29, lo que equivale a casi la tercera
parte de todas las defunciones.
Para el caso del pas industrializado: La importancia del subconjunto de muertes de menores de un ao,
en relacin con el conjunto total de muertes en el pas es de 0.12, lo que equivale a aproximadamente
una octava parte de todas la defunciones.
En conclusin: la importancia de las defunciones de nios menores de un ao es mucho mayor en el pas
subdesarrollado que en el pas industrializado.
Nota: Conviene mencionar que, en ocasiones, las proporciones son multiplicadas por el nmero 100 y
con ello se habla de los porcentajes. As, para el ejemplo, podra haberse hablado de que los porcentajes
de defunciones de menores de un ao en el pas subdesarrollado y en el pas industrializado eran de
29% y de 12%, respectivamente.
TASAS
Definicin: Una tasa es una medida de resumen para variables cualitativas que consiste en la
comparacin, a travs de una divisin, entre el nmero de veces que ocurre un cierto tipo de eventos y la
poblacin en la que puede ocurrir dicho tipo de eventos. Usualmente el resultado de tal divisin consiste
en una cifra fraccionaria menor a uno; por ello, el resultado de la divisin suele ser multiplicado por
alguna constante que sea mltiplo del nmero 10.
Ejemplo: En una ciudad, a lo largo del ao 1991, ocurrieron 345 defunciones por cncer de prstata.
Dicha ciudad tena una poblacin total de 2' 453, 310 habitantes. De ellos, 1' 210, 425 eran del sexo
masculino. Se desea condensar la informacin de tal manera que los clculos produzcan una medida de
resumen que permita imaginar o evocar la magnitud del riesgo que existe para los habitantes de tal
ciudad de fallecer por cncer de prstata.
Procedimiento: de acuerdo a la definicin de tasa debe dividirse el evento entre la poblacin en la cual
dicho evento puede ocurrir. El resultado debe multiplicarse por un mltiplo del nmero 10.
tasa de defunciones por cncer de prstata=
345
X 100,000 = 28.50 29
1210
,
,425
74
Defunciones por
enfermedades del
corazn
Total de
defunciones por
todas las causas
Jvenes
Ancianos
12, 763
11,425
48,999
306,025
Proporcin de
defunciones por
enfermedades del
corazn en relacin
con las defunciones
por todas las causas
.26
.04
Si se optara por comparar las proporciones de defunciones por enfermedades del corazn de ambos
grupos poblacionales podra quedar la impresin de que las enfermedades del corazn son un problema
mucho ms grave en el grupo de jvenes que en el de ancianos; esta falsa imagen se produce porque no
se est tomando en cuenta la cantidad de personas que componen a cada grupo poblacional; es decir,
no se est tomando en consideracin el volumen de las poblaciones en que pueden ocurrir ese tipo de
eventos.
En cambio obsrvese lo que ocurre cuando se usan los siguientes datos, necesarios para el clculo de
tasas:
Grupo
Poblacional
Jvenes
Defunciones por
enfermedades del
corazn
12, 763
Ancianos
11,425
Con los ltimos resultados ya se puede efectuar una comparacin correcta al decir que por cada 100,000
jvenes solo fallecen 53.4 de ellos por enfermedades del corazn; en cambio por cada 100,000 ancianos
fallecen 179.4 por la misma causa. Lo anterior significa que tales padecimientos constituyen un riesgo
mucho ms importante como causa de mortalidad en el grupo de ancianos que en el grupo de jvenes.
En cuarto lugar, aunque las tasas son calculadas con datos que pertenecen a periodos ya concluidos, se
considera que tales tasas sirven para anticipar la probabilidad o el riesgo de ocurrencia de un evento en
una poblacin para periodos inmediatos a aquel para el que se efectuaron los clculos.
75
PROBLEMAS
1. En un distrito escolar urbano se encontr que exista una poblacin escolar a nivel primaria de 123,456
nios. Para uso de tales nios se encontraron disponibles 1,380 sanitarios y 820 bebederos de agua.
Por otra parte, en un distrito escolar rural, se encontr una poblacin escolar de primaria de 34,244 nios. En las escuelas de dicho distrito se encontraron 179 sanitarios y 54 bebederos de agua.
Con la informacin anterior calcule e interprete las siguientes razones para los dos
distritos escolares:
2. En un pas en desarrollo ocurrieron 432,614 defunciones a lo largo de un ao. De tales defunciones las
correspondientes a nios menores de un ao fueron 125,315. Por otra parte, en un pas desarrollado,
ocurrieron 1' 347,915 defunciones en total. De tales defunciones 114,304 correspondieron a nios
menores de un ao.
Con la informacin anterior calcule e interprete la proporcin de las defunciones de menores de
un ao en relacin con el total de las defunciones. Compare la importancia de la mortalidad de
los nios menores de un ao en cada pas.
3. En un estudio sobre desercin escolar a nivel de licenciatura se encontr que de 894
estudiantes que ingresaron a la carrera de qumica 148 abandonaron los estudios
durante el primer ao de la carrera. Por otra parte, de 1,311 alumnos que ingresaron a la
carrera de medicina 118 abandonaron los estudios durante el primer ao de la carrera.
Calcule y compare las tasas de desercin en primer ao para ambas licenciaturas.
4. En un estudio efectuado en 1987 sobre el personal acadmico de instituciones pblicas y privadas de
educacin superior se encontr que haba 894 hombres y 1,814 mujeres en una universidad pblica
mientras que en una universidad privada de la misma regin haba 633 hombres y 274 mujeres.
En la universidad pblica se encontr que de los hombres 296 posean grados
acadmicos superiores al de licenciatura y de las mujeres 524 posean grados anlogos.
Con respecto a la universidad privada, se encontr que 92 hombres y 38 mujeres
posean grados acadmicos superiores al de licenciatura. Con la informacin anterior
calcule y describa para cada universidad lo siguiente:
razones hombres por cada mujeres
76
9.4
8.8
8.9
9.5
9.6
9.7
10.5
9.2
8.8
9.4
9.4
9.6
9.2
9.0
9.0
9.4
8.1
9.8
8.8
8.8
8.9
9.0
9.0
9.1
9.2
9.2
9.3
9.4
9.4
9.4
9.4
9.5
9.6
9.6
9.7
9.8
10.5
En vista de que la serie es par no existe un valor que se ubique exactamente en el centro de la serie y
que la divida en dos partes. Por lo anterior se considera que el promedio de los dos valores centrales que
estn colocados en las posiciones 10 y 11 corresponde al valor de la mediana; es decir: la mediana
equivale al valor promedio de 9.3 y 9.4 (9.35)
Interpretacin: "La mitad de los nios tuvieron un peso igual o menor que 9.35 kilogramos y la otra mitad
pesaron 9.35 o ms kilogramos"
77
PERCENTILES ( Pp ) :
Definicin: En una serie de valores ordenados, de menor a mayor o viceversa, es aquel valor que divide
en dos partes porcentualmente complementarias a toda la serie. Por ejemplo: el percentil 40 divide a
la serie en una parte que contiene al 40 % de los valores iguales o inferiores a l y, simultneamente, en
otra parte que contiene al 60% de los valores de la serie iguales o mayores a dicho percentil.
Procedimiento: Ordenar la serie y localizar el valor que la divida en los porcentajes complementarios
deseados.
Por ejemplo, para encontrar el valor del percentil 25 debe localizarse a aquel que deje a una cuarta parte
de los valores con menores o iguales magnitudes a l y a las tres cuartas partes restantes de los valores
con magnitudes ms grandes o iguales a l.
8.1
8.8
8.8
8.9
9.0
9.0
9.1
9.2
9.2
9.3
9.4
9.4
9.4
9.4
9.5
9.6
9.6
9.7
9.8
10.5
En esta serie, entre los valores 9.0 se debe encontrar un valor en una posicin tal que hasta l se encuentra el 25% de los casos y, simultneamente, desde l se encuentra el 75% restante de los casos.
Usualmente cualquier percentil se ubica en una posicin localizada mediante la siguiente frmula:
Lugar que ocupa el percentil buscado =
(p buscado ) (n + 1)
100
(p 25 ) (20 + 1)
(25) (21)
le corresponde el lugar
= 5.25
100
100
Lo anterior significa que el percentil 25 se encuentra entre el lugar 5 y el lugar 6. En estos casos, por
convencin, se considera posible obtener un promedio de los valores que se encuentren en las posiciones adyacentes. Como ya se observ, la quinta posicin est ocupada por un valor de 9.0 y la sexta por
un valor tambin de 9.0; por lo anterior, el promedio de ambos valores es igual a 9.0.
Interpretacin: (Vlida para el Percentil 25 o P25) :
" El 25% de los nios tuvo un peso de 9.0 kilogramos o menor y el 75% restante tuvo peso de 9.0 kilogramos mayor".
Como ejemplo adicional supongamos que se desea encontrar el valor del percentil 75. Para ello debe
localizarse a aquel que deje a tres cuartas partes de los valores con menores o iguales magnitudes a l y
a la cuarta parte restante de los valores con magnitudes ms grandes o iguales a l.
8.1
8.8
8.8
8.9
9.0
9.0
9.1
9.2
9.2
9.3
9.4
9.4
9.4
9.4
9.5
9.6
9.6
9.7
9.8
10.5
En esta serie, entre los valores 9.5 y 9.6 se debe encontrar un valor en una posicin tal que hasta l se
encuentra el 75% de los casos y, simultneamente, desde l se encuentra el 25% restante de los casos.
78
Utilizando la frmula:
Lugar que ocupa el percentil buscado =
(p buscado ) (n + 1)
100
(p 75 ) (20 + 1)
(75) (21)
que equivale a
= 15.75
100
100
Lo anterior significa que el percentil 75 se encuentra entre el lugar 15 y el lugar 16. Como ya se dijo, en
estos casos, y por convencin, se considera posible obtener un promedio de los valores que se encuentren en las posiciones adyacentes. Como ya se observ, la posicin 15 est ocupada por un valor de 9.5
y la posicin 16 por un valor tambin de 9.6; por lo anterior, el promedio de ambos valores es igual a
9.55.
" El 75% de los nios tuvo un peso de 9.55 kiloInterpretacin: (Vlida para el Percentil 75 o P75) :
gramos o menor y el 25% restante tuvo peso de 9.55 kilogramos mayor".
Duracin de
la gestacin
en semanas
p25
p75
Diferencia
p75 p25
60
32
1,800
2,800
1,000
2,709
39
2,884
3,132
248
79
Comentario
El 50% central de la serie de
pesos de los 60 nios tiene
una diferencia entre el mayor
de los pesos y el menor de
ellos de 1,000 gramos. Puede hablarse de gran heterogeneidad
El 50% central de la serie de
pesos de los 2,709 nios
tiene una diferencia entre el
mayor de los pesos y el menor de ellos de 248 gramos.
Puede hablarse de gran
homogeneidad
PROBLEMA RESUELTO
Luego de criar durante dos aos a un grupo de 20 cerdos en una granja modelo que funcionaba bajo el
rgimen de sociedad cooperativa, en condiciones de estricta higiene animal, se sacrificaron y observaron
sus cerebros en bsqueda de quistes de cisticercos. Los hallazgos se compararon con otro grupo de 20
cerdos criados en los patios de las casas de la misma localidad.
Cerdos provenientes de la granja modelo
Cerdo
No.
Quistes
10
11
12
13
14
1
5
1
6
1
7
18
19
20
10
11
12
13
14
1
5
1
6
1
7
18
19
20
Preguntas:
a) Para cada grupo identifique la mediana (o percentil 50) y emita una opinin con respecto a los resultados.
b) Para cada grupo identifique los valores mnimo y mximo, as como los percentiles 25 y 75 y llene la
siguiente tabla:
Valor mnimo
Percentil 25
Percentil 75
Valor mximo
Grupo "Granja"
Grupo "Patios"
c) Emita una opinin en relacin con los hallazgos en trminos de porcentajes de cada grupo considerando a los percentiles 25 y 75.
d) No olvide discutir los hallazgos para el 50% central de los animales de uno y otro grupo que se encontraron entre los percentiles 25 y 75 de cada uno de los grupos. Tambin, opine sobre la homogeneidad y
heterogeneidad de los grupos.
Para responder a las preguntas, primero se ordenan los datos y se localizan los percentiles buscados:
Cerdos provenientes de la granja modelo
Cerdo
No.
1
2
1
7
1
1
1
3
1
4
16
20
1
5
1
8
10
19
Quistes
P25 = (1+1) / 2 = 1
P50 = (1+1) / 2 = 1
80
P75 = (2+2) / 2 = 2
1
5
2
0
1
1
1
2
19
13
14
1
7
1
8
16
10
Quistes
P25 = (2+2) / 2 = 2
P75 = (4+4) / 2 = 4
Respuestas:
a) La mediana del grupo granja fue 1 y la del grupo patios fue 3.5.
Se observ que la mitad de los cerdos del grupo granja tuvo 1 o menos quistes y la otra mitad de ellos
tuvieron 1 o ms quistes
Se observ que la mitad de los cerdos del grupo patios tuvo 3.5 o menos quistes y la otra mitad de ellos
tuvieron 3.5 o ms quistes
b)
Grupo "Granja"
Grupo "Patios"
Valor mnimo
0
0
Percentil 25
1
2
Percentil 75
2
4
Valor mximo
4
9
c)
En el grupo granja una cuarta parte de los cerdos tuvo hasta 1 quiste y las tres cuartas partes restantes
tuvieron desde 1 quiste en adelante.
En el grupo granja tres cuartas partes de los cerdos tuvieron hasta 2 quistes y la cuarta parte restante
tuvo desde 2 quistes en adelante.
En el grupo patios una cuarta parte de los cerdos tuvo hasta 2 quistes y las tres cuartas partes restantes
tuvieron desde 2 quistes en adelante.
En el grupo patios tres cuartas partes de los cerdos tuvieron hasta 4 quistes y la cuarta parte restante
tuvo desde 4 quistes en adelante.
d)
En el grupo granja el 50% central de los cerdos tuvieron entre 1 y 2 quistes, mientras que en el grupo
patios el 50% central de los cerdos tuvieron entre 2 y 4 quistes; por lo anterior puede decirse que los
cerdos del grupo granja fueron ms homogneos y los del grupo patios fueron ms heterogneos.
81
9.4
8.9
9.6
10.5
8.8
9.4
9.2
9.0
8.1
9.3
8.8
9.5
9.7
9.2
9.4
9.6
9.0
9.4
9.8
PROMEDIO:
Definicin: Es el valor que tendran todos los datos de una serie numrica si ellos fueran de igual valor.
Frmula:
x=
x
n
Procedimiento: Sumar todos los valores y dividir tal suma entre el nmero de valores que componen a
la serie simple. En este caso la suma es: 185.7 y, entonces, el promedio vale:
185.7 / 20 = 9.285 Kilogramos
Interpretacin: "Si todos los nios tuvieran peso igual, ste sera de 9.285 kilogramos".
DESVIACION ESTANDAR 1
Definicin: Es la raz cuadrada de la varianza. A su vez, la varianza equivale al promedio de las desviaciones o diferencias cuadrticas de cada valor de una serie con respecto al promedio de dicha serie.
Frmula:
s=
(x x)
n -1
1 Junto con esta seccin se recomienda estudiar documentos y realizar ejercicios relacionados con la curva normal
82
Procedimiento:
Paso 1. Obtener el promedio de la serie de valores. En este caso, por tratarse de una serie simple de vax
x=
lores se usa la frmula anteriormente revisada:
n
Paso 2. Calcular la desviacin o diferencia de cada valor en relacin con el promedio de la serie; es decir
(x x )
Paso 3. Elevar al cuadrado cada una de las anteriores desviaciones; es decir obtener una serie de valo-
res
( x x )2
(x x )
Paso 5. Dividir la suma anterior entre el nmero de valores menos uno; es decir: obtener el promedio de
(x x )
n -1
Paso 6. Obtener la raz cuadrada del anterior promedio; es decir obtener la desviacin estndar:
(x x )
s=
n -1
As, los clculos para los pesos de los 20 nios son los siguientes:
Para los pasos 2, 3 y 4 se recomienda utilizar una tabla auxiliar como la siguiente para efectuar los clculos:
83
Desviacin de
cada valor con respecto al promedio
__
( Xi - X )
(paso 2)
-0.185
0.115
-0.385
.
.
0.515
9.1
9.4
8.9
.
.
9.8
Elevacin al cuadrado
de cada una de las
desviaciones
__ 2
( Xi - X )
(paso 3)
0.034
0.113
0.148
.
.
0.265.
4.446
(paso 4)
Para el paso 6: Finalmente la desviacin estndar, que equivale a la raz cuadrada de la varianza equivale a la raz cuadrada de 0.234 o sea: 0.484 kgrs.
Interpretacin: La interpretacin est condicionada a la suposicin de que los valores tienen una distribucin semejante a la de la curva normal 2.
Dicha interpretacin puede ser realizada en mltiples sentidos ya que se sabe que el 68.27% de los valores de una serie que se distribuye como la curva normal estn agrupados alrededor del promedio si a
ste se le resta una vez y tambin se le suma una vez el valor calculado para la desviacin estndar.
Para el ejemplo, puede decirse entonces que el 68.27% de los nios tuvieron pesos que fluctuaron desde 8.801 kgrs (es decir: 9.285 kgrs menos 0.484 kgrs) hasta 9.769 kgrs. (es decir: 9.285 ms 0.484
kgrs.).
Por otra parte, como se sabe que la curva normal tiene una rea que equivale a un total de 100%, entonces tambin puede decirse que hubo un 31.73% (ya que si a 100% se le resta 68.27% quedan 31.73%)
de los nios que pesaron menos de 8.801 kgrs. o que pesaron ms de 9.769 kgrs.
3. El promedio de todos los valores z de la abscisa equivale a cero, pues la mitad son negativos y
la mitad son positivos. En el sitio de la abscisa que corresponde al cero, es decir al promedio, se
encuentra la parte ms alta de la curva. En este sitio tambin se encuentra la mediana de todos los
valores z de la abscisa, pues el 50% de ellos est antes del cero y el 50% restante se encuentra
despus.
4. La curva es simtrica alrededor del promedio; esto es, hay una mitad izquierda que es reflejo de
la mitad derecha.
85
6. La curva es asinttica; es decir, sus extremos tericamente nunca tocan a la abscisa. Por ello, la
longitud de la abscisa podra ser infinitamente larga; sin embargo se acostumbra graficar solo
hasta la distancia de tres segmentos a la izquierda y a la derecha del promedio.
7. Toda el rea bajo la curva vale 1. Por lo anterior el rea a la izquierda del promedio vale .5 y el
rea a la derecha del promedio vale tambin .5
8. El rea que se encuentra sobre el segmento de la abscisa que va desde el promedio hasta el
valor z de +1 vale .3413; por simetra, el arrea que se encuentra sobre el segmento que va desde
el promedio hasta el valor z de -1 de la abscisa tambin vale .3413
Por lo anterior el rea que se encuentra por arriba del amplio segmento que va desde el valor z de
-1 hasta el valor z de +1 equivale a .6826; es decir a la suma de .3413 mas .3413
9. El rea que se encuentra sobre el segmento de la abscisa que van ms all del valor z de +1
vale .1587; por simetra, el arrea que se encuentra sobre el segmento que va ms all (hacia
menos infinito) del valor z de -1 de la abscisa tambin vale .1587
(A)
Valor z
(B)
Area entre el
promedio y el
valor z
(C)
Area ms all
del valor z
0.00
.0000
.5000
0.25
0.50
0.75
.0987
.1915
.2734
.4013
.3085
.2266
1.00
.3413
.1587
1.25
1.50
1.65
1.75
.3944
.4332
.4505
.4599
.1056
.0668
.0495
.0401
1.96
.4750
.0250
2.00
.4772
.0228
2.58
.4950
.0050
86
Al principio de este documento se coment que sin conocer las caractersticas bsicas del modelo
de la curva normal podra carecer de significado que se mencionara que el valor de la desviacin
estndar del peso de 300 personas fue de 5 kilos.
Una vez que se han comprendido las propiedades principales de la curva normal es posible
entender el significado del valor de la desviacin estndar del peso de las 300 personas si se
hacen suposiciones como las siguientes:
Suponiendo que al graficar el peso de los 300 individuos con un polgono de frecuencias, el grfico
resultante fuera muy parecido al modelo de la curva normal como se muestra en la siguiente
ilustracin:
el rea bajo la curva de valores de peso que contiene a los individuos vale 300 de
manera semejante a la propiedad del modelo de la curva normal de que su rea vale 1;
a la izquierda del promedio existen 150 individuos y a la derecha del promedio existen
los otros 150;
87
as como en la curva normal existe una rea de .3413 sobre el segmento que va desde
el valor z de 0 hasta el valor z de + 1 en la curva de valores x (es decir kilos de peso)
habr el .3413 de 300 o sea que habr 102 personas sobre el segmento que va desde
el valor x de 80 kilos hasta el valor x de 85 kilos;
de acuerdo al prrafo anterior, habr 204 personas con pesos que van desde 75 hasta
85 kilos;
al igual que en la curva normal existe simetra alrededor del promedio, se puede
considerar que en la curva de valores de peso habr 102 personas sobre el segmento
que va desde 80 kilos hasta 75 kilos de peso;
en la curva de valores peso habr un .1587 de las 300 personas; es decir 48 personas,
con pesos de 85 y ms kilos;
de manera semejante a la curva normal, por simetra habr un .1587 de las 300
personas; es decir 48 personas, con pesos de 75 y menos kilos.
Como puede apreciarse, una vez que se conocen las caractersticas del modelo de la curva
normal, la interpretacin del resultado de la desviacin estndar que se haya calculado para una
serie de datos es mucho ms fcil y brinda una gran cantidad de informacin sobre la manera en
que se distribuyen los valores.
Para confirmar que la comprensin del significado de la desviacin estndar brinda una importante
cantidad de informacin obsrvese el siguiente ejemplo:
Relato: Se aplic un mismo examen escrito a dos grupos de 90 alumnos cada uno. En un caso se
imprimi el examen en hojas de color amarillo paja y en otro caso en hojas de color marrn. Se
midi con cronmetro el tiempo, en minutos y fracciones, que tardaron los alumnos en entregar el
examen y se calcul el promedio y la desviacin estndar para ambos grupos obtenindose los
siguientes resultados:
Grupo
Color Paja
Color Marrn
Promedio
45'
45'
Desviacin
Estndar
5'
15'
Los alumnos a quienes se aplic el examen impreso en hojas color paja entregaron el
examen en tiempos ms homogneos, pues el .6826 de ellos (es decir 61 alumnos) lo
entregaron entre 40 y 50 minutos luego de haberlo iniciado.
Los alumnos a quienes se aplic el examen impreso en hojas color marrn entregaron el
examen en tiempos ms heterogneos, pues el .6826 de ellos (es decir 61 alumnos) lo
entregaron entre 30 y 60 minutos luego de haberlo iniciado.
En el grupo paja el .1587 ms lento de los alumnos (es decir: 14) entregaron su examen
luego de 50 minutos, mientras que en el grupo marrn la misma cantidad de alumnos lo
hizo luego de 60 minutos.
88
En la seccin anterior se ha visto que hay correspondencia entre las reas de la curva normal y las
de la serie de datos cuantitativos continuos que se est manejando siempre y cuando se haya
comprobado que esta ltima, al ser graficada con un polgono de frecuencias, muestra un parecido
razonable con el perfil de la curva normal.
Tal correspondencia ha permitido solamente mencionar las reas que se encuentran sobre
segmentos completos de la abscisa; es decir, solamente se ha hecho mencin de reas por arriba
o ms all de desviaciones estndar enteras.
Sin embargo, cmo podra responderse a la pregunta cuantos alumnos de cada grupo tardaron
47 o ms minutos en entregar su examen?.
En este caso se aprecia que no hay coincidencia entre el valor z de + 1 y el valor x de 47 minutos y
por ello deja de ser til el mtodo de comparacin analgica de los grficos que se utiliz en
pginas anteriores.
La respuesta estriba en el uso de una frmula para transformar cualquier valor x en su
correspondiente valor z y en hacer uso de la tabla de reas bajo la curva normal.
Una vez que se han calculado tanto el promedio como la desviacin estndar para una serie de
datos cuantitativos continuos, el valor z que, en la abscisa de la curva normal corresponde a un
determinado valor x de la abscisa de los datos que se estn manejando, se encuentra con la
frmula:
x x
z=
s
Para responder a la pregunta recientemente planteada de cuantos alumnos de cada grupo
tardaron 47 o ms minutos en entregar su examen? se hacen las siguientes sustituciones:
Para el grupo al que se aplic el examen en hojas color paja se tiene que
x = 45' y s = 5' ;
z=
47 45
5
= .4
El valor z obtenido, en este caso .4 debe localizarse en la primera columna de la tabla de reas
Una vez localizado tal valor, se busca en la segunda columna cul es el rea
bajo la curva (1) .
que en la curva normal se encuentra ms all de dicho valor z; en este caso es de .3446.
Usar la tabla detallada de reas bajo la curva normal que se encuentra como anexo de
este documento. Dicha tabla tiene ligeras diferencias de formato con la de la pgina 2
89
Como el rea encontrada (.3446) es una proporcin del rea total, entonces la misma proporcin
se aplica al total de alumnos del grupo para saber cuantos tardaron ms de 47 minutos en entregar
el examen.
As, luego de efectuar la operacin .3446 X 90 = 31, puede responderse a la pregunta con el
sealamiento de que hubo en este grupo 31 alumnos que tardaron 47 o ms minutos en entregar
su examen. Desde luego, al conocer las propiedades bsicas de la curva normal, tambin se
puede decir que hubo 59 alumnos que tardaron 47 o menos minutos en entregar su examen.
Por otra parte, para el grupo al que se aplic el examen en hojas color marrn se tiene que
x = 45' y s = 15' ;
z=
47 45
15
= .13
15
El valor z obtenido, en este caso .13 debe localizarse en la primera columna de la tabla de reas
Una vez localizado tal valor, se busca en la segunda columna cul es el rea
bajo la curva (2) .
que en la curva normal se encuentra ms all de dicho valor z; en este caso es de .3446.
Como el rea encontrada (.4483) es una proporcin del rea total, entonces la misma proporcin
se aplica al total de alumnos del grupo para saber cuantos tardaron ms de 47 minutos en entregar
el examen.
As, luego de efectuar la operacin .4483 X 90 = 40, puede responderse a la pregunta con el
sealamiento de que hubo en este grupo 40 alumnos que tardaron 47 o ms minutos en entregar
su examen. Desde luego, al conocer las propiedades bsicas de la curva normal, tambin se
puede decir que hubo 50 alumnos que tardaron 47 o menos minutos en entregar su examen.
Usar la tabla detallada de reas bajo la curva normal que se encuentra como anexo de
este documento. Dicha tabla tiene ligeras diferencias de formato con la de la pgina 2
90
(B)
(C)
xx
z=
s
91
(D)
Valor Z
(A)
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.10
0.11
0.12
0.13
0.14
0.15
0.16
0.17
0.18
0.19
0.20
0.21
0.22
0.23
0.24
0.25
0.26
0.27
0.28
0.29
0.30
0.31
0.32
0.33
0.34
0.35
0.36
0.37
0.38
0.39
0.40
0.41
0.42
0.43
0.44
0.45
0.46
0.47
0.48
0.49
0.50
rea desde el
rea en el
rea entre el
extremo
mismo
promedio y el
opuesto hasta extremo ms
valor Z
el valor Z
all del valor Z
(B)
(C)
(D)
0.5000
0.5040
0.5080
0.5120
0.5160
0.5199
0.5239
0.5279
0.5319
0.5359
0.5398
0.5438
0.5478
0.5517
0.5557
0.5596
0.5636
0.5675
0.5714
0.5753
0.5793
0.5832
0.5871
0.5910
0.5948
0.5987
0.6026
0.6064
0.6103
0.6141
0.6179
0.6217
0.6255
0.6293
0.6331
0.6368
0.6406
0.6443
0.6480
0.6517
0.6554
0.6591
0.6628
0.6664
0.6700
0.6736
0.6772
0.6808
0.6844
0.6879
0.6915
0.5000
0.4960
0.4920
0.4880
0.4840
0.4801
0.4761
0.4721
0.4681
0.4641
0.4602
0.4562
0.4522
0.4483
0.4443
0.4404
0.4364
0.4325
0.4286
0.4247
0.4207
0.4168
0.4129
0.4090
0.4052
0.4013
0.3974
0.3936
0.3897
0.3859
0.3821
0.3783
0.3745
0.3707
0.3669
0.3632
0.3594
0.3557
0.3520
0.3483
0.3446
0.3409
0.3372
0.3336
0.3300
0.3264
0.3228
0.3192
0.3156
0.3121
0.3085
Valor Z
(A)
0.50
0.51
0.52
0.53
0.54
0.55
0.56
0.57
0.58
0.59
0.60
0.61
0.62
0.63
0.64
0.65
0.66
0.67
0.68
0.69
0.70
0.71
0.72
0.73
0.74
0.75
0.76
0.77
0.78
0.79
0.80
0.81
0.82
0.83
0.84
0.85
0.86
0.87
0.88
0.89
0.90
0.91
0.92
0.93
0.94
0.95
0.96
0.97
0.98
0.99
1.00
0.0000
0.0040
0.0080
0.0120
0.0160
0.0199
0.0239
0.0279
0.0319
0.0359
0.0398
0.0438
0.0478
0.0517
0.0557
0.0596
0.0636
0.0675
0.0714
0.0753
0.0793
0.0832
0.0871
0.0910
0.0948
0.0987
0.1026
0.1064
0.1103
0.1141
0.1179
0.1217
0.1255
0.1293
0.1331
0.1368
0.1406
0.1443
0.1480
0.1517
0.1554
0.1591
0.1628
0.1664
0.1700
0.1736
0.1772
0.1808
0.1844
0.1879
0.1915
92
rea desde el
rea en el
rea entre el
extremo
mismo
promedio y el
opuesto hasta extremo ms
valor Z
el valor Z
all del valor Z
(B)
(C)
(D)
0.6915
0.6950
0.6985
0.7019
0.7054
0.7088
0.7123
0.7157
0.7190
0.7224
0.7257
0.7291
0.7324
0.7357
0.7389
0.7422
0.7454
0.7486
0.7517
0.7549
0.7580
0.7611
0.7642
0.7673
0.7704
0.7734
0.7764
0.7794
0.7823
0.7852
0.7881
0.7910
0.7939
0.7967
0.7995
0.8023
0.8051
0.8078
0.8106
0.8133
0.8159
0.8186
0.8212
0.8238
0.8264
0.8289
0.8315
0.8340
0.8365
0.8389
0.8413
0.3085
0.3050
0.3015
0.2981
0.2946
0.2912
0.2877
0.2843
0.2810
0.2776
0.2743
0.2709
0.2676
0.2643
0.2611
0.2578
0.2546
0.2514
0.2483
0.2451
0.2420
0.2389
0.2358
0.2327
0.2296
0.2266
0.2236
0.2206
0.2177
0.2148
0.2119
0.2090
0.2061
0.2033
0.2005
0.1977
0.1949
0.1922
0.1894
0.1867
0.1841
0.1814
0.1788
0.1762
0.1736
0.1711
0.1685
0.1660
0.1635
0.1611
0.1587
0.1915
0.1950
0.1985
0.2019
0.2054
0.2088
0.2123
0.2157
0.2190
0.2224
0.2257
0.2291
0.2324
0.2357
0.2389
0.2422
0.2454
0.2486
0.2517
0.2549
0.2580
0.2611
0.2642
0.2673
0.2704
0.2734
0.2764
0.2794
0.2823
0.2852
0.2881
0.2910
0.2939
0.2967
0.2995
0.3023
0.3051
0.3078
0.3106
0.3133
0.3159
0.3186
0.3212
0.3238
0.3264
0.3289
0.3315
0.3340
0.3365
0.3389
0.3413
Valor Z
(A)
1.00
1.01
1.02
1.03
1.04
1.05
1.06
1.07
1.08
1.09
1.10
1.11
1.12
1.13
1.14
1.15
1.16
1.17
1.18
1.19
1.20
1.21
1.22
1.23
1.24
1.25
1.26
1.27
1.28
1.29
1.30
1.31
1.32
1.33
1.34
1.35
1.36
1.37
1.38
1.39
1.40
1.41
1.42
1.43
1.44
1.45
1.46
1.47
1.48
1.49
1.50
rea desde el
rea en el
rea entre el
extremo
mismo
promedio y el
opuesto hasta extremo ms
valor Z
el valor Z
all del valor Z
(B)
(C)
(D)
0.8413
0.8438
0.8461
0.8485
0.8508
0.8531
0.8554
0.8577
0.8599
0.8621
0.8643
0.8665
0.8686
0.8708
0.8729
0.8749
0.8770
0.8790
0.8810
0.8830
0.8849
0.8869
0.8888
0.8907
0.8925
0.8944
0.8962
0.8980
0.8997
0.9015
0.9032
0.9049
0.9066
0.9082
0.9099
0.9115
0.9131
0.9147
0.9162
0.9177
0.9192
0.9207
0.9222
0.9236
0.9251
0.9265
0.9279
0.9292
0.9306
0.9319
0.9332
0.1587
0.1562
0.1539
0.1515
0.1492
0.1469
0.1446
0.1423
0.1401
0.1379
0.1357
0.1335
0.1314
0.1292
0.1271
0.1251
0.1230
0.1210
0.1190
0.1170
0.1151
0.1131
0.1112
0.1093
0.1075
0.1056
0.1038
0.1020
0.1003
0.0985
0.0968
0.0951
0.0934
0.0918
0.0901
0.0885
0.0869
0.0853
0.0838
0.0823
0.0808
0.0793
0.0778
0.0764
0.0749
0.0735
0.0721
0.0708
0.0694
0.0681
0.0668
Valor Z
(A)
1.50
1.51
1.52
1.53
1.54
1.55
1.56
1.57
1.58
1.59
1.60
1.61
1.62
1.63
1.64
1.65
1.66
1.67
1.68
1.69
1.70
1.71
1.72
1.73
1.74
1.75
1.76
1.77
1.78
1.79
1.80
1.81
1.82
1.83
1.84
1.85
1.86
1.87
1.88
1.89
1.90
1.91
1.92
1.93
1.94
1.95
1.96
1.97
1.98
1.99
2.00
0.3413
0.3438
0.3461
0.3485
0.3508
0.3531
0.3554
0.3577
0.3599
0.3621
0.3643
0.3665
0.3686
0.3708
0.3729
0.3749
0.3770
0.3790
0.3810
0.3830
0.3849
0.3869
0.3888
0.3907
0.3925
0.3944
0.3962
0.3980
0.3997
0.4015
0.4032
0.4049
0.4066
0.4082
0.4099
0.4115
0.4131
0.4147
0.4162
0.4177
0.4192
0.4207
0.4222
0.4236
0.4251
0.4265
0.4279
0.4292
0.4306
0.4319
0.4332
93
rea desde el
rea en el
rea entre el
extremo
mismo
promedio y el
opuesto hasta extremo ms
valor Z
el valor Z
all del valor Z
(B)
(C)
(D)
0.9332
0.9345
0.9357
0.9370
0.9382
0.9394
0.9406
0.9418
0.9429
0.9441
0.9452
0.9463
0.9474
0.9484
0.9495
0.9505
0.9515
0.9525
0.9535
0.9545
0.9554
0.9564
0.9573
0.9582
0.9591
0.9599
0.9608
0.9616
0.9625
0.9633
0.9641
0.9649
0.9656
0.9664
0.9671
0.9678
0.9686
0.9693
0.9699
0.9706
0.9713
0.9719
0.9726
0.9732
0.9738
0.9744
0.9750
0.9756
0.9761
0.9767
0.9772
0.0668
0.0655
0.0643
0.0630
0.0618
0.0606
0.0594
0.0582
0.0571
0.0559
0.0548
0.0537
0.0526
0.0516
0.0505
0.0495
0.0485
0.0475
0.0465
0.0455
0.0446
0.0436
0.0427
0.0418
0.0409
0.0401
0.0392
0.0384
0.0375
0.0367
0.0359
0.0351
0.0344
0.0336
0.0329
0.0322
0.0314
0.0307
0.0301
0.0294
0.0287
0.0281
0.0274
0.0268
0.0262
0.0256
0.0250
0.0244
0.0239
0.0233
0.0228
0.4332
0.4345
0.4357
0.4370
0.4382
0.4394
0.4406
0.4418
0.4429
0.4441
0.4452
0.4463
0.4474
0.4484
0.4495
0.4505
0.4515
0.4525
0.4535
0.4545
0.4554
0.4564
0.4573
0.4582
0.4591
0.4599
0.4608
0.4616
0.4625
0.4633
0.4641
0.4649
0.4656
0.4664
0.4671
0.4678
0.4686
0.4693
0.4699
0.4706
0.4713
0.4719
0.4726
0.4732
0.4738
0.4744
0.4750
0.4756
0.4761
0.4767
0.4772
Valor Z
(A)
2.00
2.01
2.02
2.03
2.04
2.05
2.06
2.07
2.08
2.09
2.10
2.11
2.12
2.13
2.14
2.15
2.16
2.17
2.18
2.19
2.20
2.21
2.22
2.23
2.24
2.25
2.26
2.27
2.28
2.29
2.30
2.31
2.32
2.33
2.34
2.35
2.36
2.37
2.38
2.39
2.40
2.41
2.42
2.43
2.44
2.45
2.46
2.47
2.48
2.49
2.50
rea desde el
rea en el
rea entre el
extremo
mismo
promedio y el
opuesto hasta extremo ms
valor Z
el valor Z
all del valor Z
(B)
(C)
(D)
0.9772
0.9778
0.9783
0.9788
0.9793
0.9798
0.9803
0.9808
0.9812
0.9817
0.9821
0.9826
0.9830
0.9834
0.9838
0.9842
0.9846
0.9850
0.9854
0.9857
0.9861
0.9864
0.9868
0.9871
0.9875
0.9878
0.9881
0.9884
0.9887
0.9890
0.9893
0.9896
0.9898
0.9901
0.9904
0.9906
0.9909
0.9911
0.9913
0.9916
0.9918
0.9920
0.9922
0.9925
0.9927
0.9929
0.9931
0.9932
0.9934
0.9936
0.9938
0.0228
0.0222
0.0217
0.0212
0.0207
0.0202
0.0197
0.0192
0.0188
0.0183
0.0179
0.0174
0.0170
0.0166
0.0162
0.0158
0.0154
0.0150
0.0146
0.0143
0.0139
0.0136
0.0132
0.0129
0.0125
0.0122
0.0119
0.0116
0.0113
0.0110
0.0107
0.0104
0.0102
0.0099
0.0096
0.0094
0.0091
0.0089
0.0087
0.0084
0.0082
0.0080
0.0078
0.0075
0.0073
0.0071
0.0069
0.0068
0.0066
0.0064
0.0062
Valor Z
(A)
2.50
2.51
2.52
2.53
2.54
2.55
2.56
2.57
2.58
2.59
2.60
2.61
2.62
2.63
2.64
2.65
2.66
2.67
2.68
2.69
2.70
2.71
2.72
2.73
2.74
2.75
2.76
2.77
2.78
2.79
2.80
2.81
2.82
2.83
2.84
2.85
2.86
2.87
2.88
2.89
2.90
2.91
2.92
2.93
2.94
2.95
2.96
2.97
2.98
2.99
3.00
0.4772
0.4778
0.4783
0.4788
0.4793
0.4798
0.4803
0.4808
0.4812
0.4817
0.4821
0.4826
0.4830
0.4834
0.4838
0.4842
0.4846
0.4850
0.4854
0.4857
0.4861
0.4864
0.4868
0.4871
0.4875
0.4878
0.4881
0.4884
0.4887
0.4890
0.4893
0.4896
0.4898
0.4901
0.4904
0.4906
0.4909
0.4911
0.4913
0.4916
0.4918
0.4920
0.4922
0.4925
0.4927
0.4929
0.4931
0.4932
0.4934
0.4936
0.4938
94
rea desde el
rea en el
rea entre el
extremo
mismo
promedio y el
opuesto hasta extremo ms
valor Z
el valor Z
all del valor Z
(B)
(C)
(D)
0.9938
0.9940
0.9941
0.9943
0.9945
0.9946
0.9948
0.9949
0.9951
0.9952
0.9953
0.9955
0.9956
0.9957
0.9959
0.9960
0.9961
0.9962
0.9963
0.9964
0.9965
0.9966
0.9967
0.9968
0.9969
0.9970
0.9971
0.9972
0.9973
0.9974
0.9974
0.9975
0.9976
0.9977
0.9977
0.9978
0.9979
0.9979
0.9980
0.9981
0.9981
0.9982
0.9982
0.9983
0.9984
0.9984
0.9985
0.9985
0.9986
0.9986
0.9987
0.0062
0.0060
0.0059
0.0057
0.0055
0.0054
0.0052
0.0051
0.0049
0.0048
0.0047
0.0045
0.0044
0.0043
0.0041
0.0040
0.0039
0.0038
0.0037
0.0036
0.0035
0.0034
0.0033
0.0032
0.0031
0.0030
0.0029
0.0028
0.0027
0.0026
0.0026
0.0025
0.0024
0.0023
0.0023
0.0022
0.0021
0.0021
0.0020
0.0019
0.0019
0.0018
0.0018
0.0017
0.0016
0.0016
0.0015
0.0015
0.0014
0.0014
0.0013
0.4938
0.4940
0.4941
0.4943
0.4945
0.4946
0.4948
0.4949
0.4951
0.4952
0.4953
0.4955
0.4956
0.4957
0.4959
0.4960
0.4961
0.4962
0.4963
0.4964
0.4965
0.4966
0.4967
0.4968
0.4969
0.4970
0.4971
0.4972
0.4973
0.4974
0.4974
0.4975
0.4976
0.4977
0.4977
0.4978
0.4979
0.4979
0.4980
0.4981
0.4981
0.4982
0.4982
0.4983
0.4984
0.4984
0.4985
0.4985
0.4986
0.4986
0.4987
1 Se dice que una distribucin de valores cuantitativos continuos tiene semejanza a la curva
normal si su sesgo, calculado a travs del mtodo de momentos, vale entre - 0.5 y + 0.5 , lo cual
se simboliza de la siguiente forma :
- 0.5 < a3 < + 0.5
y su curtosis, tambin calculada a travs del mtodo de momentos, vale entre 2 y 4, lo cual se
simboliza de la siguiente forma :
2 < a4 < 4
2 Las frmulas para calcular el sesgo y la curtosis, a travs del mtodo de momentos, son las
siguientes:
a3 =
SESGO
m3
m2
CURTOSIS
a4 =
m4
(m2 ) 2
3 El clculo de momentos para series simples de datos cuantitativos continuos se hace con las
frmulas siguientes:
MOMENTOS EN SERIES SIMPLES
Momento 2
Momento 3
Momento 4
m2 =
n
m3 =
n
m4 =
n
95
4 En el caso de las series simples de valores, conviene efectuar el clculo de los momentos a
travs de una tabla auxiliar de trabajo como la del siguiente ejemplo:
Ejemplo con una serie simple de valores:
9.4
8.8
8.9
9.5
9.6
9.7
10.5
9.2
8.8
9.4
9.4
9.6
9.2
9.0
9.0
9.4
8.1
9.8
__
( Xi - X )
Xi
9.1
9.4
8.9
9.6
10.5
8.8
9.4
9.2
9
8.1
9.3
8.8
9.5
9.7
9.2
9.4
9.6
9
9.4
9.8
Sumas
Desviacin de
cada valor con
respecto al
promedio
Elevacin al
cuadrado de
cada una de las
desviaciones
__ 2
Elevacin al
cubo de cada
una de las
desviaciones
__ 3
Elevacin a la
cuarta de cada
una de las
desviaciones
__ 4
( Xi - X )
( Xi - X )
( Xi - X )
-0.185
0.115
-0.385
0.315
1.215
-0.485
0.115
-0.085
-0.285
-1.185
0.015
-0.485
0.215
0.415
-0.085
0.115
0.315
-0.285
0.115
0.515
0.034
0.013
0.148
0.099
1.476
0.235
0.013
0.007
0.081
1.404
0.000
0.235
0.046
0.172
0.007
0.013
0.099
0.081
0.013
0.265
-0.006
0.002
-0.057
0.031
1.794
-0.114
0.002
-0.001
-0.023
-1.664
0.000
-0.114
0.010
0.071
-0.001
0.002
0.031
-0.023
0.002
0.137
0.001
0.000
0.022
0.010
2.179
0.055
0.000
0.000
0.007
1.972
0.000
0.055
0.002
0.030
0.000
0.000
0.010
0.007
0.000
0.070
0.000
4.446
0.077
4.421
96
x x
m2 =
n
x x
m3 =
n
x x
m4 =
n
m2 =
4.446
= 0.222
20
m3 =
0.077
= 0.004
20
m4 =
4.421
= 0.221
20
Finalmente, usando los valores calculados para los momentos y sustituyendo para las frmulas de
sesgo y curtosis en series simples, se tiene:
SESGO a 3 =
CURTOSIS
m3
m2
a4 =
a3 =
m4
(m2 )
a4 =
0.004
0.222
m4
(m2 )
0.004
(0.471)
0.221
(0.222)
0.004
= 0.038
0.105
0.221
= 4.484
0.049
En vista de que el sesgo calculado se encuentra en el intervalo que va desde - 0.5 hasta + 0.5
puede decirse que la distribucin de los pesos de los 20 nios es semejante en simetra a la de la
curva normal.
Sin embargo, en vista de que la curtosis calculada est fuera del intervalo que va desde 2 hasta 4
no puede decirse que el grado de apuntamiento o aplanamiento de los pesos de los 20 nios sea
semejante a la de la curva normal.
En resumen, la serie es simtrica como la curva normal pero ms apuntada o elevada que ella
(leptocrtica).
Por lo anterior, a pesar de que la variable es cuantitativa continua, no deben utilizarse como
medidas de resumen para describir a esta serie ni al promedio ni a la desviacin estndar y, en su
lugar, se debieran utilizar la mediana y diversos percentiles.
97
TEXTO:
(A)
COLESTEROL EN
SUERO (mg/100
ml.)
1195 - 1595
1595 - 1995
1995 - 2395
2395 - 2795
2795 - 3195
3195 - 3595
3595 - 3995
3995 - 4395
4395 - 4795
TOTAL
(E)
FRECUENCIA
FRECUENCIA
ACUMULADA
%
ACUMULADO
31
134
358
326
143
43
30
21
11
1,097
3
12
32
30
13
4
3
2
1
100
31
165
523
849
992
1035
1065
1086
1097
3
15
47
77
90
94
97
99
100
MODA:
Definicin: Es el valor que en una serie se repite con mayor frecuencia.
Procedimiento: En primer lugar identificar la clase o intervalo con mayor frecuencia (Clase Modal) y
en segundo lugar utilizar la siguiente frmula:
d1
Mo =L.inf.+
W
d1 + d2
Donde:
L.Inf. = Lmite inferior de la clase modal
d1 = Diferencia entre la frecuencia de la
clase modal y la clase anterior
d2 = Diferencia entre la frecuencia de la
clase modal y la clase posterior
W = Amplitud de la clase modal
Para el caso de la tabla de valores de colesterol:
Clase modal: 199.5 - 239.5 (porque en esta clase est la mayor frecuencia: 358 personas)
Mo =199.5 +
224
40
224 + 32
Mo =199. 5 + 35
Mo = 234.5 mgrs/100 ml
txmerag1.doc
Pgina 1 de 5
Interpretacin: "El valor de colesterol ms frecuente en el grupo de 1,097 varones fue de 234.5
mgrs/100 ml".
AMPLITUD:
Definicin: Es la diferencia entre el mayor centro de clase y el menor centro de clase de una serie
agrupada. La amplitud suele simbolizarse por las siglas Am.
Procedimiento: Encontrar, por sustraccin o resta, la diferencia entre el centro de clase ms grande
de la serie ( X' max ) y el centro de clase ms pequeo ( X' min ).
En la serie agrupada de valores de colestrol el centro de clase ms grande es 459.5 (que resulta de
sumar los lmites superior e inferior de la ltima clase y dividir entre dos); por otra parte, el centro de
la primera clase vale ( 119.5 + 159.5) / 2 = 139.5
Por lo tanto, la amplitud vale Am = X' max - X' min = 459.5 - 139.5 = 320 mgrs de colesterol
Interpretacin: "La diferencia entre el mayor y el menor valor de colesterol fue de 320 mgrs/100 ml.".
MEDIANA ( O PERCENTIL 50 ) :
Definicin: En una serie de valores agrupados en clases o intervalos, es aquel valor que divide en
dos partes de igual tamao a toda la serie; dicho de otra manera, es el valor por detrs del cual queda
un 50% de los valores y por delante del cual queda el 50% restante.
.
Procedimiento: En primer lugar, analizando una columna con porcentajes acumulados (como la
columna E de la tabla de valores de colesterol que se muestra al principio de este documento),
identificar la clase en la que se acumula el 50% de las observaciones (identificacin de la clase que
contiene a la mediana).
Posteriormente, aplicar la siguiente frmula genrica vlida para cualquier percentil (recordar que la
mediana tambin se denomina percentil 50):
Pp = L.inf. +
n (p)
FA
100
W
fp
Donde:
Pp = Percentil a calcular
L.inf = Lmite inferior de la clase que contiene a la mediana
n
= nmero total de valores de la serie
p
= percentil buscado ( en este caso el 50)
FA = frecuencia acumulada ( columna D) hasta la
clase anterior a la que contiene a la mediana
fp
= frecuencia simple de la clase que contiene a la
mediana
W
= ancho de la clase que contiene a la mediana
Para el ejemplo de los 1,097 valores de colesterol, se tiene que la clase que contiene a la mediana es
la que tiene como lmite inferior a 239.5 y como lmite superior a 279.5, porque en la columna de
porcentajes acumulados ( E ) se observa que existe un 78% de los valores hasta tal clase. Por otra
parte, en la clase anterior (199.5 - 239.5) apenas se haba acumulado un 48% de todos los valores.
txmerag1.doc
Pgina 2 de 5
As pues, en la clase 239.5 - 279.5 necesariamente estar el valor que deja al 50% de los valores de
la serie por detrs de l.
1,097 ( 50)
523
100
40
326
548.5 523
Md = P50 = 239.5 +
40
326
Md = P50 = 239.5 +
Md = P50 = 242 . 62
Interpretacin: "La mitad de los 1,097 varones de 40 a 59 aos tuvieron valores de colesterol iguales
o menores que 242.62 mgrs/100 ml y el 50 % restante tuvo valores iguales o superiores a dicha cifra".
PERCENTILES ( Pp ) :
Definicin: En una serie agrupada de valores, es aquel valor que divide en dos partes
porcentualmente complementarias a toda la serie. Por ejemplo: el percentil 40 divide a la serie en
una parte que contiene al 40 % de los valores iguales o inferiores a l y, simultneamente, en otra
parte que contiene al 60% de los valores de la serie iguales o mayores a dicho percentil.
Procedimiento: En primer lugar, analizando una columna con porcentajes acumulados (como la
columna E de la tabla de valores de colesterol que se muestra al principio de este documento),
identificar la clase en la que se acumula el porcentaje de las observaciones correspondientes al
percentil que se desea calcular (identificacin de la clase que contiene al percentil).
Posteriormente, aplicar la siguiente frmula genrica vlida para cualquier percentil:
Pp = L.inf. +
n (p)
FA
100
W
fp
Donde:
Pp = Percentil a calcular
L.inf = Lmite inferior de la clase que contiene al percentil
n
= percentil buscado
txmerag1.doc
Pgina 3 de 5
percentil
W
Para el ejemplo de los 1,097 valores de colesterol, y suponiendo que se desea calcular el percentil 40
(P 40)se tiene que la clase que contiene al percentil 40 es la que tiene como lmite inferior a 199.5 y
como lmite superior a 239.5, porque en la columna de porcentajes acumulados ( E ) se observa que
existe un 48% de los valores hasta tal clase. Por otra parte, en la clase anterior (159.5 - 199.5)
apenas se haba acumulado un 15% de todos los valores. As pues, en la clase 199.5 - 239.5
necesariamente estar el valor que deja al 40% de los valores de la serie por detrs de l.
1,097 ( 40)
165
100
40
358
438.8 165
Pp = 199.5 +
40
358
Pp = 199.5 +
P40 = 199.5 +
{ ( 0.764)
40}
P4 0 = 199 . 5 + 30 . 56
P4 0 = 230 . 06
Interpretacin: "El 40% de los 1,097 varones de 40 a 59 aos tuvieron valores de colesterol iguales
o menores que 230.06 mgrs/100 ml y el 60 % restante tuvo valores iguales o superiores a dicha cifra".
txmerag1.doc
Pgina 4 de 5
PROBLEMAS:
1. Calcule e interprete la moda, amplitud, mediana y percentiles 10, 25, 75 y 90 para la siguiente
serie agrupada de valores:
Peso (en grs) de un grupo de recin nacidos vivos
Pas industrializado
(A)
(B)
(C)
(D)
(E)
PESO
FRECUENCIA
FRECUENCIA
ACUMULADA
%
ACUMULADO
2100 2299
2300 2499
2500 2699
2700 2899
2900 3099
3100 3299
3300 3499
3500 3699
3700 3899
TOTAL
31
134
358
326
143
43
30
21
11
1,097
2.8
12.2
32.6
29.7
31
165
523
849
2.8
15.0
47.7
77.4
100.0
2. Calcule e interprete la moda, amplitud, mediana y percentiles 10, 25, 75 y 90 para la siguiente
serie agrupada de valores y compare los resultados con los del problema 1
Peso (en grs) de un grupo de recin nacidos vivos
Pas subdesarrollado
Pas
(A)
(B)
(C)
(D)
(E)
PESO
FRECUENCIA
FRECUENCIA
ACUMULADA
%
ACUMULADO
2100 2299
2300 2499
2500 2699
2700 2899
2900 3099
3100 3299
3300 3499
3500 3699
3700 3899
TOTAL
131
134
258
76
43
30
12
8
2
694
100.0
Mo
txmerag1.doc
Am
P50
100.0
P10
P90
P25
P75
RIC
Pgina 5 de 5
TEXTO:
(B)
(C)
(D)
(E)
COLESTEROL
EN SUERO
(mg/100 ml.)
1195 - 1595
1595 - 1995
1995 - 2395
2395 - 2795
2795 - 3195
3195 - 3595
3595 - 3995
3995 - 4395
4395 - 4795
TOTAL
FRECUENCIA
FRECUENCIA
ACUMULADA
%
ACUMULADO
31
134
358
326
143
43
30
21
11
1,097
3
12
32
30
13
4
3
2
1
100
31
165
523
849
992
1035
1065
1086
1097
3
15
47
77
90
94
97
99
100
PROMEDIO :
Definicin: Es el valor que tendran todos los datos de una serie numrica, ya sea en una serie
simple o en una serie agrupada, si llos fueran de igual valor.
'
f x
Frmula para series agrupadas:
x=
n
Procedimiento: Sumar todos productos de la multiplicacin de cada frecuencia por su
correspondiente centro de clase y dividir tal suma entre el nmero de valores que componen a la
serie agrupada. Para efectuar con mayor facilidad el procedimiento es muy til el empleo de una
tabla auxiliar de trabajo como la que se ejemplifica a continuacin:
txmerag2.doc
Clases o
Intervalos
COLESTEROL
EN SUERO
frecuencia
Centros de cada
clase
Productos
(mg/100 ml.)
x'
f x'
1195 - 1595
1595 - 1995
1995 - 2395
2395 - 2795
2795 - 3195
3195 - 3595
3595 - 3995
3995 - 4395
4395 - 4795
TOTAL
31
134
358
326
143
43
30
21
11
1,097
139.5
179.5
219.5
259.5
299.5
339.5
379.5
419.5
459.5
4,324.5
24,053.0
78,581.0
84,597.0
42,828.5
14,598.5
11,385.0
8,809.5
5,054.5
274,231.5
Pgina 1 de 4
x=
f x'
x=
274,231.5
1,097
= 249.98
Interpretacin: "Si todos los individuos tuvieran la misma concentracin de colesterol esta sera de
249.98 mgrs/100 ml".
DESVIACION ESTANDAR
(en series agrupadas)
Definicin: Es la raz cuadrada de la varianza. A su vez, la varianza equivale a la divisin de una
suma de productos entre el nmero de valores de la serie; es decir equivale a un promedio.
Tal promedio resulta de dividir la suma de productos de las frecuencias de cada clase multiplicadas
por las desviaciones o diferencias cuadrticas de cada centro de clase con respecto al promedio de
la serie agrupada entre el nmero de valores de la serie.
Frmula para series agrupadas:
s=
f ( x x)
Procedimiento:
Paso 1. Obtener el promedio de la serie agrupada de valores (utilizando la frmula para el
clculo del promedio en series agrupadas),
Paso 2. Calcular la desviacin o diferencia de cada centro de clase en relacin con el
promedio de la serie,
Paso 3. Elevar al cuadrado cada una de las anteriores desviaciones; es decir, obtener
diferencias cuadrticas,
Paso 4. Multiplicar la frecuencia de cada clase por su correspondiente diferencia
cuadrtica; es decir, obtener productos
Paso 5. Efectuar la suma de los anteriores productos,
Paso 6. Dividir la suma de productos entre el nmero de valores; es decir, obtener el
promedio de desviaciones cuadrticas o varianza,
txmerag2.doc
Pgina 2 de 4
Con el propsito de sistematizar los clculos, se recomienda utilizar una tabla auxiliar de trabajo
como la que se muestra a continuacin:
Clases o
Intervalos
Frecuencias
Centros de
cada clase
x'
Diferencias
de cada
centro en
relacin al
promedio
_
(x' - x)
Diferencias
cuadrticas
Productos
_ 2
(x' - x)
_ 2
f (x' - x)
TOTAL
As, para el caso de los 1,097 valores de colesterol se tienen los siguientes clculos:
Paso 1. El promedio, calculado en una seccin anterior de este documento, vale: 249.98
Clases o
Intervalos
Frecuencias
Centros de
cada clase
COLESTEROL
EN SUERO
(mg/100 ml.)
x'
1195 - 1595
1595 - 1995
1995 - 2395
2395 - 2795
2795 - 3195
3195 - 3595
3595 - 3995
3995 - 4395
4395 - 4795
TOTAL
31
134
358
326
143
43
30
21
11
1,097
139.5
179.5
219.5
259.5
299.5
339.5
379.5
419.5
459.5
Diferencias de
cada centro en
relacin al
promedio
_
(x' - x)
Diferencias
cuadrticas
(PASO 2)
(PASO 3)
(PASO 4)
-110.34
-70.34
-30.34
9.66
49.66
89.66
129.66
169.66
209.66
12,174.92
4,947.72
920.52
93.32
2,466.12
8,038.92
16,811.72
28,784.52
43,957.32
377,422.38
662,993.89
329,544.58
30,420.89
352,654.53
345,673.37
504,351.47
604,474.83
483,530.47
3,691,066.41
_ 2
(x' - x)
Productos
_ 2
f (x' - x)
(PASO 5)
Pasos 6 y 7
s=
f ( x x)
n
s=
3 , 691, 066 . 41
1,097
s = 3 , 364 . 69
s = 58 . 00 mgrs./100 ml.
Interpretacin: La interpretacin, que est condicionada a la suposicin de que los valores tienen
una distribucin semejante a la de la curva normal 1, puede ser realizada en mltiples sentidos ya
que se sabe que el 68.27% de los valores de una serie que se distribuye como la curva normal
1 Ver documentos relacionados con la curva normal
txmerag2.doc
Pgina 3 de 4
estn agrupados alrededor del promedio si a ste se le resta una vez y tambin se le suma una
vez el valor calculado para la desviacin estndar.
Para el ejemplo, puede decirse que el 68.27% de los 1,097 varones tuvieron concentraciones de
colesterol que fluctuaron desde 191.88 mgrs./100 ml (es decir: 249.88 mgrs./100 ml. menos 58.00
mgrs./100 ml.) hasta 307.88 mgrs./100 ml. (es decir: 249.88 mgrs./100 ml. ms 58.00 mgrs./100
ml.).
Por otra parte, como se sabe que la curva normal tiene una rea que equivale a un total de 100%,
entonces tambin puede decirse que hubo un 31.73% de los varones que tuvieron concentraciones
de colesterol menores o cuando mucho iguales a 191.88 mgrs./100 ml. o que tuvieron
concentraciones iguales o mayores a 307.88 mgrs./100 ml. (ya que si a 100% se le resta 68.27%
quedan 31.73%).
Problema:
A continuacin se muestran la ganacias de peso desde el nacimiento hasta el ao de edad de dos
grupos de nios. Sin importar que las distribuciones carezcan de semejanza con la curva normal,
calcule el promedio y la desviacin estndar para ambos grupos e interprete los resultados en el
supuesto de normalidad cumplida.
Grupo sin orientacin
nutricional continua
txmerag2.doc
Ganancia de
peso
Nmero
de nios
Ganancia de
peso
Nmero
de nios
11 a 12
11 a 12
9 a 10
9 a 10
15
7a 8
12
7a 8
53
5 a 6
34
5 a 6
30
3a 4
49
3a 4
Total
107
Total
103
Pgina 4 de 4