Está en la página 1de 178

FAYAD CAMEL V.

Profesor de Bioestadstica Escuela de Salud Pblica Universidad Central de Venezuela

ESTADSTICAS MDICAS
Y DE
SALUD PBLICA

IMPRESO EN LA UNIDAD ANDRES VOISIN


IMPRENTA DE LA UNIVERSIDAD
LA HABANA CUBA
1968
CONTENIDO
CAPITULO PAGINA
PARTE I: METODOLOGA ESTADSTICA
I LA ESTADSTICA Y SUS RELACIONES CON EL
METODO CIENTFICO Y CON LA MEDICINA

1.1 CONCEPTO
1.2 EL METODO CIENTFICO
1.3 LA ESTADSTICA Y EL METODO CIENTFICO
1.4 LA ESTADSTICA Y LA MEDICINA
1.4.1.Usos en medicina individual
1.4.2.Usos en medicina colectiva

II LAS ETAPAS DEL METODO ESTADSTICO

LA ETAPA DE PLANIFICACIN

PLANIFICACIN DE LAS INVESTIGACIONES


MEDICAS

III 3.1.GENERALIDADES
3.2. PASOS DE LA PLANIFICACIN
3.3. PRIMER PASO: PLANTEAMIENTO DEL
PROBLEMA
3.3.1. Naturaleza e importancia del problema
estudiado
3.3.2. Determinacin de objetivos
3.4. SEGUNDO PASO: BSQUEDA Y EVALUACIN
DE
LA INFORMACIN EXISTENTE
3.4.1. Evaluacin de trabajos individuales
3.4.2.Evaluacin global del material estudiado
3.5. TERCER PASO: FORMULACION DE
HIPTESIS
3.6. CUARTO PASO: VERIFICACIN DE LA
HIPTESIS
3.6.1. Diseo de la investigacin
3.6.2.Ejecucin de la investigacin
3.7. QUINTO PASO: CONCLUSIONES Y
RECOMENDACIONES

LA ETAPA DE RECOLECCION DE LA
INFORMACIN

IV PASOS EN LA RECOLECCION DE LA
INFORMACIN

V LOS ERRORES EN LAS OBSERVACIONES

5.1.GENERALIDADES
5.2. ERRORES DEPENDIENTES DEL
OBSERVADOR
5.3. ERRORES DEPENDIENTES DEL METODO DE
OBSERVACIN
5.4. ERRORES DEPENDIENTES DE LOS
INDIVIDUOS
OBSERVADOS
5.5. RELACION ENTRE LAS DIVERSAS FUENTES
DE
ERROR
5.6. CONTROL DE ERRORES EN LAS
OBSERVACIONES
VI METODOS DE RECOLECCION DE LA
INFORMACIN

6.1.GENERALIDADES
6.1.1.Fuentes primarias de recoleccin
6.1.2.Fuentes secundarias de recoleccin
6.2. LA OBSERVACION
6.3. EL INTERROGATORIO
6.4. PRINCIPALES METODOS DE RECOLECCION
6.4.1. Encuestas y experimentos
6.4.2.Censo de poblacin
6.4.3.Sistemas de registro

VII LA ELECCIN DE LOS INDIVIDUOS A ESTUDIAR

7.1.GENERALIDADES
7.2. UNIVERSOS Y MUESTRAS
7.3. VENTAJAS DEL EMPLEO DE MUESTRAS
7.4. DESVENTAJAS DEL EMPLEO DE MUESTRAS
7.5. CONDICIONES DE UNA BUENA MUESTRA
7.5.1. Cantidad de individuos en la muestra
7.5.2.Calidad de la muestra
7.5.3.Muestras representativas y muestras
seleccionadas
7.6. CLASES DE MUESTRAS
7.6.1. Muestras de conveniencia
7.6.2.Muestras probabilsticas
7.7. DEMOSTRACION PRACTICA
7.8. ELECCIN ENTRE MUESTRAS
PROBABILSTICAS Y
DE CONVENIENCIA
7.9. METODOS PARA LA OBTENCION DE UNA
MUESTRA PROBABILSTICA
7.10. DIFERENTES TIPOS DE MUESTRAS
PROBABILSTICAS
7.10.1. Muestras por azar simple
7.10.2.Muestras sistemticas
7.10.3.Muestras estratificadas
7.10.4.Muestras de conglomerados
7.10.5.Muestras por procedimientos combinados
7.11.ANALISIS DE LOS RESULTADOS DE LAS
MUESTRAS
7.11.1. Valores del universo
7.11.2. Precisin de los resultados de la muestra

VIII DISEO DE LOS FORMULARIOS

8.1.GENERALIDADES
8.2.ELABORACION DE LOS FORMULARIOS

LA ETAPA DE ELABORACIN DE LA
INFORMACION

IX PASOS EN LA ELABORACION DE LA
INFORMACION

X REVISIN Y CORRECCION DE LA INFORMACION


RECOGIDA

XI CLASIFICACION Y COMPUTACION DE LOS


DATOS
25.5. INTERPRETACIN DE CHI
CUADRADO
25.6. PROBABILIDADES DADAS POR
EL CHI
CUADRADO
25.7. RELACIONES ENTTRE EL CHI
XXVI CUADRADO Y LA
CURVA NORMAL

COMPARACIONES ENRE LOS


PROMEDIOS ENTRE TRES O MAS
MUESTRAS INDEPENDIENTES

XXVII 26.1.INTRODUCCIN
26.2. PRUEBA DE KRUSHKAL-WALLIS
26.2.1. Calculo e interpretacin

COMPARACIN ENTRE DOS


MUESTRAS NO INDEPENDIENTES

27.1.GENERALIDADES
27.2. COMPARACIN DE LOS
PROMEDIOS DE DOS
MUESTRAS NO
INDEPENDIENTES
27.2.1. Prueba de significacin
incorrecta
27.2.2. Prueba de significacin
correcta
27.3. COMPARACIN ENTRE LOS
PORCENTALES DE
XXVIII DOS MUESTRAS NO
INDEPENDIENTES
27.3.1. Comparacin incorrecta
27.3.2.Comparacin correcta
27.3.3.Prueba de Mc Nemar

AJUSTE DE TASAS
Introduccin

La principal dificultad que se encuentra en la enseanza de la Estadstica a los estudiantes y


profesionales de la Medicina, es quizs, la resistencia mental que ellos oponen a una disciplina,
cuyo estudio considera que requiere profundos conocimientos matemticos.

Este libro, el cual es simplemente un resumen de mis lecturas y de los conocimientos adquiridos
bajo la direccin de los profesores Dr. Shelly Hernndez, John W. Ferlig y Leslic Kish, presenta la
Estadstica desprovista de toda complicacin matemtica y el lector constatar, que un buen
conocimiento de las 4 operaciones elementales de la Aritmtica, es absolutamente suficiente para
llegar a dominar las tcnicas estadsticas de utilizacin ms corriente por los mdicos y
profesionales afines.

Con tal finalidad, se ha presentado de todo detalle tcnico innecesario, procurando dar nfasis a la
Estadstica como un mtodo de raciocinio, pues se ha considerado, que es mucho ms provechoso
conocer las posibilidades y limitaciones de una tcnica, an cuando no se tenga ninguna destreza
en su manejo, que dominar los ms intricados secretos de su clculo, cuando no se posee una
visin acertada de su aplicacin.

El libro cubre el programa de Estadstica seguido en el curso de Mdicos Sanitaristas de la


Escuela de Salud Pblica de la Universidad Central. Su primera parte, la Metodologa Estadstica,
constituye el material bsico para los cursos de estudiante de Medicina y de Mdicos Clnicos,
aunque, como es obvio, algunos aspectos se estiman con ms detalles en unos cursos que en
otros.

Con propsitos prcticos, siempre teniendo en mente la comodidad del estudiante, tres detalles ya
utilizados en otros textos, se adoptaron en este libro:

a. La numeracin de los cuadros y grficos corresponde a la pgina en la cual se encuentran, con


lo cual el estudiante podr localizarlos ms fcilmente, cada vez que se hace referencia a ellos.
b. Con el fin de facilitar la verificacin de los clculos aritmticos lo cual se considera
imprescindible en el aprendizaje de las tcnicas expuestas-, la mayora de los ejemplos son
tericos, pero el lector observar que ellos corresponden siempre, a problemas reales del
campo de la medicina.
c. Un asterisco (*) delante de un captulo, de una seccin o de un prrafo cualquiera, indica que
se trata de material que ofrece cierta dificultad, lo cual amerita un estudio mucho ms
cuidadosa.

Al terminan quiero agradecer al personal docente de la Escuela de Salud Pblica y muy


particularmente a los doctores A. Llopis y P. Urdancia, sus valiosos consejos en la redaccin de
algunos de los captulos de este libro; a mis secretarios, los seores Iris de Pia e Irradia de Lpez
y la seorita de Vannes Khan, su inters en mecanografiar este material y al seor Claricio
Crdenas, su excelente labor en la ejecucin del material grfico incluido.

Especialmente grato me resulta finalmente, expresar mis agradecimientos a las autoridades


universitarios de la Universidad de Los Andes, sin cuya buena voluntad no hubiera sido posibles la
edicin de este libro.

Caracas, noviembre de 1964.


PARTE I

METODOLOGA ESTADSTICA
CAPITULO I

LA ESTADSTICA Y SUS RELACIONES CON EL MTODO CIENTFICO Y CON


LA MEDICINA

1.1 Concepto.

La estadstica deriva su nombre del hecho de haber sido aplicada primeramente a la recoleccin
de datos que permitieran la administracin de los estados, pues con unos propsitos militares o
impositivos lo cual constitua la primera preocupacin administrativa de los antiguos imperios-, los
gobernantes necesitaban conocer cierta informacin referente al nmero y riquezas de sus
sbditos.

La palabra Estadstica tiene hoy en da 2 significados diferentes. El trmino estadsticas, en plural


es sinnimo de datos numricos mientras que la estadstica, en singular, es el mtodo utilizado en
el manejo de los datos anteriores, es decir el mtodo de recolectar, elaborar, analizar e interpretar
datos numricos.

A pesar de su concisin sta definicin nos permite entrever los vastos campos de accin de la
Estadstica, pudindose decir que no hay prcticamente rama del saber humano en donde no
tenga utilizacin. Lo anterior no quiere decir que ella constituya el nico mecanismo a travs del
cual se puedan obtenerse nuevos conocimientos, o que el solo hecho de manejar una gran
cantidad de material numrico constituya un trabajo cientfico. La estadstica, al menos la
Estadstica prctica que ser la nica parte estudiada en este curso, ms que una ciencia es
simplemente un mtodo que ensea procedimientos lgicos de observacin y anlisis, necesarios
de tener en cuenta para aprovechar al mximo las experiencias de otras ciencias. En tal sentido
es un auxiliar irremplazable del mtodo cientfico.

1.2. El Mtodo Cientfico.

Tan variables como los motivos que dan origen a determinada investigacin, son los
procedimientos que conducen a su realizacin. No hay en realidad reglas fijas que indiquen al
cientfico cual debe ser el punto de partida de su investigacin o que limiten la escogencia de los
procedimientos que debe utilizar, pues en cualquier caso ellos varan de acuerdo a sus intereses e
inquietudes, a su preparacin previa y a los recursos y presupuesto con que cuenta.

Bajo estas condiciones no puede hablarse del mtodo cientfico como un camino nico que
conduce al descubrimiento de la verdad y mucho menos como un esquema rgido e inmodificable
fuera del cual la investigacin pierde su carcter cientfico. No obstante, es evidente que en las
ciencias mdicas al igual que en los otros ramos de las ciencias naturales, los hechos surgen y
deben ser comprobados a travs de la observacin objetiva de los diferentes fenmenos.

Sin embargo la observacin aislada de determinado fenmeno sera estril si no pudiera resumirse
en una ley cientfica capaz de explicar racionalmente lo observado y a partir de la cual puedan
hacerse generalizaciones valederas. Antes de Fleming, numerosos bacterilogos haban visto la
destruccin de sus cultivos en el laboratorio sin que tal observacin fuera de ningn beneficio, pues
no se indagaron las causas que podran explicarla con el fin de extraer nuevos conocimientos y
nuevas enseanzas. Esa misma observacin metodolgicamente, analizada, condujo al cientfico
ingls al descubrimiento de la Penicilina.

De acuerdo a Bertrand Russel (31), las etapas del mtodo cientfico pueden resumirse en los
siguientes tres pasos:

1. Exacta observacin del fenmeno que se estudia.


2. Formulacin de una hiptesis, mediante la cual pueden explicarse los hechos observados.
3. Verificacin de la hiptesis mediante nuevas observaciones.

En la investigacin real los pasos anteriores estn tan ntimamente relacionados, que es imposible
pretender que todos los investigadores sigan siempre el anterior esquema de la misma secuencia
sealada. Se comprende por ejemplo que la formulacin de una hiptesis previa es generalmente
necesaria para saber cules hechos se deben observar, y a su vez, la formulacin racional de tales
hiptesis, requieren habitualmente ciertos conocimientos sobre el problema que se estudia. No es
difcil sin embargo encontrar numeroso ejemplo en la literatura mdica que ilustran la manera como
los pasos anteriores se aplican en la investigacin. Considrese al respecto, el descubrimiento del
bacilo tuberculoso:

Koch observ ciertas formas bacilares en los esputos de pacientes tuberculosos (primer paso), y
como hiptesis de trabajo atribuy a ellas la causa de la enfermedad (segundo paso), lo cual
demostr ms tarde, al comprobar que el bacilo se encontraba en los esputos de individuos
tuberculosos y nunca en los procedentes de individuos sin enfermedad (tercer paso).

No hay que creer que los pasos esbozados son privativos de las grandes investigaciones
solamente, pues no es difcil entrever como ellos se siguen rutinariamente, quizs
inconscientemente, aun en algo tan sencillo como la historia clnica de cualquier paciente. En
efecto, en todo diagnstico:

a. Primero se recogen los datos sobre los antecedentes del enfermo, los cuales se complementan
por inspeccin, palpacin, percusin o auscultacin. Es decir, se hacen determinadas
observaciones.
b. En segundo lugar se hace el diagnstico, el cual al principio es solamente un diagnstico
provisional, es decir, una hiptesis de trabajo.
c. Finalmente se har la verificacin del diagnstico, mediante nuevas observaciones, con la
ayuda del laboratorio y de otras tcnicas especializadas, o en ltima instancia, observando los
resultados del tratamiento, los cuales sern favorables cuando el diagnstico fue correcto.

1.3. La Estadstica y el Mtodo Cientfico.

La estadstica cumple diferente papel en cada uno de los 3 pasos del mtodo cientfico, siendo
especialmente importante en la observacin de fenmenos y en la verificacin de las hiptesis. En
la formulacin de estas tambin tiene importancia aunque ello es un proceso en el cual intervienen
sobre todo la intuicin y la imaginacin de los investigadores.

a. La estadstica interviene en el primer paso de la investigacin cientfica ayudando a que las


observaciones fidedignas y exactas. Cada uno de los tres factores que intervienen en la
observacin. Observador, mtodo de observacin e individuo observado pueden ser una
fuente de error que contribuya a que las observaciones sean incorrectas y como estas son el
punto de partida de la investigacin, se requiere de un mtodo que permita la medicin y el
control de errores as determinados, con el fin de que las conclusiones tengan validez. Este
mtodo no es otro que la Estadstica, la cual nos ensea que parte de la variabilidad
registrada puede considerarse como real y que parte puede atribuirse a errores cometidos
durante el proceso de observacin de los fenmenos.

b. En la verificacin de las hiptesis tambin es importante la Estadstica. Como la verificacin de


las hiptesis se hace siempre mediante nuevas observaciones, es necesario resumir
adecuadamente los resultados de estas, pues la mente humana es incapaz de desentraar la
verdad que se encuentra en una gran cantidad de datos si estos no han sido previamente
ordenados y clasificados. La Estadstica al reducir a sencillas frmulas numricas el material
recogido y presentarlo y resumirlo en cuadros y grficos, ayuda a este proceso de sntesis
mental, facilitando el anlisis de los resultados.
c. Finalmente, aunque la formulacin de las hiptesis es ante todo un proceso de imaginacin e
intuicin, la Estadstica puede ayudar a ese proceso, pues al resumir convenientemente el
resultado de las observaciones, facilitando el razonamiento y pone de presente relaciones que
pueden concluir a la formulacin de hiptesis racionales.

1.4 La Estadstica y la Medicina.

Las consideraciones ya expuestas bastaran para explicar las relaciones existentes entre la
Estadstica y la Medicina, la ciencia est caracterizada por los complejos y variables fenmenos
que estudia.

Para medico clnico, lo mismo que para el sanitarista, el mtodo estadstico es un instrumento
invalorable a pesar de que a menudo se desconoce su gran utilidad. Al investigador mdico que
trata de probar una hiptesis de trabajo o que pretende simplemente extraer ciertas deducciones
de las observaciones realizadas, la estadstica le ayudara a decidir sobre el nmero de pacientes
que debe estudiar para que sus conclusiones tengan validez, a recoger adecuadamente los datos
pertinentes, a resumir y analizar convenientemente el material reunido y a presentar a otros el
fruto de sus investigaciones. El estudiante por su parte, solo podr evaluar ms objetivamente la
evidencia que otros investigadores le presentan, si es capaz de comprender el alcance y
limitaciones de los datos numricos que han servido de base a las conclusiones de estudio, y esa
capacitacin requiere un mnimo de conocimientos estadsticos.

1.4.1. Usos en Medicina Individual.

En el campo de la clnica, al diagnstico de cualquier enfermedad solo es posible llegar mediante


la experiencia ganada a travs del anlisis estadstico de un conjunto de sntomas y signos
observados en muchos individuos. Si decimos por ejemplo, que el signo de Koplick es
patognomnico del Sarampin, es porque la clasificacin estadstica de las enfermedades, de
acuerdo a sus sntomas y signos, nos ha mostrado que el Koplick solo se presenta en el
sarampin y no en otra enfermedad.

Un pronstico a su vez no es otra cosa que la aplicacin que el clculo de probabilidades a un


enfermo determinado. Si ante un paciente con fiebre Tifoidea predecimos que casi con seguridad
se salvara, lo hacemos con confianza, pues el estudio estadstico de innumerables enfermos
demuestra que la enfermedad cuando se trata correctamente, solo es fatal en aproximadamente un
30% de los casos.

Finalmente, todo nuevo tratamiento requiere su ensayo experimental que demuestre si es


realmente efectivo e inocuo. En tales ocasiones solo a travs de la Estadstica podemos analizar la
evidencia recogida y decidir si los efectos observados son debido a la casualidad y si pueden ser
lgicamente atribuidos al nuevo tratamiento.

1.4.2 Usos en Medicina Colectiva.

En el campo de la Salud Pblica solo mediante procedimientos estadsticos podr conocerse la


composicin y principales caractersticas de la poblacin que se va a servir, los cambios que
acontecen en ella, los riesgos a que est sometida y las necesidades que presenta.

La planificacin de las actividades de Salud Pblica, el control de los programas que se estn
desarrollando y la evaluacin final de sus rendimientos y eficiencia solo podr llevarse a cabo
mediante procedimientos estadsticos. En tal sentido, la estadstica es tan imprescindible para el
trabajador de Salud Pblica como lo es la contabilidad en las actividades de comercio e industria.
CAPITULO II

LAS ETAPAS DEL METODO ESTADISTICO

La aplicacin de la Estadstica a un problema determinado comprende las siguientes etapas:

1. Planificacin del estudio.


2. Recoleccin de la informacin.
3. Elaboracin de los datos recogidos.
4. Anlisis e Interpretacin.

En el presente curso, se estudiaran los puntos ms importante de cada una de estas etapas y
aunque se pondr ms nfasis en la enseanza de aquellas tcnicas ms necesarias al
investigador mdico, se procurara ante todo familiarizar al alumno con los principios bsico del
mtodo estadstico.

Hay buenas razones que justifican este proceder. Las tcnicas estadsticas son muy numerosas y
aquellas que son ms apropiadas para determinados problemas pueden no ser convenientes para
otros. En cambio los principios generales de mtodo estadstico son universales en su utilizacin,
no importa cul sea la investigacin que se realice o el ramo de conocimiento humano a que se
aplique. Parece mucho ms conveniente por lo tanto, conocer las posibilidades y limitaciones de
una tcnica aun cuando no se tenga ninguna destreza en su manejo, que dominar los ms
intrincado secretos de su clculo cuando no se tiene una visin acertada de su aplicacin.
CAPITULO III

LA ETAPA DE PLANIFICACIN

PLANIFICACIN DE LAS INVESTIGACIONES MDICAS


3.1 Generalidades.

Aunque algunos de los ms importantes descubrimientos cientficos se ha debido a la casualidad


(Rayos X, Penicilina, etc.), puede decirse que por regla general todo nuevo conocimiento ha
surgido unas veces por la necesidad de encontrar solucin prctica a determinado problema, y
otras por curiosidad cientfica, que impulsa al investigador a llenar lagunas existentes en nuestros
conocimientos o a explorar campos todava no perfectamente conocidos.

En estos ltimos casos, planificar en esencial no solo para calcular el tiempo que durara la
investigacin, el personal que se requiere y el presupuesto necesario, sino con el fin de que la
investigacin se realice con metas perfectamente definidas, evitando improvisaciones durante el
desarrollo de la misma, que en general introduce fuentes de error capaces de invalidar o
desmeritar el estudio.

Bsicamente la etapa de planificacin tiene por fin el estudio de los detalles concernientes a la
recoleccin elaboracin y anlisis de la informacin, sobre la base de la cual se describirn las
caractersticas de determinada poblacin o se confirmara o negara determinada hiptesis de
trabajo. Es obvio sin embargo que ninguna planificacin podr hacerse adecuadamente si antes no
se ha definido claramente la naturaleza y objetivos de la investigacin y si no se ha hecho una
conveniente evaluacin de los conocimientos que sobre el problema se poseen y de las hiptesis
que se han formulado para explicarlo.

3.2 Pasos de la Planificacin.

Los diferentes pasos que deben considerarse en la etapa de planificacin, se comprendern


fcilmente si se considera brevemente el procedimiento que se sigue habitualmente en cualquier
investigacin.

Cuando intentamos realizar un estudio, comenzamos por hacer un planteamiento del problema en
el cual estamos interesados. Consideramos su naturaleza e importancia y a grandes rasgos
decidimos sobre los objetivos que perseguiremos en su realizacin.

Luego tratamos de documentarnos convenientemente sobre dicho problema, haciendo una


bsqueda y evaluacin de la informacin existente, lo que nos llevara a su mejor conocimiento, nos
enseara nuevas tcnicas y complementara nuestra previa experiencia, pero a la vez nos pondr
presente a un conjunto de fallas en nuestros conocimientos que conducir a la formulacin de
hiptesis que pueden explicarlas. El paso siguiente es lgicamente la verificacin de las hiptesis
mediante la planificacin y ejecucin de la respectiva investigacin, sobre la base de la cual
podremos formular una serie de Conclusiones y Recomendaciones.

Las anteriores consideraciones nos permiten esquematizar la planificacin en los siguientes 5


pasos (45):

1. Planteamiento del Problema.


2. Bsqueda y Evaluacin de la informacin existente.
3. Formulacin de hiptesis.
4. Verificacin de las Hiptesis.
5. Conclusiones y Recomendaciones.
El estudio de alguno de estos puntos no es en realidad un problema estadstico, pero se detallaran
a continuacin, ya que su conocimiento y ordenada aplicacin constituyen un mtodo ideal de
trabajo para cualquier investigador.

3.3. Primer paso: Planteamiento del problema.

Al plantear el problema que se va a investigar, debe darse especial consideracin a los siguientes
puntos:

a) Definicin de la naturaleza e importancia del problema que se estudia.


b) Determinacin del objetivo final y de los objetivos inmediatos de la investigacin.

3.3.1. Naturaleza e Importancia del Problema.

Definir la naturaleza del problema que se estudia es explicar QUE vamos a estudiar. Es obvio que
ser imposible la planificacin de las etapas posteriores si antes no se ha determinado claramente
el problema que se trata de investigar. No basta por ejemplo, decir que se va estudiar la Fiebre
Tifoidea, pues probablemente ningn investigador este en capacidad de cubrir todos los aspectos
de esta enfermedad. Debe acentuarse explcitamente se vamos a evaluar una tcnica diagnstica,
un nuevo tratamiento o algunos de sus aspectos epidemiolgicos.

Definir la importancia del problema es cuantificar su extensin y equivale a explicar POR QUE se
va a estudiar. Un investigador puede abocarse al estudio de un problema por razones ticas.
Estticas o metafsicas, pero la mayora de las veces, es el deseo utilitarista el que lo gua.

3.3.2. Determinacin de Objetivos.

Determinar el objeto final, significa dilucidar las posibilidades de aplicacin prctica de la


investigacin, es decir, explicar PARA QUE se realice. De acuerdo a la finalidad de estudio, se
decidir sobre los datos que deben investigarse y sobre la precisin con que deben recogerse y se
orientara el anlisis en tal forma que se obtengan respuestas a las preguntas previamente
formuladas.

Determinar los objetivos inmediatos es explicar COMO se va a hacer la investigacin, es decir,


sealar la estrategia que se utilizara en los procedimientos generales que se usara en el desarrollo
de la misma.

3.4. Segundo Paso: Bsqueda y evaluacin de la informacin existente.

Antes de proceder el estudio, el investigador debe revisar, en cuanto sea posible, lo que al
respecto se haya hecho, con el fin de percatarse de lo que realmente se conoce sobre el y
familiarizarse con las tcnicas de estudio ms convenientes para su propsito, pues solo en esa
forma tendr posibilidades de investigar con xito lo que se propone.

No basta sin embargo, conocer todo sobre determinado tpico se haya escrito, sino que debe
hacerse una cuidadosa revisin de tales publicaciones.

Debe en primer lugar, hacerse una bsqueda tan completa como sea posible haciendo uso de
todos los medios bibliogrficos al alcance.

Luego, el material disponible se clasificara para su lectura por tpicos y de acuerdo a la


investigacin que se realice.

La evaluacin tiene dos partes: a) Evaluacin de los trabajos individuales y b) Evaluacin conjunta
del material estudiado.
3.4.1. Evaluacin de Trabajos Individuales.

Para la evaluacin de los diferentes trabajos, no pueden darse reglas fijas, sobre todo que ella
depende en gran parte de la preparacin de la persona que evala, pero quizs es de mucha
utilidad, tratar de dar respuestas a las siguientes preguntas propuestas por Donald Mainland (23).

QUIN hizo el estudio?


POR QU lo hizo, o sea, cules fueron sus propsitos y objetivos?
CUL fue el material estudiado?
DONDE se hizo el estudio?
CUANDO se hizo?
COMO fue realizado?
CUANTOS individuos estudiaron?
QUE conclusiones se obtuvieron?

Debe darse especial importancia, en primer lugar, a la manera como fueron recogidos los datos,
pues los procedimientos y mtodos empleados en la recoleccin, servirn de gua para juzgar
sobre su precisin y limitaciones. En segundo lugar es preciso analizar cuidadosamente si las
conclusiones fueron legtimamente derivadas del material estudiado si fue correctamente la
interpretacin de las asociaciones encontradas, pues hay muchos trabajos que a pesar de que
fueron cuidadosamente planificados y convenientemente realizados, han sido analizados
defectuosamente llegndose a conclusiones equivocadas.

3.4.2. Evaluacin Global del material estudiado.

La anterior evaluacin nos permitir destacar como inadecuados muchos de los trabajos
evaluados, a la vez el de aceptar como correctas algunas conclusiones. Estas conclusiones deben
analizarse ahora en su conjunto para ver si son consistentes entre s o si existen algunas que son
contradictorias. Justamente, la presencia de tales contradicciones revela tpicos que deben
investigarse y gua al investigador hacia la Formulacin de hiptesis que deben verificarse,
mientras que conclusiones unnimes sobre el mismo problema, quizs nos lleven a abandonar o
modificar nuestro primitivo plan de trabajo ya que por lo general no vale la pena duplicar un trabajo
ya hecho.

3.5 Tercer paso: Formulacin de la Hiptesis.

En toda investigacin (salvo aquellas esencialmente descriptivas) implcita o explcita, se trata de


probar una hiptesis de trabajo. La hiptesis es simplemente una explicacin provisional de los
hechos, que se anticipa con el fin de constatar que es cierta.

Ella permite centrar la observacin sobre aquellos fenmenos que guardan relacin con el
problema que se estudia evitando que muchos hechos importantes pasen inadvertidos o que el
investigador se pierda en un cmulo de observaciones inconexas.

La escogencias de la hiptesis que va a verificarse depender de la sntesis del investigador, de


las necesidades existentes del personal y recursos con que cuenta, pero su formulacin debe
hacerse claramente, ya que el diseo, planificacin y desarrollo de la investigacin depender de la
hiptesis que se trata de probar.

3.6 Cuarto paso: Verificacin de la Hiptesis.

La verificacin de la hiptesis constituye la investigacin propiamente dicha, en la cual se


consideran dos aspectos: a) el diseo de la investigacin y b) la ejecucin de la misma.

3.6.1. Diseo de la Investigacin.


Al disear la investigacin se debe estudiar por adelantado cada una de sus diferentes etapas, es
decir, todos los detalles relacionados con la recoleccin, elaboracin y anlisis de los datos. Es
necesario determinar de antemano todo lo concerniente a las observaciones que se harn, al
nmero de individuos que se estudiar y el procedimiento a utilizar en su escogencia, investigando
cuidadosamente si existen factores ticos que pueden oponerse a la realizacin del estudio en la
forma proyectada. Se considerara la poca en la que se har el estudio, el tiempo que durara, los
gastos que determinara. Se har la seleccio9n y entrenamiento del personal que va a colaborar y
si es el caso, se buscara el asesoramiento de un estadstico que aconseje sobre el diseo del
experimento proyectado.

Es necesario definir los trminos que se usaran en la investigacin, pues frecuentemente


aparentes resultados contradictorios sobre el mismo problema, se deben al uso de los mismos
trminos, con significados diferentes. As por ejemplo, la poblacin urbana de Venezuela fue
respectivamente de un 30% y 54% segn los censos de 1941 y 1950. Aun cuando el pas tiende a
un urbanismo progresivo, parte de la diferencia anterior se debe al distinto significado que se ha
dado al termino urbano, pues en el primer censo se consider como poblacin urbana las
localidades de 2500 o ms habitantes, y en el segundo, las localidades de 1000 o ms habitantes,
es decir, que en todas las poblaciones entre 1000 y 2500 habitantes que no se consideraban como
urbanos en 1941, si se consideraron como tales en el censo de 1950.

Es importante sobre todo:

a. Definir la unidad que se observa, con el fin de incluir a la totalidad de los individuos que
presentan las caractersticas que se estudian y excluir a aquellos que no las presentan;
b. Definir lo que se va a observar para que todos los individuos sean uniformemente estudiados.

As por ejemplo, si vamos a estudiar un nmero determinado de familias debe especificarse


claramente quienes deben considerarse formando parte de ellas. Para un estudio sanitario deben
incluirse todas las personas que vivan bajo un mismo techo aunque no tengan ningn parentesco,
pues todas ellas participan de las mismas condiciones sanitarias, las cuales modifican con su
presencia. En cambio para un estudio que tuviera por finalidad investigar la transmisin hereditaria
de cualquier caracterstica biolgica, la familia incluir solamente a personas con lasos
consanguneos, sin tomar en cuenta a los dems, aunque vivan bajo el mismo techo y aunque
haya de por medio cualquier otro tipo de vnculo familiares o legales.

Las definiciones que se adopten deben ser claras y precisas para evitar ambigedades y con el fin
de facilitar las comparaciones entre los diversos investigadores, deben escogerse cuando existen
aquellas de aceptacin universal.

Finalmente debe hacerse un balance entre los recursos que se tienen y los que se necesitan para
ejecutar la investigacin conforme se ha planificado. Tal balance puede mostrar que los recursos
con que se cuestan son suficientes o que no lo son. En el primer caso podr proseguirse con la
investigacin pero en el segundo, habr que decidirse por una de las siguientes alternativas 1)
Aumentar cuando ello sea posible-la cantidad o el rendimiento de los recursos que se poseen
hasta el nivel necesario; 2) Planificar de nuevo la investigacin de manera que pueda ejecutarse
con los recursos existentes y 3) Diferir la investigacin hasta tanto se pueda conseguir los
recursos adicionales que se necesitan.

3.6.2. Ejecucin de la Investigacin.

La ejecucin de la investigacin es la: Recoleccin, Elaboracin y anlisis de la informacin


recogida, etapas que deben realizarse tal como han sido planeadas de antemano y cuyos detalles
sern motivos de estudio a lo largo de este curso.
3.7. Quinto paso: Conclusiones y Recomendaciones.

Ejecutado el estudio se considera si fue realizado conforme estaba planificado y con los resultados
a la vista se concluir si la hiptesis han sido verificadas o no hacindose las recomendaciones
pertinentes.

No es de esperarse que todas las veces se verifiquen las hiptesis, pero aun cuando ello no se
logre, el esfuerzo no ha sido en vano. En medicina experimental sobre todo, tan importante como
probar que un tratamiento es bueno, puede ser demostrar que una droga que s vena aplicando
de rutina, no tiene ningn valor. Muchas drogas que por aos se consideraron excelentes se han
abandonado luego por ineficaces o perjudiciales. Muchos males se hubieran evitado si antes de su
aplicacin se hubiera exigido mayor evidencia sobre sus virtudes.
CAPITULO IV

LA ETAPA DE RECOLECCION DE LA INFORMACIN


PASOS EN LA RECOLECCION DE LA INFORMACIN

Esta etapa tan a menudo olvidada, tiene para el investigador mucha ms importancia que cualquier
otra. Mientras que la elaboracin y el resumen de los datos recogidos pueden ser delegados en un
componente tcnico estadstico, la recoleccin de la informacin tiene que ser vigilada
constantemente por el propio investigador y realizada conforme a los planes previamente trazados.
Como ya se ha advertido, solo si la informacin ha sido recogida de la manera correcta, podrn
tener validez las conclusiones que de ella deriven. En el caso contrario, no se justifica siquiera el
empleo de las Estadstica, ya que ninguna tcnica podr corregir los errores presentes en los datos
bsicos recogidos.

La decisin sobre los datos que van a recogerse y sobre la precisin con la que deben ser
obtenidos depende primordialmente del propsito de la investigacin y del material estudiado,
siendo conveniente limitarse a recoger tan solo0 aquella informacin que va a ser utilizada pues el
deseo de investigar muchos datos, en la esperanza de que algn da sern de utilidad, conspira
contra la correcta obtencin de aquellos que son realmente esenciales.

Entre los principales puntos que deben considerarse al recoger la informacin y que sern motivo
de los prximos captulos figuran:

a. Los errores que pueden cometerse en la recoleccin de los datos y la manera de controlarlos.
b. Las ventajas y limitaciones de los diversos mtodos empleados en la recoleccin de la
informacin.
c. Las condiciones que deben reunir los individuos que se estudian y los procedimientos ms
convenientes para su eleccin.
d. El diseo de los formularios que servirn para registrar la informacin que se recoja.
CAPITULO V

LOS ERRORES EN LAS OBSERVACIONES


5.1 Generalidades.

Los integrantes de toda poblacin, a la vez que poseen caractersticas que le son comunes
presentan algunas diferencias que sirven para individualizarlos. Es justamente por la existencia de
tales diferencias que se justifica el empleo de la Estadstica, pues si todos los individuos de
determinada poblacin fueran exactamente iguales, bastara describir uno de ellos, para tener una
descripcin acertada del conjunto.

A lado de esta variacin real, inherente a los individuos que se estudian, hay que considerar una
variacin sobreentendida o espuria que solo es en realidad, errores determinados por los factores
que intervienen en toda observacin, es decir dependientes de:

1. El observador:
2. El mtodo de observacin, y
3. El objeto o individuo observado.

La presencia de tales errores determina por lo tanto que ninguna medicin sea absolutamente
exacta. Esto debe tenerse en cuenta cuando se comparan dos o ms observaciones, con el fin de
no dar mayor importancia a la existencia de pequeas diferencias, las cuales pueden deberse
simplemente al proceso de medicin utilizada. As por ejemplo, si un paciente mostr en un primer
examen sanguneo que tena 4000,000 de glbulos rojos por milmetro cbico y luego, tras un
tratamiento con drogas anti-anmicas, un segundo contare seala 4200,000, debemos considerar
que parte de esta diferencia se debe a errores del anlisis, antes de que podamos alegrarnos por
el xito del tratamiento. Por lo tanto, solo en la medida en que tales errores pueden controlarse,
podrn conocerse la verdadera variabilidad que intentamos medir.

5.2 Errores dependientes del observador

El grado diferente de preparacin o entrenamiento de los observadores, su estado fsico, el exceso


de trabajo, las condiciones ambientales bajo las cuales trabajan, se reconocen como las
principales causas de error de las observaciones. Con el fin de ilustrar este tipo de error,
considrese la siguiente experiencia realizada hace algn tiempo en los Estados Unidos.

A un grupo de cinco expertos radilogos se entregaron en dos oportunidades diferentes-separadas


una de otra por el lapso de dos meses-, las mismas 1256 radiografas de trax, con el fin de
diagnosticar la existencia de tuberculosis pulmonar. Las radiografas, de tamao estndar (14 x 17
pulgadas), fueron ledas separadamente por cada radilogo con los siguientes resultados:

Cuadro 26

Resultados de la lectura de las mismas 1256 radiografas torcicas realizadas por


Los cinco radilogos diferentes en dos oportunidades distintas.

Numero de Radiografas declaradas positivas


Observador
Primera Lectura Segunda Lectura
A 118 139
B 59 78
C 83 88
D 96 69
E 106 88
Fuente: Bikelo y colaboradores / A.M.A. Vol. 133 Pg.359 Febrero 1947.
Puede observarse en el cuadro que antecede, que en ninguna de las dos ocasiones las diferentes
observaciones coincidieron en l nmero de radiografas patolgicas (variacin Inter.-
observadoras) y que para un mismo observador las lecturas dadas como patolgicas son
diferentes en las dos oportunidades (variacin intra-observadores). Como en una y otra ocasin los
diversos investigadores estudiaron exactamente las mismas 1256 radiografas, debemos concluir
que tales discordancias no reflejan una variacin real, sino simplemente, errores cometidos por
quienes hicieron la lectura del material radiogrfico.

5.3 Errores dependientes del mtodo de observacin.

Todos los mtodos de observacin tienen errores ms o menos importantes y de ah la continua


preocupacin cientfica de mejorarlos o cambiarlos por otros ms convenientes.

Al estudiar las condiciones pulmonares de un paciente puede utilizarse la fluoroscopia y la


fluorofotografa de Abreu o la radiografa corriente de 14 x 17 pulgadas, pero la eficiencia de estos
mtodos es muy diferente, como se observa en el siguiente cuadro:

Cuadro 27

Eficiencia de diversos mtodos en l diagnstico de la Tuberculosis Pulmonar

Mtodo Eficiencia
Radioscopia 70%
Fluorofotografa de Abreu 90%
Radiografa estndar 95%

El cuadro muestra una marcada variacin entre los diferentes mtodos, siendo la radioscopia el
menos conveniente (variacin Inter.-mtodos). Se reconoce adems, que para cada mtodo en
particular hay una serie de factores que pueden conducir a falsear los resultados. As por ejemplo,
una baja del voltaje de la corriente elctrica o una prdida de potencia de los lquidos reveladores
pueden dar radiografas de mala calidad que causan errores en su lectura (variacin intra-
mtodos).

5.4 Errores dependientes de los individuos observados.

Fuera de la variabilidad real que presentan los individuos que se observan, hay tambin una
variabilidad sobreaadida dependiente de ellos mismos, debido a las condiciones y al tiempo en
que se estudian.

La glicemia normal de varis individuos puede ser diferente por el solo hecho de que la sangre sea
tomada a intervalos diferentes despus de la comida o porque algunos pacientes hayan ingerido
muchos hidrocarbonados y otros no (variacin Inter.-individual).

Se comprende adems, que para un mismo individuo, los factores acabados de mencionar harn
variar los resultados de una ocasin a otra (variacin intra-individual).

5.5 Relaciones entre las diversas fuentes de error.

A pesar de la clara distincin que hemos hecho entre las anteriores fuentes de error, no debe
pensarse que ellos son completamente independientes. Si se recapacita sobre el ejemplo dado
para ilustrar los errores dependientes del observador, puede admitirse que ellos dependen en gran
parte del mtodo de observacin utilizado, pues no se escapa que mientras ms perfecto sea ste,
menores sern los errores cometidos. Si el mtodo fuera tan perfecto, que al colocar una
radiografa en una pantalla se encendiera una luz cuando existiera una lesin, slo una persona
ciega o que estuviera distrada, fallara en el diagnstico.
De la misma manera, muchos de los errores dependientes de los individuos que se observan,
pueden atribuirse a condiciones relacionadas con el mtodo de investigacin y de ah la necesidad
de estudiar a los diferentes individuos en condiciones tan similares como sea posible.

5.6 Control de errores en las observaciones.

Cualquiera que sea la causa de los errores anteriores, su control puede hacerse por reduccin o
medicin. Reducirlos primero hasta donde sea posible; medirlos luego, cuando ya no puedan
reducirse.

5.6.1. Reduccin de los errores.

La reduccin de los errores se lograr de acuerdo a las causas que los determinan. Aquellos
dependientes de los observadores, pueden reducirse aumentando la preparacin y entrenamiento
de los observadores, vigilando sus condiciones fsicas y ponindolos en las ms optimas
condiciones de trabajo. Para disminuir los errores causados por el mtodo de observacin, se
procurar seleccionar las mejores tcnicas conocidas, estandarizar los mtodos a emplear y
controlar constantemente el funcionamiento de los aparatos utilizados. Se procurar finalmente,
que los individuos estudiados se investiguen en las ms favorables y similares circunstancias con
el fin de disminuir los errores que de ellos puedan depender.

5.6.2. Medicin de los errores.

Al hablar de la medicin de los errores, nos referiremos al progreso de la evaluacin de las


diferentes tcnicas y mtodos de estudio.

Aunque algunos de los errores cometidos se deben a la tcnica en s, y otros a los observadores
que la utilizan, su separacin es difcil y conviene considerarlos en conjunto. Cada investigador
debiera estimar los errores que comente en el trabajo habitual con las tcnicas e instrumentos de
rutina y cada tcnica debiera valorarse convenientemente, investigando los mrgenes de error a
que pueda conducir su aplicacin. Los procedimientos para tal evaluacin ya implican un proceso
estadstico, cuyos fundamentos slo se comprendern en prximos captulos, pero cuya utilidad
ilustran los siguientes ejemplos:

a. Si mediante todos los medios diagnsticos al alcance llegamos a la conclusin que en un


grupo de personas hay 100 enfermos con lesiones pulmonares de tuberculosis y si mediante la
radioscopia pulmonar descubrimos solamente 70, podremos concluir que la eficiencia de tal
mtodo es alrededor del 70%. Por lo tanto, si al practicar una radioscopia declaramos que
determinado individuo no presenta tuberculosis pulmonar, es posible que una lesin mnima se nos
haya escapado, ya que el mtodo no es efectivo en el 100% de los casos.

b. La mayora de las veces, sin embargo, los errores que se comenten al realizar determinada
medicin se hacen unas veces por exceso y otras por defecto. El siguiente sencillo experimento,
frecuentemente utilizado por los profesores de estadstica, pone de presente la anterior afirmacin.
Si se traza una lnea en el tablero y se pide a un grupo de estudiantes que estimen a simple vista
su longitud, se constata que aproximadamente la mitad de los alumnos sobreestiman su valor,
mientras que la otra mitad da valores inferiores a las reales. Se constata adems, que casi
invariablemente la verdadera longitud de la lnea se encuentra aproximadamente a mitad del
intervalo determinado por el mayor y la menor de las estimaciones hechas.

Sobre la base de la anterior observacin, no es difcil comprender que si un laboratorista quisiera


por ejemplo, conocer la precisin de los exmenes hematolgicos que realiza, podra hacer
digamos, 20 preparaciones de una misma sangre y en cada una practicar el recuento de glbulos
rojos. Si los resultados encontrados varan entre 4.600.000 y 5.000.000. En tal caso y volviendo al
ejemplo dado anteriormente, en el cual un paciente tena originalmente 4.000.000 de glbulos y
despus de un tratamiento anti-anmico registraba 4.200.000, puede admitirse que la primera cifra
pudo ser 3.800.000 4.200.000 y la segunda 4.000.000 4.400.000, es decir, que no hay
evidencia definitiva a favor del mejoramiento del paciente.
CAPITULO VI

METODOS DE RECOLECCION DE LA INFORMACIN


6.1. Generalidades

Aunque en la mayora de las investigaciones la informacin debe recogerse directamente de su


fuente de origen, en muchas ocasiones suelen aprovecharse los datos previamente recogidos por
otros individuos. En el primer caso se considera que la informacin ha sido recogida de fuentes
primarias y se habla de fuentes secundarias de recoleccin en el segundo caso.

6.1.1. Fuentes primarias de recoleccin.

Cuando la informacin no est registrada, habr que recogerla directamente de su fuente de


origen, es decir, de los individuos en donde puede suceder el fenmeno o encontrarse la
caracterstica en que estamos interesados. En tales ocasiones, slo hay 2 procedimientos para
recolectar la informacin:

a. La observacin.
b. El interrogatorio.

Aunque la observacin y el interrogatorio son los 2 nicos procedimientos generales que permiten
recoger informacin a partir de su fuente de produccin, ellos, aislada y conjuntamente, forman
1
parte de mtodos especiales que luego se estudiarn ( )

Cuando la informacin que nos interesa se encuentra registrada, como corresponde tan solo,
buscarla y hacer buen uso de ella. A veces se halla publicada en textos o revistas y entonces es
fcil encontrarla en cualquier buena biblioteca. Si por el contrario no est publicada, su obtencin
suele dificultarse a causa del carcter confidencial con que ha sido recogida, aunque resmenes
adecuados son generalmente fciles de conseguir.

De existir varias fuentes con la misma informacin, la escogencia una con preferencia a las otras
debe basarse en 2 criterios:

a. Calidad de la informacin, y;
b. Accesibilidad administrativa.

Aunque es obvio que entre diversas fuentes debe preferirse la de mejor calidad, muchas veces no
hay lugar a tal escogencia, pues por razones administrativas o de otra ndole, puede suceder que
no se tenga acceso a alguna de ellas. Antes de conformarse con aprovechar la nica disponible,
debe evaluarse adecuadamente el material suministrado para constatar si rene las necesarias
condiciones de fidelidad y exactitud.

6.2. La Observacin.

La observacin directa de los diferentes fenmenos ha sido el mtodo clsico de la investigacin


cientfica y cuando es aplicable debiera ser el preferible, por ser el ms objetivo. Sin embargo,
este mtodo es caro, pues requiere personal altamente especializado y no es conveniente cuando
se estudian grandes masas humanas. Por otra parte, no puede aplicarse cuando se trata de

1
En un sentido general observar significa ganar conocimientos por cualquiera de los rganos de los sentidos, y por lo
tanto, el interrogatorio sera simplemente uno de los procedimientos de realizar observaciones, no habiendo razn de
contrastar sus versiones y desventajas con las de la Observacin, de la cual formara parte. Los dos trminos sin embargo
sugieren procedimientos perfectamente diferenciables, mientras que en el interrogatorio hay participacin activa del
individuo que se estudia, en la Observacin hay pasividad por parte de ste, a pesar de que en ciertas oportunidades se
provocan sus reacciones. Los prximos prrafos no dejan ninguna duda sobre el significado que se ha querido dar a estos
dos trminos.
investigar las manifestaciones subjetivas de los individuos, su comportamiento pasado o sus
actitudes futuras. Si en el estudio de un paciente se desea averiguar si tiene buen apetito o
conocer qu enfermedad ha padecido anteriormente o a cules actividades se dedicar una vez
mejorado, en tales casos tendremos que recurrir al interrogatorio.

6.3. El Interrogatorio.

Las ventajas del interrogatorio no son otras que las limitaciones sealadas en la observacin
directa, siendo por lo tanto el nico mtodo a emplear cuando se averigua el pasado, el futuro o las
manifestaciones subjetivas de los individuos. Tiene como desventajas, el apelar a la memoria y a la
buena fe de los interrogados y dar diferentes resultados segn el tipo de preguntas y la manera
como son formuladas.

El que un paciente registre entre sus antecedentes, el haber padecido determinada enfermedad,
depende de que guarde memoria del tal acontecimiento y de que tenga voluntad de confesarlo,
sobre lo cual influye desde luego, la claridad con que se haga el interrogatorio.

Al interrogar a una persona, las preguntas que se le formulan deben ser concisas y claras, evitando
aquellas ambiguas o capciosas y las que presuponen un hecho o sugieren una respuesta.

Si se est interesado por ejemplo, en saber si un paciente consume vitaminas, lo lgico es


preguntarle primero si las toma o no y luego en caso afirmativo, averiguar la frecuencia con que lo
hace. Conformarse con preguntar si se toman vitaminas, no es suficiente, pues una respuesta
afirmativa puede decir que se toman diariamente o una vez por semana o slo ocasionalmente.
Adems siempre se procurar evitar aquellas preguntas que sugieren la respuesta. Si a una
madre se le pregunta con cierto nfasis: Usted le da a su nio vitaminas, no es verdad?, sera
raro que ella respondiera que no.
El interrogatorio puede ser directo o indirecto.

El interrogatorio directo es aquel que se hace por medio de entrevistas y su ventaja principal es
que puede complementarse con la observacin directa. A un paciente puede preguntrsele si ha
tenido viruela y si contesta afirmativamente, puede constatarse su respuesta buscando las
cicatrices indelebles que deja la enfermedad. En encuestas sociales es posible que la
personalidad, clase social, la inflexin de la voz y la manera de preguntar del entrevistador, hagan
varia las posibles respuestas.

El interrogatorio indirecto habitualmente se hace mediante los cuestionarios postales. En general,


es un mtodo ms barato y rpido, aunque slo es posible para preguntas sencillas. Como
inconveniente se seala el hecho de que generalmente es muy pequeo el nmero de personas
que envan contestacin, especialmente en poblaciones con alto personaje de analfabetismo y en
tales casos, es posible que las personas que consten no representan a la totalidad de la poblacin
que se quiere conocer:

6.4. Principales mtodos de recoleccin.

La escogencia del mtodo de recoleccin depende fundamentalmente del mtodo de estudio, de la


naturaleza de la informacin y de la forma en que esta se recoja (ocasional, peridica o
continuamente). Entre estos mtodos, cuyos detalles se vern posteriormente se escribirn a
continuacin:

a. Las encuestas y los experimentos, como ejemplos de mtodos utilizados cuando la informacin
se recoge ocasionalmente.
b. El mtodo censal, como tipo de informacin recogida peridicamente
c. El sistema de registros, como tipo de informacin recogida continuamente.
6.4.1. Encuestas y experimentos

Generalmente se piensa que encuestas y experimentos difieren porque en las primeras la


informacin se recoge mediante el interrogatorio y en los segundos, mediante la observacin.
La verdadera diferencia estriba sin embargo, en la naturaleza de los datos recogidos. En la
encuesta, los datos ya existen y solo es necesario recogerlos. En el experimento los datos no
existen y es necesario provocar su aparicin.

Cuando una nueva droga se introduce o un nuevo tratamiento se recomienda, no hay al respecto
ninguna informacin registrada, simplemente porque no hay ninguna informacin existente. En
dichos casos, es necesario planificar un estudio con el fin de producir dicha informacin y luego
registrarla para subsiguientemente analizarla. En otras palabras, es necesario realizar un
EXPERIMENTO. En tales ocasiones la observacin directa es el mtodo habitual de recoger la
informacin, pero el interrogatorio puede ser tambin utilizado, como a menudo se hace en algunos
estudios de Sociologa.

Hay otras ocasiones en que ya existe la informacin sobre la cual estamos interesados, pero no se
halla registrada. En dicho caso solo tenemos que buscarla y registrarla convenientemente para su
anlisis posterior. Si queremos, por ejemplo, saber con que frecuencia se presentan quemaduras
en los trabajadores del petrleo o cual es el sueldo medio de los profesionales de la medicina,
nuestro trabajo consistir solamente en buscar y registrar tal informacin. En dicho casos, la
tcnica consiste en hacer una ENCUESTA en el grupo de personas en el que estamos
interesados. Tal encuesta puede hacerse por entrevistas personales o por medio de cuestionarios
postales, adoptando de acuerdo a los propsitos del estudio, uno cualquiera de los sistemas que
se describirn en el captulo sobre Estadsticas de Morbilidad (Capitulo XXXII).

6.4.2. Censo de Poblacin

El tipo de informacin recogida peridicamente en el Censo de Poblacin. Venezuela, como casi


todos los pases del mundo, se ha comprometido a efectuar un censo cada 10 aos, habindose
efectuado el ltimo el 26 de Febrero de 1961.

A menudo se cree que el Censo y la Encuesta difieren en cuanto a la poblacin que cubren, pues
mientras que el primero se referira a la totalidad del universo, la segunda solo estudiara una
muestra de dicha poblacin. Tal concepto es errneo pues tanto el uno como la otra pueden cubrir
a toda la poblacin o solo a un segmento de ella. La diferencia esencial radica en la naturaleza de
la informacin que se busca. En el Censo habitualmente se buscan datos generales de la
poblacin. En la encuesta, por el contrario, se trata de lograr informacin sobre un tema concreto,
procurando profundizar en sus diferentes aspectos.

El censo cuyos detalles se estudiaran en el captulo XXIX, puede compararse con una fotografa de
la nacin en un momento determinado de su historia, siendo el medio mas seguro para conocer la
composicin y principales caractersticas de las poblaciones humanas.

6.4.3. Sistemas de Registro

Mediante los registros se recoge la informacin continuamente, a medida que se va produciendo.


Los detalles por ellos suministrados son datos dinmicos, y de ah que puedan que puedan
compararse con una cinta cinematogrfica de la poblacin, mediante el cual pueden compararse
los cambios que acontecen en ella.

Esta informacin se refiere unas veces a la totalidad de determinada poblacin o pas, como es el
caso del Registro Civil de Nacimientos y Defunciones, y otra a fenmenos que suceden en
determinada institucin, como es el caso de las Historias Clnicas de los Hospitales. Los principios
generales sobre la organizacin de estos sistemas de registro, se estudiaran a propsito de las
Estadsticas Vitales.
CAPITULO VII

LA ELECCIN DE LOS INDIVIDUOS A ESTUDIAR


7.1 Generalidades.

Ya dijimos que cuando la informacin no est registrada, habr que recogerla directamente de su
fuente de origen, es decir, de las personas en donde el fenmeno que nos interesa puede
acontecer. El problema que se presenta en tales ocasiones, es la acertada escogencia de las
personas que vamos a estudiar.

Este problema se presenta, porque muchas veces resulta imposible y otras imprctico estudiar la
totalidad de personas en donde puede encontrarse la caracterstica en la que estamos interesados
y en tales casos, nuestro estudio tiene que limitarse a un grupo de dichos individuos, es decir, a
una muestra. No hay que olvidar, sin embargo, que aunque es la muestra la que observamos, es el
universo lo que queremos conocer, pues el estudio no tendra ninguna trascendencia sino
pudiramos generalizar a la poblacin los hechos observados en la muestra. Sin embargo, para
que esta generalizacin sea posible, los individuos integrantes de la muestra deben ser escogido
adecuadamente, y esto plantea una serie de dificultades que trataremos de estudiar en las
prximas pginas.

7.2. Universo (Poblacin) y muestras.

Se entiende por universo o poblacin la totalidad de individuos o elementos en los cuales puede
presentarse determinada caracterstica susceptible de ser estudiada. Una muestra a su vez, es
una parte o grupo del universo. As por ejemplo, si con el fin de conocer la estatura media de los
1500 alumnos de la Escuela de Medicina escogemos un grupo representativo de 200 de ellos, el
universo en estudio estar formado por la totalidad de los 1500 alumnos, y la muestra constara de
los 200 escogidos.

Las anteriores definiciones ameritan algunas explicaciones. En primer lugar, las unidades que se
estudian pueden ser personas, animales o cosas o pueden ser conglomerados de unidades, como
ser una familia, una colonia de parsitos o un bloque de viviendas. En segundo lugar, los trminos
universo y muestra son conceptos relativos, pues un conjunto de individuos puede ser considerado
como un universo para ciertos estudios o como una muestra para otros. As por ejemplo, los
alumnos de la Universidad Central constituyen una muestra con respecto a la totalidad de los
universitarios del pas, pero constituyen el universo para dicha universidad en particular.

Los universos pueden ser finitos e infinitos. El universo se denomina finito, cuando est formado
por un nmero limitado de unidades, como ser el nmero de alumnos de la Universidad, de
mdicos en Venezuela, etc. Se denomina infinito, cuando cuenta con un nmero limitado de
unidades. El nmero de estrellas en el ciclo, son universos infinitos que nunca podran ser
cuantificados. En ocasiones, el universo que se estudia puede ser hipottico y entonces se le
considera como infinito. As por ejemplo, si con el fin de ensayar una nueva droga contra la Fiebre
Tifoidea se la prueba en una muestra de 20 enfermos. El universo correspondiente, estar
constituido por todos los pacientes que actualmente tienen la enfermedad y por todas las personas
que alguna vez puedan adquirirla. Igualmente si a determinado individuo se le mide la tensin
arterial en tres oportunidades diferentes esas tres mediciones constituyen el universo de infinitas
mediciones que en dicho individuo pueden practicarse.

7.3. Ventajas del empleo de muestras.

Hay varias razones por las cuales el estudio de una muestra es preferible al de la totalidad del
universo.
Ante todo, es evidente que el estudio de muestras es el nico practicable cuando se trata de
universos infinitos o de universos limitados pero muy extensos, pues ningn investigador sera
capaz de tratarlo en su totalidad. Lo mismo es valedero para aquellas investigaciones en las cuales
el proceso de investigacin destruye al individuo que se estudia, como en el caso en que se prueba
la accin de ciertos casos en animales de experimentacin.

Pero aun en el caso en que se quiera estudiar un universo perfectamente limitado, debemos
decidirnos por la muestra, pues su utilizacin tiene las siguientes ventajas:

1. Ahorra tiempo, dinero y trabajo


2. Permite una mayor exactitud en el estudio

El primer punto no necesita mayores comentarios. Si queremos estudiar cualquier caracterstica de


los 20000 estudiantes de nuestra Universidad Central digamos su metabolismo basal--- y para
ello tenemos una muestra de 2000 alumnos, el tiempo, el dinero y el trabajo serian
aproximadamente una dcima parte del que se invertira en el estudio de toda la poblacin
estudiantil.

En efecto, como ser menor el nmero de investigadores que intervienen en el estudio, ser
mucho ms fcil conseguir buenos especialistas y entrenarlos uniformemente: como se necesitaran
menos instrumentos de investigacin, estos podrn vigilarse y calibrarse ms cuidadosamente, y
como sern menos los individuos a estudiar, ser posible controlarlos ms adecuadamente, de tal
manera que todos ellos estn en la ms ptimas condiciones de estudio. Todo lo anterior
disminuir los errores en las observaciones y por lo tanto, los resultados obtenidos tendrn mayor
exactitud.

7.4. Desventajas del empleo de muestras

Al lado de las ventajas sealadas, la nica desventaja del uso de muestras, es el llamado error de
muestreo, el cual sumado a los 3 tipos de errores antes mencionados, podra invalidar nuestro
estudio.

Este error por muestreo es una consecuencia e la variabilidad de las poblaciones. Como los
individuos de toda la poblacin son muy variables los diferentes grupos o muestras que podemos
formar con ellos difieran tambin unos de otros y como nosotros solamente estudiamos una
muestra para generalizar luego a toda la poblacin, los resultados sern algo distintos segn la
muestra que hayamos escogido. Esta diferencia por el valor dado por la muestra y el verdadero
valor del universo, constituye el error por muestreo, a condicin desde luego, que en uno y otro
caso se utilicen idnticos mtodos de estudio, pues en caso contrario, gran parte de dicha
diferencia pudiera ser debida a errores inherentes a los mtodos empleados.

Con el fin de aclarar el anterior concepto, supongamos una poblacin de 4 personas que tuvieran
respectivamente 5, 3, 2 y bolvares. El capital total de esta poblacin es Bs. 20, o sea un promedio
de Bs. 5 por persona (20/4=5). Si no se conociera dicho promedio y para averiguarlo se tomara una
muestra de dos personas digamos las dos primeras (Bs. 5 y Bs. 3), concluiramos a travs de esta
pequea muestra que el capital promedio de cada persona de la poblacin es Bs. 4 cuando en
realidad vimos que era 5. Esa diferencia de 1 bolvar entre el valor de la muestra y el valor del
universo constituye el error por muestreo.

La presencia del error por muestreo pareca indicar que el estudiar una muestra en vez de la
totalidad del universo, es desfavorable y no ventajoso como hemos indicado. Sin embargo
conviene tener presente, en primer lugar, que el error por muestreo suele ser mucho menos
importante que los errores debidos al observador, al mtodo de observacin y a los individuos
estudiados, y en segundo lugar, que el error por muestreo puede medirse estadsticamente y en
cierto modo puede disminuirse a voluntad, tan solo con aumentar el tamao de la muestra.
Por lo tanto, como una muestra bien tomada permite el control de los errores debidos al
observador, al mtodo de observacin y a los individuos estudiados y, como por otra parte, el error
por muestreo puede medirse y disminuirse, se comprende fcilmente el por que hemos dicho que
los resultados a partir de una muestra, son mucho ms exactos que aquellos obtenidos del estudio
de todo el universo.

7.5. Condiciones de una buena muestra.

Por lo dicho anteriormente, se deduce que no todas muestras contienen informacin acerca de la
poblacin de donde proceden y por consiguiente, la muestra debe ser escogida de tal forma que la
informacin buscada se encuentre en ella.

Las condiciones que la muestra debe tener para que sea buena, es decir, para que rinda la mayor
utilidad posible, son dos. La muestra debe ser adecuada en:

a. cantidad, y
b. calidad.

7.5.1. Cantidad de individuos en la muestra

El que una muestra sea buena en cantidad, quiere decir que debe incluir un nmero ptimo y
mnimo de individuos. Hay frmulas estadsticas que estudiaremos luego, mediante las cuales
podemos determinar el nmero de individuos que debemos incluir en cada investigacin, pero
mientras tanto, las siguientes consideraciones ayudaran a aclarar este punto.

Supongamos una lista de alumnos de los cuales 15 sean hombres y una mujer. Si de esta lista
extraemos el nombre de un alumno y este es un hombre, a nadie se le ocurrira tomar esto como
evidencia para afirmar que todos los alumnos son del sexo masculino. Es evidente que en el
mejor de los casos, se necesitara extraer cuando menos dos nombres para poder afirmar que
hay hombres y mujeres en el curso, pero podra suceder que los 15 primeros nombres que
extraigamos sean de varones y en este caso extremo, sera necesario ver la totalidad de la lista
para indicar con absoluta seguridad cual es la composicin verdadera del curso. De la misma
manera, si entre los 16 alumnos del curso hubiera 4 de cada una de las regiones geogrficas del
pas, sera imposible afirmar tal hecho, con una muestra que tuviera menos de 4 individuos.

Los ejemplos anteriores aunque aparentemente pueriles, permiten sealar que el nmero de
individuo que deben incluirse en la muestra, depende de 2 factores, a saber:

La frecuencia con la cual el fenmeno que se estudia se encuentra en el universo, pues es


evidente que si una enfermedad se presenta tan solo en el 1% de la poblacin, habr necesidad de
estudiar por lo menos 100 casos, para tener la posibilidad de hallar una persona enferma, mientras
que, si su frecuencia fuera del 50%, al menos tericamente, de cada 2 personas que se estudien
se encontrara una enferma.

La variabilidad del universo que se estudias, pues se comprende que si todos los individuos que lo
forman fueran exactamente iguales, bastara con estudiar uno solo para conocer todo el universo y
en el caso opuesto, en que todos los individuos fueran completamente diferentes, habra que
estudiarlos en su totalidad.

7.5.2. Calidad de la muestra

El que una muestra sea buena en CALIDAD, quiere decir que debe reflejar fielmente las
caractersticas del universo del cual procede y diferir de l, solo en el nmero de unidades
incluidas.
Los aspectos referentes a la calidad de la muestra, son ms importantes que los referentes a su
cantidad y no debe pensarse que la calidad de la muestra depende de su cantidad. Si quisiramos
estudiar las caractersticas del pueblo venezolano, y nos emperamos en estudiar solamente a
los habitantes de Caracas, aunque estudiramos a todos ellos, nuestra muestra no seria todava
representativa de toso el pas.

7.5.3. Muestras representativas y muestras seleccionadas

Lo anterior quiere decir que si queremos generalizar que lo que es cierto en la muestra es cierto
tambin en todo el universo entonces la muestra debe ser perfectamente representativa de l. Si la
muestra no es representativa de su universo, se dice que es una muestra seleccionada y
generalmente no es conveniente trabajar con tales muestras. En el lenguaje corriente se llama
seleccionado algo que es excelente o de ptima calidad. En estadstica por el contrario una
muestra seleccionada suele ser mala, ya que por definicin, ella no representa su universo. No
quiere esto decir que una muestra seleccionada sea intil significa tan solo, que es necesario
considerar ciertas limitaciones en las conclusiones que de ello se deriven. Por lo dems una
muestra seleccionada, que no es representativa para determinado problema puede ser
representativa para otro. As por ejemplo, los estudiantes de la Facultad de Ingeniera forman una
mala muestra para un estudio que tuviera por fin, averiguar la proporcin de hombres y mujeres en
la Universidad Central pues pocas mujeres eligen esta carrera, pero formaran una muestra
adecuada, si el problema fuera conocer el porcentaje de catlicos en la Universidad, pues
aparentemente no hay ninguna relacin entre los sentimientos religiosos y la eleccin de la carrera
que se estudia.

La seleccin puede ser voluntaria o involuntaria. En el primer paso el investigador conoce las
limitaciones del material que est estudiando y las conclusiones que deriven deben estar de
acuerdo con ellas. Un investigador, por ejemplo que estudia las variaciones del paso de un grupo
de escolares de 8 aos, no podr generalizar sus hallazgos a escolares de todas las edades sino
exclusivamente al grupo de edad investigado.

El segundo caso es ms importante, porque como a menudo se agrupa dicha seleccin, se


pretender generalizar a toda una poblacin conclusiones que no le corresponde. Generalmente
este error se comete por una de las tres causas siguientes:

a. Porque se toma la muestra de solo un sector del universo, creyendo equivocadamente, que
dicho sector constituye todo el universo.

b. Si se quisiera estudiar por ejemplo, el ingreso promedio del obrero venezolano y para ello se
obtuviera una muestra que incluyera solamente a trabajadores del Zulia, el promedio obtenido
no sera vlido para toda Venezuela, pues se sabe perfectamente que los salarios en el Zulia
son muchos ms altos que en el resto del pas, a causa de las explotaciones petroleras. Una
muestra adecuada debera incluir trabajadoras delos diversos estados y territorios de la nacin.
c. Como un segundo ejemplo, supongamos que se desea hacer un estudio para averiguar la
letalidad de la fiebre tifoidea, o sea la proporcin de enfermos de fiebre tifoidea que fallecen.
Se sabe que la letalidad de la enfermedad vara en las diversas edades y depende del estado
nutritivo del paciente y del momento en que se inicia el tratamiento. Una buena muestra por lo
tanto, debe incluir pacientes de diversas edades, tanto desnutridos como bien nutridos en
diferentes etapas de la enfermedad. Si para dicho estudio se escogiera la muestra en el
Hospital Vargas de Caracas, tal muestro no nos revelara la verdadera letalidad de la Fiebre
Tifoidea, pues como se sabe, a dicho Hospital solo asisten personas adultas, generalmente
pobres y desnutridos y en estado grave, pues los casos benignos permanecen en sus
domicilios. Las conclusiones derivadas de un estudio como el anterior, podran generalizarse
solamente a enfermos de condiciones semejantes a los estudiados (adultos, desnutridos, etc.),
pero sera errneo pretender aplicarlas a otras circunstancias.
d. Porque el mtodo de escogencia de los individuos no es al azar, cual como veremos
enseguida es el nico procedimiento que no garantiza una buena escogencia. Tal error se
comete siempre que se trabaja con muestras de conveniencia.

e. Porque una vez obtenida la muestra, existen circunstancias que nos impiden estudiar a, los
individuos escogidos. La muestra puede haber sido escogida de toda la poblacin y por un
procedimiento al azar, con lo cual se elimina las dos causas de error acabadas de estudiar,
pero si no es posible recoger la informacin de las personas que deben estudiarse, ciertos
segmentos de la poblacin no van a quedar representados, esto sucede por ejemplo, en
encuestas mediante cuestionarios postales, pues en general quienes contestan pueden ser
muy diferentes de quienes no lo hacen.

En Venezuela por ejemplo, una encuesta en tal forma seria contestada solamente por una clase
social relativamente alta, ya que los pobres son generalmente analfabetos.

7.6 Clases de muestras.

Hay dos clases de muestras:

a.- muestras de conveniencia


b.- muestras probabilsticas.

7.6.1. Muestras de conveniencia o propositivas

Entran en esta categora todas aquellas muestras en las cuales los individuos se escogen sobre la
base de la opinin de un experto por considerarlos representantes tpicos del universo que se
quiere conocer.

Si se deseara, por ejemplo, averiguar los porcentajes de hombres y mujeres en la Universidad, en


vez de obtener una muestra de las diferentes facultades que la integran, podramos limitarnos al
estudio de un grupo de alumnos de aquella Facultad que nos parezca muy representativa con
relacin al sexo de sus integrantes. Sin embargo la validez de los resultados obtenidos, depender
exclusivamente del acierto que hayamos tenido al seleccionar como tpica dicha facultad.

Tal es la desventaja de este tipo de muestras: aun cuando sus resultados son bastantes
fidedignos, estamos en incapacidad de juzgar objetivamente sobre su posicin. Hace falta pues un
mecanismo ms objetivo de apreciacin que ofrezca garantas de probabilidad y que a la vez nos
permita medir la exactitud de los valores encontrados. Esto se logra con las muestras
probabilsticas.

7.6.2. Muestras probabilsticas.

Son aquellas en que cada individuo de la poblacin tiene una posibilidad perfectamente conocida
de ser incluido en la muestra. No es siquiera necesario que los diferentes individuos tengan una
posibilidad de pertenecer a la muestra, basta con que tengan cualquier posibilidad (diferente de
cero) de formar parte de ello y que la posibilidad sea conocida.

La eleccin de una muestra probabilstica requiere dos condiciones fundamentales. En primer lugar
como acaba de mencionarse, es necesario que la probabilidad de elegir cada individuo sea
perfectamente conocida, pues si no lo es, no ser posible calcular los errores que pueda
cometerse al hacer su escogencia. As por ejemplo, muchas muestras de opinin pueden ser
representativas de su universo, pero por no llenar el anterior requisito, estamos en incapacidad de
juzgar objetivamente sobre su representatividad. En segundo lugar, es indispensable que los
individuos se elijan al azar, sin permitir la intervencin de ningn factor que favorezca la eleccin
de unos en detrimento de los otros.
Elegir los individuos al azar, no quiere decir elegirlos sin ton ni son, a nuestra voluntad o a
voluntad de otros, quiere decir elegirlos por un mtodo perfectamente estudiado en tal forma que la
voluntad no tenga ninguna participacin en dicha eleccin, tal como se hace en el popular juego de
la lotera o bingo, en el cual la obtencin de cualquier nmero es obra de la suerte. Veremos
enseguida, que solo para aquellos casos en los cuales el azar se utiliza como sistema de eleccin
de los individuos, ha sido posible determinar y valorar la variacin que es dado esperar entre
diversas muestras.

7.7. Demostracin prctica.

Antes de segur adelante, conviene recurrir a una de la cualquiera de las demostraciones Ya


clsicas, con el fin de entender la verdadera importancia del azar en la obtencin de muestras.
Con el fin vamos a presentar los resultados de una de esas demostraciones obtenidas en el ltimo
curso de mdicos higienistas.
La demostracin consisti en colocar 500 metras blancas y 500 negras en una caja y despus de
mezclarlas cuidadosamente se pidi a los alumnos del curso que secaran, sin ver, muestras de 10
metras.

Cada vez que se extraa una muestra se anotaba l nmero de metras blancas obtenidas y luego
de retornar las 10 metras a la caja se mezclaban convenientemente antes de obtener otras
muestras. En esta forma se obtuvieron 150 muestras en total, las cuales se presentan en el
prximo cuadro, clasificadas de acuerdo al nmero de metras blancas.

Antes de comentar los resultados obtenidos, obsrvese que esta demostracin no es tan terica
como parece y que ella es equivalente a muchos problemas prcticos. La caja con 1000 metras
blancas y negras pudiera ser una poblacin de 1000 habitantes, unos sanos y otros enfermos, de
la cual el un primer investigador obtuvo una muestra de 10 individuas con el fin de conocer el
porcentaje de enfermos, luego un segundo investigador hizo lo mismo y as sucesivamente hasta
que 150 personas distintas estudiaron dicha poblacin.

El examen del cuadro 46 revela varios puntos:

a. Hay cierta variacin en los resultados obtenidos con las muestras. No todas ellas arrojaron el
mismo resultado.

b. Como fueron los mismos observadores quienes por el mismo mtodo estudiaron el mismo
universo de metras, hay que concluir que la causa de la variacin observada fue al azar

c. A pesar del variacin presente, puede observarse que no todos los resultados se presentan en
la misma frecuencia. La mayora de los valores estn muy cerca del verdadero valor de la
poblacin estudiada (50%) y los valores muy diferentes al del universo, van siendo mucho ms
raros, mientras mucho ms se aparten de l. En realidad no hubo ninguna muestra en que no
apareciera por lo menos una metra blanca, o en la cual todas las metras fueran blancas, a
pesar de que en ocasiones puedan presentarse. Los resultados que con mayor frecuencia se
presentaron fueron aquellos vecinos a la verdadera composicin del universo de 1000 metras y
de hecho. Hubo 36 muestras en las cuales el porcentaje de metras blancas fue de 50 %, valor
exactamente igual al del universo

d. Puede observarse igualmente que los resultados no son desordenados, sino que presentan
cierta simetra. En efecto, puede notarse que las frecuencias aumentan paulatinamente hasta
llegar a un mximo, para decrecer luego en la misma forma si se unen los vrtices de las
barritas que sealan las frecuencias puede observarse que se forma una curva de campana.
Esta curva cuyas caractersticas se estudiaran mas tarde, se conoce con el nombre de Curva
de Gauss o Curva normal
Distribucin de 150 muestras de 10 metras cada una, de acuerdo al nmero de metras
blancas obtenidas.

(Metras blancas en el universo: 50 %)

Cuadro 46
Nmero de muestras
Metras blancas por muestra
obtenidas
0 0
1 3
2 6
3 20
4 30
5 36
6 28
7 18
8 8
9 1
10 0
Total 150

Grfico 46

40

30
Frecuencia

20

10

0
1 2 3 4 5 6 7 8 9 10 11

Metras blancas por muestra


El hecho de que los resultados dados por el azar sigan una Curva normal es importantsimo, pues
esta Curva es un modelo matemtico perfectamente estudiado y por lo tanto, si el azar sigue une
Curva normal, las leyes matemticas que se apliquen a esta, podrn ser a aquel. La utilidad de
esta conclusin solo ser aparente en prximos captulos, pero la demostracin que se acaba de
hacer nos indica que aunque los resultados dados por el azar son muy variables, dicha variacin
no es anrquica, sino perfectamente ordenada y perfectamente previsible, y de ah la confianza
que debemos tener cuando usamos dicho mtodo para escogencia de las muestras.
7.8. Eleccin entre muestras probabilsticas y de conveniencia

Como se ha visto, la diferencia entre muestras probabilsticas y muestras de conveniencia estriba


en que estas ltimas la posibilidad de que un individuo sea incluido en la muestra es desconocida
como siendo imposible medir la exactitud de los resultados obtenidos.

A causa de esto, siempre que sea posible deben utilizarse muestras probabilsticas, a pesar de que
hay ocasiones- ilustradas en los siguientes ejemplos-en las cuales se precisa recurrir a muestras
de conveniencia.

a.- Muchas veces, por limitaciones nuestros recursos tenemos que estudiar un nmero de
individuos menor que el que fuera deseado y entonces la opinin de un experto puede ser
conveniente. As por ejemplo, si al ensayar una nueva droga solo se tienen 5 o 6 dosis en vez de
escoger los individuos al azar, pueden seleccionarse solamente casos graves, ya que se presume
que la droga es efectiva en ella con mayor razn lo ser en los casos benignos o corrientes de la
enfermedad. Igualmente, si se quiere conocer cualquier caracterstica de una poblacin a travs
del estudio de unos pocos individuos se lograra una mayor exactitud, si se aprovecha de la
experiencia que se tiene, para estudiar tan solo a individuos que presenten en promedio la
caracterstica que se investigue.

b.- Otras veces, no se puede obtener una lista completa de la poblacin que se va a estudiar,
siendo por lo tanto imposible aplicar el azar. En tales casos, la seleccin de los individuos que se
estudian envuelve un proceso de opinin.

Finalmente, hay ocasiones en las cuales el principal inters est en localizar individuos con
determinadas caractersticas en una poblacin muy numerosa, digamos los enfermos tuberculosos
de una comunidad en tales casos es preferible concentrarnos en el estudio de aquellos grupos en
los cuales la experiencia seala que hay posibilidades de encontrar a los individuos buscados.

7.9 Mtodos para la obtencin de una muestra probabilstica.

Bsicamente son dos los mtodos para asegurar escogencia que una buena muestra:

a. El mtodo de la lotera.
b. El mtodo de los nmeros al azar o aleatorio.

El mtodo de la lotera: consiste en colocar en un recipiente fichas con los nombres de todos los
integrantes de la poblacin que se va a estudiar y despus de revolverlas bien, se extraern tantas
fichas como individuos se quieren obtener. Se comprende que la poblacin es muy numerosa este
procedimiento resulta poco prctico y por consiguiente, debe darse preferencia a la que
describiremos a continuacin.

Las tablas de nmeros al azar: son tablas con miles de nmeros obtenidos con un procedimiento
como el de la lotera, es decir, por su procedimiento al azar. Algunas de ellas contienen hasta un
milln de dgitos y la que se inserta en la prxima pgina es solo un modelo obtenido en prcticas
de clase.

Aunque los nmeros estn agrupados de 5 x 5, tal distribucin se hace simplemente con el fin de
facilitar la lectura, siendo indiferente que esta se realicen hacia abajo, hacia arriba, horizontal o
diagonalmente.

Para utilizar estas palabras se empieza por numerar a los individuos de la poblacin desde el uno
en adelante y luego se extraern tantos nmeros como individuos vayan a incluirse en la muestra.
La tabla puede empezarse a leer en cualquier parte, pero debe escogerse al azar la columna y la
fila de comienzo, para lo cual es suficiente colocar a siegas un dedo sobre el cuerpo de la tabla y
empezar en ese sitio la lectura.

Supongamos por ejemplo, que de una poblacin de 5000 individuos previamente numerados del 1
al 5000 se desea extraer una muestra de 500. Como l nmero 5000 consta de 4 dgitos ser
necesario utilizar 4 columnas de la tabla sin que tenga importancia cuales sean. Si mediante el
procedimiento mencionado sea decidido comenzar en la columna 7, fila 3, el primer individuo ser
l nmero 01954, el segundo nmero ser 4321. Luego aparecern los nmeros 9183 y 6956 los
cuales no se tomara en cuenta ya que la poblacin solo consta de 5000 elementos y por lo tanto el
tercer individuo que se escoger ser el 139. Al terminar estas columnas se continuara en la parte
superior de la tabla con los nmeros 2481, 2835, etc. (columnas 1 a 14) hasta que haya sido
obtenida la muestra de 500.
Cuadro 49
Tabla de nmeros al azar
_ _ _
Filas Columnas
_ _ _

1-5 6-10 11-15 16-20 21-25

1 28596 75255 24813 25171 00935


2 95504 73814 28355 99264 20968
3 70426 01954 86694 53918 47721
4 25757 44321 02621 03392 19773
5 00076 39183 92696 62103 88027

6 05428 36956 09005 81983 53470


7 71540 80139 17632 61177 77333
8 66292 79184 81386 82260 29281
9 78168 15727 03388 16789 27661
10 68603 72198 93952 80082 56210

11 42641 60859 17445 45157 00820


12 25205 33559 52323 08309 53669
13 55563 62108 98633 31743 08345
14 11495 13819 86358 59582 87793
15 21729 72882 07456 22912 43280

16 68598 46869 37573 24965 75237


17 76384 54351 43621 64510 90654
18 17648 75770 89043 69826 94302
19 46105 03781 91384 80785 99901
20 81383 22762 60794 63630 30169

21 10395 09373 42604 35861 80689


22 35258 90303 15371 13264 28390
23 75014 35713 15138 81415 78187
24 20562 64270 51580 76136 74954
25 41987 61152 98447 93635 33871

26 15993 08117 66623 83885 12276


27 74230 97335 35355 21799 90234
28 57667 28151 44889 28879 50985
29 40917 21639 65973 30101 75678
30 70585 73790 74377 49114 53839
7.10 Diferentes tipos de muestras probabilsticas

En el terreno prctico, las nociones anteriores suelen combinarse con el fin de lograr mayor
precisin en el muestreo. Entre los numerosos modelos utilizados y que describiremos muy
brevemente estn:

a. Muestras por azar simple


b. muestras sistemticas
c. muestras estratificadas
d. muestras de conglomerados
e. muestras por procedimiento combinado o mixto.

Con el fin de sealar las diferencias, ventajas y desventajas de estos procedimientos, tomemos el
siguiente ejemplo terico. Supongamos que en cada una de las 4 zonas geogrficas del pas hay
100 escuelas artesanales con 50 alumnos en cada escuela y que con el fin de estudiar
determinada caracterstica, resolvemos extraer una muestra de 2000 alumnos.

Hay en total 400 escuelas con 20000 alumnos y la eleccin de los 2000 que vamos a estudiar
podr hacerse por cualquiera de los siguientes procedimientos.

7.10.1. Muestra por azar simple

A partir de una lista con los nombres de los 20000 estudiantes del pas se elegirn los 2000 que
deben estudiarse, por el mtodo de la lotera o con la ayuda de una tabla de nmeros al azar. El
procedimiento tiene tres inconvenientes:

1. Se necesita una lista detallada con todos los alumnos del pas, lo cual no es fcil de obtener.
2. La muestra quedara tan dispersa, que probablemente haya necesidad de trasladarse a una
apartada regin, para estudiar uno o dos alumnos.
3. No hay garanta de que las 4 regiones estn adecuadamente representadas en la muestra,
pues puede ser posible que mientras de una regin se escojan 800 alumnos de otra se
obtengan solamente 100 o 200.

7.10.2. Muestras sistemticas.

Como son 20000 alumnos de los cuales se estudiaran 2000, esto quiere decir que de cada 10 se
estudiara uno. Para obtener una muestra sistemtica, nos procuraremos una lista de tolos alumnos
del pas que numeraremos del 1 al 20000. Luego se escoger al azar un nmero entre el 1 y el 10,
el cual indicara el primer alumno que se va estudiar y completaremos la muestra tomando de la
lista cada dcimo nio. Si l nmero escogido fue 5, los alumnos sern los correspondientes a los
nmeros 5, 15, 25, 35, etc.

Cuando la lista est hecha al azar, este procedimiento es equivalente al descrito anteriormente y
presenta sus mismos inconvenientes. Pero dada la sencillez de su aplicacin, suele utilizarse en
todos aquellos casos en los cuales existen ficheros o tarjeteros especiales con los nombres de
cada uno de los individuos de la poblacin que se investiga. As por ejemplo, si en los archivos de
un hospital hay 20000 historias clnicas numeradas del 1 al 20000 y se desea unas muestra de
1000 de ellas (una de cada 20), en vez de tomarnos la molestia de extraer 1000 nmeros de tabla
de dgitos al azar ser fcil obtener un nmero del 1 al 20, digamos el 10, el cual indica la primera
historia que se estudiara continundose luego con cada 20 historias hasta completar las 1000
deseadas, o sea, que se escogern las 10, 30, 50, 70, etc.

Sin embargo, si la lista no est hecha al azar, la utilizacin de muestras sistemticas puede
conducir a serios errores. Considrese como ejemplo el siguiente caso extremo: 1000 parejas que
van a contraer matrimonio acuden a obtener el correspondiente certificado de salud, cuya copia es
archivada en el mismo orden que se examinaran las personas. Como por galantera la mujer
siempre se examin de primero como los nmeros impares correspondern a historias de mujeres
y los pares a historias de hombres. En tales circunstancias, si quisiramos extraer una muestra
sistemtica del 10% de las historias con el fin de conocer por ejemplo, la edad promedio de los
contrayentes y comenzamos digamos en l nmero 3, todas las historias corresponderan a
mujeres (3, 13, 23, etc.).

7.10.3. Muestras Estratificadas

En este sistema la poblacin se divide primero en estratos y luego en cada uno de los estratos
escogen al azar los que compondrn la muestra.

Nuestro ejemplo hipottico, las cuatro zonas del pas las consideraremos estratos diferentes de
cada uno de los cuales escogeremos los individuos para completar los 2000 de la muestra. La
escogencia se da con el mtodo de la lotera o mediante una tabla de nmeros al sustrayendo
sucesivamente 500 alumnos de cada uno de las zonas.

Esta al igual que los mtodos anteriores requieren una lista detallada de todo los alumnos y a
pesar de que la muestra puede ser demasiado dispersa hay garanta de que las 4 zonas estarn
adecuadamente representadas.

La estratificacin es un procedimiento mediante el cual se utiliza la competencia que se tiene sobre


el problema que se estudia, con el fin de dar mayor exactitud a los resultados. As por ejemplo es
que en promedio los das de hospitalizacin de los servicios de maternidad, pediatra, ciruga y
medicina general son muy diferentes unos de otros, pues mientras que en la maternidad una
parturienta dura por trmino medio 3 das, en ciruga esta cifra se acerca a 10 das. Este
conocimiento puede utilizarse en el muestreo construyendo una muestra separada de cada uno de
los 4 servicios y esperando luego sus resultados con lo cual hay 2 ventajas sobre el muestreo por
azar simple: a) Se obtiene informacin separada para cada uno de los servicios. b) Se evita el
riesgo que determinado momento quede inadecuadamente representado, pues de no hacerse la
estratificacin, puede darse el caso que la mayora de la historias prolongan el servicio de
maternidad, en el cual la hospitalizacin es menor y la muestra nos hara concluir errneamente
que el tiempo de permanencia en el hospital es menor de lo que en realidad es.

7.10.4. Muestras de Conglomerados

En este procedimiento, en lugar de escoger a los individuos que van ha estudiarse. Se escoger
grupos o conglomerados de individuos.
Como cada escuela tiene 50 alumnos, al escoger 40 escuelas tendremos los 2000 alumnos que
queremos estudiar.

En las muestras de conglomerado no se necesita tener una lista detallada de los alumnos pues
basta con numerar las 400 escuelas del pas para escoger las que se estudiaran. Por otra parte se
evita la dispersin, pues aunque haya que estudiar una escuela en un pueblo lejano, al
trasladarnos all lo haremos, no por uno o dos alumnos sino por 50 lo cual se traduce en un ahorro
de tiempo dinero y esfuerzos.

El nico inconveniente pudiera ser que las zonas no nos quedaran adecuadamente representadas.
Adems, las muestras de conglomerados no suelen dar resultados tan precisos como las
obtenidas con las estratificadas. Mientras que en estas debe procurarse que cada uno de los
estratos sea tan homogneo como sea posible, en aquellas se obtendrn mayor precisin mientras
ms heterogneos sean los individuos que conformen el conglomerado, pues en tal caso, cada
conglomerado viene a ser como una poblacin en miniatura.
7.10.5. Muestras por procedimiento combinado

Como las muestras de conglomerados evitan la necesidad de tener una lista detallada de la
totalidad del universo que se estudia evita la dispersin de la muestra y como a su vez la s
muestras estratificadas aseguran la representatividad de los diferentes sectores de la poblacin se
comprende que una combinacin elimina los 3 grandes inconvenientes del muestreo por azar
simple.

En nuestro ejemplo, una muestra estratificada de conglomerados se obtendra escogiendo


separadamente 10 escuelas de cada una de las zonas del pas (4x10x50=2000 alumnos).

Habitualmente una vez que se escogen los conglomerados no se estudia la totalidad de las
unidades que los forman sino que se escogen al azar algunas de estas unidades. En nuestro
ejemplo note que para elegir los 2000 alumnos, cualquiera de las siguientes combinaciones ser
posible:

Alumnos estudiados Total de alumnos


Tipo de combinacin Nmero de escuela
por escuela estudiados
A 400 5 2000
B 200 10 2000
C 100 20 2000
D 50 40 2000
E 40 50 2000

E y A se escogen 5 alumnos de cada escuela pero 100 por ciento de alumnos estn representados
en una muestra. En E solo se escogen 40 alumnos, pero el 100 % de sus alumnos deben ser
estudiados.

Cualquier combinacin de las anteriores podra ser escogida, pero con miras a una mayor
precisin, esta aumentara mientras mayor sea el nmero de escuelas que se estudien
(combinacin A mejor que B esta mejor que C y as sucesivamente). Ntese sin embargo, que
mientras ms escuelas se estudien ms dispersa quedara la muestra y en la combinacin A sera
necesario tener una lista de toda la poblacin, con lo que se pierden las dos grandes ventajas de
las muestras de conglomerados.

7.11. Anlisis del resultado de la muestra

Una vez obtenida la muestra y convenientemente resumidos los hallazgos, el paso siguiente es la
generalizacin de los resultados de esta poblacin de la cual procede. Dicha generalizacin exige
2 requisitos, A) estimar los valores del universo y b) juzgar sobre la posicin de tales valores.

7.11.1 Valores del universo

La estimacin de los valores del universo depende del tipo de muestra que se haya utilizado.
Cuando se trata de una muestra por azar simple o de una muestra sistemtica, los resultados
observados de ella pueden aplicarse directamente al universo. Si en el anterior ejemplo de los
escolares encontramos que el 40% de los escolares de Venezuela son mujeres.

Cuando la muestra es estratificada o de conglomerados, se resumirn rimero los resultados de


cada estrato o conglomerado, y luego se estimara el valor global de todo el universo lo cual
requiere la utilizacin de los llamados promedios ponderados, cuyo clculo se estudiara en la
seccin 16.8.

El caso de las muestras por procedimiento combinado es ms complicado siendo aconsejable el


asesoramiento de un tcnico estadstico.
7.11.2 Precisin de los resultados de la muestra

Si en la muestra estudiada se encontr que el 40% de los escolares son mujeres, podemos aplicar
tal porcentaje de la totalidad de la poblacin escolar de Venezuela, aunque se entiende desde
luego, que dicha cifra es tan solo una aproximacin. Cabe preguntarse cun exacta es tal
aproximacin.

Este problema ser dilucidado en prximos captulos y tratado especialmente en el captulo XIX,
pero mientras tanto, tngase presente que siempre que siempre que se hacen generalizaciones a
partir de una muestra, se corre el riesgo de que los valores dados por ella no correspondan
exactamente a los del universo. Sin embargo, aunque tal riesgo no puede eliminarse por cualquier
procedimiento, puede reducirse convenientemente y estimarse con bastante exactitud a partir de
los propios resultados de la muestra, a condicin de que sea una muestra probabilstica y que su
tamao sea adecuado.
CAPITULO VIII

DISEO DE FORMULARIOS
8.1 Generalidades

Cuando se hace un estudio, se recoger tal cantidad de datos que ser imposible confiarlos a la
memoria. En tales caso, habr necesidad de registrarlos en formularios adecuados como paso
previo para su resumen y anlisis.

Bajo la denominacin genrica de formularios se incluye toda forma impresa destinada a la


recoleccin de datos, tal como las historias clnicas, las fichas epidemiolgicas o tarjetas
especiales que a la vez permiten recoger los datos, sirven para su computacin.

Los formularios deben ser planeados cuidadosamente, en tal forma que sean realmente tiles y
que faciliten y no dificulten la obtencin de los datos. Ellos deben ayudar a recoger la informacin
de manera completa y eficiente, permitiendo uniformidad en las diferentes observaciones y
evitando la recoleccin de datos intiles o irrelevantes al estudio.

El formulario debe permitir recoger dos tipos de datos:

a. Datos administrativos o de identificacin.


b. Datos sobre el problema que se estudia

Los primeros ayudaran a identificar las unidades en observacin e incluyen el nombre de a


persona, su edad, sexo, residencia y fecha de estudio. A travs de ello puede medirse el
rendimiento del personal y la distribucin de algunas caractersticas en el tiempo y en el espacio.

En cuanto a los segundos deben tener un propsito perfectamente definido y ser pertinentes al
estudio.

8.2. Elaboracin del formulario

Antes de elaborar el formulario debe considerarse el propsito para el cual ser utilizado y las
circunstancias bajo las cuales se recoger la informacin. Lo primero tiene importancia para decidir
sobre los datos que en ltima instancia se recogern y lo segundo, para la adopcin del tamao,
forma y material ms conveniente.

Aunque es imposible dar reglas fijas para la correcta elaboracin de un formulario, los siguientes
puntos sern de utilidad:

1. Decidir sobre los datos que recogern. Un formulario muy extenso, conspira con la exacta
recoleccin de los datos y de all que solo deban recogerse aquellos tiles y pertinentes al
estudio. En esta decisin es conveniente:

a. Hacer una lista de todos los datos de acuerdo a la finalidad del estudio.

b. Considerar cuales datos son factibles de recoger de manera fidedigna y exacta. Averiguar si
una persona es o no adicta a la s drogas heroicas, es una informacin deseable de recoger,
pero generalmente no vale la pena investigarla, pues es raro que las personas Ester
dispuestas a suministrarla.

c. Limitar los datos aquellos prcticos de recoger. As por ejemplo hay ciertas reacciones
serolgicas mucho ms especficas que el VDRL para el diagnstico de la Sfilis, pero siendo
ms complicadas posiblemente se prefiera no utilizarlas.
d. Limitar la informacin aquella que se usar. Generalmente se recogen muchos datos pensando
que algunos que hoy parecen sin importancia, posiblemente en el futuro sean de utilidad. Tal
actitud es justificada, solo cuando se tiene la seguridad de que esta investigacin adicional
entorpecer la recoleccin de los datos verdaderamente esenciales.

2. Decidir sobre el orden en que se asentarn los datos en el formulario. La distribucin debe
hacerse en manera lgica y ordenada y as por ejemplo, datos sobre la ocupacin, vivienda,
educacin y otros referentes a las condiciones econmicas y sociales no deben ser
separados.

3. En general la parte superior del formulario debe reservarse para datos clarificativos y de
identificacin (nombre, direccin, rea geogrfica, etc.) y no ocuparla, como suele hacerse, con
el nombre de la oficina que hace el estudio.

4. Considerar cmo se hacen las preguntas.-Esto tiene mucha ms importancia en los formularios
utilizados en ciertas encuestas sociolgicas que en el caso de las historia clnicas o formularios
afines empleados por el mdico.

5. En todos los casos en que ciertas preguntas deben ser formuladas, se procurar un lenguaje
simple, sin ambigedades y como hemos sealado, se evitarn las preguntas insinuantes,
poco explicitas o insuficientemente especficas.

6. Planear como se anotarn las respuestas. No es infrecuente el hecho que para anotar ciertas
respuestas ms o menos extensas, apenas se deja espacio para una o dos palabras, lo cual,
como es lgico, impide recoger la informacin de manera completa. El espacio que se deje
debe ser adecuado para las respuestas que se espere siempre que sea posible se adoptar el
sistema que exija el esfuerzo menor. Obsrvese como la misma informacin del sexo puede
consignarse de tres manera diferentes, aunque la segunda parece mucho ms conveniente.

a. Sexo?...............

Hombre
b. Sexo
Mujer

SI

c. Hombre?

NO

7. Determinar Las caractersticas del formulario. Con respecto a este punto vale la pena
considerar:

QUIN Recoger la informacin?


DE QUIN Ser recogida?
DONDE Y CUANDO Se registrar?
CMO Se procesarn los datos?

De acuerdo a las anteriores preguntas, se deducir sobre las formas, tamao, material, color,
etc. de los formularios.
a) Forma y tamao: Aunque una sola pgina facilita considerablemente su manejo a forma y
tamao depender de la cantidad y extensin de los detalles que se van a recoger y de si el
formulario se usar directamente o no para las computaciones.

b) Material: Depende del empleo que se le dar al formulario, mientras que formularios que se
van a usar justifican un material de ptima calidad, otros que solo se utilizaran una vez, como
las rdenes para los exmenes de laboratorio, podrn ser hechos de papel corriente.

c) Colores: Cuando en una misma dependencia se utilizan varios formularios, suele ser
conveniente usar diferentes colores para distinguirlos fcilmente as por ejemplo, el Ministerio
de Sanidad usa el color blanco para consulta de lactantes, rozado para escolares, amarillo
para la consulta de prenatales, etc.

d) Probar la operatividad del formulario. Antes de que el formulario sea impreso de forma
definitiva, es conveniente probarlo en el terreno mediante un estudio piloto, para darse cuenta
de las fallas que aun puedan presentar y hacer las correcciones necesarias. Muchas veces,
solo despus de mltiples experiencias puede llegarse a la adopcin de un formulario
definitivo. La historia clnica por ejemplo a pasado por tres diferente etapas, antes de que se
empleara la forma que hoy se utiliza. Al principio era una simple hoja en blanco, en donde el
mdico anotaba los hallazgos de su examen, lo cual tena como inconveniente, la falta de
uniformidad de las observaciones haciendo imposible la comparacin entre un grupo de
pacientes y otro. Despus se transform en una lista interminable de preguntas, de la cual el
mdico no podra apartarse. Como se ha sealado, era un atentado contra la personalidad del
mdico y del paciente. Hoy en da, en la historia clnica, a manera de recordatorio para el
mdico, se sealan las grandes bases de datos que deben investigarse, pero se deja en
libertad al profesional para investigarlos en la forma y en detalle que juzgue conveniente.

8. Redactar las instrucciones necesarias. Estas pueden imprimirse en el mismo formulario cuando
no son muy extensas o en hojas aparte en caso contrario.
CAPITULO IX

LA ETAPA DE ELABORACIN DE LA INFORMACIN

PASOS EN LA ELABORACIN DE LA INFORMACIN

Una vez recogida la informacin, es necesario revisarla cuidadosamente y luego resumirla y


presentarla convenientemente, antes de que sea posible analizarla.

As por ejemplo, los datos referentes al peso de un grupo de 30 individuos, tal como aparecen a
continuacin, no revelan fcilmente ninguna caracterstica del grupo:

En cambio, los mismos datos ya elaborados, presentados en la forma que sigue, permite
formarse juicio bastante exacto, sobre el conjunto de personas estudiadas:

73 69 72 67 63 62
66 68 52 61 68 64
52 55 63 60 58 54
63 62 56 58 51 59
64 61 64 57 56 56

Cuadro 61
Individuos de acuerdo a su peso

Peso en kilos Nmero de personas


50-54 4
55-59 8
60-64 12
65-69 4
70-74 2
TOTAL 30

Al resumir los datos en tal forma, algunos detalles sobre las variaciones individuales se han
perdido, pero las caractersticas generales del grupo se han conservado y son mas aparentes.

En la etapa de elaboracin se consideran los tres pasos siguientes, cuyos detalles se estudiaran
en los prximos captulos:

1. Revisin y Correccin de la informacin recogida.


2. Clasificacin y Computacin de los datos.
3. Presentacin mediante Cuadros y Grficos.
CAPITULO X

REVISIN Y CORRECCION DE LA INFORMACIN RECOGIDA


Es necesario revisar cada uno de los formularios recogidos, como fin de ver si los datos han sido
registrados de manera completa y fidedigna, ya que las conclusiones que del estudio se deriven
nunca podrn ser ms exactas que los datos en los cuales se basan.

Hay que ver ante todo si el formulario est completo o si existen omisiones, es decir, ver si todos
los datos que debieron investigarse se encuentran asentados.

Hay que fijarse luego si dichos datos son correctos. No siempre ser posible decidir sobre la
correccin o no de un dato, pero frecuentemente la existencia de otra informacin en el formulario
y cierto conocimiento de la materia que se estudia, ayudara al respecto. As por ejemplo, una
persona nacida en 1950 puede aparecer como de 40 aos, lo cual a todas luces es imposible, o un
nio de 5 aos aparecer con un peso de 50 Kilos, lo cual, indudablemente, es una equivocacin.

Cuando tales inexactitudes se comprueban, ser necesario hacer las correcciones pertinentes
cuando ello sea posible, u omitir de las computaciones finales los formularios incompletos e
incorrectos. En este ltimo caso se corre el riesgo de invalidar el estudio, pues generalmente se
trabaja con muestras y la eliminacin de unos cuantos individuos puede viciar los resultados. Una
adecuado planificacin de la investigacin y una cuidadosa recoleccin de la informacin, sern la
manera lgica de precaverse contra tales eventualidades.
CAPITULO XI

CLASIFICACION Y COMPUTACIN DE DATOS

La computacin consiste simplemente en contar cuntos individuos presentan o no alguna


caracterstica especial o averiguar en qu forma se distribuyen de acuerdo a determinada escala
de clasificacin.

Antes de que se haga cualquier computacin, es necesario por lo tanto, haber decidido de
antemano el criterio bajo el cual sern clasificadas las personas estudiadas, pues un grupo de
individuos podr clasificarse de muchas maneras diferentes, segn la finalidad que se persigue: de
acuerdo al sexo, la raza, la edad, etc.

11.1 Escalas de clasificacin

Como la presentacin de los datos estadsticos y su anlisis posterior depende en gran parte de la
manera como estn clasificados, algunas consideraciones al respecto son convenientes.

11.1.1 Condiciones de una buena escala

Cualquiera que sea la escala que se escoja, debe reunir, entre otras, dos condiciones bsicas:

1. Debe ser exhaustiva;


2. Las clases o subdivisiones de que consta deben ser mutuamente excluyentes.

El que la escala sea exhaustiva significa que debe permitir la clasificacin de cualquier individuo
que se estudia. Una escala que dividiera las razas solamente en Blanca y Negra sera incompleta,
ya que no permitira la inclusin de personas de otros grupos raciales.

El que las clases sean mutuamente excluyentes quiere decir, que no debe dejar dudas sobre
donde incluir a cada una de las unidades en estudio.

Grupos de Edad

Escala Escala
Incorrecta Correcta
0-5 0-4
5-10 5-9
10-15 10-14
15-20 15-19
etc. etc.

Una escala como la de la izquierda es incorrecta, porque es ambigua y en un momento dado no se


sabra donde incluir a un nio que tuviera exactamente 5 o 10 aos de edad. La escala de la
derecha evita tal confusin y es preferida por su sencillez y exactitud.

11.1.2. Diferentes tipos de escala

Al estudiar a un individuo, podemos contentarnos con investigar simplemente si presenta o no


determinada cualidad o atributo, o podemos, cuando ello sea posible, tratar de medir cunto o qu
cantidad posee de alguna particular caracterstica.

La anterior nocin permite distinguir dos clases de escalas:


1. cualitativas, y
2. cuantitativas

11.1.2.1 Escalas (Variables) cualitativas. Las escalas cualitativas solo permiten distribuir a los
individuos de acuerdo a ciertas caractersticas que le son comunes y por medio de las cuales
pueden distinguirse de otros individuos que no las poseen. Al clasificar a un grupo de personas por
sexo, raza, estado civil, regin de donde proceden, enfermedad que padecen, etc., se est usando
una escala cualitativa.

Las escalas cualitativas pueden ser:

a. Nominales: presenta modalidades no numricas que no admiten un criterio de orden. Por


ejemplo: El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado
y viudo. A su vez, stas se clasifican en binarias o dicotmicas (cuando tienen dos categoras
ej. sexo) y Policotmicas (cuando tienen ms de dos categoras ej. estado civil)

b. Ordinales: presenta modalidades no numricas, en las que existe un orden. Por ejemplo: La
nota en un examen: suspenso, aprobado, notable, sobresaliente.

c. 11.1.2.2. Escalas cuantitativas. Las escalas cuantitativas son mas precisas, porque a ms de
permitir la diferenciacin entre unos individuos y otros, sealan cuan grandes son las
diferencias observadas. La determinacin del peso, la estatura, edad, pulso o tensin arterial
de una persona, o la divisin de las familias por el nmero de hijos de que constan o de
acuerdo a sus ingresos se hace mediante el uso de una escala cuantitativa.

Las escalas cuantitativas se dividen en:

a. Continuas
b. Discontinuas

Una escala cuantitativa se denomina continua cuando cualquier valor intermedio entre 2 ntegros
es posible. La edad de una persona por ejemplo, puede ser 40 aos, o 40 aos y 10 meses, o an
podra expresarse como 40 aos, 10 meses, 5 horas, 15 minutos, etc. De la misma manera el peso
de un hombre puede ser 60 Kilos, pero si se tuviera una balanza de precisin quiz podra
anotarse como 60 kilos, 300 gramos, 20 centigramos, etc.

Una escala se llama discontinua cuando solo admite valores de nmeros enteros. Las familias
clasificadas segn el nmero de hijos o los escolares por el nmero de dientes cariados que
tengan, son ejemplos de escalas discontinuas, porque una familia podr tener 1,2.... 15 hijos; o un
escolar 1,2... 20 caries, pero ningn valor fraccionado tendr significado.

La distincin entre escalas continuas y discontinuas es til aunque su diferenciacin en ocasiones


no tiene razn de ser. El nmero de glbulos rojos por persona es un ejemplo de escala
discontinua, ya que no puede haber valores fraccionados, pero la discontinuidad es tan poco
aparente, que tal escala se trata como si fue continua. En realidad, nadie podra sealar si una
persona tiene 4.999.999 glbulos rojos o exactamente 5.000.000.

11.1.3. Clasificacin de los Datos

Se comprende fcilmente que los individuos que se estudian pueden clasificarse segn una escala
nica o de acuerdo a dos o ms escalas a la vez. Teniendo en cuenta esta nocin, los datos
estadsticos podrn clasificarse en los tres tipos que a continuacin se describen:

11.1.3.1. Distribuciones de Frecuencias. En un grupo de personas podemos averiguar primero


cuantos hombres y cuantas mujeres hay, o investigar despus, como se reparten de acuerdo a su
raza. En uno y otro caso se est usando una nica escala cada vez.
Individuos por Sexo Individuos por Raza
Hombres 45 Blancos 80
Mujeres 55 Negros 20
Total 100 Total 100

Datos como los anteriores, en donde un grupo de individuos se clasifica de acuerdo a una nica
escala, sean su edad, peso, raza o estatura, reciben el nombre de Distribuciones de Frecuencia.

11.1.3.2. Datos de Asociacin. Sin embargo, si se deseara saber cuntos hombres son de raza
blanca o cuantas de las personas negras son del sexo femenino, los datos presentados
anteriormente no permitiran responder tales preguntas. Para poder responderlas, las personas
deben clasificarse simultneamente, de acuerdo a las dos escalas:

Cuadro 67

Individuos por Sexo y Raza

Raza
Sexo Total
B N
Hombres 36 9 45
Mujeres 44 11 55
Total 80 20 100

Note que el cuadro anterior resume los dos primeros, pero a partir de aquellos no puede elaborarse
este ltimo. Para su elaboracin se requiere una nueva computacin de datos.

Casos como el anterior, en donde los individuos se clasifican simultneamente de acuerdo a dos
escalas, como ser raza y sexo, o edad y sexo, estatura y edad, etc., constituyen los llamados Datos
de Asociacin.

11.1.3.3. Series Cronolgicas. Finalmente algunas veces la escala que se emplea es el tiempo,
para mostrar la evolucin de un fenmeno en relacin a l. Tales series ilustradas a continuacin,
reciben el nombre de Series Cronolgicas.

Cuadro 68

Mortalidad por Tuberculosis Caracas, 1952 1955

Ao Nmero de Defunciones
1952 459
1953 325
1954 270
1955 252

11.1.4. Subdivisiones o clases de la escala.

Aunque las subdivisiones o clases de la escala suelen escogerse arbitrariamente, tal escogencia
debe reunir ciertas condiciones.

11.1.4.1. Formacin de las clases. Solo deben incluirse en una misma clase datos ms o menos
homogneos. Si por ejemplo, de 100 casos de una enfermedad se presentan:

10 casos en menores de 1 ao
12 casos en nios de 1 ao
8 casos en nios de 2 aos, etc. etc.
Es posible formar un solo grupo que incluya:

Menores de 3 aos: 30 casos

Pues el nmero de casos es ms o menos constante en cada ao de edad (alrededor de 10 =


30/3)

En cambio s en el mismo ejemplo tuviramos:


22 casos en menores de 1 ao
7 casos en nios de un 1 ao, y
1 caso en nios de 2 aos

30 casos

No convendra formar una sola clase, pues es evidente que hay una gran diferencia entre una y
otro.

11.1.4.2. Nmero de clases. Si las clases son muy numerosas habra tantos detalles, que
relaciones importantes pueden pasar inadvertidas. Si hay por el contrario muy pocas clases,
importantes diferencias entre los individuos estudiados se pasarn por alto.

El nmero de clases debe ser tal, que se evite el detalle innecesario, pero que no conduzca a la
prdida de ms informacin de la que puede ser convenientemente ignorada. Al estudiar los
habitantes de una poblacin, grupos quinquenales de edad son perfectamente adecuados, pero
ellos seran inconvenientes para clasificar los alumnos de una escuela, dado que en sta, la
variabilidad es muy poca.

En todo caso, es preferible utilizar ms clases que las necesarias, que utilizar menos de las que se
necesitan, pues si las clases resultan muy numerosas, podrn unirse varias de ella a voluntad y en
cambio ser imposible subdividir una clase ya constituida, a menos que se hagan todas las
computaciones nuevamente. Por lo general, 8 a 15 clases suelen ser adecuadas.

11.1.4.3. Lmites de la Clase. Ya se ha sealado que con el fin de evitar ambigedades, las clases
se sealan como 50 54, 55 59 y no 50 55, 55 60, etc.

Sin embargo los verdaderos lmites de esas clases son algo diferentes de los anotados. Si
estudiamos el peso de un grupo de personas y lo mismo es cierto siempre que el dato se
aproxime al dgito ms cercano, cualquier individuo que pese algo ms de 49.5 kilos o algo menos
de 50.5 kilos ser registrado como peso de 50 kilogramos. Igualmente, un individuo que se registre
con 54 kilos pero en realidad entre 53.5 y 54.5.

Lo anterior debe tenerse presente, para poder determinar la amplitud y punto medio de cada clase,
pero antes de ocuparnos de estos aspectos hay que advertir que en el caso de la edad, la
determinacin de los verdaderos lmites es algo distinta. Como la edad no se aproxima al
cumpleaos ms prximo, sino que se registra como aos cumplidos, un individuo de 50 aos
puede tener cualquier edad entre 50 y 50,999 aos, o sea, prcticamente entre 50 y 51 aos.

11.1.4.4. Amplitud de la Clase. Se entiende por amplitud de la clase, la diferencia que hay entre el
mximo y el mnimo valor observados en dicha clase. Para su determinacin deben tenerse en
cuenta los verdaderos lmites de la clase, tal como se explic anteriormente. Por lo tanto, si la clase
fuera 50-54 kilos, su amplitud no sera 4, pues como sus lmites verdaderos son 49.5 y 54.5 kilos la
amplitud sera: 54.5 49.5 = 5

De la misma manera, si se tratara de una escala de edades, como los lmites son 50 y 54.999 la
amplitud sera nuevamente 5.
Aunque generalmente es recomendable que todas las clases tengan la misma amplitud, pues con
ello se facilitan muchos clculos y en algunos problemas tal disposicin no es posible, ya que
deben fijarse de acuerdo a los datos que se estudian y al mtodo que se ha resuelto utilizar.

11.1.4.5. Punto medio de la clase. Se obtiene tomando los verdaderos lmites de la clase. Note por
consiguiente si la escala fuera 50-54 aos, los limites verdaderos seran 50 y prcticamente 55
aos y el punto medio de la ecuacin.
50 + 5

= 52.5
2
En cambio de una escala de peso, los limites verdaderos serian 49.5 y 54.5 Kilos, y el punto medio
de la clase 104/2 = 52 kilos.

11.2. Mtodos de Computacin.

Hay varios mtodos de computacin y la escogencia de uno influencia a los dems, depende del
nmero de individuos que hay y de la complejidad del anlisis que se intenta y de los recursos
econmicos con los que se cuenta.

A continuacin se tratara sobre los siguientes 5 mtodos:

1. Mtodo de las listas


2. Mtodo de los palotes
3. Tarjetas simples
4. Tarjetas con perforaciones marginales
5. Tarjetas tipo Hollerith.

11.2.1. Mtodos de las listas

Frecuentemente los resultados de un estudio se resumen en una larga lista, en la cual se destina
una lnea para anotar las caractersticas correspondientes a cada individuo. En tales casos, la
computacin se concentrara a buscar cuales individuos presentan determinada caracterstica y a
contarlos mentalmente marcndolos con un signo convencional (v) o (x), con el fin de facilitar la
verificacin al final.

Cuadro 71

Lista de defunciones y caractersticas a ser tabuladas

Nombre
Estado Atencin Causa de
del Sexo Edad Residencia Nacionalidad
Civil Medica Defuncin
paciente
A.P. M 15 Soltero Urbana Extranjero SI TBC
B.D. F 25 Casada Rural Venezolana SI Eclampsia
H.O. F 30 Casada Urbana Venezolana SI Neumona
T.P. M 56 Casado Rural Venezolana SI Diabetes
P.H. M 48 Casado Rural Venezolana NO Accidente
C.C. M 30 Casado Urbana Venezolana SI Neumona
S.Q. M 27 Casado Urbana Venezolana SI Accidente
E.G. F 25 Soltera Urbana Venezolana SI TBC
I.P. F 23 Casada Urbana Venezolana SI Eclampsia
P.V. M 39 Casado Urbana Venezolana SI Diabetes
Como se comprende, el mtodo solo es utilizable cuando son pocas las unidades que se estudian
y siempre que no se pretenda clasificarlas por ms de dos escalas a la vez. En el presente
ejemplo, sera muy fcil contar cuantos individuos eran hombres o mujeres, o cuantos murieron por
Tuberculosis o Neumona, pero el trabajo sera interminable si quisiramos hacer computaciones
combinadas, con el fin de averiguar por ejemplo: cuantas mujeres extranjeras, menores de 30 aos
y que residan en el campo, murieron por determinada enfermedad.

11.2.2. Mtodo de los palotes

Consiste en poner en una hoja de trabajo un palote (/) por cada unidad que se cuenta, destacando
cada quinta unidad con el fin de facilitar la computacin final.

Las computaciones pueden hacerse a partir de los formularios originales en los cuales se recogi
la informacin, o a partir de una lista como la anterior que la resuma.

11.2.4 .Tarjetas con perforaciones marginales

Prcticamente estas tarjetas pueden usarse en cualquier estudio que se haga y slo cuando el
nmero de casos es excesivo, digamos ms de 5000, sera ventajoso utilizar las tarjetas tipo
Hollerith, que lo describiremos. Con ellas el trabajo es rpido, relativamente dinmico y los errores
en la computacin se reducen al mnimo.

11.2.4.1. Descripcin.

Son tarjetas de tamao variable. Con una serie de orificios en sus bordes, a cada uno de los cuales
se le asigna la representacin de una de las caractersticas que se estudian.

Los datos que van a inscribirse en la tarjeta, puede encontrarse en los formularios especiales o
pueden recogerse directamente en ella, caso en el cual se anotarn en su parte central. A veces,
cuando se hacen encuestas sencillas, en vez de escribir los datos, pueden asentarse directamente
en las tarjetas perforadas, marcando con tinta los orificios correspondientes que luego deban ser
desmarginados. Observe que esto se ha hecho en la tarjeta que se reproduce en el grfico 75.

11.2.4.2. Inscripcin de los datos.

Para facilitar la exposicin volveremos al ejemplo anterior sobre la mortalidad de un grupo de


personas en los cuales se investigaron los datos que enseguida aparecen, sper simplificados con
propsito docente.

Datos
Informacin buscada Nmero de datos
investigados
Edad Lactantes pre-escolares escolares o adultos 4
Sexo Masculino o femenino 2
Estado Civil Soltero casado viudo o divorciado 4
Residencia Urbana o rural 2
Nacionalidad Venezolana o extranjera 2
Atencin Mdica Recibi o no-atencin mdica 2
Causas de muerte Segn los 17 grupos de la clasificacin internaciona 17
TOTAL 33
GRAFICO 75

Tarjeta con perforaciones marginales utilizadas con los datos ilustrados en el texto
(Nota: Loa orificios correspondientes a la edad, sexo, estado civil, ya han sido abiertos, mientras que los que indican
residencia, nacionalidad, etc. Solamente estn sealados. La tarjeta indica que se trata de un adulto hombre casado con
residencia rural, extranjero, etc.)

Se podr notar que como se investigaron en total 33 diferentes datos, al asignar un orificio a cada
uno, la tarjeta en su forma ms simple tendr que constar de 33 perforaciones aunque luego
veremos que algunas simplificaciones son posibles.

11.2.4.3. Utilizacin.

A cada individuo se destinar una tarjeta distinta y la inscripcin de los datos se har mediante un
saca bocado, con lo cual se destroza el orificio correspondiente, cortando la lengeta que lo
separa del borde.

Debe tenerse cuidado de abrir convenientemente los orificios, pues de lo contrario, la tarjeta puede
engancharse en las vecinas y noquear en un momento dado.

11.2.4.4. Computaciones.

Al introducir un punzn por cualquier orificio de un bloque de tarjetas y levantarlo ligeramente,


aquellas tarjetas en los cuales se han desmarginado el tal orificio, caern en la mesa, mientras que
en el punzn quedarn aquellas con los orificios intactos.

Si en el ejemplo que nos sirve de ilustracin, quisiramos clasificar a los individuos segn el sexo y
el estado civil, procederamos de la siguiente manera:

1.- Se toma el bloque de tarjetas, se acomoda convenientemente y se pasa el punzn por el


orificio que representa el sexo masculino. Al levantar el punzn, caer a la mesa las tarjetas con
orificios ensanchados, es decir, las del sexo masculino, mientras que las del sexo femenino
quedarn sostenidas en el punzn. Las tarjetas, por consiguiente, han quedado divididas en dos
bloques: en uno estn los hombres y en otro las mujeres.

2.- Tomando el primer bloque ( digamos el de hombres), se pasar el punzn por los orificios que
representan el estado civil: primero por el solteros y luego sucesivamente por los casados,
viudos y divorciados, con lo cual el grupo de hombres quedarn divididos segn su estado civil,
restando solamente contar y anotar cuntas personas hay en estas categoras.

3.- El paso anterior se repetir con el bloque de las tarjetas de las mujeres, con lo cual se habr
terminado la computacin deseada.

Si hubiramos querido hacer las computaciones de acuerdo a tres variables a la vez, para
averiguar por ejemplo, cuntas defunciones ocurrieron entre mujeres casadas extranjeras o entre
hombres solteros venezolanos, bastara con dividir en dos partes cada uno de los bloques de
tarjetas obtenidas anteriormente aprovechando el procedimiento acabado de discutir.

11.2.4.5 .Codificacin

Al utilizar las tarjetas perforadas pueden recurrirse a ciertas simplificaciones, gracias a los cuales
no habr necesidad de utilizar un orificio diferente para cada dato que se inscriba. Para ello, antes
de asentar los datos en las tarjetas, se har una transformacin previa, conocida como
codificacin.

La codificacin es simplemente una clave, mediante la cual cada dato se designa por un nmero.
As por ejemplo, si se estudia las diferentes causas de mortalidad, se puede convenir la
tuberculosis es la enfermedad N 1; el cncer la N 2, etc. De igual manera, si se estudian los 23
Estados y Territorios de la nacin, puede designarse al distrito federal con el nmero 1 al estado
Anzotegui con el 2 y as sucesivamente.

Con los datos as codificados, solo se necesitarn 4 orificios para inscribir hasta 10 caractersticas.
Efectivamente, bastan solamente 4 dgitos (1, 2, 4 y 7) para representar cualquier nmero hasta el
9, pues para sealar el 6 se tomarn los nmeros 4 y 2: para sealar el 9, se tomarn el 7 y 2:
para indicar el cero, se dejarn todos los orificios intactos.

7 4 2 1 7 4 2 1
Decenas unidades

Si los mismos 4 bsicos dgitos se repiten de nuevo hacindolos presentar las decenas, entonces
8 orificios sern suficientes y para representar hasta 100 caractersticas (del 00 al 99).

11.2.5. Tarjetas tipo Hollerith

De las tarjetas que utilizan el procedimiento inventado por Hollerith, las ms conocidas son las
mundialmente famosas tarjetas IBM, cuyo uso requiere complicadas maquinarias electrnicas, por
ello indicaremos solamente sus caractersticas, a pesar que es el sistema de computacin ms
perfecto que se conoce.

La utilizacin de moderadas unidades electrnicas permite clasificar varios miles de tarjetas por
minuto y de ah que el sistema sea irremplazable en las grandes compaas y en los servicios
nacionales de estadstica, que manejan millones de datos.

11.2.5.1. Descripcin. La tarjeta IBM es una cartulina de material especial, que consta de 80
columnas, cada una con 10 filas numeradas del 0 al 9 (vase modelo anexo).

Aunque a primera vista la tarjeta solo permite escribir datos que den un mximo de 800
computaciones (80 columnas por 10 filas), la verdad es que una sola tarjeta puede recibir datos
que representen millones de combinaciones.

11.2.5.2. Requerimientos para su utilizacin. Para utilizar estas tarjetas es impredecible codificar
los datos previamente, de acuerdo a los principios ya sealados. Como cada columna tiene 10
filas, cualquier caracterstica que no tenga ms de 10 subdivisiones, podr inscribirse en una sola
columna. Con 2 columnas se podrn inscribirse hasta 100 datos; con 3 columnas hasta 1.000, etc.

Esta codificacin explica porque dijimos antes que en la tarjeta podran asentarse millones de
combinaciones, pues como se desprenden de lo dicho, una caracterstica que tuviera 100.000 ()
subdivisiones, solo necesita 5 columnas.

11.2.5.3. Inscripcin de los datos. La inscripcin de los datos en la tarjeta se realiza haciendo
pequeas perforaciones rectangulares en los espacios que le corresponde, segn el cdigo
adoptado. Dichas perforaciones se hacen elctricamente con una mquina especial que tiene un
teclado como una mquina de calculador.

La computacin de las tarjetas se hace en otras mquinas especiales, que no solo las encuentran
y las separan de los grupos deseados, sino que llegan hasta totalizar e imprimir los resultados.

GRAFICO 79

Tarjeta I.B.M.
CAPITULO XII

CUADROS ESTADSTICOS

12.1. Caractersticas generales.

La finalidad de los cuadros estadsticos es presentar en forma resumida e inteligible determinando


material numrico.

Aunque la disposicin del cuadro variar de acuerdo a los datos que intenten resumir, hay algunos
principios comunes que deben tener en cuenta.

En todo cuadro debe considerarse:

1. El ttulo.
2. El cuadro propiamente dicho.
3. Las notas explicativas.

12.1.1. Ttulo.

Como los resultados deben entenderse fcilmente. Sin necesidad de recurrir al texto que
acompaan, el ttulo debe reunir las condiciones.

a. Ser completo: un ttulo que sea completo, debe indicar claramente cul es el contenido del
cuadro. En otras palabras, debe responder a las preguntas:

QUE? COMO? DONDE? CUANDO?

QUE: se estudia, o sea, cual es el universo que se investiga.


COMO: se estudia, es decir, de acuerdo a cuales caractersticas se clasifican los individuos
investigadores.
DONDE: o a que se refiere los datos
CUANDO: o sea la poca a que se refiere el estudio.

b. Lo ms conciso posible: el titulo debe ser breve, lo ms conciso posible, aunque no debe
sacrificarse la claridad a la concisin. Observe como el primero de los dos ttulos siguientes es
completo, pero le falta brevedad y no aade nada nuevo al segundo de ellos.

Titulo no recomendable:

Cuadro de muestra la descripcin de las defunciones habidas en el hospital Vargas de Caracas,


durante el ao de 1960, clasificadas de acuerdo con la edad de los fallecidos.

Titulo correcto:

Defunciones por edad y sexo, Hospital Vargas. Caracas. 1960.

12.1.2. Cuadro propiamente dicho.

Sucintamente, el cuerpo del cuadro consta de un conjunto de casillas o celdas, dispuestas en


columnas y filas.

En la primera columna y la primera fila tiene una finalidad diferente a las restantes, porque en ellas
irn las diferentes subdivisiones de la clasificacin que se adopte, a los encabezamientos que se
indiquen a que se refieren los datos numricos escritos.
La primera fila, es la de los ENCABEZAMIENTOS, los cuales indican a que se refieren los datos
que van inscritos en las celdas subyacentes. Ellos al igual que las ltimas, deben ser breves, pero
suficientemente explcitos. As por ejemplo, en vez de poner simplemente EDAD, es preferible
poner Edad en Aos o Edad en Meses segn el caso. Igualmente, en vez de poner tan solo
TASAS debe indicarse: Tasa de Mortalidad por 1.000,Tasas de Mortalidad por 100.000, etc.

La primera columna conocida como COLUMNA MATRIZ se destina a asentar las diferentes
clases de la escala de clasificacin utilizada. Cuando las observaciones se clasifican de acuerdo a
una nica escala, digamos edad, las subdivisiones de esta, deben ir en esta columna (vanse
cuadros 83 y 84). Cuando dichas observaciones se clasifican simultneamente de acuerdo a dos
escalas, digamos edad y sexo, cualquiera de estas dos caractersticas podr ir en columna o
matriz, segn veremos luego (vase cuadro 86).

12.1.3. Notas Explicativas

Con el fin de que no haya duda sobre el contenido del cuadro, este se acompaa a veces de notas
explicativas, que pueden ir en la parte superior o inferior. Convencionalmente, las notas colocadas
en la parte superior afectan todo el contenido del cuadro, mientras que aquellas que se colocan en
la parte inferior, slo se refieren a las cifras de determinadas celdas o de una fila o columna en
particular.

Lo cual se indicar con un pequeo nmero o letra (1) (a).

Estas notas, repetimos, slo se utilizan en ocasiones aunque en trabajos que no son originales,
siempre deben ponerse al pie del cuadro, la fuente de donde se obtuvieron los datos, no son slo
por reconocimiento de sus autores, sino para que el lector en un momento dado, pueda consultar
el trabajo original, de donde dichas cifras proceden.

12.2 Diferentes clases de cuadros.

De acuerdo a su finalidad los cuadros estadsticos pueden dividirse en dos categoras:

a. Cuadros de propsito general.


b. Cuadros de propsito especial.

Los primeros, los cuales sirven de base para la construccin de los segundos, son cuadros
extensos, de resumen, frecuentemente destinado a presentar material bsico a otros
investigadores y de ah que cuando se publican se acompaan de extensas notas explicativas y de
cuidadosa mencin de los procedimientos y mtodos utilizados en la recoleccin de los datos.

Los segundos, son cuadros generalmente elaborados con propsitos analticos. Habitualmente se
intercalan en la presentacin de trabajos y monografas originales y estn destinados a mostrar
determinadas relaciones sobre las cuales el autor quiere llamar la atencin y que constituyen el
ncleo de las conclusiones que de la investigacin se derivan. Ellos sern los nicos a que
haremos referencia en los prximos prrafos.

Los cuadros ms sencillos, son aquellos en que los individuos se agrupan de acuerdo a una escala
nica de clasificacin. Cuando se clasifican simultneamente en dos, tres o ms escalas, son
desde luego ms complejos; aunque los mismos principios generales ya vistos son aplicables.

12.2.1. Presentacin tabular de las Distribuciones de Frecuencia

Si los individuos se clasifican de acuerdo a una nica escala; el cuadro podr hacerse como el que
aparece a continuacin:
Cuadro 83

Defunciones por accidentes, por grupos de edad. Venezuela, 1961


(Se excluyen 16 defunciones cuya edad se desconoce)

Aos de edad Nmero de defunciones


0-4 501
5-14 453
15-24 605
5-44 931
45-64 499
65-84 218
TOTAL 3207
Columna matriz

Fuente: Anuario de Epidemiologa y Estadstica Vital.

En cuadros de este tipo, se acostumbra poner una columna ms con la distribucin porcentual de
los casos, lo cual facilita grandemente las comparaciones:

Cuadro 84
Defunciones por accidentes, por causas. Venezuela, 1961

Causas Nmero de defunciones Porcentajes


Accidentes de transporte 1377 42,7
Sumersin accidental 438 13,6
Cadas accidentales 343 10,6
Envenenamientos 101 3,1
Otros accidentes 964 30,0
TOTAL 3223 100,0

Fuente: la misma del cuadro anterior.

Obsrvese que aunque los dos cuadros anteriores se refieren a los mismos datos, los dos totales
no son iguales, pues como indica la nota del primero, all se excluyeron 16 defunciones de edad
desconocida.

12.2.2. Presentacin tabular de las series cronolgicas

Cuando la escala de clasificacin es el tiempo, mostrando como vara un fenmeno en relacin a


l (series cronolgicas) la elaboracin del cuadro es muy semejante al cuadro anterior.

Sin embargo, como tales cuadros slo pretenden mostrar la variacin de un fenmeno de una
poca a otra, en ellos se emite los totales y lgicamente, al no existir estos, ser imposible el
clculo de la respectiva columna de porcentajes.

No obstante, si el cuadro se refiere a lo ocurrido en una poblacin cuyo nmero de habitantes ha


variado a travs de los aos, es conveniente colocar una ltima columna que seale el nmero de
veces que ocurri el fenmeno estudiado por cada 1000, 10000 o 100000 habitantes. En otras
palabras: las cifras absolutas se deben acompaar de los coeficientes o tasas respectivas, con lo
cual se facilitar la comparacin de los datos.
Cuadro 85
Defunciones por accidentes y tasas por 100.000 habitantes.
Venezuela, 1957-1961

Aos Nmero de defunciones defunciones por 100000 habitantes


1957 2872 43,3
1958 3255 47,3
1959 3390 47,6
1960 3217 43,7
1961 3223 42,4

Fuente: Anuario de Epidemiologa y Estadstica Vital. Venezuela 1957-1961.

12.2.3 Presentacin Tabular de los Datos de Asociacin

Si los individuos se clasifican simultneamente de acuerdo a dos escalas, por ejemplo: edad y
sexo (Datos de Asociacin), una escala ir en la vertical y otra la horizontal. El que una u otra
vayan en la horizontal o en la vertical no cambia el significado del cuadro. Sin embargo, es
conveniente poner en la vertical, aquella escala que presente ms subdivisiones, ya que el ojo
humano compara ms fcilmente, nmeros dispuestos de arriba abajo, que arreglados unos al
lado de otros, en filas horizontales.

Observe que como hay dos escalas la tabla debe tener dos totales. Estos suelen ponerse en la
ltima columna y en la ltima fila, pero si se prefiere puede colocarse en la primera columna y en la
primera fila.

Tngase en cuenta tambin, que es posible presentar en el mismo cuadro tanto las cifras
absolutas como los porcentajes o tasas correspondientes. Debe evitarse sin embargo que el
cuadro quede con demasiadas columnas, pues en tal caso su interpretacin se har difcil. En tales
ocasiones, es preferible presentar la informacin en 2 o ms cuadros distintos.

Cuadro 86
Defunciones por sexo y grupos de edad
Venezuela, 1961
(Se excluyen 12 hombres y 4 mujeres cuya edad se desconoce)

Sexo
Aos de edad Ambos sexos
Hombres Mujeres
0-4 275 226 501
May-14 288 165 453
15-24 519 86 605
25-44 835 96 931
45-64 400 99 499
65-84 115 103 218
Total 2432 775 3207

Si los individuos se clasifican al mismo tiempo de acuerdo a tres escalas, como edad, sexo y
causa del accidente, el cuadro aparecer de la manera ilustrada en la prxima pgina.

Queremos advertir, que aunque por dificultades tcnicas, los encabezamientos de algunos cuadros
del siguiente texto, fueron colocados verticalmente, es preferible sin embargo, por razones
estticas y para facilitar la lectura, disponerlos de forma horizontal.
Como observacin final, recurdese la importancia de numerar las diferentes columnas del cuadro
cuando son muy numerosas, especialmente si han de hacerse referencia a ellas en el texto (verse
cuadro 87)

Cuadro 87

Defunciones por accidentes, por sexo, edad y causa externa que los produjo
Venezuela, 1961
(Se excluyen 16 casos, cuya edad se desconoce)

Sexo y edad Causas del accidente


Hombres 1140 344 241 58 649 2132
15 aos 170 110 45 32 206 563
15-44 712 191 101 20 330 1354
45 y ms 258 43 95 6 113 515

Mujeres 228 92 101 43 311 775


15 aos 102 59 18 34 181 321
15-44 74 28 9 9 62 182
45 y ms 52 5 74 3 68 202

Ambos sexos 1368 436 342 101 960 3207


15 aos 272 169 63 63 387 954
15-44 786 219 110 29 392 1536
45 y ms 310 48 169 9 181 717

Fuente: la misma del cuadro anterior

12.3 Errores en la presentacin tabular

Entre los errores que se cometen al elaborar un cuadro estadstico, deben evitarse especialmente
los siguientes:

a) Disposicin incorrecta de los datos. Contrstese el cuadro anterior que es correcto con el
que aparece a continuacin, el cual ilustra generalmente un error cometido por los principiantes. El
error consiste en que no se clasifica a cada individuo de acuerdo a tres escalas. En realidad son
dos cuadros diferentes colocados el uno al lado del otro.

Cuadro 88

Cuadro incorrecto que intenta presentar los datos del cuadro anterior

Sexo Causas del accidente


Edades (aos) M F Total T S C C Otras Total
15 563 391 954 272 169 63 63 387 954
15-44 1354 182 1536 786 219 110 29 392 1536
45 y ms 515 202 717 310 48 169 9 181 717
Total 2432 775 3207 1368 436 342 101 960 3207
Por ejemplo, l no indica cuantos hombres o mujeres murieron en cada grupo de edad a causa de
cadas accidentales, lo cual si puede ser determinado en el cuadro anterior.
b. Ttulos y encabezamientos incompletos o inadecuados. El cuadro debe comprenderse
fcilmente, sin necesidad de recurrir al texto que lo acompaa, lo cual ser imposible si los ttulos y
encabezamientos son incompletos o insuficientemente claros.

c. Cuadros que muestran solamente porcentajes. Por lo general, los cuadros no deben
mostrar solamente porcentajes sin indicar las cifras de donde proceden, pues un porcentaje del
50% puede indicar 1 caso en 2, 10 en 20, 100 en 200, etc. Y como es obvio mientras menor sea el
nmero de casos, menor valor tendr el porcentaje.

d. Cuadros sobre cargados. Cuadros que intentan mostrar muchos datos a la vez, resultan
confusos e inadecuados. En tales casos es recomendable realizar varios cuadros separados.

Cuadros sobrecargados. Cuadros que intentan mostrar muchos datos a la vez, resultan confusos e
inadecuados. En tales casos es recomendable realizar varios cuadros separados.

12.4 Manera de leer un cuadro estadstico.

La lectura de un cuadro estadstico no debe de hacerse de forma desordenada. Existen ciertas


reglas resumidas por W. Allen Wallis y Harry V. Robert, en su libro Statics: A new Approach las
cuales trataremos de ilustrar en el siguiente cuadro, en el cual se resumen algunos de los
resultados de una encuesta de morbilidad, realizada en la urbanizacin 23 de Enero de Caracas.
Las viviendas de esta urbanizacin comprenden 2 tipos: por una parte bloques de apartamentos
de hasta 15 pisos de altura, y por otra parte ranchos en los cuales las condiciones sanitarias son
desastrosas.

Aun cuando la encuesta incluy 22168 personas de todas las edades, solo nos referimos a un
grupo de adultos.

Cuadro 89

Porcentajes de enfermos por grupos de edad y sexo de la poblacin adulta de los bloques y
ranchos de la urbanizacin 23 de enero. Caracas, 1960.

(Resultado de una muestra de 10983 personas mayores de 15 aos. Como enfermo se consider
a toda persona que manifest sufrir de alguna dolencia).

Bloques Ranchos Total


Nios de Hombres Mujeres Hombres Mujeres Hombres Mujeres Total
Total (4) Total (7)
edad (1) (2) (3) (5) (6) (8) (9) (10)
15-24 11.3 15.3 13.6 15.8 48.8 17.5 42.0 15.8 44.4
25-34 13.3 22.4 17.9 15.9 26.3 20.6 13.7 22.9 18.3
35-44 19.6 27.2 23.4 18.8 30.9 24.9 19.5 27.8 23.6
45-54 24.3 40.4 33.9 18.5 42.3 29.9 22.9 40.8 33.1
55 y + 35.5 51.1 46.7 37.7 43.6 41.2 36.1 49.9 ?
Total 15.3 24.1 20.1 18.1 27.4 22.8 15.8 24.6 ?

Fuente: basada en J. D. Maldonado y M. Pizzi una encuesta de mortalidad en el sector oeste de la urbanizacin 23 de
Enero. Revista venezolana de sanidad y asistencia social. Vol. XXVI N. 1 marzo de 1960.

Los pasos a seguir son los siguientes:

1.- Leer cuidadosamente el ttulo

La lectura del ttulo es necesaria con el fin de entender perfectamente a que se refiere el cuadro.
En el caso presente, el ttulo indica claramente que el cuadro se refiere a los adultos enfermos
encontrados en la ciudadela 23 de Enero de caracas, distribuidos de acuerdo a su edad, sexo y
tipo de vivienda. Nos indicar tambin que los datos se expresan en forma de porcentajes. Tales
hallazgos suelen presentarse en formas de las tasas que indican el nmero de enfermos cada
1000 o 100000 habitantes, pero aqu hemos preferido los porcentajes puesto que este es un
trmino de ms fcil comprensin para cualquier lector no familiarizado con los trminos
estadsticos.

2.- Leer las notas explicativas

Las notas explicativas que acompaan al cuadro, permiten a que est consultando su mejor
comprensin. En nuestro ejemplo, vemos en primer lugar que no se estudian todos los habitantes
de la urbanizacin sino solamente una muestra de 11000. Esto es importante pues ya sabemos
que los resultados obtenidos estn sometidos al error por muestreo. Aunque solo en prximos
captulos se aprender a medir este error, ya sabemos, no obstante, que su magnitud es pequea
cuando la muestra es suficientemente grande y de ah la importancia que se nos haya aclarado
que fueron 10983 las personas estudiadas.

En segundo lugar la nota indica que el estudio se trata de persona mayores a 15 aos, con lo cual
se nos disipa cualquier duda que pudiramos tener sobre a quienes se los consider como adultos.

Finalmente se especifica que como enfermo debe entenderse a cualquier persona que
manifestase tener alguna dolencia. De nuevo, esta es una aclaracin importantsima, por que el
hecho de catalogar a un individuo como sano o enfermo, depende en gran parte de la persona que
decide. Este ser un punto que se discutir posteriormente, pero debe sealarse desde ahora que
cuando es el mismo paciente quien decide si se encuentra o no enfermo, se introduce una
apreciable fuente de error, ya que frecuentemente tal decisin se presta para notables
arbitrariedades.

3.- Averiguar las unidades de medida utilizadas.

El encabezamiento de la primera columna explica que se trata de aos de edad y no de meses y


das. Quizs en el caso frecuente tal aclaracin est dems, pero en otras ocasiones es necesario
tener muy en cuenta este detalle.

El ttulo nos indica que no se estn utilizando porcentajes, es decir que para cada grupo la cifra
indica el nmero de personas enfermas por cada 100 entrevistados. Note por consiguiente, que las
columnas y filas de totales no son la suma de porcentajes parciales, ni el promedio aritmtico
corrientemente utilizado. Son en realidad promedios, pero promedios ponderados que despus se
aprendern a calcular.

4.- Fijarse en el promedio o porcentaje general del grupo.

El cuadro muestra que el 20,5 % de las personas entrevistadas, es decir 1 de cada 5 personas,
manifest sentir alguna dolencia.

Esta cifra es desde luego extremadamente elevada, pero como sealan los autores del trabajo, no
deben de olvidarse que de este tipo de encuestas algunos tipos tienden a magnificar sus dolencias
con el objeto de recibir atencin mdica.

5.- Relacionar el promedio general del grupo con cada una de las variables que se estudian.

Las variables presentadas en el cuadro anterior son: edad, tipo de residencia y sexo, y ellas deben
de analizarse separadamente.

a. Edad: si nos fijamos en la ltima columna del cuadro, vemos que la morbilidad asciende
constantemente, al ascender la edad de las personas estudiadas. En realidad el porcentaje de
enfermos mayores de 55 aos es tres veces mayor al del grupo de 15-24 aos (45,7 versus 14,1%)
b. Sexo: Fijndonos en las ltimas cifras de la penltima y antepenltima columnas-las de los
hombres y mujeres en la poblacin total-. Vemos que la morbilidad es mucho mayor en las
hembras que en los varones (24,6% y 15,8% respectivamente).

Este hallazgo deber de ser analizado posteriormente con mayor profundidad, pues como ya
sabemos la morbilidad es mayor en las personas ancianas que en las jvenes, si el grupo de
mujeres tuviera ms ancianas que el de los hombres, esto explicar por qu la morbilidad es mayor
en ellas.

Tipo de residencia: Con el fin de comparar la morbilidad en los bloques con la de los ranchos, se
examinar las cifras al final de las columnas (4) y (7). Su examen revela que mientras que en los
bloques el 20,1% de la poblacin estaba enferma, en los ranchos las cifras ascendieron al 22.8%
una diferencia del 2,7%. Aparentemente tal diferencia es mucho menor de la que era dado
esperar, pues ya habamos mencionado que las viviendas de los ranchos presentan condiciones
higinicas deplorables. Sin embargo, lo mismo que para el caso del sexo, tal diferencia amerita un
examen ms detallado pues como ya hemos encontrado una relacin entre la morbilidad y la
edad, tal diferencia podra explicarnos por qu la diferencia entre los bloques y los ranchos no son
mayores, pues si en los bloques hubiera habido ms ancianos que en los ranchos, su morbilidad
se presentara mucho ms alta por este simple hecho. Hay desde luego procedimientos
estadsticos que permiten mejorar tal comparacin (ver tasas ajustadas), pero por el momento
seguiremos nuestro anlisis prescindiendo de ellos.

Antes de proseguir el anlisis podemos resumir nuestros hallazgos hasta el presente, diciendo que
la morbilidad es mayor en los viejos que en los jvenes, en las hembras que en los varones, que
en los ranchos que en los bloques.

6. Relacionar entre s los promedios o porcentajes de las variables que se estudian.

Esto es necesario pues como hemos mencionado, puede haber alguna interaccin entre ellas, que
causen las diferencias observadas.

a. Edad: Comparando las columnas de totales para la poblacin de los Bloques y la de los
Ranchos (columnas 4 y 7) se observa que el aumento de la morbilidad con la edad aparece en
ambos lugares. Sin embargo, puede notarse, que hasta los 45 aos, los porcentajes son mayores
en los Ranchos, pero despus de esta edad, se hacen superiores en los Bloques.

Si examinamos ahora la influencia de la edad con respecto a los sexos, para lo cual veremos las
cifras de la penltima y antepenltima columnas, se constata que el aumento de la morbilidad con
la edad es constante. Pero tambin observaremos que dicho aumento es algo menor para los
varones que para las hembras, pues mientras en los primeros la diferencia entre el grupo de 15 -
24 aos y el de mayores de 55 aos es de 24,1% (36,1%-12,0%) para las segundas es de 34,1%
(49,9%-15,8%)

Si se quiere examinar lo anterior con ms detenimiento, pueden compararse separadamente,


primero los hombres de los dos tipos de viviendas y luego las mujeres. Al hacer esta comparacin,
puede apreciarse que tanto para los bloques como para los ranchos, la edad parece jugar mayor
papel en las hembras que en los varones y que para cada edad los porcentajes de aquellas, son
sistemticamente superiores a los de stos.

En conclusin, los cambios en la morbilidad relacionados con la edad, son ms importantes en las
hembras que en los varones. Para cada grupo particular de edad la morbilidad es superior en las
mujeres que en los hombres, ya vivan en los bloques o en los ranchos.
b. Sexo: Comparando los totales para los dos sexos, separadamente para los bloques y para
los ranchos (columna 2 versus 3 y 5 versus 6), concluimos que la influencia del sexo es
prcticamente igual en ambos tipos de residencia (8,8 y 9,3 respectivamente), con una morbilidad
mayor en las mujeres, conclusin que viene a confirmar nuestros hallazgos anteriores.

c. Tipo de residencia: Si comparamos el total para los hombres de los Bloques con el de los
Ranchos y luego hacemos lo mismo con las mujeres (columnas 2 versus 5 y 3 versus 6),
concluimos como anteriormente, que la influencia del sexo es prcticamente semejante en los
bloques y ranchos (2,8% para los hombres y 3,3% para las mujeres).

7. Buscar irregularidades en los datos.

En el cuadro presente hay dos irregularidades que ameritan una investigacin mas profunda. Los
varones de 45-54 aos de los ranchos presentan una morbilidad algo menor que los del grupo 35-
44 aos y las mujeres del grupo 55 y ms aos de los ranchos, prcticamente tienen la misma
morbilidad que las del grupo 45-54 aos. Tales no parecen consistentes con los restantes del
cuadro, aunque al consultar los datos originales de la encuesta nos damos cuenta que dichos
porcentajes se basan en 92 y 78 personas respectivamente y por lo tanto podemos considerarlo
como fluctuaciones debidas al tamao relativamente pequeo de la muestra entrevistada

8. Conclusiones Finales.

En conclusin, la lectura del cuadro anterior nos revela:

a. La morbilidad es mayor mientras mayor es la edad de las personas.

b. La morbilidad es mayor en los ranchos que en los bloques y en las mujeres que en los
varones.

c. La influencia del sexo es semejante en los bloques y ranchos y por lo tanto, las diferencias
observadas en los dos tipos de vivienda, no pueden ser atribuidas a distinta composicin de los
pobladores con respecto a los sexos.

d. La relacin entre la edad y la morbilidad es ms acentuada en las hembras que en los varones
y por lo tanto la mayor morbilidad de aquellas pudiera ser debida a una composicin estara
diferente. Sin embargo, este factor puede ser descartado, pues como vimos en el punto 6 las
diferencias entre hombres y mujeres se mantienen para cada edad en particular.

e. La relacin entre la edad y la morbilidad es ms acentuada en ranchos hasta los 45 aos, pero
sucede a la inversa a partir de esta poca. Aparentemente la mayor morbilidad de los ranchos
puede deberse en parte a una composicin estara diferente, y para despejar esta duda abra
necesidad de recurrir a las llamadas tasas ajustadas (ver Estadsticas de Mortalidad)

f. Irregularidades de los datos en la poblacin masculina de los ranchos, en el grupo de 45-54


aos y en las mujeres mayores de 55 aos pueden atribuirse a fluctuaciones causadas por el
escaso nmero de personas examinadas en tale s grupos.
CAPITULO XII
GRAFICOS
13.1 Caractersticas Generales.

Los grficos dan una idea mucho ms sinttica que los cuadros estadsticos. Unas veces su
finalidad es simplemente tratar de mostrar a otras personas la evolucin de determinado
fenmeno, pues mientras que la interpretacin de un cuadro estadstico requiere ciertos
conocimientos, cualquiera puede comprender fcilmente que una lnea ascendente traduce un
aumento del fenmeno estudiado y que una lnea descendente significa una disminucin. Otras
veces la finalidad del grfico es ayudar al anlisis de la informacin, poniendo de presente o
aclarando ciertas relaciones poco aparentes en el material tabulado.

Al igual que en los cuadros estadsticos, en los grficos se considera:

a. El ttulo
b. El grfico propiamente dicho.
c. Las notas explicativas.

Sobre el ttulo y las notas explicativas no es necesario insistir, pues todo lo que se dijo a propsito
de los Cuadros, es valedero para los grficos.

13.1.1 Escalas del grfico y errores en su empleo.

Dejando a un lado contadas excepciones que se sealarn a su debido tiempo, la mayora de los
grficos presenta forma rectangular y se inscriben en las llamadas coordenadas rectangulares,
que son aquellas formadas por la intercepcin de dos lneas en ngulo recto.

De estas dos lneas la horizontal o abscisa se destinar para las diferentes clases de la escala
que se utiliza y la vertical u ordenada, para anotar la frecuencia o nmero de veces que se
observa el fenmeno estudiado.

A propsito de estas escalas es necesario recordar los siguientes principios:

a. Las dos escalas deben ser de la misma longitud o algo mayor la horizontal que la vertical. En
general, salvo ocasiones se sealarn oportunamente, las dos escalas deben guardar una
proporcin entre 1 a 1 y 1 a 2, es decir, que si la ordenada mide 10 cm. la abscisa debe medir
entre 10 y 20. Esta exigencia se hace con el fin de no distorsionar el fenmeno que se estudia.

b. Ntese en los tres primeros diagramas del grfico 97 - los cuales representan el mismo
fenmeno - , que cuando se exagera la escala vertical (diagrama A), se tiene la impresin de
un descenso irreal y cuando se exagera la escala horizontal (diagrama B) parece que el
fenmeno estudiado no ha variado. Una impresin correcta se obtiene en cambio, cuando se
observa el diagrama C, en el cual hay un buen equilibrio en la longitud de las dos escalas.

c. De igual manera, para evitar la incorrecta apreciacin de los hechos, las escalas deben
comenzar en 0 (cero), pero sin embargo cuando los valores que se representan son muy
elevados y con pequeas fluctuaciones debe partirse el grfico (diagrama E), para evitar
diagramas como el D, poco vistoso y sin mayor utilidad, pues es difcil formarse juicio sobre
las variaciones que se quieren representar. Ya veremos que en algunos diagramas tal
particin de la escala no es aconsejable.

d. Cada escala debe ser rotulada de tal manera que se comprenda fcilmente que representa:
edad en aos o en meses, kilos o libras de peso, etc.
e. Como el grfico de ninguna manera da una idea matemticamente exacta de las fluctuaciones
estudiadas para ello estn los cuadros con los datos originales-, las escalas no deben tener
demasiadas subdivisiones. Aquellas que se utilicen deben ser por lo general, nmeros
redondos.

Grfico 97
Ilustracin de los errores ms comunes en la elaboracin de los grficos

Principales grficos

Los principales grficos se pueden apreciar en el siguiente esquema:


* DIAGRAMA DE BARRAS:

- SIMPLES
- DOBLES
GRAFICOS A - COMPUESTAS
CUALITATIVAS
UTILIZAR
* DIAGRAMA DE SECTORES

* PICTOGRAMAS

DISCONTINUAS
O DISCRETAS
TIPO DE
VARIABLES

CUANTITAITVAS
* HISTOGRAMA

* POLIGONO DE FRECUENCIAS

* DIAGRAMA DE FRECUENCIAS
GRAFICOS A ACUMULADAS (OJIVA)
CONTINUAS
UTILIZAR
* DIAGRAMAS DE PUNTOS (XY o DE
DISPERSION)

* DIAGRAMA SEMILOGARITMICO
* DIAGRAMA DE CAJAS.

De acuerdo a lo sealado, pueden por consiguiente distribuirse dos clases de grficos: aquellos
destinados a mostrar las variaciones de determinado fenmeno y aquellos utilizados con fines
analticos, los primeros aunque muy demostrativos no son siempre los de mayor utilidad para el
investigador.

Dada la extraordinaria diversidad de grficos existentes (2) solo nos referiremos a los ms
generalmente utilizados. Estudiaremos sucesivamente:

1. Diagrama de barras y sus diferentes modalidades


2. Diagrama de sectores
3. Histograma
4. Polgono de frecuencias
5. Diagrama de frecuencias acumuladas
6. Diagrama semilogartmico
7. Diagrama de puntos
8. Diagrama de cajas y bigotes.

13.2.1 Diagrama de barras y sus diferentes modalidades

Es aquel en el cual el fenmeno que se estudia queda representado por una serie de rectngulos o
barras, las cuales pueden dibujarse horizontal o verticalmente. Las barras deben ser de la misma
anchura y el espacio que los separa no debe ser mayor que el espesor de ellas mismas.

Dos detalles deben tenerse en cuenta cuando se utiliza este diagrama:

Si los datos representados no estn en alguna secuencia que debe conservarse, deben ordenarse
de tal manera que las barras queden de mayor a menor, con lo cual se mejora la esttica del
grfico y se captan mejor las variaciones que se estudian.
Si se quieren representar por ejemplo, las variaciones mensuales de un fenmeno durante
determinado ao, los meses deben colocarse ordenadamente de enero a diciembre cualesquiera
que sean las cifras correspondientes, pues sera ilgico que por razones estticas se empezara por
marzo, seguido de noviembre, julio, etc. En cambio en el grfico 101 las barras han sido
correctamente ordenadas de mayor a menor, pues es indiferente que un tipo de vacunacin se
mencione de primero o de ltimo.

(Note que en el diagrama de barras los rectngulos estn separados y en el Histograma van unidos)

(Note la escala vertical en el diagrama lineal, dos nmeros consecutivos siempre estn a igual
distancia, pero no as en el semilogartmico)

La escala de la frecuencia debe comenzar siempre en O:

Debe interrumpirse, pues de lo contrario la visualizacin del fenmeno ser errada. Observe dicho
error en el grfico adjunto en el cual se representa dos enfermedades de la cual se conocieron 450
casos respectivamente.

Grfico 100

Correcta e incorrecta manera de numerar la escala de un diagrama de barras.


13.2.1.1. Diafragma de barras sencillas: Se utiliza para las distribuciones de frecuencias en escala
cualitativa y cuantitativa discontinua. Puede utilizarse tambin para series cronolgicas, cuando
son pocos los valores que se quieren representar; especialmente cuando corresponde a
observaciones peridicas, como ser la poblacin de Venezuela en los censos de 1936, 1941,1950
y 1961. Para elaborar el diagrama se necesita tan solo dibujar las barras de tal manera, que en
altura este en proporcin con las cantidades que representan en el grfico 101

Vacunaciones practicadas en la primera zona epidemiolgica del Estado Lara en 1961

Tipo de vacunacin Personas


Antivarilica 16202
Doble 5239
Triple 15584
Antipolio 22591
Antifica 873
BCG 7752
Total 68241

Grfico 101

Personas inoculadas

BCG

Antifica

Antipolio

Triple

Doble

Antivarilica

0 5000 10000 15000 20000 25000

13.2.1.2. Diagrama de barras dobles. Esta diagrama, (grfico cuya idea puede hacerse extensiva
para barras triples y cudruples que se emplea para representar datos de asociacin cuyas dos
barras sean cualitativas (defunciones por sexo y causa, etc.). Tambin se emplea cuando se quiere
comparar dos distribuciones de referencias con relacin al tiempo.
Grfico 101 a.
Distribucin por tipo de instruccin y sexo.

13.2.1.3. Diagrama de barras compuestas. Las aplicaciones de este diagrama, el cual se


esquematiza a continuacin (grfico 102) son muy semejantes a las del grfico anterior, sobre el
cual no tiene ninguna ventaja. Note sin embargo, que aunque los grficos 101 no representan los
mismos datos del cuadro 101 a, la comparacin que tienen es algo diferente. En el grfico 103 se
intenta sealar para la causa de accidente la contribucin de cada uno de los sexos.

En el grfico 102 se desea enfatizar la proporcin en que intervienen las diferentes causas en la
mortalidad de cada sexo.

Grfico 102

Defunciones por accidentes, por causa y sexo.- Venezuela, 1961


Cuadro 103
Defunciones por accidente por causa y sexos.- Venezuela 1961
Grfico 103

13.2.2. Diagrama de sectores.

Este diagrama, el cual es uno de los ms frecuentes empleados se utiliza con fines comparativos,
cuando se quiere mostrar los diversos componentes de una serie y con tal propsito a menudo se
emplea el lugar de diagrama de barras sencillas, a pesar de que no tiene ninguna ventaja sobre el.

En el pueden representarse cifras absolutas o porcentajes. Como crculo tiene 360, la manera
ms fcil de elaborarlo es expresar los datos que se estudian en forma de porcentajes, pues en tal
caso, el 1% corresponde al 3,6 del crculo.

13.2.2.1. Elaboracin. En el cuadro 104 se presenta las muertes por diversos tipos de leucemias y
aleucemias ocurridas en Venezuela. Como para representar cada 1% se necesitan 3,6 del crculo,
los porcentajes se multiplicaran por 3,6 con el fin de averiguar cuntos corresponde a cada uno de
los sectores, por ejemplo, el sector que representa la leucemia tendr (15,2% x 3,6% = 55) y el
que representa la leucemia linftica tendr 49 (13,6% x 3,6%= 49)

Cuadro 104

Defunciones por diversos tipos de Leucemia y Aleucemias. Venezuela 1961


Grfico N 104

Defunciones por Leucemia y Aleucemia por formas clnicas


Venezuela 1961

Hechos los clculos anteriores se inscribirn con un transporte sobre los correspondientes sectores
sombrendolos diferentemente para distinguirlos entre s. Para indicar que representa cada sector,
puede usarse cualquiera de los procedimientos ilustrados en el grfico 105.

13.2.3. Histograma.

En el histograma el fenmeno que se estudia queda representado por una serie de rectngulos
semejantes a los diagramas de barras. Sin embargo, las barras del histograma siempre se colocan
verticalmente y deben ir unas al lado de las otras, sin que haya ningn espacio que las separe.

Este grfico se utiliza para representar distribuciones de frecuencia en escala cuantitativa continua,
como ser la distribucin de un grupo de individuos de acuerdo a su edad, peso, estatura, etc.

13.2.3.1. Elaboracin. Para elaborar el histograma vase grfico 109. Deben seguirse los pasos
que a continuacin se detallan, los cuales se encuentran esquematizados en el cuadro 107.

1. Antes de trazar el sistema de coordenadas, los datos originales deben ser transformados en tal
forma, que para cada clase se obtengan el nmero de casos promedio por unidad de la escala
para ello se buscara primero la amplitud de cada clase y se dividir la frecuencia
correspondiente por dicha amplitud. Observen el ejemplo que la primera clase tiene amplitud
de 5 y como esa clase haba 501 defunciones, al dividir 501 por 5, nos dar en promedio hubo
100 defunciones por cada ao (omitiendo la fraccin decimal).

Igualmente para el grupo (5-14 aos), la amplitud de la clase en 10 y dividiendo por 10 las 453
defunciones observadas, se obtendrn que en promedio se presentaron 45 por cada ao de la
vida.
Cuadro 107

Defunciones por accidentes, por grupos de edad.- Venezuela, 1961


(Datos que ilustran los pasos necesarios para la elaboracin del histograma ilustrado en el grfico
109)

Para entender la razn por la cual deben obtenerse estos promedios pinsese en una enfermedad
que afectar por igual a todas las personas, sin distingos de edades y que en determinada
colectividad hubiera producido 10 enfermos en cada uno de los aos de la vida.

Si los pacientes se agruparan por edades, lgicamente aquellos grupos que comprendan ms aos
de edad mostraran ms pacientes, dando la impresin de que la enfermedad tiene preferencia por
esas edades, cuando en realidad se ha visto que tal preferencia no existe. Por lo dems, sino se
obtuvieran los promedio, bastara cambiar los grupos de edad para hacer variar la aparente
preferencia de la edad.

Observe la mencionada falacia, cuando los mismos 300 casos presentan, utilizando agrupaciones
diferentes.

Cuadro 108

2. Trazar el sistema de coordenadas

3. Enumerar las escalas. La ordenada debe comenzar en cero (O), pero como las frecuencias
que se utilizaran para la elaboracin del histograma, son los promedios acabados de obtener,
el lmite mximo de dicha ordenada estar dado por el mximo promedio obtenido. Observe en
nuestro ejemplo, que aunque se observaron 931 muertes en el grupo 25-44 aos, la ordenada
solo se numera hasta 100 120, ya que el mximo promedio obtenido fue 100.

Con respecto a la abscisa, no ha de olvidarse que l comienzo de una clase corresponde


exactamente a la terminacin de la clase que le precede. Note en el ejemplo que sirve de
ilustracin que el final de la primera clase 5, que es a su vez el comienzo de la segunda.

Igualmente la segunda clase termina en 15 que es el comienzo de la tercera. Por lo tanto al


numerar la escala, deben colocarse solamente las cifras que indican el principio de cada clase.
Adems debe evitarse un error comn de los principiantes, que consiste en destinar igual
longitud de la escala a clases que tienen igual actitud.

En el ejemplo adjunto la primera clase comprende 5 aos, la segunda y la tercera 10 y las


restantes 20 aos y por lo tanto si para la primera clase se dejan 5 milmetros para la segunda
y la tercera se dejaran 10 y para las restantes 20.

4. La inscripcin de los rectngulos debe hacerse teniendo en cuenta que la altura de cada uno
es dada por la frecuencia que aparece en los datos originales, sino por los promedios
obtenidos en el paso nmero uno. En nuestro ejemplo el histograma hecho con los datos
originales no es correcto, como puede verse en el grfico 109.

Grfico 109

Defunciones por accidentes, por grupos de edad.- Venezuela 1961

5. Un ltimo detalle que se debe tener en cuenta es el siguiente: como la frecuencia en cada
clase se ha dividido por la amplitud de clase para obtener el numero promedio de muertes por
ao de edad, en la escala vertical no debe ponerse simplemente Defunciones, sino que es
necesario especificar las defunciones por ao tal como hemos hecho en el grafico
correspondiente

13.2.3.2 Caso especial de histograma. Segn se recordara la relacin entre varios nmeros no se
altera si se dividen por la misma cifra. As por ejemplo, si en la progresin: 40 :20: 10:, cuya razn
2, se divide cada termino por 10, se obtiene la nueva progresin 4: 2:1, en el cual la razn sigue
siendo 2, sea, en ambas progresiones cada nmero es la mitad del que le precede.
40 . . _. . _. ._ . _._ . _.4
20 . ._ . ._ . _.2
10 . . . _.1

Este recordatorio permite comprender que cuando las clases de una serie tiene la misma amplitud
(digamos 10), los rectngulos del histograma que representa dichas cifras guardara la misma
proporcionalidad, sea que se escriban los datos originales, o los promedios que resulten de dividir
la frecuencia de cada clase por su amplitud.

Por consiguiente en aquellas ocasiones en que todas las clases de una serie tiene la misma
amplitud, el histograma puede hacerse inscribiendo directamente las frecuencias dadas sin
necesidad de obtener los promedios de casos por unidad de las escala pues exceptuando la
graduacin de la ordenada, los grficos sern iguales obtngase o no los promedios mencionados

En el ejemplo siguiente ntese que los histogramas elaborados con los datos originales de la
segunda columna del cuadro 108 y con los promedios de las clases son exactamente iguales, pero
que la numeracin de la ordenada es diferente, pues en el ltimo caso la escala es de 1/10 de la
primera, pues como en cada grupo decenal se obtienen el promedio por ao de edad, se han
representado defunciones por ao de edad

Grafico 110

Defunciones por accidentes, por grupos de edad. Venezuela. 1961.

n de muertes
800

600

400

200

0
0 10 20 30 40 50 60 70 80 90

aos de edad

Fuente: Datos de cuadro 108.

Todos los detalles mencionados a propsito del histograma son aplicables a la construccin del
polgono de frecuencias y por lo tanto lo mismo que en aquel, es necesario obtener el nmero
promedio de observaciones por ao de edad cuando las clases son desiguales en amplitud.

La diferencia entre estos dos diagramas estriba en que el polgono de frecuencia no se usa
rectngulos, sino una serie de puntos que se colocan a la altura que ocuparan los rectngulos del
histograma y en la parte media de cada clase. Luego para dar la idea de continuidad dichos
puntos se renen para un trazo continuo.
Por regla general el histograma debe preferirse al polgono de frecuencias. Este debe destinarse a
aquellos casos a los que se debe destinar ms de una serie en el mismo grfico, con fines
comparativos. Si por ejemplo se quisiese comparar la distribucin etaria de las defunciones por
accidentes para los dos sexos no se lograran ninguna claridad con la superposicin de dos
histogramas uno para cada sexo. La representacin se har correctamente en un polgono de
frecuencias, inscribiendo sucesivamente los datos para hombres y mujeres.

Grfico 112

Comparacin entre el histograma y el polgono de frecuencias

Fuente: Datos de cuadro 107.

Y, utilizando un trazado diferente para cada serie de datos cuyo significado se aclarara al lado
De el grfico (grfico 103) (datos que ilustran la elaboracin de un polgono de frecuencias)

Amplitud de Defunciones por ao


Edades Sexo clase de edad
Hombres Mujeres Hombres Mujeres

0-4 275 226 5 55 45


5 > 14 288 165 10 29 17
15-24 519 86 10 52 9
25-44 835 96 20 42 5
45-64 400 99 20 20 5
65-84 115 103 20 6 5

Total 2432 775

Fuente: Anuario de epidemiologa y estadstica vital. Venezuela.


Grfico 113

900
800
700
600
500
Hombres
400
Mujeres
300
200
100
0
0-4 5 > 14 15-24 25-44 45-64 65-84

13.2.4.1 Detalle adicional. Un grfico todo semejante al polgono de frecuencias para la


representacin de las vas cronolgicas sin embargo debe tenerse en cuenta un detalle
adicional para su correcta elaboracin

Grfico 114

1950 1951 1952 1950 1951 1952

AOS AOS

Si ven los esquemas adjuntos se observar que las subdivisiones del tiempo (aos, meses, das,
etc.) pueden colocarse entre dos ordenadas opuestas inmediatamente debajo de ellas

En el primer caso el ao comienza en una ordenada y termina en la siguiente, es decir, que para
su representacin se dispone de todo el espacio comprendido entre dos ordenadas. En tales
ocasiones, la inscripcin del punto que representa determinada frecuencia, se har generalmente
en la mitad de dicho espacio, salvo el caso de que se quiera descartar que la cifra corresponda al
total para un periodo especifico. Si por el contrario, los aos se han puesto debajo de las
ordenadas los puntos correspondientes se inscribirn sobre ellas.

13.2.5 Diagrama de frecuencias acumuladas. Este diagrama se utiliza para representar


distribuciones de frecuencia en escala cuantitativa con fines analticos o para resumir ciertas series
cronolgicas cuando se tiene inters, no tanto en las fluctuaciones de un lapso a otro, sino en el
efecto acumulado a travs del tiempo.

Antes de indicar la elaboracin del diagrama obsrvese los datos presentados en el siguiente
cuadro. Las dos primeras columnas del cuadro muestran las muertes accidentales en el pas en
1961 por grupos decenales de edad. Sumando sucesivamente las defunciones ocurridas, en los
diversos decenios se obtienen las cifras de la columna (3) que indican el nmero de defunciones
ocurridas a determinada edad. As por ejemplo, hubo 748 en el grupo 0-9 aos y por lo tanto,
todas ellas fueron en menores de 10 aos.

Como luego aparecen 457 en el grupo de 10 a 19aos al sumar esta cifra a la anterior 748 + 457
= 1205), se tiene 1205 defunciones ocurrieron en personas menores de 20 aos. Igualmente hubo
1847 en menores de 30 aos, sea, las 748 menores de 10 aos + las 457 del grupo de 10- 19, y
las 642 que el grupo de 20 a 29. Si se desea puede dividirse estas frecuencias acumuladas por la
frecuencia general del grupo, y multiplicar * 100 para obtener los porcentajes acumulados que
aparecen en la columna.

Cuadro 115

Defunciones por accidentes. Frecuencias acumuladas por grupos de edad. Venezuela, 1961.

Frecuencias acumuladas
Edad en aos Nmero de defunciones
Nmero Porcentajes
1 2 3 4
0- 9 748 748 23.3
10 > 19 457 1203 37.6
20-29 642 1817 57.6
30-39 466 2313 72.1
40-49 340 2653 82.7
50-59 244 2891 90.2
60-69 156 3050 95.1
70-79 76 3126 97.5
80-89 81 3207 100
Total 3207

Fuente: Anuario de epidemiologa y estadstica vital, Venezuela.

Grafico 116
Defunciones por accidentes, frecuencias acumuladas por grupos de edad, Venezuela, 1961.

3500

3000

2500

2000

1500

1000

500

0
1 0- 9 10 > 19 20-29 30-39 40-49 50-59 60-69 70-79 80-89
Fuente: Datos del cuadro 115.
13.2.5.1 Elaboracin. La elaboracin del diagrama de frecuencias acumuladas se resume en los
siguientes pasos:

1. Obtener las frecuencias acumuladas tal como se acaba de indicar.

2. Trazar el sistema de coordenadas y numerar las escalas. En la abscisa, se ponen intervalos de


clase, en la misma forma indicada en el histograma.

3. La ordenada debe comenzar en cero y llegar hasta la cifra que corresponda al total del grupo.

4. Generalmente es preferible utilizar una doble escala como se ha hecho en el grafico 116 en el
cual la escala vertical derecha muestra los porcentajes acumuladas (0% - 100%) y la izquierda
el nmero de defunciones acumulada.

5. Inscribir las frecuencias acumuladas. Cada frecuencia queda representada por un punto, el
cual debe colocarse al final del espacio destinado a la respectiva clase, para indicar el nmero
de casos que hubo por debajo de dicho valor. As por ejemplo, como aparecen 748
defunciones en el grupo 0-9 aos el punto debe ir encima del valor de la abscisa
correspondiente a 10 aos, significando que 748 defunciones ocurrieron en menores de 10
aos. Igualmente, como hubo 1205 en menores de 20 aos, el punto estar colocando encima
del valor 20 aos de la abscisa

6. Unir los puntos inscritos, con una lnea continua, para facilitar la lectura del grfico.

7. El grafico de frecuencias acumuladas permite responder fcilmente preguntas como las


siguientes:

a. Cuntas defunciones hubo en menores de determinada edad?

b. Por ejemplo, para averiguar las muertes ocurridas en menores de 35 aos, se levanta una
vertical a esta edad hasta la curva del diagrama y se proyecta en la escala vertical
izquierda, lo cual nos indica que por debajo de esa ocurrieron aproximadamente 2100
defunciones.

c. De las defunciones totales. que porcentaje ocurri por debajo de determinada edad?

d. Para el ejemplo anterior, se levanta una vertical hasta la curva y se proyecta en la escala de
los porcentajes obtenindose que aproximadamente el 65% de las defunciones fueron en
menores de 35 aos.

e. Por debajo de que edad ocurri determinado porcentaje de las defunciones?

f. Por ejemplo, si se desea saber antes de que edad ocurri el 50% de las muertes, se traza
una horizontal desde esta cifra hasta la curva del diagrama y bajando luego una vertical
hasta la abscisa, vemos que el 50% ocurre antes de los 26 aos (Q) . En la misma forma
podemos ver que el 25% de las defunciones ocurre antes de los 11 aos (Q1) y el 75%
antes de los 43 aos (Q3). Desde luego, son valores aproximados y ms adelante se
estudiarn mtodos matemticos ms exactos.

13.2.6. Diagrama Semilogartmico.

Es aquel cuya escala vertical tiene una escala logartmica, mientras que la horizontal presenta una
graduacin aritmtica como la utilizada en todos los grficos vistos anteriormente.

Con fines recordatorios, puede decirse que un logaritmo no es otra cosa que el nmero que indica
cuantos ceros siguen a la unidad. As por ejemplo, 100 tiene dos ceros y por siguiente su
logaritmo es 2, el nmero 1000 tiene tres ceros y su logaritmo es 3. Siendo 2 el logaritmo de 100
y 3 el logaritmo de 1000, cualquier nmero comprendido entre los anteriores, digamos 300, tendr
un logaritmo entre 2 y 3, es decir, que su logaritmo ser 2 ms alguna fraccin.

De lo anterior se deriva que los logaritmos 2, 3, 4, etc., representan nmeros que estn en
progresin geomtrica: 100, 1000, 10000, etc. Por consiguiente cuando se utiliza la escala
logartmica, aquellos nmeros que representan una misma proporcin, como ser: 1 y 2 o 3 y 6
100 y 200 etc., quedaran en el grfico separadas por una misma distancia, lo cual no sucede en la
escala aritmtica corriente. Esto puede apreciarse en el esquema de la prxima pgina.

La escala consta de uno o varios ciclos exactamente iguales, de tal manera que si el primero
representa los nmeros del 1 al 10, el segundo representara los nmeros del 10 al 100 y as
sucesivamente. Note por consiguiente que la escala logartmica, nunca empieza en cero. Su
comienzo puede ser 0,1; 1 10 100 de acuerdo a los datos que se representan.

En el comercio se consigue ya timbrado, papel de 1, 2 o ms ciclos pero en ocasiones se desea


hacer el grfico ms grande o ms pequeo de lo que el papel timbrado lo permite. Para ello,
utilizando el papel comercial, puede agrandarse o empequeecerse la escala mediante
procedimiento esquematizado en el grfico 120.

13.2.6.1. Utilizacin del diagrama semilogartmico. El papel semilogartmico tiene, entre otros,
los siguientes usos:

a. Si se quieren representar en el mismo grfico dos series cuyas cantidades son muy diferentes
unas de otras, como ser las variaciones en l nmero de glbulos rojos y de glbulos blancos, o los
casos y muertes de ciertas enfermedades, la escala aritmtica no lo permitir, como lo demuestra
el siguiente ejemplo:
GRAFICO 120
PROCEDIMIENTOS PARA OBTENER CICLOS LOGARTMICOS MS PEQUEOS (A) O MS

GRANDES (B)

CUADRO 121

CASOS Y DEFUNCIONES POR TOSFERINA. REA DE NOTIFICACIN ORGANIZADA


VENEZUELA, 1956 1960

Aos Casos Defunciones

1956 2.824 79
1957 1.420 76
1958 938 43
1959 4.476 118
1960 6.764 101

Fuente: Anuario de Epidemiologa y Estadstica Vital Venezuela 1961

Al utilizar una escala aritmtica para representar estos datos se caera en una de las dos
alternativas siguientes:

1. Si la escala presenta subdivisiones en 1000, las variaciones de los casos se apreciaran


correctamente, pero como las defunciones presentan muchas pequeas variaciones con
referencia a ellos, quedaran prcticamente representadas por una lnea recta, lo cual no
permitira apreciar los cambios en la mortalidad habida en el lapso. (Vase el grafico 122B).

2. Si para subsanar el anterior inconveniente se hicieran subdivisiones de 10 en 10, entonces el


grafico tendra que tener varios metros de altura, para que permitiera inscribir los miles de
casos presentados.
Grfico 122 A

DIAGRAMA SEMILOGARITMICO
Frecuencias

7.000

5.000

CASOS
2.000
1.000
500

200

100 DEFUNCIONES

50

20

10

1956 1957 1958 1959 1960


AOS

Grfico 122 B

USO INADECUADO DE LA ESCALA ARITMTICA


(No se aprecian las variaciones anuales en el nmero de defunciones)

7.000

6.000

5.000

4.000

3.000
CASOS

2.000

1.000
DEFUNCIONES

1.956 - AOS - 1.960


Fuente: Datos del cuadro 121

La representacin correcta de los datos anteriores puede hacerse fcilmente utilizando el papel
semilogartmico. En el grafico 122 A la vez que se apreciaran las variaciones en l nmero de
casos, se apreciaran tambin las ocurridas en las defunciones.
3. Muchas veces se tiene inters en comparar, no los cambios absolutos que presentan 2 o
ms series, sino los cambios relativos y en tales ocasiones, el papel Semilogartmico es el
adecuado. Considere por ejemplo, los siguientes datos:

CUADRO 123
MORTALIDAD ESTIMADA POR TUBERCULOSIS Y BILHARZIOSIS
VENEZUELA, 1953 1957
Tasas por 100.000 habitantes

Ao Tuberculosis Bilharziosis
1953 87.0 1.9
1954 74.0 1.5
1955 57.0 1.2
1956 45.0 1.0
1967 43.0 0.7
Fuente: Anuario de Epidemiologa y Estadstica Vital de Venezuela. 1961

Note que de 1953 a 1957, la Bilharziosis descendi en ms del 60% y la Tuberculosis solamente
en un 50%. Esto se aprecia correctamente en el diagrama Semilogartmico pero en diagrama de
escala aritmtica aparece que la Tuberculosis hubiera descendido mucho ms que la Bilharziosis

GRFICO 124

MORTALIDAD ESTIMADA POR TUBERCULOSIS Y BILHARZIOSIS.


VENEZUELA, 1953 1957

SEMILOGARITMICO ARITMTICO

Tasas por 100.000 habitantes Tasas por 100.000 habitantes

3.0 90
Tuberculosis

Tuberculosis
2.0 60

30
1.0 Bilharziosis

Bilharziosis

0.1 0
1953 1954 1955 1956 1957 1953 1954 1955 1956 1956

AOS AOS

Fuente: Datos del Cuadro 123

13.2.7. Diagrama de Correlacin

Este grfico se utiliza para aquellos casos en los cuales a cada individuo que se estudia se le
toman dos medidas diferentes, es decir, cuando cada individuo se clasifica al mismo tiempo en
relacin a 2 escalas cuantitativas como ser peso y estatura, edad y peso, etc.
En el grfico cada individuo queda representado por un punto segn la forma como estos puntos
se agrupen, se podr juzgar sobre el grado de asociacin entre las dos variables, lo cual se
estudiar en detalle posteriormente.

13.2.7.1Elaboracin. Para elaborar el diagrama de Correlacin, se proceder as:

1. Trazar el sistema de coordenadas. En este grfico las dos escalas deben ocupar la misma
longitud, es decir, si la ordenada mide 15cms; la abscisa tambin debe medir 15cms.

2. Numerar las escalas. No es necesario como en otros grficos, que las escalas comiencen en 0.
La numeracin puede comenzar con el valor menor observado en los datos o con el nmero
redondo inmediatamente inferior y terminar con el mximo valor observado o con el nmero
redondo inmediatamente superior.

3. Como cada individuo va a ser representado por un punto, ste se colocar en la intercepcin de
2 lneas imaginarias que pasen por los correspondientes valores.

Ejemplo: Con el fin de constatar si realmente los estudiantes que obtienen las mejores
calificaciones en sus ejercicios son quienes presentan los mejores exmenes finales, un
grupo de 20 estudiantes de estadstica ha sido clasificado de acuerdo a las notas previas
obtenidas en los ejercicios y a los resultados del examen final.
El grfico 126 representa los mencionados datos. Observe que en el diagrama se ha destacado el
o
valor correspondiente al individuo N 7, para mostrar cmo deben colocarse los puntos. Dicho
valor corresponde a un estudiante que tena una nota previa de 11 puntos y obtuvo 10 en el
examen final.

Detalles sobre la interpretacin de los grficos de correlacin y sobre las asociaciones


encontradas, sern dados al estudiar el Anlisis de la Informacin recogida.

NOTAS PREVIAS DEL EXAMEN FINAL DE 20 ESTUDIANTES


DE METODOLOGA ESTADSTICA.

ALUMNOS NOTA PREVIA NOTA FINAL


1 15 13
2 13 12
3 16 18
4 14 16
5 20 18
6 17 18
7 11 10
8 15 16
9 18 18
10 12 11
11 19 17
12 16 16
13 10 9
14 11 13
15 18 15
16 10 8
17 15 15
18 16 17
19 14 13
20 13 14
Grfico 126

25

20

15
NOTA PREVIA

10 NOTA FINAL

0
0 5 10 15 20 25

13.2.8. Diagrama de Cajas Bigotes

Los diagramas de Caja-Bigotes (boxplots o box and whiskers) son una presentacin visual que
describe varias caractersticas importantes, al mismo tiempo, tales como la dispersin y simetra.

Para su realizacin se representan los tres cuartiles y los valores mnimo y mximo de los datos,
sobre un rectngulo, alineado horizontal o verticalmente.

Una grfica de este tipo consiste en una caja rectangular, donde los lados ms largos muestran el
recorrido intercuartlico. Este rectngulo est dividido por un segmento vertical que indica donde se
posiciona la mediana y por lo tanto su relacin con los cuartiles primero y tercero (recordemos que
el segundo cuartil coincide con la mediana). Esta caja se ubica a escala sobre un segmento que
tiene como extremos los valores mnimo y mximo de la variable. Las lneas que sobresalen de la
caja se llaman bigotes. Estos bigotes tienen un lmite de prolongacin, de modo que cualquier dato
o caso que no se encuentre dentro de este rango es marcado e identificado individualmente

Ejemplo distribucin de edades:

Utilizamos la ya usada distribucin de frecuencias (en tallos y hojas), que representan la edad de
un colectivo de 20 personas.

36 25 37 24 39 20 36 45 31 31 4 29 23 41 40 33 24 34 40

1. Ordenar los datos

2. Para calcular los parmetros estadstico, lo primero es ordenar la distribucin 3.

20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45

4. Clculo de cuartiles
5. Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribucin. Como N =
20 resulta que N/4 = 5; el primer cuartil es la media aritmtica de dicho valor y el siguiente:

Q1 = (24 + 25) / 2 = 24,5

6. Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribucin, es el valor de la


variable que ocupa el lugar central en un conjunto de datos ordenados. Como N/2 =10 ; la
mediana es la media aritmtica de dicho valor y el siguiente:

Med.= Q2 = (33 + 34)/ 2 =33,5

7. Q3, el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribucin. En
nuestro caso, como 3N / 4 = 15.

Q2=(39 + 39) / 2 = 39

8. Dibujar la caja y los bigotes

El bigote de la izquierda representa al colectivo de edades ( Xmn, Q1) La primera parte de la


caja a (Q1, Q2),

La segunda parte de la caja a (Q2, Q3) El bigote de la derecha viene dado por (Q3, Xmx).

9. Informacin del diagrama

Podemos obtener abundante informacin de una distribucin a partir de estas representaciones.


Veamos alguna:

La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las edades
comprendidas entre el 25% y el 50% de la poblacin est ms dispersa que entre el 50% y el 75%.

El bigote de la izquierda (Xmm, Q1) es ms corto que el de la derecha; por ello el 25% de los ms
jvenes estn ms concentrados que el 25% de los mayores.

El rango intercuartlico = Q3 - Q1 = 14,5; es decir, el 50% de la poblacin est comprendido en


14,5 aos.
CAPITULO XIV

EL ANLISIS DE LA INFORMACIN:
LOS ESTUDIOS DESCRIPTIVOS
FACTORES QUE DETERMINAN EL METODO DE ANLISIS

14.1. Generalidades:

El anlisis de todo estudio, debe comenzar con una evaluacin global de la informacin disponible
y de la manera como fue recogida.

Conviene examinar si los planes se cumplieron a cabalidad y si los datos se recogieron en la forma
prevista y slo una vez que se est seguro de la fidelidad de la informacin, podr iniciarse el
anlisis estadstico propiamente dicho.

Las tcnicas de anlisis estadstico son muy numerosas, y la escogencia depende, entre otros
factores de:

1. El propsito del estudio.


2. El tipo de informacin recogida.
3. La escala de clasificacin utilizada.
4. El nmero de individuos estudiados.

En captulos anteriores, ya se consideraron algunos aspectos referentes al tipo de informacin


recogida (distribuciones de frecuencia, datos de asociacin y series cronolgicas) y a la escala de
clasificacin utilizada (cualitativa y cuantitativa). Consideramos ahora, la importancia que para el
anlisis tiene el propsito del estudio, y el nmero de observaciones estudiadas (series agrupadas
o no agrupadas).

14.2 Estudios descriptivos y estudios comparativos.

De acuerdo a su propsito, los estudios se clasifican en:

- Descriptivos, y
- Comparativos.

En los estudios descriptivos interesa sobre todo, resumir adecuadamente la informacin y al mismo
tiempo destacar las caractersticas importantes del grupo que se estudia. En los estudios
comparativos interesa primordialmente averiguar si hay o no diferencias entre los dos o ms
grupos que se estudian y si dichas diferencias existen, hallar razones valederas que puedan
explicarlas.

Es de advertir que esta tajante diferenciacin entre estudio; descriptivos y comparativos, es ms


bien aparente. En primer lugar, todo estudio comparativo debe comenzar con una descripcin de
los hallazgos encontrados, pues solamente despus que estos han sido resumidos
convenientemente, podr hacerse con provecho las comparaciones deseadas. En segundo lugar,
no debe olvidarse que en muchos estudios descriptivos la finalidad ltima es hacer ciertas
generalizaciones a partir de los resultados observados, pues aunque por razones prcticas el
investigador solo estudia una muestra de la poblacin en que est interesado, su deseo es llegar al
conocimiento de dicha poblacin a travs de los resultados de la muestra. Tal proceso de
induccin exige tcnicas, distintas a las utilizadas en la simple descripcin de los datos, las cuales
tienen mucho en comn, con aquellas que se emplean en los estudios comparativos.
A pesar de las salvedades anteriores, con propsitos docentes se estudiarn separadamente las
tcnicas estadsticas que se emplean los estudios descriptivos y aquellas que se utilizan en las
comparaciones de grupo, pues el perfecto conocimiento de las primeras, es imprescindible para
poder estudiar las segundas.

14.3 Nmero de individuos estudiados

Trtese de un estudio descriptivo o comparativo, la escogencia de las tcnicas de anlisis que se


utilizarn, depende del nmero de individuos en los cuales se basa la investigacin.

Cuando el nmero de individuos observados es poco numeroso, los valores correspondientes se


pondrn uno al lado del otro sin que haya necesidad de agruparlos en diferentes categoras. Se
tienen entonces las llamadas series no agrupadas.

Cuando por el contrario, el estudio incluye una cantidad apreciable de individuos, ningn anlisis
podr hacerse si no se clasifican previamente en un determinado nmero de grupos o clases, tal
como sealamos en el captulo noveno. Tales datos as presentados reciben el nombre de series
agrupadas.

Las tcnicas estadsticas de anlisis sern distintas segn se traten de series agrupadas o de
series no agrupadas, siendo un poco ms laboriosas las primeras

14.4 Tcnicas de anlisis de los estudios descriptivos.

Las tcnicas utilizadas en el resumen de los estudios descriptivos pueden esquematizarse en la


forma siguiente:

14.4.1 .Distribuciones de Frecuencias

Las distribuciones de frecuencia en escala cualitativa se resumen por frecuencias relativas (tasas,
porcentajes, etc.) Si la escala es cuantitativa, pueden resumirse en la misma forma, pero
generalmente se resumen mediante las llamadas tendencias centrales (promedio, mediana, modo)
y medidas de dispersin (desviacin, desvos, percentiles, etc.)

14.4.2. Datos de Asociacin

Si las dos escalas son cualitativas, se resumirn en frecuencias negativas. Si una es cualitativa y la
otra cuantitativa, podr escogerse, de acuerdo con la finalidad del estudio, cualquiera de las
medidas hasta ahora mencionadas y si ambas escalas son cuantitativas se emplearan el
Coeficiente de Correlacin o el Coeficiente de Regresin.

14.4.3. Series cronolgicas

Se resumen por medio de las tendencias calculadas, cambios porcentuales y tcnicas de


regresin.
CAPITULO XV

DISTRIBUCIONES DE FRECUENCIAS
EN ESCALA CUALITATIVA

Razones, proporciones, porcentajes y tasas


15.1. Presentacin tabular.

Las formas ms simples de presentar estos datos, son mediante un cuadro de dos columnas. En la
primera se ponen las subdivisiones de la escala de clasificaciones que se utilizan y en la otra el
nmero de individuos observados. Generalmente el cuadro se acompaa de una primera columna,
en la cual se ponen los porcentajes respectivos.
(Ver cuadro 84)

15.2. Presentacin grfica

Pueden utilizarse el diagnstico de barras o de sectores, pero la escala tiene muchas


subdivisiones, siempre debe preferirse el nmero. En ellos pueden respetarse los nmeros
absolutos o los porcentajes respectivos. El grafico quedar igual en ambos casos, cuando
solamente la numeracin de la escala utilizada. (Ver grfico 101 y 105)

15.3. Anlisis: frecuencias relativas.

El anlisis de estos datos se hacen mediante frecuencias relativas. Bajo la denominacin general
de frecuencias relativas se incluye un conjunto de trminos (razones, proporciones, ndices,
porcentajes, coeficientes, tasas) sobre cuya diferenciacin no hay todava un acuerdo completo.
Desde el punto de vista prctico, la exacta definicin de cada uno, tiene mucha menor importancia
que comprender su utilizacin y aplicaciones.

La importancia de las frecuencias relativas radica en que gracias a ellas pueden ponerse ms
fcilmente de presente, las relaciones que existen entre dos o ms cifras de los datos que se
estudian, facilitando la comprobacin de diversos resultados.

El dato aislado que en una ciudad hubo 100 de funciones y 500 en otra, es de indudable valor
para ciertos propsitos, pero de poca utilidad para otros. Saber el nmero de defunciones en cada
localidad es esencial para decidir sobre las facilidades mdicas y hospitalarias que deben
proveerse, pero si aspiramos a comparar el riesgo de morir en las dos poblaciones, es necesario
relacionar el nmero de defunciones en cada ciudad con su nmero de habitantes, pues es obvio
en el ejemplo presente, que si la segunda tiene 5 veces ms habitantes que la primera, en ella
deben haber ms o menos 5 veces ms defunciones.

15.3.1. Razones y Proporciones.

Si suponemos que un grupo de 396 estudiantes est formado por 297 hombres y 99 mujeres:

Hombres 297
Mujeres 99
Total 396

Aunque es evidente el predominio de los hombres, la intensidad de esa relacin se apreciar


mejor, al dividir el nmero de hombres por el de mujeres, con lo cual podemos decir, que hay 3
hombres por cada mujer en dicho grupo (297/99=3).
Puede tambin dividirse el nmero de hombres por la totalidad de personas en el grupo (297/396 =
= 75%), con lo cual se evidencia fcilmente, que cada 4 estudiantes, tres son de sexo
masculino, es decir, que hay 3 hombres por cada mujer en dicho grupo de estudiantes.

En el primer caso se ha relacionado el nmero de individuos en la categora con el nmero de


individuos la otra. En el segundo caso se ha relacionado el nmero de observaciones de una
categora, con el total general del grupo. La primera de tales frecuencias se denomina una razn;
la segunda se llama una proporcin cuando la serie que se estudia consta solamente de dos
categoras hombres y mujeres o enfermos y sanos - puede usarse segn las referencias una razn
o una proporcin -. Si la serie consta de tres o ms categoras, no hay una manera nica de
calcular una razn en tales casos es preferible utilizar las proporciones.

15.3.2. Porcentajes.

Un porcentaje es una proporcin multiplicada por 100. Por consiguiente, para calcular porcentajes,
basta dividir el nmero de individuos en cada categora por el total del grupo y multiplicar el
resultado por 100.. En nuestro ejemplo, el 75% de los estudiantes son hombres: (297/396) x 100 =
75%) y el 25% mujeres: (99/396) x 100 = 25%.

El uso de los porcentajes tiene varias ventajas. En primer lugar, ellos permiten comparar fcilmente
2 o ms series cuyos totales son diferentes, pues estos quedan convenientemente reducidos a
100.

Note que si se tienen los 2 siguiente grupos de personas:

Hombres 297 Hombres 255


Mujeres 99 Mujeres 85
396
Total Total 340

El clculo de los porcentajes nos permite sealar sin dificultad que la proporcin de hombres en los
dos grupos es semejante (297/396 =75% y 255/340 =75%), lo cual no era muy aparente antes de
su clculo.

En segundo lugar, a travs de los porcentajes se puede resumir la probabilidad de la ocurrencia de


un hecho. En la ilustracin anterior por ejemplo, hay un 75% de probabilidad de que una persona
sea de sexo masculino (297/396) y un 25% de que sea de sexo femenino (99/396)

15.3.3. Tasas

En toda la poblacin es importante conocer su composicin y los cambios que acontecen en ella.
Al estudiar estos cambios, ni las razones, ni los porcentajes, a pesar de su utilidad, permiten
analizar completamente la informacin disponible. Supngase que en la poblacin de San Pedro
los accidentes automovilsticos hubieran sido clasificados como seala el siguiente cuadro:

Cuadro 133
Accidentes automovilsticos segn sexo de los conductores.
San Pedro, 1961

Sexo de los conductores Frecuencia Porcentajes


Hombres 400 80%
Mujeres 100 20%
Total 500 100%
La informacin anterior es desde luego til. Los porcentajes calculados sealan, entre otras cosa,
que al ocurrir un accidente hay un 80% de probabilidad que sea un hombre quien conduce, lo cual
facilitar ciertas decisiones administrativas. As por ejemplo, si se est planeando construir un
hospital para atender conductores heridos o una crcel para detenerlos, los porcentajes nos
indican que aproximadamente un 80% de las camas hospitalarias o de las celdas carcelarias
deben ser para hombres.

Sin embargo sera un absurdo concluir sobre la base de la informacin anterior que los hombres
tienen mayor peligro de verse envueltos en un accidente automovilstico o que las mujeres sean
ms cuidadosas al manejar.

Con el fin de facilitar comparaciones como la anterior, siempre que se trate de medir el riesgo de
que acontezca determinado fenmeno debe relacionarse con la poblacin en la cual puede
acontecer. Tales relaciones reciben el nombre general de tasas.

Una tasa es simplemente un quebrado. El numerador, indica el nmero de veces que ocurri
determinado fenmeno en un rea altamente limitada y en un perodo de tiempo perfectamente
dado. El denominador indica el nmero de habitantes de la poblacin en la cual puede ocurrir el
fenmeno descrito en el numerador:

Nmero de veces que ocurri determinado fenmeno


n
x 10
Poblacin en la cual ocurri el fenmeno

Como el numerador de la tasa nunca podr ser mayor que su denominador, el resultado ser
menor que la unidad y para evitar casos de decimales, los resultados se multiplican por 100, 1000,
10000, etc. Pues es ms fcil recordar por ejemplo, que la tasa de mortalidad en Venezuela en
1960 fue de 9 por 1000 que recordar que es 0.009.

Teniendo en cuenta el concepto anterior, ser muy fcil obtener y calcular cuantas tasas se quiera.
Entre ellas, tienen importancia en Medicina:

1. Las tasas de mortalidad: las cuales expresan el riesgo de morir.


2. Las tasas de morbilidad: que expresan el riesgo de adquirir determinadas enfermedades.
3. Las tasas de natalidad: que miden el crecimiento de las poblaciones.
4. Las tasas de letalidad: que indican cuan graves son las enfermedades.

Las tasas anteriores pueden calcularse para toda una poblacin y separadamente para algunos de
sus segmentos, como ser para determinado grupo de edad o determinado sexo. Adems, unas
veces pueden referirse a todas las causas en conjunto o solamente a una causa o grupo de causas
en particular.

Tasas que se refieren a toda la poblacin y a todas las causas a la vez, se denominan tasas
crudas y aquellas que se refieren slo a parte de la poblacin o a una determinada causa, se
denominan tasas especficas. Pueden calcularse tasas especficas por edad, tasas especficas
por causa, tasas a la vez especficas por edad y causa, etc. Una tasa puede hacerse tan especfica
como se quiera, desde que se disponga de los datos bsicos necesarios.

Al calcular estas diversas tasas, slo habr que tener en cuenta la poblacin expuesta al riesgo,
para que el denominador sea correcto.

Como las poblaciones estn cambiando continuamente, aumentando a causa de los nacimientos y
de la inmigracin, disminuyendo a causa de las defunciones y de la emigracin, el nmero de
habitantes es diferente al principio, a mediados o a fines del ao. Por tal motivo la poblacin
especificada en el denominador, debe ser la de mediados de ao, es decir la del 1 de Julio, pues
se considera, que dicha poblacin es intermedia entre la de principios y final de ao.
15.3.3.1. Principales Tasas.

Aun cuando estas tasas sern estudiadas en detalle posteriormente, a continuacin se indica el
clculo de las ms comnmente empleadas:

Defunciones por todas las causas


y en todas las edades ocurridas
en determinada regin durante
determinado ao.
Tasa Cruda de Mortalidad: x 1000
Poblacin de la mencionada regin
para el 1 de Julio del ao
que se estudia

Ejemplo: La poblacin de Venezuela para el 1-7-64 se estim en 7.600.000 habitantes y


en dicho ao ocurrieron en el pas un total de 55.466 defunciones. La tasa cruda de mortalidad fue
por lo tanto:

55.466 x 1.000
= 7.3 por 1.000 habitantes
7.600.000

Total de nacimientos vivos habidos


en determinada regin
durante determinado ao
Tasa Cruda de Natalidad = x 1.000
Poblacin de la mencionada regin
para el 1 de Julio del ao
que se estudia

En 1961 se registraron en Venezuela 340.433 nacimientos vivos, y la poblacin se estim en


7.600.000 habitantes. Su tasa cruda de natalidad fue por consiguiente:

340.433 x 1.000
= 44,7 por 1.000 habitantes
7.600.000

Tasa Cruda de Morbilidad: Habitualmente no se calcula, ya que salvo el caso de


encuestas especiales, es imposible conocer la morbilidad total de una
regin.

Defunciones por determinada causa habidas en


determinada regin durante el ao en estudio
Tasa de Mortalidad x 100.000
Especfica por causa:
Poblacin de la mencionada regin para el 1
de Julio del ao respectivo

Ejemplo: Durante 1961 ocurrieron en Venezuela 1.312 defunciones por Tuberculosis.


Como la poblacin del pas dicho ao se estim en 7.600.000 habitantes, la tasa de mortalidad
especfica por Tuberculosis fue:
1.312 x 100.000
= 17,3 por 100.000 habitantes
7.600.000

Defunciones por todas las causas en


determinado grupo de edad
Tasas de Mortalidad x 1.000
especfica por edades: Poblacin del correspondiente grupo de
edad para el 1 de Julio del ao estudiado

3.400.000
Ejemplo: La poblacin venezolana de menores de 15 aos fue estimada para 1961 en
habitantes. Dicho ao ocurrieron en el pas un total de 26.303 defunciones en personas
menores de 15 aos. La tasa de mortalidad en menores de 15 aos fue:

26.303 x 1.000
= 7,7 por 1.000
3.400.000

Defunciones habidas por determinada causa


en determinado grupo de edad
Tasa de Mortalidad x 100.000
Especfica por causa
y por edades: Poblacin del correspondiente grupo de edad
para el 1 de Julio del ao de estudio.

Ejemplo: En 1961 ocurrieron en Venezuela 140 defunciones por Tuberculosis en el grupo de


menores de 15 aos. Como la poblacin estimada para esas edades, fue de 3.400.000 habitantes,
la tasa de mortalidad especfica por Tuberculosis para menores de 15 aos fue:

140 x 100.000
= 4,1 por 100.000
3.400.000

Nmero de enfermos por determinada causa


conocidos en determinada regin durante el ao
Tasa de Morbilidad x 100.000
Especfica por causa: Poblacin de la regin para el 1 de Julio del
ao en estudio

Ejemplo: En 1961 se conocieron en Venezuela 8.242 casos de Tuberculosis Pulmonar. Como la


poblacin del pas era de 7.600.000 la tasa de morbilidad por Tuberculosis fue:

8.242 x 100.000
= 108,4 por 100.000
7.600.000

Defunciones por determinada causa


Tasa de Letalidad: x 100
Casos conocidos de la enfermedad en
el mismo ao y en la misma regin
Ejemplo: En 1961 se conocieron en el pas 861 casos de Fiebre Tifoidea, de los cuales fallecieron
26. La tasa de letalidad para la Fiebre Tifoidea fue por lo tanto:

26 100 = 3.0%
861

Es preciso hacer notar en ciertas ocasiones la poblacin que sirve de denominador a la tasa no
puede conocerse y es necesario empezar a estimarla por cualquier procedimiento. Como ejemplos
se tienen: la tasa de mortalidad infantil y la tasa de mortalidad materna.

La tasa de mortalidad infantil se refiere exclusivamente a las defunciones de nios que no han
cumplido un ao. Por consiguiente, en el denominador de la tasa debiera figurar l nmero de
nios menores de un ao. Esta cifra sin embargo nunca aparece con exactitud pues los datos
censales son muy deficientes al respecto, y para estimarla se toma el nmero de nacimientos
ocurridos en el ao en la regin que se estudia. De acuerdo a lo anterior la tasa de mortalidad
infantil se calcula mediante la frmula siguiente:

Tasa de Mortalidad Infantil = Defunciones de nios menores de un ao x 1.000


Nacimientos vivos

Ejemplo: En Venezuela durante 1961 ocurrieron 18.137 casos defunciones de nios menores de
1 ao y dicho ao se registraron en todo el pas 340.433 nacimientos vivos. La tasa de
mortalidad infantil fue:

18.137 x 1.000 = 53.2 por 1.000 nacimientos vivos


340.433

Es decir, por cada 1.000 nacimientos vivos ocurridos, fallecieron 53 nios menores de 1 ao.

b) La tasa de mortalidad materna mide el riesgo de morir a causa de cualquier trastorno imputable
directamente al embarazo, parto o puerperio. Como se desconoce el nmero de embarazadas
parturientas y purperas, dicha cifra se estima a travs del nmero de nacimientos vivos ocurridos,
quedando la tasa:

Tasa Mortalidad Materna: Defunciones Maternas 1.000


Nacimientos Vivos

Ejemplo: En 1961 ocurrieron en Venezuela 378 defunciones por complicaciones del embarazo,
parto y puerperio. Como en tal ao se registraron 340.433 nacimientos vivos, la tasa de mortalidad
materna fue:

378 x 1.000 = 1.1 por 1.000 nacimientos vivos.


340.433
CAPITULO XVI

DISTRIBUCIONES DE FRECUENCIAS
EN ESCALA CUANTITATIVA
16.1. Presentacin tabular.

Los cuadros que sirven para representar estos datos son en lo semejantes a los utilizados en otras
distribuciones de frecuencias (cuadro 83).

16.2. Presentacin grfica.

Cuando la escala es continua, la representacin grfica se hace en polgonos de frecuencia y


preferentemente en histogramas (ver grfico 109). En los raros casos en los cuales la escala es
discontinua, debe utilizarse el diagrama de barras.

16.3. Anlisis.

Lo mismo que las series anteriores, las distribuciones de frecuencias en escala cuantitativa pueden
analizarse mediante porcentajes, pero generalmente el anlisis se efecta mediante las llamadas
constantes centrales y de dispersin. Las primeras (promedio aritmtico, mediana y modo) sealan
aquellas cifras alrededor de las cuales est la mayora de las observaciones y las segundas
(desviacin estndar, percentiles, etc.)

Sealan la manera como se distribuyen las observaciones con respecto a los anteriores valores
centrales.

El que se prefiera analizar una serie mediante porcentajes o mediante medidas centrales y de
dispersin depende de la finalidad que se persigue en el estudio. La informacin dada por unos y
otras es diferente y en ocasiones suelen utilizarse al mismo tiempo los dos tipos de medida.

16.4. Anlisis mediante frecuencias relativas.

Distribuciones de frecuencias en escala cuantitativa, pueden analizarse para ciertos propsitos


mediante porcentajes y porcentajes acumulados.

Cuadro 141
Escolares de acuerdo a su peso

Peso en Kilos No. de Escolares Porcentajes Porcentaje acumulado


20-24 4 8.0 8.0
25-29 8 16.0 24.0
30-34 9 18.0 42.0
35-39 10 20.0 62.0
40-44 7 14.0 76.0
45-49 6 12.0 88.0
50-54 6 12.0 100.0
Total 50 100.0
Fuente: Datos hipotticos para ilustracin

En muchas ocasiones como esta, el promedio puede ocultar diferencias importantes entre los
individuos que se estudian, mientras que el simple anlisis de los porcentajes puede ser mucho
ms ilustrativo. Supongamos por ejemplo, que el peso promedio normal para nios de la edad
estudiada hubiera sido fijado en 35 kilos.
El promedio para este grupo de 50 escolares, calculado por el mtodo que luego se estudiar es
exactamente 37 kilos, el cual nos lleva simplemente a formarnos la impresin de que el grupo
estudiado, presenta un estado nutritivo normal. Sin embargo, el anlisis de los porcentajes nos
muestra claramente que el 8% de los nios pesa entre los 24 kilos y que el 42% pesa menos de 35
kilos, o sea, que debido a nuestro patrn de normalidad, casi la mitad de estos escolares estaran
desnutridos.
16.5. Constantes centrales en series no agrupadas.

16.5.1. Promedio aritmtico ( ) ( para el caso de la muestra)


El promedio aritmtico es la cifra que se obtiene al dividir la suma de todos los valores observados
por el nmero de observaciones y se tienen 5 nios cuyos respectivos pesos son:

7, 4, 9, 6, y 4 kilos

El promedio aritmtico se obtendr sumando las cifras anteriores y dividiendo por 5 que es el
nmero de nios:

4+9+6+4 = 30 = 6 kilos
= 7 +
5 5

Es decir, los nios pesan en total 30 kilos, y si todos ellos pesarn igual, esto es, si no existiera
variacin, el peso de cada uno sera de 6 kilos.

16.5.2. La Mediana (M)

La mediana es aquella observacin que divide la serie en 2 partes iguales, en tal forma, que la
mitad de las observaciones son iguales o menores que dicho valor y la otra mitad, iguales o
mayores que l.

Para calcular la mediana, es necesario ordenar las observaciones de menor a mayor o viceversa.
Por lo tanto, en el ejemplo anterior, la mediana no es 9, pues ordenando los datos de menor a
mayor, se obtendra:

4, 4, 6, 7, 9

y la mediana ser 6, a cada lado de la cual quedan 2 observaciones.

Si en vez de un nmero impar de observaciones tuviramos las 6 siguientes:

4, 5, 7, 8, 9, 10

se ve que no hay en realidad ninguna observacin que ocupe la mitad, pues el lmite estara entre
el 7 y el 8. En dichos casos, para obtener la mediana, se promediarn los 2 valores centrales, en
este caso, los correspondientes a la 3 y 4 observaciones, es decir:

7 8 = 7 1/2
2

16.5.3. El Modo (M)

El modo, o valor de moda, es aquel que se observa con mayor frecuencia. En el primer ejemplo, en
que los pesos eran:
7, 4, 9, 6, 4 kilos
El modo es 4, pues ste es el valor que se observa con mayor frecuencia.

Obsrvese que si los valores fueran 7, 4, 8, 3, y 5, no hay en realidad ningn valor que se observe
ms frecuentemente que los otros. Lo mismo sucede si los valores fueran:

2, 2, 4, 4, 6, y 6
16.6. Constantes centrales en series agrupadas.

16.6.1. Promedio Aritmtico

Para calcular el promedio, se asume que cada uno de los individuos en determinada clase tiene un
valor igual al punto medio de la clase. En el ejemplo que sigue, se ve que el punto medio de la
primera clase es 22 (recurdese seccin II ), lo cual significa que cada uno de los 4 individuos de
esa clase pesa 22 kilos y por lo tanto, los 4 pesarn en conjunto 88 kilos (22 4). Igualmente, el
punto medio de la segunda clase es 27, o sea que cada individuo de los 8 que hay, pesa 27 kilos y
por lo tanto, los 8 pesarn en total 216 kilos (27 8 = 216). Bastar entonces sumar estos
productos para saber cuntos kilos pesa la totalidad de los individuos estudiados y dividir esta
suma por el nmero de observaciones para encontrar el punto medio.

En las 2 primeras columnas del siguiente cuadro aparecen los datos sobre el peso de 50
escolares y en las restantes, los clculos necesarios para obtener el promedio, los cuales se
resumen a continuacin.

Cuadro 144
Escolares de acuerdo a su peso
(Clculo del Promedio)

Peso en kilos No de Individuos fi Punto medio de la clase xi Peso total de cada clase fi xi
(1) (2) (3) (4)
20-24 4 22 88
25-29 8 27 216
30-34 9 32 288
35-39 10 37 370
40-44 7 42 294
45-49 6 47 282
50-54 6 52 312
Total 50 1.850

Aproximado a la unidad completa

Promedio: 1.850 = 37.0 kilos


50

Los pasos seguidos en el clculo anterior son los siguientes:

1. Averiguar el punto medio de cada clase (Columna 3).

2. Multiplicar el punto medio de cada clase por los individuos en ella (Columna 4) y sumar estos
productos.

3. Obtener el promedio dividiendo la suma anterior por el nmero de individuos estudiados.

16.6.2. Mediana

Para calcular la mediana se considera que los individuos de cada clase se encuentran
uniformemente repartidos en ella. As por ejemplo, en la clase 35-39, cuyos verdaderos lmites son
34.5 y 39.5 kilos y cuya amplitud es 5, hay 10 individuos, o sea, que existe una diferencia de peso
entre uno y otro igual a 0.5 kilos (5 /10 0.5).

Es como si el intervalo de la clase 34.5 a 39.5 en la cual hay 10 personas, se divide en 10


subintervalos de 0.5 de amplitud, en medio de cada uno de los cuales se encuentra un individuo.
Como en la primera clase hay 4 personas, esto quiere decir que all estn los individuos del 1 al 4 y
por consiguiente, como en la segunda clase hay 8, all estarn los individuos del 5 al 12 y as
sucesivamente.

La colocacin de los 10 individuos de la clase 34.5-39.5 (individuos 22-31) se har como lo


muestra el siguiente esquema:

Colocacin de los individuos

Con estas explicaciones podemos ilustrar el clculo de la mediana tomando el mismo ejemplo
utilizado en el clculo del promedio en series agrupadas.

Cuadro 146
Escolares de acuerdo a su peso
(Clculo de la mediana)

Peso en kilos Intervalos verdaderos No. de escolares Frecuencias acumuladas


(1) (2) (3) (4)
20-24 19.5-24.5 4 4
25-29 24.5-29.5 8 12
30-34 29.5-34.5 9 21
35-39 34.5-39.5 10 31
40-44 39.5-44.5 7 38
45-49 44.5-49.5 6 44
50-54 49.5-54.5 6 50
Total 50

Los pasos son los siguientes:

1. Escribir los verdaderos lmites de cada clase. Esto no es esencial, pero es conveniente para el
principiante.

2. Obtener a frecuencia acumulada de las observaciones por el procedimiento conocido (columna


4).

3. Averiguar cul observacin es la mediana, para lo cual:

4. Observacin mediana n = 50 = 25
2
5. Como la mediana es la observacin nmero 25 y como hay 21 por debajo de 34.5 kilos (vase
columna 4), se necesitan 4 observaciones ms (25 21 = 4) de las 10 que hay en la siguiente
clase. Puesto que se considera que dichas observaciones estn a igual distancia una de otra,
se tomar 4/10 de la amplitud de esta clase y se aadir a 34.5 que es su comienzo, con el fin
de obtener la mediana:

Mediana = 34.5 + (4/10 x 5) = 34.5 + 2.0 = 36.5 kilos

El lector observar que como se trata de un nmero par de observaciones (50), el valor de la
mediana correspondera al promedio de las observaciones 25 y 26 y no a la observacin nmero
25. Un atento examen del esquema anterior muestra que el individuo 25 tiene un peso de 36.25 y
el individuo nmero 26 un peso de 36.75. El semipromedio de estos valores que sera la mediana
es de 36.5 kilos. Si para facilidades de clculo se asume que el primer individuo de esta clase (el
nmero 22) est en el punto 35, en vez de estar en el punto 34.7, que es su verdadera colocacin,
lo estamos desplazando subintervalo hacia la derecha.

Para compensar este desplazamiento, en vez de formar el valor medio entre las observaciones 25
y 26 se tomar el valor de la nmero 25, como se ha hecho en la frmula anterior, con lo cual
obtenemos el verdadero valor investigado.
a
16.7. Escogencia entre el promedio, la mediana y el modo ( )

De las tres constantes anteriores, el promedio aritmtico puede ser ms frecuentemente utilizado,
quizs por la facilidad de su computacin a pesar de que en muchas ocasiones la mediana o el
modo resultan de mayor inters.

a. El promedio aritmtico como medida de resumen tiene la ventaja de tomar en cuenta la


totalidad de los valores de la serie, aumentando o disminuyendo de acuerdo con ella pero
a causa de esta propiedad, puede ser desventajosamente afectado por la existencia de
valores anormalmente altos o anormalmente bajos. Por regla general, sin embargo, puede
decirse que cuando la serie es ms o menos simtrica, el promedio debe ser preferido a
cualquier otra constante de resumen.

b. La mediana por su parte debe ser utilizada cuando entre los valores que se estudian haya
alguno muy diferente de los otros. Su valor extremo afectar el promedio por ejemplo, el
tiempo de hospitalizacin de 5 nios con gastroenteritis fuera respectivamente:

2, 3, 4, 6 y 30 das

El ltimo valor, debido tal vez a alguna complicacin de la enfermedad, hace aparecer la
permanencia en el hospital mucho ms larga de lo que generalmente es. El promedio:

2 3 4 6 30 45
9 das
5 5

Es engaoso, pero en cambio la mediana, que es 4 das, tiene la ventaja de no tomar en cuenta los
valores anormales extremos, dando una impresin ms acorde de lo usual. Observe que si la
ltima observacin fuera 300 en vez de 30, el promedio ascendera a 63 das, pero la mediana
continuara siendo 4.

(a) Adems del promedio aritmtico ocasionalmente se utiliza el promedio geomtrico y armnico cuya
enseanza se omite por constatarlo de escaso inters, pero cuyo clculo se ilustra en el Apndice.
Note que cuando dichos valores extremos no existen, el valor del promedio y de la mediana
concuerda bastante bien y se hacen exactamente iguales si la serie es simtrica. Por ejemplo, si
se tiene:
3, 5, 7, 9, 11

El promedio es 7 y la mediana tambin es 7.

Hay adems ocasiones en que debe usarse la mediana por no ser posible el clculo del promedio.
Tal sucede en aquellas series en las cuales la primera o la ltima clase no tienen lmites precisos.
Si en el ejemplo de los 50 escolares dado anteriormente, la primera clase hubiera sido menos de
25 kilos o la ltima figurara como 50 kilos y ms se comprende que habra sido imposible
calcular el promedio, a no ser que se fijaran arbitrariamente los lmites de las mencionas clases.

Exceptuando estas aplicaciones, la mediana no tiene ninguna ventaja sobre el promedio aritmtico,
pues su valor depende solamente del nmero de trminos, sin tomar en cuenta los valores
()
numricos de estos .

c. El modo finalmente, es la constante que se emplea cuando el inters se centra en conocer


el valor que se presenta ms frecuentemente. Tal sucede cuando se trata de determinar
el periodo de incubacin de una enfermedad o su duracin habitual, casos en los cuales el
promedio y la mediana pueden no ser convenientes a causa de sus defectos sealados.

16.8. Promedios ponderados.

Hay ocasiones en que se quiere expresar en una sola cifra, los resultados de varios grupos de
individuos, cada uno de los cuales ha sido resumido previamente mediante un promedio. Tal es el
caso de las muestras estratificadas, en las cuales se calcula un promedio para cada estrato. En
dichas ocasiones, el promedio general para los diferentes grupos no se obtiene promediando los
promedios parciales, sino que es necesario tener en cuenta el nmero de observadores en que se
basa cada promedio. Tal promedio recibe el nombre de Promedio Ponderado.

Supongamos un grupo de 4 mujeres y otro de 6 hombres, cuyos pesos fueron los siguientes:

Mujeres: 46, 48, 52 y 54 Promedio = 50 Kilos


Hombres: 55, 38, 59, 60,61 y 67 promedio = 60 Kilos

50 60
El promedio general para estas 10 personas no es 55kg
2
El promedio correcto se obtiene ponderando cada promedio parcial por el nmero de personas que
incluye. Como 50 fue el promedio para las 4 mujeres, el grupo de mujeres peso en total 200 kilos
(4x 50) e igualmente los hombres pesaron en total 3360 kilos (6x60). Por consiguiente, las 10
personas pesaron 560 kilos en conjunto (200 + 360) y el verdadero promedio ser: 560 10 = 56
kilos.

En resumen si tenemos los promedios etc., calculado respectivamente en n1 , n2 , n3 observaciones


el promedio correcto ser

n1 x1 n2 x2 n3 x 3
Promedio Ponderado
n1 n2 n3

()
En la Seccin 32.10 se estudiar la aplicacin de la Mediana en el clculo del ndice Endmico
es decir, basta multiplicar cada promedio parcial por el nmero correspondiente de personas
estudiadas, sumar luego estos productos y dividir por el nmero total de personas en los varios
grupos.

De la misma manera se proceder para promediar los porcentajes de varios grupos de individuos.
Si los porcentajes de mujeres en 3 escuelas diferentes fueran:

Escuela N de alumnos Porcentaje de mujeres


A 48 50,00
B 60 70,00
C 30 40,00

El porcentaje global de mujeres, para las 3 escuelas, no sera:

50 70 40 160
53,3%
3 3
El porcentaje verdadero sera:

(50% 48) (70% 60) (40% 30) 7.800


56,5%
48 60 30 138
16.9. Medidas de dispersin.

16.9.1 Importancia de las medidas de dispersin.

Supongamos que se tiene tres grupos de pacientes de 7 individuos cada uno y como ejemplo
ilustrativo supngase adems que el primer grupo sufre de Gastroenteritis, el segundo de
Bronquitis y el tercero de Amigdalitis.

Si la permanencia hospitalaria de cada paciente fuera la que aparece a continuacin:

Enfermedades Das de hospitalizacin de los Pacientes


Gastroenteritis 1, 3, 5, 7, 9, 11, 13
Bronquitis 1, 2, 3, 7, 11, 12, 13
Amigdalitis 1, 5, 6, 7, 8, 9, 13

Sera fcil constatar los siguientes puntos:

a. Cada serie tiene el mismo nmero de observaciones, es decir 7 pacientes


b. En los 3 casos la amplitud de la serie es la misma: de 1 a 13 das.
c. Las 3 series tienen el mismo promedio, o sea 7 das.
d. Las 3 series tienen la misma mediana, o sea 7 das.
e. En cada serie el promedio y la mediana coinciden exactamente.

No obstante las similitudes sealadas, las 3 series son muy distintas, pues como puede apreciarse
en el grafico siguiente:

a. En el caso de la Gastroenteritis, los 7 pacientes se distribuyen uniformemente en el lapso de 1


a 13 das
b. En el caso de la Bronquitis, los pacientes se agrupan en los extremos de dicho lapso (1 2 3
y 11 12 - 13).
c. En el caso de la Amigdalitis, se agrupan hacia el centro ( 5 6 7 8 9 )
Grafico 151
Das de hospitalizacin de 3 grupos de pacientes

DIAS DE HOSPITALIZACION

ENFERMEDADES

GASTROENTERITIS

BRONQUITIS

AMIGDALITIS

Las anteriores anotaciones sealan que cuando se tienen un grupo de observaciones no basta
conocer cul es su promedio o su mediana, sino que adems, es necesario tener una medida que
indique claramente cmo se distribuyen las observaciones alrededor de ese promedio o esa
mediana.
()
Con tal fin se utilizan la llamada Desviacin Estndar y el Intervalo Intercuartilar. Debe tenerse
en cuenta que cuando se busca el promedio aritmtico, se debe calcular la Desviacin Estndar y
es el Intervalo Intercuartilar, pues este ltimo se utiliza solamente para medir la dispersin
alrededor de la mediana. Es decir: con el promedio se utiliza la desviacin estndar y con la
mediana, el intervalo intercuartilar.

16.9.2 Clculo de la Desviacin Estndar en series no agrupadas

Como ilustracin tonemos el ejemplo de la Bronquitis, dado anteriormente, es decir, los das de
hospitalizacin de 7 pacientes que fueron:

1, 2, 3, 7, 11, 12, 13

Para el clculo, se dispondrn los datos convenientes, tal como aparecen en el siguiente cuadro:

()
La Desviacin estndar D. E. suele representarse con la letra griega sigma minscula ( ) y a veces se
coloca su valor despus del signo que sigue al promedio ( x = 10 2 indica que la D. E. = 2) Como
ambos procedimientos se utilizan tambin para indicar el valor del Error Estndar que estudiaremos luego, con
el fin de evitar confusiones, utilizaremos D. E. y E. E. respectivamente, al referirnos a estas constantes.
Cuadro 153

Das de hospitalizacin en 7 pacientes con Bronquitis (Clculo de la Desviacin


Estndar)

Das de Desviaciones (valor de cada Desviaciones al


Pacientes 2
hospitalizacin observacin menos promedio) cuadrado (d )
1 2 3 4
Primero 1 1-7 =-6 36
Segundo 2 2 - 7 = -5 25
Tercero 3 3-7=-4 16
Cuarto 7 7-7=-0 0
Quinto 11 11 - 7 = + 4 16
Sexto 12 12 - 7 = + 5 25
Sptimo 13 13 - 7 = + 6 36
Total 49 158


Promedio = 49 7 das
7

Desviacin Estndar = nd 2

154
7
22 = 4,7 das ()

Los pasos a seguir son los siguientes:

1. Averiguar el promedio: 49/ 7= 7


2. Buscar la diferencia que hay entre cada observacin y el promedio (columna 3). As por ejemplo:
el primer paciente solamente estuvo 1 da hospitalizado es decir, 6 das menos que el promedio y
en cambio el ultimo paciente estuvo 13 das, o sea, 6 das ms que el promedio. Ntese que es
necesario poner el signo (-) o (+) para distinguir, entre quienes estn por debajo o por encima del
promedio (desde luego el signo (+) no hay necesidad de ponerlo). La suma de esta columna debe
ser igual cero (0).

3. Como la suma de la columna (3) ser siempre igual a cero (0), no se podr saber cul es en
promedio la desviacin del grupo de observaciones. Para obviar este inconveniente se eleva al
cuadrado cada desviacin de la columna (4). la cual se totaliza luego.

4. El total de la columna ( 4) se dividir por el nmero de observaciones que en nuestro ejemplo es 7,


o sea 154/7=22. Esto quiere decir que en promedio cada paciente difiere en 22 unidades
cuadradas del promedio general del grupo.

5. Como cada desviacin la habamos elevado al cuadrado y no tiene ningn significado hablar de
das cuadrados o de kilos cuadrados, con el fin de volver a las unidades primitivas se extraer la
raz cuadrada al anterior valor y dicha cantidad ser la desviacin estndar. En este ejemplo

D. E. = 22 = 4,7 das

()
cuando se calcula la Desviacin Estndar d un pequeo grupo de individuos. Es ms exacto
dividir por (n - 1) que por (n), pero en grupos ms o menos grandes, digamos ms de 30
individuos, tal refinamiento no en necesario. Aunque es evidente que en el presente ejemplo la
divisin debe hacerse por 6 y no por 7, los clculos tratan de ilustrar el caso general y no el caso
particular a que hemos hecho referencia.
16.9.3 Desviacin Estndar en series agrupadas

Los diferentes pasos que deben seguirse para el clculo de la Desviacin Estndar y explicaremos
en seguida, aparecen resumidos en el siguiente cuadro, cuyas primeras cuatro columnas se
utilizan para calcular el promedio, conforme ya se ha estudiado.

Cuadro 155

Escolares de acuerdo a su peso


(Clculo de la Desviacin Estndar)

Desviaciones
Nmero de Punto Desviaciones
Producto Desviaciones por nmero
Peso. Kg. individuos medio de al cuadrado
X1*f1 (d) 2 de individuos
(f1) clase (X1) (d )
(f1*d)(2*6)
1 2 3 4 5 6 7
20 -24 4 22 88 -15 225 900
25 - 29 8 27 216 -10 100 800
30 - 34 9 32 288 -5 25 225
35 - 39 10 37 370 0 0 0
40 - 44 7 42 294 +5 25 175
45 - 49 6 47 282 +10 100 600
50 - 54 6 52 312 +15 225 1350
Total 50 1850 4057

1850
Promedio = = 37,0
50

4,050
Desviacin Estndar = 81 = 9.0 kilos
50

Los pasos son los siguientes:

1. Calcular el promedio por la tcnica conocida para lo cual se utiliza las 4 primeras columnas del
cuadro.
2. Buscar la diferencia entre el promedio, y cada uno de los puntos medios de las clases (columna 5).
Estas cifras indican en cuantos difiere cada observacin del promedio general del grupo.
3. Elevar al cuadrado las anteriores diferencias (columna 6).
4. Multiplicar regln a regln, las cifras de las columnas (2) y (6). Esto es necesario, pues las
diferencias de la columna 6 se refiere a un solo individuo y por lo tanto, si en la primera clase hay 4
individuos y cada uno difiere 225 unidades cuadradas de su promedio, los 4 individuos diferirn en
900 unidades ( 4 x 225 ).
5. Sumar los productos de la columna (7), para saber la diferencia global entre todos los individuos y su
promedio.
6. Dividir la suma anterior por el nmero de individuos estudiados
7. ( en nuestro caso n = 50 ).
()
8. Extraer la raz cuadrada. Este ltimo valor ser la Desviacin Estndar

()
una frmula que suele ahorrar trabajo es la siguiente:
f d
2


4.050
D. E. = 1 1
9 kilos
n 50

16.9.4 Utilizacin de la Desviacin Estndar

Hemos dicho que la Desviacin Estndar indica en que formas se distribuye las observaciones
alrededor del valor central representado por el promedio.

Su utilidad se debe a que ella, junto con el promedio, ayuda a determinar los limites dentro de los
cuales se encuentran las observaciones que se estudian, en tal forma, que basta conocer el
promedio y la D. E. para reproducir toda la informacin contenida en los datos originales, salvo,
desde luego, pequeas variaciones. Esta interpretacin se basa en las propiedades de la Curva
Normal.

16.9.5. La Curva Normal

La curva normal es una curva en forma de campana, perfectamente simtrica, de tal manera, que
una perpendicular que pase por el vrtice la divide en 2 mitades exactamente iguales. Dicha
perpendicular representa el promedio aritmtico (vase grfico 158).

Puede observarse que en cada mitad, la curva es primero cncava hacia arriba, y luego cncava
hacia abajo, habindose dado el nombre de punto de inflexin a aquel en el cual la curva cambia
de direccin.

Hay por consiguiente, 2 puntos de inflexin, uno izquierdo y otro derecho. La distancia que separa
a cada punto de inflexin de la lnea central que representa el promedio, constituye una desviacin
estndar, aunque tericamente, la curva nunca toca la horizontal para propsitos prcticos, puede
considerarse que la totalidad de al rea se encuentra comprendida entre 2 lneas verticales
situadas a 3 D. E. a cada lado del promedio.

Los matemticos han demostrado que aproximadamente un 68% del rea de todo el rea de la
curva se encuentra comprendida entre las 2 verticales que pasan por los puntos de inflexin, lo
cual equivale a decir que el 68% del rea se encuentra entre el promedio ms una desviacin
estndar y el promedio menos una desviacin estndar.
Igualmente se ha visto que entre el promedio ms menos 2, D. E. se encuentra aproximadamente
el 95% del rea de la curva y que prcticamente el 100% del rea se encuentra entre el promedio
()
ms menos 3 D. E.

f x
2
2
x
1 1
D. E. =
n
O sea: multiplicar cada una de las cifras de la columna (4) por el respectivo punto medio de la clase; sumar estos productos
y dividir por el nmero de observaciones. Restar al resultado anterior el cuadrado del promedio y extraer la raz cuadrada.
(esta frmula fue utilizada para e clculo de la D. E. que aparea al final dela Pg. 199). Un mtodo ms abreviado se ilustra
en el apndice.

()
Exactamente un 95% del rea de la curva se encuentra entre el x 1,96 D. E. y un 99% entre x 2,58 D. E.
Para fcil memorizacin dichas cifras se forman habitualmente como 2 y 2.8 D. E. Igual aproximacin se utiliza en las
diversas aplicaciones del error estndar que se vern posteriormente.
GRAFICO 158

Curva Normal que muestra los porcentajes de su rea total comprendidos entre diversos
mltiplos de la desviacin estndar.

En resumen, y usando una notacin matemtica:

x 1 D. E. Incluye aproximadamente el 68.27% del rea de la curva


x 2 D. E. Incluye aproximadamente el 95.45 % del rea de la curva
x 3 D. E. Incluye aproximadamente el 99.73 % del rea de la curva

Lo anterior es importante por dos razones principales. En primer lugar, porque ya sealamos que
los resultados dados por el azar siguen una curva normal punto que discutimos nuevamente en
prximo captulo- y en segundo lugar, porque se ha visto que casi todas las constantes fisiolgicas
de los individuos (peso, estatura, presin arterial, etc.). Y en general las diferentes caractersticas
de la poblacin, se distribuyen formando una curva normal.

Y se quiere decir que las propiedades de la curva normal pueden servirse a cualquier
caracterstica que tengan una distribucin normal y as por ejemplo, si la edad promedio de los
individuos es 30 aos y la D. E. = 3 aos, entonces:

Aproximadamente el 68% de los individuos tienen entre 27 y 33 aos ( x 1 D.E = 30 = 1 x 3 )


Aproximadamente el 95% de los individuos tienen entre 24 y 36 aos ( x 2 D.E = 30 = 2 x 3 )
Prcticamente todos los individuos tienen entre 21 y 39 aos ( x + 3 D.E = 30 = 3 x 3 ).
Si el promedio hubiera sido 30 aos, pero D. E. = 1 ao, entonces:

Aproximadamente el 68% de los individuos tienen de 29 a 31 aos.

Aproximadamente el 95% de los individuos tienen de 28 a 32 aos.

y prcticamente la totalidad tienen entre 27 y 33 aos.

A travs de los anteriores ejemplos puede verse como el promedio y la D. E. basta para resumir un
estudio. Debe advertirse sin embargo, que:
a. Cuando la serie es muy pequea como en el ejemplo de la pgina 155, las anteriores
propiedades de la D. E. son difciles de comprobar, y

b. Para que la interpretacin sea correcta se requiere que la caracterstica estudiada semeje una
curva normal, si tal similitud no existe, es preferible recurrir a la mediana y a los percentiles
para resumir la serie y conformarse con analizar esta mediante el uso de porcentajes.

16.9.6 Intervalo Intercuartilar

Antes de ensear a calcular el intervalo intercuartilar debe definirse que se entiende por percentiles
y cuartiles.

16.9.6.1 Percentiles y Cuartiles.

El trmino percentil deriva de por ciento, y por lo tanto una serie de observaciones no puede tener
ms de 100 percentiles. Cada percentil indica el porcentaje de observaciones que en cada serie
est por debajo de l. El 10 percentil es el valor por debajo del cual el 10% de las observaciones y
el 25 percentil es el valor por debajo del cual se encuentra el 25% de las observaciones.

Segn esto, la mediana es simplemente el 50 percentil, ya que debajo de ella se encuentra el 50%
de las observaciones, segn lo estudiado anteriormente.

Al 25 percentil suele drsele el nombre de primer cuartil, por debajo de este valor se encuentra el
25% de las observaciones, es decir la cuarta parte de estas. De la misma manera, al 75 percentil
se le da el nombre de tercer cuartil, pues por debajo de l, dan tres cuartas partes de las
observaciones.

16.9.6.2. Clculo del primer cuartil.

Para calcular el primer cuadril (Q1) se proceder de manera semejante como se hizo para el
clculo de la mediana, tomando el mismo ejemplo que sirvi para lograr el clculo (ver el cuadro
146) se proceder en la siguiente forma:

a. Buscar los lmites verdaderos de las clases.


b. Obtener la frecuencia acumulada de las observaciones.
c. Averiguar cul de las observaciones corresponde al primer cuartil, o sea:

N = 50 / 4 = 12.5

d. Como el primer cuartil est situado en la posicin 12.5 y como hay 12 observaciones por
debajo de 29,5 kilos, se necesita observacin + (12.5 - 12 = 0.5) de las que hay en la
siguiente clase. Como se ha asumido que las observaciones estn igualmente escapadas se
tomara 0.5/ 9 de la amplitud de la respectiva clase y se aadir a su punto de comienzo, con el
fin de obtener el valor del primer cuartil.

Q1 =29.5 + (0,5 x 5)/9 = 29.5 + 0.27 = 29.77kilos

16.9.6.3 Calculo Del Tercer Cuartil.

La observacin correspondiente al tercer cuartil (Q3) ser la:


3
3 3 = +
=

4 3
Linf: lmite real inferior
f a ant: frecuencia acumulada anterior
f: frecuencia modal
i: intervalo

Por lo tanto como hay 31 observaciones por debajo de 39.5 kilos se necesitan 6.5 observaciones
ms de las siete que hay en la prxima clase, o sea que debemos tomar 6.5 / 7 de la amplitud de
la clase y aadirlo a su comienzo para averiguar el valor del tercer cuartil:

Q3 = 39.5 + ( 6.5 x 5 ) / 7 = 39.5 + 4.64 = 44.14 kilos.

16.9.6.4 Intervalo Intercuartilar.

El intervalo intercuartilar es aquel comprendido entre el primero y el tercer cuartiles. Su utilidad


consiste en que dentro de los lmites determinados por l, se encuentra el 50% de las
observaciones centrales. Generalmente no afectadas por las fluctuaciones extremas de la serie.
El intervalo intercuartilar mide la dispersin de los valores de la serie, pues mientras ms prximos
sus lmites, mayor concentracin de las observaciones alrededor de la mediana.
Si los das de hospitalizacin de 2 grupos de pacientes es respectivamente:

Primer grupo Segundo grupo


Md = 10 Md = 10
Q1 = 9 Q1 = 3
Q3 = 11 Q3 = 18

A pesar de que la mediana es 10 para ambos grupos, se observa que en el primero el 50% de los
pacientes tienen valores muy prximos a ella y en cambio, en el segundo grupo, la dispersin es
muchsimo mayor.
Sin la informacin adicional suministrada por el clculo de los cuartiles Q1 y Q3, el resumen de la
serie quedara incompleto.
En ocasiones se calcula la llamada desviacin cuartana o cuartilar (Q), que es simplemente la
mitad del intervalo intercuartilar:
3
2 Q1

=
Si la serie es perfectamente simtrica, entonces: Md Q

Engloba el 50% de las observaciones.

Si por lo contrario la serie es muy asimtrica, y en tales casos la desviacin cuartana sugiere una
interrelacin errnea, razn por la cual, casi nunca se utiliza.

16.9.6.5 Percentiles en series pequeas.

Note que cuando el nmero de observaciones es muy pequeo, slo se pueden calcular ciertos
percentiles. Si hay 5 observaciones slo pueden calcularse: en realidad 5 percentiles; si hay 7,
podrn
En talescalcularse solocalcular
casos, para 7, etc. determinado percentil, se utiliza la frmula:

+1


100
Supngase por ejemplo, que se tienen las siguientes observaciones:

2, 3, 5, 9, 11, 15, 18
De acuerdo a la formula anterior:

a. El primer cuartil (25 percentil) ser:


7+1

25 = 2
100
b. Es decir, la observacin nmero 2 cuyo valor es 3.
c. La mediana (50 percentil) ser la observacin nmero 4 cuyo valor es 9.
7+1

50 = 4
100
d. El tercer cuartil (75 percentil) ser:
7+1

75 = 6
100
O sea la observacin nmero 6 cuyo valor es 15.
CAPITULO XVII

DATOS DE ASOCIACIN

Como se recordar, se llaman datos de asociacin a aquellos en los cuales los individuos se
clasifican simultneamente mediante dos escalas.

Las escalas utilizadas pueden ser:

1. Ambas cualitativas.
2. Una cualitativa y otra cuantitativa.
3. Ambas cuantitativas.

La presentacin y anlisis subsecuente de los datos depender de la divisin anterior:

17.1 Ambas Escalas Cualitativas.

17.1.1 Presentacin Tabular

Segn se ha visto, una escala ir en la vertical y otra en la horizontal. Por lo general, aquella con
ms subdivisiones se coloca en la vertical, salvo en los casos en que una de las escalas es
notoriamente ms importante que la otra y por lo tanto debe ocupar dicho lugar. Como son dos
escalas, el cuadro mostrar una fila y una columna de totales.

Con fines analticos, el cuadro suele llevar una o varias columnas con porcentajes o tasas, para
facilitar su interpretacin por lo general no conviene presentar cuadros exclusivamente con
porcentajes, en ocasiones puede hacerse, pero en tales casos, debe editarse el nmero de
observaciones sobre los que se basan dichos porcentajes, como se han hecho en los cuadros 165,
166, y 167.

Cuadro 164

Defunciones por Leucemias y Aleucemias por formas clnicas y sexo.


Venezuela, 1961

Formas clnicas Sexo Ambos sexos


Hombres Mujeres
Linfoide 15 11 26
Mieloide 14 15 29
Agudas 51 40 91
Otras 23 22 45
Total 103 88 191
Fuente: Anuario de Epidemiologa y Estadstica Vital. Venezuela, 1961.

7.1. 2 Presentacin Grfica.

La presentacin grfica de estos datos en cualquiera de las formas del diagrama de barras (ver
grfico 102 y 103).

17.1.3 Anlisis

El anlisis se hace mediante porcentajes, cuyo clculo variara de acuerdo al propsito del estudio.
Como un cuadro de asociacin tiene una fila y una columna de datos, como adems de un total
general, pueden, por consiguiente, calcularse porcentajes de 3 maneras diferentes lo cual
ilustraremos con los datos del cuadro anterior.
a. En relacin al gran total. De las 191 defunciones, 26 fueron por leucemia linfoide, o sea, el
13,7%:
126

100 = 13.7
191
El 53,9% de las defunciones fueron en hombres:
103

100 = 53.9 %
191 Cuadro 165

Defunciones por Leucemias y Aleucemias por formas clnicas y sexo.


Venezuela, 1961

Formas clnicas Sexo Ambos sexos


Hombres Mujeres (N = 191)
Linfoide 7.9 5.8 13.7
Mieloide 7.3 7.9 15.2
Agudas 26.7 20.9 47.6
Otras 12.0 11.5 23.5
Total 53.9 46.1 100.0
Fuente: datos del cuadro 164

b. En relacin a los totales de la ltima columna. De las 26 defunciones por leucemia linfoide 15
fueron en hombres, o sea el 57. 7 %:
15

100 = 57.7 %
26
y de las 29 por leucemia mieloide, 15, o sea el 51.7% ocurrieron en mujeres.
15

100 = 75.0 %
2 Cuadro 166

Defunciones por Leucemias y Aleucemias por formas clnicas y sexo.


Venezuela, 1961
(Porcentajes en relacin a los totales de la ltima columna)

Formas clnicas Sexo Ambos sexos


Hombres Mujeres (N = 191)
Linfoide (N = 26) 57.7 42.3 100.0
Mieloide (N = 29) 48.3 51.7 100.0
Agudas (N = 91) 56.0 44.0 100.0
Otras (N = 41) 51.1 48.8 100.0
Total (N = 191) 53.9 46.1 100.0

Fuente: datos del cuadro 164.

c. En relacin a los totales de la ltima fila. De las 103 defunciones en el sexo masculino, 15, o
sea el 14.6% fueron a causa de leucemia linfoide:
15

100 = 14.6 %
103aguda:
y 51, o sea el 49,5% fueron por leucemia
51

100 = 49.5 %
103 Cuadro 167

Defunciones por Leucemias y Aleucemias por formas clnicas y sexo.


Venezuela, 1961
(porcentajes en relacin a los totales de la ltima fila)

Sexo
Ambos sexos
Formas clnicas Hombres Mujeres (N = 191)
(N = 103) (N = 88)
Linfoide 14.6 12.5 13.7
Mieloide 13.6 17.0 15.2
Agudas 49.5 45.5 47.6
Otras 22.3 25.0 23.5
Total 100.0 100.0 100.0

Fuente: datos del cuadro 164

Lo anterior seala que hay que saber escoger los porcentajes que se usarn. Por regla general
puede decirse que los descritos en primer lugar no tienen mayor utilidad, pues en realidad
contribuyen muy poco a la mejor interpretacin del cuadro. En cambio, las otras dos clases son
igualmente tiles, pues la informacin dada por ellos es algo diferente.

En el ejemplo presentado, si el inters est en saber cul de las formas clnicas de la enfermedad
causa ms muertes en cada uno de los sexos, los porcentajes calculados sobre los totales de la
ltima fila son los ms convenientes (cuadro 167). Si por el contrario se desea averiguar cul de los
dos sexos es afectado en cada forma clnica entonces los porcentajes en relacin a los totales de
la ltima columna son los adecuados (cuadro 166).

Como un segundo ejemplo consideramos la informacin siguiente:

Cuadro 168

Casos, defunciones y tasas de letalidad en enfermos de neumona de acuerdo a tratamiento


recibido

Nmero de Numero de Nmero de Tasa de


Tratamiento
defunciones sobrevivientes casos letalidad por 100
Terramicina 4 96 100 4
Penicilina 6 54 60 10
Sulfadiazina 6 34 40 15
Total 16 184 200 8
Fuente: Datos hipotticos para ilustracin
En el ejemplo presente es evidente que el mejor anlisis consiste en comparar la letalidad habida
en los diferentes tratamientos tal como el caso en el cuadro el cual seala claramente que los
enfermos tratados con terramicina presentan la menos letalidad. As 4 veces menos cuando se
emplea sulfadiazina. Desde luego as hubiramos podido llegar a las mismas conclusiones aunque
no (4/16) a pesar que en el 50% de los casos estaba en dicho grupo (100/200) mientras solo el
20% de los casos recibi sulfadiazina (40/200) en dicho grupo se present el 37.5% de las
muertes (6/16)

17.2 Una escala cualitativa y otra cuantitativa

17.2.1 Presentacin tabular

Se hace en la misma forma que en el caso anterior, colocando de preferencia la escala cuantitativa
en la primera columna, salvo en el caso que la escala cualitativa tenga muchas subdivisiones
(vase cuadro 196)

17.2. 2 Presentacin grfica

Comnmente se utiliza el polgono de frecuencia o el diagrama semilogartmico. Cuando le


frecuencia o tasa no difiere grandemente un de otra, se usa de preferencia el primero pero si tales
diferencias son marcadas debe utilizarse el segundo (ver grfico 113 y 122)

Anlisis

Este tipo de datos puede analizarse mediante el clculo de constantes centrales y de dispersin, o
calculando, como en el caso anterior tasas y porcentajes.

Por lo general los datos que maneja el medico clnico y el experimentador se resume mejor usando
valores promdiales y de dispersin mientras que para el trabajador en salud pblica o el
demgrafo, el anlisis con tasas y porcentajes es ms til.

Lo anterior no quiere decir que datos susceptibles de un anlisis no puedan ser analizados por el
otro mtodo. La escogencia es cuestin de lo que se quiera poner ms de patente. De todas
maneras recurdese el siguiente principio: si no hay seguridad sobre que mtodo usar debe
utilizarse las tasas y los porcentajes

Cuadro 169

Peso a nacer de 180 nios segn el sexo

Peso en gramos hombres mujeres total


2000-2499 8 12 20
2500-2999 20 25 45
3000-3499 50 35 85
3500-3999 16 14 30
Total 94 86 180
Fuente datos hipotticos para ilustracin

En el cuadro anterior se calcula primero para los hombres y luego para las mujeres el promedio
estndar y la desviacin estndar respectiva podemos concluir que el promedio de al nacer de los
nios 3144gr mientras que para las nias es de 3047gr.

Sin embargo para un sanitarista, quizs es importante conocer que el 43% de las nias pesan
menos de 3kg (37/86), mientas que solo el 30% de los nios pesan menos de 30kg (28/94).
17.3 Ambas escalas cuantitativas

Entra en esta categora todos aquellos casos en los cuales a cada uno de los individuos estudiados
se le investiga dos medidas diferentes como ser cantidad de oxigeno inalado y CO2 exhalado,
contenido de oxgeno en la sangra arteria y venosa edad y estatura, etc.

17.3.1 Regresin y correlacin

El anlisis de cuadros presenta dos aspectos diferentes. Unas veces nuestros intereses esta en
conocer si las dos variables estn variadas y medir hasta qu punto los cambios en una pueden
explicares por los cambios en la otra. En tal caso tenemos el problema de correlacin y la unidad
de medida es el llamado coeficiente de correlacin (r).

Otras veces cuando estamos seguros que existe un alto grado de variacin entre 2 variables sea
porque lo conozcamos por experiencia o porque as los indique el coeficiente de correlacin
previamente calculado el anlisis se encamina a cuantificar la relacin existente con el fin de
predecir cules sern los valores de una variable, cuando se conocen los valores de la otra. En
este caso se trata de un coeficiente de regresin y la medida utilizada es el coeficiente de
regresin (b)

Como se ve la explicacin de un mtodo no excluye precisamente el otro. Al estudiar las


variaciones de cualquier caracterstica debemos averiguar cules son los factores que pueden
explicar dichas variaciones y una vez que lo hemos identificado podemos dedicarnos a medir en
qu grado los cambios que ellos experimentan a las caractersticas que nos interesa. (Problema de
regresin).

Supngase por ejemplo, que al estudiar la mortalidad por determinada enfermedad, se sospecha
que hay una serie de causas que actan sobre ella. Mediante tcnicas de correlacin precisaremos
cuales de esas causas estn ms ntimamente ligadas con la enfermedad y cuando ya han sido
identificadas, las tcnicas de regresin ayudaran a determinar hasta qu punto cada una de esta
causas es responsable por las variaciones observadas en la mortalidad.

Hay sin embargo, ciertas limitaciones en la escogencia de la tcnica ms apropiada para cada
caso. Muchas veces es muy fcil constatar que los valores de una escala estn determinados o
dependen de los valores de la otra. As por ejemplo la estatura de un nio " depende " de su edad y
la cantidad de oxgeno en la sangre venosa "depende" de la cantidad de oxgeno en la sangre
arterial. Hablemos entonces de una escala independiente (x) y dependiente (y), y es justamente en
tales casos cuando es correcto el ejemplo de las tcnicas de regresin.

Otras veces la anterior relacin no es cierta. NO puede decirse que ciertos valores determinen los
otros, si no que unos y otros varan conjuntamente. As por ejemplo, es frecuente observar que al
aumentar las pulsaciones, aumentan tambin las respiraciones, sin que por ello se pueda concluir
que el aumento de las pulsaciones dependen del aumento de las respiraciones o viceversa, en tal
caso no puede hablarse propiamente de un variable dependiente y otra independiente, sino de una
mutua relacin entre las dos. Las tcnicas de correlacin sern empleadas electivamente en tales
ocasiones

17.3.2 Presentacin tabular

Si los individuos son pocos bastara con especificar a lado de cada uno, los valores de las
observaciones hechas tal como puede verse al cuadro que acompaa al prximo grfico, pero si
son ms de 50 o 60 se agruparan en clases.
17.3.3 Presentacin grfica

Tratase de un problema de correlacin o de regresin, la presentacin se har mediante el


diagrama de puntos cuya elaboracin se discuti anteriormente cuando se trat de la presentacin
de los datos estadsticos, sin embargo, como dicha representacin ser base para el anlisis de los
datos, insistiremos sobre ello en los prrafos siguientes.

17.3.4 Coeficiente de regresin

En cualquier problema de regresin lo primero que se debe hacerse es un grfico. Los principios
generales para su elaboracin ya fueron estudiados y el nico detalle adicional que debe tenerse
presente es de los valores de la variable independiente, se acostumbra colocarlos
proporcionalmente en la abscisa, mientras que la ordenada se reserva a los valores de la variable
dependiente.

En el cuadro y grafico siguiente se presenta el peso y estatura de un grupo de alumnos


ligeramente modificado para facilitar los clculos.

Cuadro 172
Estatura y peso del curso de estadstica

ALUMNOS ESTATURA EN CENTMETROS PESO EN KILOS


1 162 58
2 158 54
3 155 56
4 162 60
5 170 68
6 160 61
7 175 70
8 165 60
9 168 64
10 165 69

La distribucin de los puntos del diagrama sugiere que la relacin entre las dos variables puede ser
resumida adecuadamente mediante una lnea recta tal como la trazada en el grfico. Claramente
se observa que tales puntos tienden a agruparse alrededor de la lnea y el peso aumenta
uniformemente cuando aumenta la esta uniformemente cuando aumenta la estatura

Grafico 173
Estatura y peso de un grupo de alumnos de metodologa estadstica

Peso

Estatura
Lgicamente, mientras ms tienda los puntos a caer sobre la lnea de regresin, ms estrecha es
la relacin entre las 2 variables y constatarse que si a cada aumento de 1 cm corresponder a un
aumento de 2 kg entonces todos los puntos se dispondran en una lnea recta.

Si por lo contrario no existiera ninguna asociacin entre las 2 variables, de tal manera que altos
pesos hubieran sido presentados distintamente por alumno distintos altos y bajos, los puntos
tenderan a alejarse considerablemente de la lnea, formando una especie de crculo o cuadrado.
En tal caso se concluira que no existe asociacin entre las 2 variables y con ello se terminara el
anlisis.

Si el fenmeno estudiado puede ser resumido por una lnea recta, como en nuestro ejemplo
podemos intentar resumir matemticamente dicha relacin, con lo cual nos ser posible predecir
los valores de la escala dependiente (Y) cuando se conoce los de la escala independiente (X).

La medida estadstica utilizada es el coeficiente de regresin (b) el cual indica q los valores en la
escala dependiente cambia b unidades por unidad que cambia los valores de la escala
independiente. En el mtodo presente al utilizar el ejemplo que luego estudiaremos, encontramos
que b = 0,80; lo cual quiere decir que por cada aumento de 1cm en la estatura se observa un
aumento de 0,80 Kg. de peso.

El coeficiente de regresin puede tener cualquier valor negativo. Si es positivo, significa que ambas
variables disminuyen o aumenta a la vez; si es negativo, quiere decir que cuando una variable
aumenta, la otra disminuye o viceversa; si fuere 0, tendramos que para cualquier valor de la
escala independiente habra siempre el mismo valor para la escala independiente, o que para cada
valor de la escala independiente pudiramos observar cualquier valor en la escala independiente
(ver grfico 1745).

17.3.4.1. Calculo del coeficiente de regresin.

Es fcil aunque las operaciones son muy laboriosas.

GRAFICO 175
Cuadro 176
Talla y peso de un grupo de alumnos del curso de Metodologa Estadstica
(Clculo del coeficiente de regresin)

Desviaciones Desviaciones Desviaciones Desviaciones Producto


Estatura
Peso ( Y) del promedio del promedio de X al de Y al de la
(X)
cuadrado cuadrado desviacin
dx dy dx2 dy2 (dx) (dy)
(2) (3) (5) (Y- Y )
2
(6) (X- X )
2
(7) (Y- Y )
2
(4) (X- X )
2 (8)
162 58 -2 -4 4 16 8
168 54 -6 -8 36 64 48
155 56 -9 -6 81 36 54
162 60 -2 -2 4 4 4
170 68 6 6 36 36 36
160 61 -4 -1 16 1 4
175 70 11 8 121 64 88
165 60 1 -2 1 4 -2
168 64 4 2 16 4 8
163 69 1 7 1 49 7
1640 620 0 0 316 278 255
Media 164 Media 62

255
b = = 0,80 kilos
316
Los pasos a seguir en el clculo del coeficiente de regresin se resumen a continuacin:

a. Disponer los datos como en el cuadro anterior.


b. Obtener el promedio para cada una de las variables en estudio.
c. Ver cunto difiere cada observacin de su promedio respectivo. Estas desviaciones se
obtendrn primero para una variable y luego para la otra y se anotarn respectivamente en las
columnas (4) y (5) del cuadro teniendo cuidado de indicar si son positivas o negativas.
d. Elevar al cuadrado las anteriores desviaciones, anotando los cuadrados en las
e. Columnas respectivas (6) y (7).
f. Totalizar las dos columnas de cuadrados.
g. Buscar el producto de las desviaciones obtenidas en el punto (3), para lo cual se multiplicara
rengln a rengln las columnas (4) y (5) conservando los signos algebraicos. Totalizar luego
estos productos.
h. Calcular el coeficiente de regresin, para lo cual se divide el total de la columna de productos
por el total de la columna dx2 (desviaciones cuadradas de los valores independiente)

dxdy =
255
= 0,80 kilos
dx 2 316

17 .3. 4 .2 La lnea de regresin.- La lnea recta trazada en el grafico 173 recibe el


Nombre de lnea de regresin. Ella representa una inclinacin de 0,8 kilos de peso por cada
centmetro de estatura.
Dicha lnea se puede utilizar para predecir el peso de cualquier individuo cuya estatura se conozca,
pero para ello, necesario poderla trazar con absoluta exactitud. La ecuacin general de esta lnea
es:

Y = ( Y b X ) + bX
En donde:

Y = valor de variable dependiente que se quiere conocer dado determinado valor de la variable
independiente.

Y y X = promedio de variables de estudio.


b = coeficiente de regresin.
X = valor de la variable independiente para el cual se quiere conocer el
correspondiente valor de la otra variable (Y)

Ejemplo: se quiere conocer el peso (Y) de un individuo que mide 180 centmetros de estatura (X).

Mediante el cuadro 176 sabemos que:

Y = 62
X = 164
b = 0,80 kilos
adems:

X = 180, ser de la estatura del individuo cuyo correspondiente peso (Y) queremos conocer.

Por lo tanto, reemplazando en la frmula anterior:

Y180 = 62 (0,80 x 164) + (0,80 x 180)

Y haciendo los clculos cuidando poner correctamente los signos algebraicos:

Y180 = 62 131,2 + 144,0 = 74,8 kilos

Es decir, el peso de un individuo de 180 centmetros puede estimarse en 74,8 kilos.

En la misma forma, si se quiere averiguar el peso de un individuo de 158 centmetros de estatura:

Y158 = 62 (0,80 x 164) + (0,80 x 158) = 57.2 kilos

3. 4. 3. Limitaciones en la utilizacin del coeficiente de regresin.

El clculo de b solo debe hacerse cuando el grfico correspondiente seala que la relacin
estudiada es lineal. Si no se llena esta condicin su clculo no tiene ningn significado.

Por lo dems, el coeficiente no puede aplicarse para predecir valores que excedan los lmites de la
serie en donde fue calculado.

As por ejemplo, es un hecho que la estatura depende de la edad, pero esto solo es cierto hasta el
final de la edad del crecimiento y ser absurdo averiguar cul sera la estatura de un hombre de 50
aos, utilizando el coeficiente de regresin.

Finalmente, tngase presente que b no es una medida de la intensidad de la asociacin que existe
entre dos variables. Si b es 800 en lugar de 0,80, esto no significa que en el primer caso la
asociacin sea 1000 veces mayor que en el segundo caso. El valor de b depende de las unidades
de medicin que se empleen y puede constatarse con los datos del cuadro 176, en donde b = 0,80
kilos que si hubiramos expresado el peso de los estudiantes en gramos, entonces b hubiera sido
igual a 800.
17. 3. 5. Coeficiente de correlacin

En un problema de correlacin no puede decirse que una variable sea independiente y otra
dependiente. Si a un grupo de individuos tomamos el nmero de pulsaciones y respiraciones, sera
igualmente valedero preguntarse qu cambios se producen en el nmero de pulsaciones al
aumentar las respiraciones o viceversa. Para resumir los datos habra que calcular dos coeficientes
de regresin: b que indicar los cambios en las respiraciones por cada pulsacin que aumenta y
b que indicar los cambios en el nmero de pulsaciones al variar las respiraciones.

Con el fin de reducir las dos constantes a una sola, se utiliza el coeficiente de correlacin r, que es
simplemente igual a la raz cuadrada del producto de los dos coeficientes de regresin
mencionados ( b y b). Por lo tanto:

r= b' xb''

3. 5. 1. Clculo del coeficiente de correlacin.

El clculo del coeficiente de correlacin se hace fcilmente con los datos de cuadro 176 para lo
cual se tomar los totales de las 3 ltimas columnas, pues siendo r = b' xb'' , si se considera
primero que la estatura, es la variable independiente, entonces, conforme ya se ha visto:

dxdy 255
b = 0,80 kilos
dx 2 316
y si se considera luego que el peso es la variable independiente, entonces se calcular b, para lo
cual solo variar el denominador del quebrado:

dxdy 255
b = 0,91centmetros
dy 2 278

y por lo tanto:


b' xb'' 255 x 255
r= 255 0,86
316 278 316x278

3. 5. 2. Valores de r.

El coeficiente de correlacin puede tener cualquier valor entre 1 y +1. Valores positivos indican
que las dos variables aumentan o disminuyen al tiempo: valores negativos significan que cuando
una variable aumenta, la otra disminuye o viceversa. (Vase grfico 181).

Si r es exactamente igual a 1 o +1, quiere decir que hay una perfecta asociacin entre las dos
variables, en el sentido de que por cada unidad que aumenta o disminuye una variable, la otra
cambia siempre igual nmero de unidades. En dichas ocasiones los puntos en el grfico caeran
todos sobre una lnea recta. Tal sera el caso si a cada aumento de una pulsacin correspondiera
siempre el mismo aumento en el nmero de respiraciones (esquema A) o si a cada aumento de
una pulsacin se observara siempre una misma disminucin en el nmero de respiraciones
(esquema B).

Si r = 0, significa que no hay ninguna asociacin entre las dos variables, o que de existir, no es
una relacin lineal. El grfico que entonces se obtendra sera semejante al del esquema C, lo cual
se observara, si para cada nmero de pulsaciones pudiera encontrarse cualquier nmero de
respiraciones.

Sin embargo, valores de r = 0 o iguales a la unidad, son ms bien tericos. En primer lugar aunque
no haya ninguna asociacin entre 2 caractersticas, las variaciones causadas por el azar suelen
dar una correlacin aparente. En segundo lugar, aun tratndose de correlaciones perfectas, no es
de esperar que r sea exactamente igual a 1, a causa de los errores que se cometa al hacer las
observaciones.

En la prctica pues, solo se observan valores intermedios entre 0 y 1 . Si las pulsaciones y las
respiraciones aumentaran o disminuyeran al mismo tiempo, pero sin que a cada aumento de una
pulsacin corresponda siempre el mismo aumento en las respiraciones, se obtendra un grfico
como el esquema D. Finalmente, si cuando las pulsaciones aumentan las respiraciones disminuyen
o viceversa, pero sin que haya la misma variacin en las respiraciones por cada unidad que
cambia las pulsaciones, entonces se observara algo como el esquema E.

Grfico 181
Diagrama de puntos que ilustran diferentes grados de correlacin

A: r = + 1 B: r = - 1

C: r = 0 D: r = 0.50

E: r = - 50
3. 5. 3. Interpretacin de r.

En el ejemplo que nos sirvi para el clculo del coeficiente de correlacin encontramos que r =
0,86. Este valor no debe interpretarse como se hace corrientemente, en el sentido de que el 86%
de las variaciones en el peso son causadas por las variaciones en la estatura.

Para una interpretacin, hay que obtener el Coeficiente de determinacin que es la forma ms
2 2 2
correcta debe tomarse r . En nuestro ejemplo r = (0,86) = 0,74, nos indica que un 74% de los
cambios en el peso se explican por las variaciones de la estatura. Si se hubiera encontrado que r =
2
0,71 y por lo tanto r = 0,50 se concluira que solo el 50% de los cambios observados en el peso
son explicables por las variaciones en la estatura, quedando todava un 50% de variacin no
atribuible a esta ltima variable. La anterior explicacin ayuda a comprender por qu coeficientes
de correlacin menores de 0,50 son por lo general difciles de interpretar, no debindose dar
demasiada importancia a tales hallazgos.

17. 3. 5. 4.Recomendaciones finales. Al interpretar las asociaciones entre dos variables, deben
tenerse en cuenta, finalmente, los siguientes principios:

1. Asociacin no es sinnimo de causalidad. El que una variable aumente o disminuya al mismo


tiempo que otra, no quiere decir que los cambios en una, son determinados por la otra. As por
ejemplo, en los ltimos aos la mortalidad por accidentes y la mortalidad por cncer pulmonar
han aumentado considerablemente s que pueda decirse que la una sea causa de la otra.
Evidentemente los asares de la vida moderna y otros muchos factores que han evolucionado
con el tiempo determinan tales ascensos.

2. Las asociaciones encontradas no deben aplicarse indebidamente a valores que excedan los
lmites de las series estudiadas. Ya dijimos que la estatura aumenta con la edad, pero eso solo
es vlido hasta el final de la edad del crecimiento y a nadie se le ocurrira predecir la estatura
de un adulto de 50 aos en base a la anterior asociacin.

3. El clculo de coeficiente de correlacin r slo se justifica cuando el grfico seala que la


asociacin estudiada puede ser convenientemente resumida por una lnea recta. En algunas
ocasiones el grfico seala claramente que tal asociacin no existe, pero si se calcular r podra
llegarse a obtener un valor equvoco a causa de la presencia de una valor aberrante como en
el caso esquematizado.
Grfico 183
Diagrama de puntos que muestra una falsa correlacin positiva

Por lo dems la relacin existente puede no ser lineal. En el esquema prximo r = 0 a pesar de
que existe una perfecta relacin curvilineal. En ocasiones como esta el clculo de la
correlacin es mucho ms difcil y al asesoramiento por un tcnico estadstico se hace
imprescindible.

4. La interpretacin del coeficiente de correlacin se har teniendo en cuenta el nmero de


individuos estudiados. En las secciones 7.4 y7.7 sealamos que al obtener muestras repetidas
de una poblacin los promedios de estas no siempre eran iguales.

a. Grfico 184
Perfecta correlacin curvilneal en donde r = 0
De la misma manera, si muestras repetidas se extraen de determinado universo y para cada una
se calcula el coeficiente de correlacin o el de regresin, dichos coeficientes, como sucede en el
promedio, pueden diferir del verdadero valor del universo en una cantidad ms o menos
apreciable. Sin embargo, mientras mayor sea el tamao de la muestra, menor variabilidad
presentarn dichos coeficientes y mayor ser su validez. Se ha visto por ejemplo que aun en
poblaciones en las cuales no existe ninguna asociacin (r = 0 por lo tanto) es posible encontrar
valores de r tan altos como 0,30 para muestras de 40 individuos, debido simplemente a accidentes
del muestreo. Esta es una nueva dificultad para la interpretacin del coeficiente de correlacin, la
cual debe tenerse siempre presente, para no dar mucha importancia a valores de r que se basen
en muestras muy pequeas.

b. Cuando se estudia un grupo grande de individuos es necesario agrupar los datos en un nmero
conveniente de clases, con el fin de facilitar las complicaciones, las cuales sin embargo siguen
siendo muy laboriosas y se prestan a mltiples equivocaciones cuando se carece de prctica. Si el
investigador no puede recurrir al asesoramiento de un tcnico estadstico es preferible analizar los
datos a la manera descrita anteriormente, pues el tiempo adicional consumido en tal anlisis,
queda compensado por errores de clculo que han podido evitarse. Si la realizacin de una
investigacin ha exigido meses de trabajo, unas cuantas horas destinadas a su anlisis estadstico
no representa una inversin intil.
CAPITULO XVIII

SERIES CRONOLGICAS

Las series cronolgicas son aquellas que estudian la variacin de un fenmeno a travs del
tiempo. El fenmeno estudiado puede referirse a: los casos o muertes de una enfermedad, al
ingreso per cpita de una colectividad, al nmero de estudiantes universitarios, etc.

El anlisis de una serie cronolgica puede tener por nico propsito, describir la marcha histrica
de un fenmeno. Sin embargo, habitualmente se persigue evaluar los cambios ocurridos por la
introduccin de alguna actividad particular o resumir la evolucin de un fenmeno con miras a
predecir su posible ocurrencia en el futuro.

Cualquiera sea el propsito, el anlisis de tales series es por lo general difcil, y aqu solo se
explicarn las tcnicas ms corrientes, no debindose olvidar, que la presentacin tabular y grfica
es paso previo indispensable para decidir sobre el anlisis.

18.1. Presentacin tabular.

Como ya se vio anteriormente, el cuadro que resume una serie cronolgica consta habitualmente
de dos columnas: la primera se destina a la escala del tiempo y la segunda a la inscripcin del
nmero de veces que acaeci el fenmeno estudiado.

Sin embargo, cuando se describen las variaciones de una poblacin, es conveniente colocar una
tercera columna de tasas, las cuales sealan la frecuencia con que se present el fenmeno por
cada 1.000, 10.000 o 100.000 habitantes, etc., con lo cual se facilitan grandemente las
comparaciones.

Cuadro 187
Tuberculosis. Mortalidad estimada y tasas por 100.000 habitantes.
Venezuela, 1956 1960

Ao Nmero estimado de defunciones Tasa x 100,000 hab.


1956 2843 45,0
1957 2835 43,0
1958 2459 36,2
1959 2275 32,3
1960 2111 29,5
Fuente: Anuario de Epidemiologa y Estadstica Vital. Venezuela. 1960.

18.2. Presentacin grfica.

Los grficos utilizados para la presentacin de las series cronolgicas ya fueron descritos
anteriormente, pudindose utilizar el papel aritmtico corriente o el semilogartmico. Se recordar,
que cuando el inters est en conocer los cambios absolutos en el periodo, debe preferirse la
escala aritmtica, pero si por el contrario se desea estudiar los cambios relativos de la serie, el
papel semilogartmico es preferible. En los estudios mdicos, por lo general el mayor inters se
encuentra en conocer los cambios absolutos ocurridos: en averiguar por ejemplo, cuntas vidas se
han salvado o cuntos casos de determinada enfermedad se han evitado, en tales ocasiones el
grfico en papel aritmtico debe por consiguiente ser utilizado.

18.3 Anlisis de las series cronolgicas.


Los fenmenos cambian de intensidad en las diversas pocas del ao (variaciones estacionales);
presentan alzas y bajas de unos aos a otros (ciclos anuales), y para largos periodos pueden
permanecer ms o menos estacionarios o manifestar una tendencia hacia el aumento o el
descenso (tendencia secular). Considrese por ejemplo el caso de Tosferina en Venezuela. A
partir de 1936 cuando se fund el Ministerio de Sanidad, la enfermedad ha venido en franco
retroceso gracias a las diversas medidas preventivas realizadas (tendencia secular hacia el
descenso). Sin embargo cada cuatro aos se observa un aumento en el nmero de casos pues los
nios que nacen en el periodo forman una poblacin de susceptibles que favorecen a la
propagacin de la enfermedad (ciclos anuales). Finalmente, puede constatarse que para cada ao,
la enfermedad tiene predominancia durante los meses de noviembre y diciembre, poca del ao en
la cual parece que las condiciones ambientales son propicias para la multiplicacin del bacilo
(variacin estacional).

Es a consecuencia de la ocurrencia conjunta de estos tres tipos de variacin, que el anlisis de las
series cronolgicas se dificulta. Mientras que el examen de las tendencias seculares solo es
factible cuando se hace abstraccin de las pequeas variaciones que ocurren cada ao, se
comprende fcilmente que los cambios anuales solo pueden interpretarse tomando en
consideracin las variaciones cclicas y seculares del fenmeno. Desconocer la anterior
interrelacin ha conducido frecuentemente a numerosos errores de interpretacin. Observe por
ejemplo el esquema siguiente, el cual representa una enfermedad con exacerbaciones cada 10
aos: 1940. 1950, 1960.

Si un investigador estudiara el decenio 1950-1959, llegara a l conclusin de que la enfermedad ha


descendido considerablemente, pero si otro investigador estudiara el decenio 1951-1960
concluira que la enfermedad se ha incrementado. Una simple ojeada al grafico mostrara que la
enfermedad continua estacionaria a pesar de lo asensos que aparecen cada 10 aos.

En cualquiera de los casos anteriores, el grafico de una serie cronolgica es muy importante, pues
de una simple mirada, podemos apreciar las variaciones habidas en lapso estudiado. Si se quiere
no obstante expresar la magnitud de las variaciones observadas, ser necesario recurrir a otros
mtodos, cuya escogencia depende de gran parte del aspecto que presenta los datos previamente
acentuados en el grfico.

Cuando el grafico muestra que la serie asciende o desciende en forma ms o menos lineal, el
anlisis es bastante sencillo y cualquiera de las tcnicas que a continuacin se describen pueden
ser utilizadas

GRAFICO 189
Enfermedades con ciclos epidmicos decenales
Si la serie presenta por el contrario muchas irregularidades o si el grafico muestra que su tendencia
es ms bien curvilnea, entonces el anlisis es mucho ms complicado. La suavizacin de los datos
mediante el mtodo de los promedios mviles descrito en la seccin 18.3.1.3. puede servir de
ayuda en la descripcin de estas series.

18.3.1. Lneas de Tendencia

Este mtodo consiste en buscar la lnea o curva que represente mejor los datos estudiados, en tal
forma, que sin tenerse en cuenta las fluctuaciones menores, se destaque la tendencia general a
travs de los aos.

Dicha lnea o curva viene a ser una lnea promedio y mediante ella puede leerse en la ordenada,
los valores que corresponden a las distintas fechas.

Aunque existen tcnicas matemticas especiales para encontrar la mejor lnea en cada caso,
debido a su complejidad, solo mostraremos mtodos aproximados ms sencillos.

18.3.1.1 Lnea de tendencia a mano libre. Una vez hecho el grafico con los datos
correspondientes, se traza a mano una lnea recta o curva, que aproxim lo ms fielmente los
hechos descritos, evitando prolongar el trazo ms all del periodo en cuestin.

Desde luego, que si prolonga la lnea un poco ms all del ltimo ao estudiado, se podr predecir
la intensidad del fenmeno en los aos futuros. Sin embargo, tales estimaciones asumen que el
fenmeno investigado varia en la misma forma que en el pasado, lo cual no siempre es verdadero,
y de ah que por lo general solo son correctas cuando se hacen por el inmediato futuro.

Por lo dems, el mtodo es solo aproximado, pues es difcil que dos personas distintas obtengan
los mismos resultados.

18.3.1.2. Lnea de tendencia usando semipromedios. Este mtodo solo debe utilizarse cuando
el grafico de los datos seala que ellos pueden ser representados por una lnea recta.

Con los datos del cuadro 187 se proceder de la forma siguiente:

a. L os datos del periodo que se estudia se divide en dos grupos iguales y en cada uno se obtendr el
promedio respectivo. Si el nmero de aos es impar como en el ejemplo presente , el ao de la
mita se incluir en ambos promedios

Aos Tasas
1956 45,0
1957 43,0

1958 36,2 .
1959 32,3 .
1960 29,5 .
.

Por lo tanto los semipromedios sern:

45.0 43.0 36.2 124.2


= = 41.4
3 3
36.2 32.3 29.5 98.0
= = 32.7
3 3

b. En el grafico previamente elaborado se asentaran los dos semipromedios obtenidos, mediante


dos pequeas cruces. Cada cruz debe ir en la mitad del espacio destinado para el periodo.
Puede verse en el grafico que sigue, que como el primer periodo se refiere a los aos 1956,
1957 y 1958, el promedio se inscribe al frente del ao 1957, que es el ao central.

Grfico 191
Mortalidad Estimada Por Tuberculosis, Venezuela, 1956 1960

Fuente: datos del cuadro 187

18.3.1.3. Lnea de tendencia con promedios mviles. Cuando las variaciones de las series son
muy irregulares es a veces difcil captar con la claridad la tendencia general del fenmeno que se
estudi. En tales ocasiones puede recurrirse a suavizar los datos mediante los promedios mviles.

Segn el nmero de trminos de la serie, puede calcular promedios mviles que incluyen 3,5 o
ms aos a la vez. En general, mientras mayor el nmero de aos que se incluyen en la obtencin
de los promedios, ms regular se hace la lnea de tendencia, pero en esos casos, ms probabilidad
hay de que se pierdan importantes situaciones de la serie que se estudia y de ah que el nmero
de los escogidos, no debe ser tan numeroso.

Para ilustrar la obtencin de estos promedios, tomaremos los casos de Lepra, conocidos en el rea
de Notificacin Organizada durante el periodo 1941-1960. Dicha rea comprende aquellas
regiones del pas en las cuales los servicios sanitarios estn bien organizados, en tal tema que los
datos sobre morbilidad y mortalidad se conocen de manera bastante exacta.
Cuadro 192
Lepra. Casos notificados por 100000habitantes. rea de notificacin organizada 1941 1960.
(Clculo de promedios mviles para 5 aos)

Aos Casos x 100.000 habitantes. Totales mviles Promedios Mviles


1941 8,3 - -
1942 8,9 - -
1943 11,3 47,2 9,4
1944 9,8 49,5 9,9
1945 8,9 50,8 10,2
1946 10,6 47,7 9,5
1947 10,2 46,8 9,4
1948 8,2 48,9 9,8
1949 8,9 50,6 1,1
1950 11,0 48,5 9,7
1951 12,3 48,5 9,7
1952 8,1 47,3 9,5
1953 8,2 41,4 8,3
1954 7,7 34,1 6,8
1955 5,1 30,2 6,0
1956 5,0 26,9 5,4
1957 4,2 26,5 5,3
1958 4,9 26,7 5,3
1959 7,3 - -
Fuente. Anuario de Epidemiologa y estadstica Vital Venezuela 1960

Los datos del cuadro anterior pueden suavizarse calculando promedios mviles de 5 en 5 aos.
Para ello:

a. Se sumaran las tasas de los 5 primeros aos disponibles y esta cifra, la cual representa el total
para el primer quinquenio, se colocara frente al ao intermedio (1943).

b. Los totales sucesivos se obtendrn excluyendo del total precedente el primer ao del
quinquenio y aadindole el siguiente ao (1941 a 1945). (1942 a 1946) (1943 a 1947), etc.

c. Se obtendrn los promedios mviles dividiendo por 5 cada una de las cifras de la columna
anterior.

d. Una vez obtenidos estos promedios, se inscribirn en el mismo grafico en el cual se hayan
inscrito los datos originales.
Grfico 193

Lepra; tasas observadas y promedios mviles, 1941-1960

Fuente: Datos de cuadro 192

Se observa en la serie anterior que no ha podido calcularse un promedio mvil para los 2 primeros
y los 2 ltimos aos, pues ellos se basan en datos que no figuran en el cuadro. Si los promedios
hubieran sido para tres aos, en tal caso no se hubiera podido calcular el promedio para el primer
ao y para el ltimo de la serie.

A pesar del uso frecuente de los promedios mviles, ellos pueden ocultar oscilaciones importantes
de la serie o dar origen a dar irregularidades ficticias. Puede observarse en la serie anterior que en
los aos en los cuales las tasas fueron elevadas, se hacen menos aparentes, pero el ascenso se
manifiesta dos aos antes y termina dos aos despus.

18.3.2 Variacin promedio anual

Consiste en averiguar mediante una simple resta, cual ha sido el aumento o el descenso absoluto
observado en el periodo y dividir por el nmero de aos correspondientes, con el fin de obtener la
variacin promedia anual.

En el ejemplo del cuadro 187, como la enfermedad descendi de 45.0 en 1956 a 29.5 en 1960 o
sea un descenso de 15.5 al dividir por 4 (1960 1956= 4), obtendremos que la tasa disminuyo 3.9
cada ao. Observe que hemos dividido por 4 y no por 5, pues en el periodo solo hay en realidad 4
descensos anuales y no 5.

Conviene insistir en dos observaciones finales: a) el mtodo slo debe utilizarse cuando la
representacin grfica de los datos sigue ms o menos una lnea recta; b) proyecciones futuras
solo deben hacerse para aos inmediatos. Observe que de acuerdo a nuestros datos, puede
estimarse que la tasa para 1961 ser 25.6 (29.5 en 1960 3.9 = 25.6) pero si la proyeccin fuera
para 1970 se obtendran un valor negativo (29.5 10 x 3.9 =-9. 5.

18.3.3 Ascenso y descenso porcentual


Para obtener el ascenso o descenso porcentual para el perodo se buscara la diferencia existente
entre los datos para el ao inicial y los del ao terminal del periodo y se dividir por la frecuencia
correspondiente al ao inicial. El resultado se multiplicara por 100 para expresarlo en forma de
porcentaje.
En los da tos anteriores se ve que el cambio porcentual para el perodo fue de:

Se observara que en este clculo, al igual que en el mtodo anterior, slo se toman en cuenta los
valores del primero y del ltimo ao y el resultado siempre ser igual cualesquiera que sean las
cifras intermedias. De ah que el mtodo solo debe usarse, cuando los datos ascienden o
descienden siguiendo una lnea recta.

18.3.4. Lnea de regresin en series cronolgicas

Cuando la serie estudiada puede resumirse adecuadamente por una lnea recta, como en los datos
del cuadro 187, las tcnicas de regresin son aplicables.

El clculo del coeficiente de regresin da una mejor estimacin del cambio anual que experimenta
el fenmeno que se estudia, pues toma en cuenta todos los valores de la serie, y no solamente los
valores inicial y terminal. Los clculos son idnticos a los aprendidos en el captulo XVII, pero
reemplazados los aos 1956, 1957, etc. por 1, 2, 3, etc.

41.7
b= = - 4.17
10
Lo cual indica que en promedio, la tasa desciende en 4.17 cada ao.

La ecuacin de la lnea segn se ha estudiado, ser:


Y= Y- bX + bX = 37.2 (- 4.17 x 3)+ (-4.17X) = 49.7 4.17 X

Si se desea saber cul ser la tasa a esperar en 1961 (sexto ao de la serie); bastara reemplazar
por 6, la incgnita de la frmula anterior:

Y1961= 49.7 (4.17 x 6)=49.7 25.0 = 24.7


CAPITULO XIX

MEDICIN DEL ERROR POR MUESTREO:


ERROR ESTNDAR Y SUS APLICACIONES

19.1. Introduccin.

Al resumir los resultados de un estudio mediante, cualquiera de las medidas estadsticas acabadas
de ver (promedios, porcentajes, etc.), hay que tener en cuenta que tales constante pueden
adolecer de los mismos defectos que presentan las mediciones individuales.

Los errores debidos al observador, al objeto observado mtodo de observacin, pueden algunas
veces desaparecer al utilizar una medida de resumen o hacer al contrario ms aparentes.

Un observador a causa de su impericia o fatiga puede registrar como negativos exmenes que en
realidad son positivos. Una tcnica defectuosa, la prdida de potencia de los reactivos utilizados o
la observacin de los individuos bajo condiciones desfavorables, pueden conducir a cometer el
mismo error .En tales casos, al resumir los resultados encontrados, el nmero de reacciones
positivas ser mucho menor de lo que en realidad es a causa de que se ha cometido un error
sistemtico en una misma direccin.

Otras veces, los errores que se cometen no se hacen siempre en una misma direccin. Al tomar el
metabolismo basal de un grupo de individuos , unas veces se peca por exceso y otras por defecto
y en tales casos ,al resumir los resultados mediante un promedio por ejemplo, los errores en ms o
menos, tienden a compensarse y el promedio as calculado representara el verdadero valor o un
valor muy cercano al que quiere conocerse.

En realidad no existe ningn mtodo estadstico que permita valorar exactamente los anteriores
errores una vez cometidos. Una perfecta preparacin de los observadores, un control adecuado de
las tcnicas y aparatos utilizados en las observaciones y la estandarizacin de un mtodo que
permita estudiar a todos los individuos en las mejores condiciones sern imprescindibles para
reducir a un mnimo tales errores.

19.2 Error por muestreo

Existe sin embargo otro tipo de error susceptible de controlarse estadsticamente. Conforme hemos
mencionado previamente por lo general resulta imposible estudiar la totalidad de la poblacin en la
cual puede observarse determinado fenmeno, teniendo que limitarnos al estudio de una muestra
de dicha poblacin. Pero de la misma manera que los individuos difieren unos de otros, las
diferentes muestras formadas con ellos diferirn tambin unas de otras, dando origen nuevamente
a una nueva fuente de error. Ese error el cual se debe simplemente al hecho de que no estamos
estudiando la totalidad del universo solo una porcin de l, se conoce con el nombre de Error por
Muestreo y el representante en realidad la diferencia que hay entre el valor dado por la muestra y
el verdadero valor del universo que tratamos de averiguar a travs del estudio de aquel.

19.2.1 Medicin del error por muestreo: Error Estndar.

La constante estadstica que permite la medicin del error por muestreo recibe el nombre de error
estndar.
Desde luego que cada una de las medidas de resumen conocidas tendr su correspondiente error
estndar. Podr hablarse por consiguiente del error estndar del promedio, del error estndar de
un porcentaje o del error estndar de coeficiente de correlacin, etc. y las frmulas utilizadas para
su clculo varan en cada caso.
19.2.2 Origen del Error estndar.

Aunque es difcil explicar sucintamente el origen del error estndar los resultados de la
demostracin prctica comentados en la seccin 7.7 y ayudaran a su comprensin. Segn se vio
entonces si de una poblacin determinada se obtiene un nmero grande de muestras del mismo
tamao en cada una se calcula el promedio, estos promedios se distribuirn alrededor del
verdadero valor del universo formando una curva normal.

Por consiguiente como los promedios del conjunto de muestras extradas de determinado universo
se distribuye alrededor del verdadero valor del universo formando una curva normal, puede
afirmarse: que ninguna muestra diferir del valor del universo en ms de tres veces la desviacin
estndar, pues ya se sabe que entre X 3D.E. se encuentra prcticamente el 100% del rea de
la curva.

Ahora bien, si con el fin de averiguar el verdadero valor del promedio de determinado universo, se
obtiene una muestra y se calcula su promedio, esto no ser exactamente igual al del universo, pero
si conociramos la desviacin estndar de un conjunto de muestras extradas de dicho universo
bastara tomar X 3D.E. para determinar los limites dentro de los cuales se encuentra el
promedio del universo que se quiere conocer.

Sin embrago, para calcular este desviacin estndar habra necesidad de obtener, digamos 100 o
200 muestras diferentes, lo cual es imprctico, pues en la investigacin real se extraen solamente
una muestra y a partir de ella, se tratara de conocer la poblacin de donde procede.
No obstante, se ha demostrado que la desviacin estndar de un conjunto de muestras obtenidas
de determinada poblacin, puede estimarse con bastante exactitud a partir de una sola muestra.

Esta constante estadstica, mediante la cual se estima la verdadera desviacin estndar de un


conjunto de muestras, que recibe el nombre de Error estndar.

Con el fin de contestar que tan bien el error estndar puede estimar la desviacin estndar de un
conjunto de muestras, volveremos nuevamente a los resultados de la demostracin de la seccin
7.7 en dichas demostraciones como se recordara tenamos un universo de metras en el cual el
50% eran blancas y de l extrajeron 150 muestras de 10 metras cada una. El resultado es obtenido
entonces los que se copian en el siguiente cuadro, en el cual se han aadido las dos ltimas
columnas para el clculo del promedio y la desviacin estndar.

El promedio y la desviacin estndar calculados por los mtodos estudiados por el captulo XVI
son respectivamente (vase cuadro 200)

7420 407000
X = = 49.5% D.E = (49.5) 2
= 16.3%
150 150
CUADRO 200

Distribucin de 150 muestras de 10 metras cada una, de acuerdo al porcentaje de metras


blancas obtenidas
(Clculo del promedio y la Desviacin Estndar)

Porcentaje de N de muestras
metras blancas observadas FX FX2

0 0 0 0
10 3 30 300
20 6 120 2.400
30 0 600 18.000
40 30 1.200 48.000
50 36 1.800 90.000
60

Calculemos ahora el error estndar de esta serie, para apreciar si l realmente estima la desviacin
estndar acabada de obtener. La frmula para calcular el error estndar de un porcentaje, que
ser estudiada con ms detalle en la seccin 19.4.2., es la siguiente:

. =
en donde:

p = porcentaje de metras blancas en el universo (50% en nuestro ejemplo).


q = porcentaje de metras no blancas = 100 - p = 50%
n = tamao de la muestra (10 en nuestro ejemplo).

Reemplazando en la frmula los anteriores valores:

50
50
. = = 250 = 15.8 %
10
Puede apreciarse que este valor estima con bastante exactitud la desviacin, estndar calculada
anteriormente, que fue 15.8%.

19.2.3. Desviacin Estndar y Error Estndar.

Antes de seguir adelante, conviene tener en cuenta la diferencia que hay entre la desviacin
estndar y el error estndar.

La desviacin estndar, como hemos sealado, sirve para indicar la variacin que presentan los
individuos de una muestra, alrededor de su promedio.

El error estndar por su parte, mide la variacin de un conjunto de muestras y puede considerarse,
por lo tanto, como la desviacin estndar de un conjunto de muestras.
Por lo tanto, si queremos describir la manera como se distribuyen alrededor del promedio los
individuos de la muestra que estamos estudiando, debemos calcular la desviacin estndar, pero si
lo que deseamos es saber cmo se distribuyen los promedios de diferentes muestras alrededor del
verdadero valor del universo, entonces debemos calcular el error estndar.

19.2.4. Interpretacin del Error Estndar.

Como este error no es otra cosa que la desviacin estndar de un conjunto de muestras, los
conceptos estudiados a propsito de esta son tambin aplicables a l y por lo tanto, podemos
afirmar que:
= 1 incluye aproximadamente el 68% de las observaciones.

= 2 incluye aproximadamente el 95% de las observaciones.

AREAS DE LA CURVA NORMAL

Diferencia E.E: Diferencia observada, expresadas en unidades de curve normal. Esta columna
tambin se refiere al intervalo comprendido entre el promedio y determinada mltiplo de la D.E.
P: Probabilidad de acuerdo a la curva normal, de encontrar una diferencia igual o mayor de la
observada o proporcin de los individuos estudiados que se encuentran fuera de los limites
comprendidos entre el promedio ms sanos al mltiplo de la D.E indicado en la columna anterior.

IP: Probabilidad de acuerdo a la curva normal, de encontrar una diferencia menor que la observada
o proporcin de los individuos estudiados que se encuentran entre los limites comprendidos entre
el promedio ms sanos mltiplo de la D.E.

X 3 E.E. incluye aproximadamente el 100% de las observaciones.


Lo anterior puede expresarse en otra forma, quizs no correcta desde el punto de vista matemtico
puro, pero fcil de comprender para quienes poseen escasos conocimientos matemticos. En vez
de decir que entre el promedio del universo ms o menos dos veces su error estndar se
encuentra el 95% de los promedios de las muestras que de l puedan obtenerse, podra decirse
que solo el 5% de las muestras extradas de determinado universo, diferirn de l en ms de dos
veces el error estndar o lo que es lo mismo, si afirmamos que el verdadero promedio del universo
se encuentra comprendido entre el promedio de la muestra ms o menos dos veces su error
estndar, tendremos la seguridad de estar en lo cierto en un 95% de las veces.

(Recurdese nota de la pgina 157).

De la misma manera, al afirmar que el promedio del universo se encuentra comprendido entre el
promedio de la muestra ms o menos 3 veces su error estndar, tendremos la seguridad de estar
en lo cierto, prcticamente en un 100 de los casos.

19.3. Certeza absoluta. Certeza relativa.

La explicacin anterior parecera indicar que al hacer afirmaciones como las ilustradas, debiera
buscarse siempre una certeza del 100%, usando el promedio ms o menos 3 veces el error
estndar. Sin embargo, las siguientes explicaciones permitirn comprender por qu esto no es
siempre posible.

Cuando afirmamos un hecho, se tiene una de las siguientes posibilidades:

afirmar que es cierto, algo que en realidad es cierto.


afirmar que es falso, algo que en realidad es falso.
afirmar que es verdadero, algo que es falso.
afirmar que es falso, algo que es verdadero.

Reconocer que es cierto o falso, algo que en realidad lo es, constituye la meta de todo
investigador, buscndose evitar los errores envueltos en las 2 ltimas afirmaciones. Sucede sin
embargo, que en estadstica, mientras ms procuramos no cometer el primer error, mayores
probabilidades tenemos de cometer el segundo.

En el esquema siguiente se representan dos universos, uno de sanos y otro de enfermos. Si se


toman 3 errores estndar a cada lado, se tendra la seguridad que ningn individuo enfermos
dejara de reconocer como tal, pero al mismo tiempo algunos sanos se estn incluyendo como
enfermos (falsos positivos), ahora estamos decidiendo que es cierto algo que en realidad es falso.

Si no queremos cometer el anterior error, podemos tomar 2 lados estndar en lugar de 3 y


entonces ningn individuo sano se incluir como enfermo, pero en tal caso, algunos individuos
realmente se dejaran de reconocer como tales (falsos negativos), es estamos reconociendo como
falso algo que es realmente verdadero.
Grfico 204
Lustracin de los errores que pueden cometerse en la comparacin de 2 muestras

Puede observarse que mientras ms procuramos no cometer el primer error, ms caemos en el


segundo y viceversa. Por lo tanto, aspiramos a tener un 68%, un 95% o un 100% de certeza en
nuestras afirmaciones, depende del problema de que se trate.

El siguiente ejemplo servir para aclarar este punto.

Imaginemos un nuevo tratamiento sobre el cual se tienen favorables indicios en cuanto a su


efectividad, pero cuya aplicacin presenta cierta peligrosidad. Si el tratamiento es para una
enfermedad relativamente benigna, como la difteria, descaremos tener una certeza as absoluta de
que es efectivo, pues existiendo otros medios teraputicos para la enfermedad, no correremos el
riesgo de recomendar una su aplicacin.

19.4. Clculo del error estndar.

Se ha sealado que cada una de las medidas de resumen tiene su correspondiente error estndar.
A continuacin se sealan las frmulas utilizadas para calcular el error estndar de un promedio y
el de un porcentaje. Otras frmulas se explicarn a medida que sea necesario.

19.4.1. Error Estndar de un promedio (Error tpico).


.
. =


En su clculo se seguirn los siguientes pasos:

1. Calcular el promedio de la serie.


2. Calcular la D.E. por el mtodo conocido.
3. Dividir la D.E. por la raz cuadrada del nmero de observaciones incluidas en la muestra. El
valor as obtenido es el error estndar del promedio.

19.4.2. Error Estndar de un Porcentaje.

. =
En esta frmula:
p: es el porcentaje de personas que poseen determinadas caractersticas, y,
q: el porcentaje de personas que no la poseen.
Si en un grupo de personas que se estudian, el 25% son hombres.
P = 25% y
q = 75%

Por lo tanto, conociendo p se conocer el valor de q, pues

q = 100 - p

19.5 Utilizacin del error estndar.

El error estndar se utiliza para 3 fines principales:

1. Para conocer dentro de que lmites se encuentra el verdadero valor del universo.
2. Para estimar el tamao que debe tener una muestra para lograr determinada precisin.
3. Para saber si una muestra procede o no de determinado universo.

Las dos primeras de estas aplicaciones se estudiarn a continuacin y en cuanto a la tercera, ser
vista a propsito de los estudios comparativos.

19.6. Estimacin de valor del universo.

Aunque el investigador toma una muestra con el fin de inferir partir de ella el verdadero valor de la
totalidad del universo, los resultados arrojados por la muestra no corresponden exactamente a los
del universo. Si con el fin de calcular la estatura promedio de alumnos de la Universidad,
estudiamos un grupo de 400 jvenes encontramos que el promedio es 160 centmetros, esta cifra
no representa exactamente el verdadero valor para todos los universitarios, aunque s es una cifra
muy aproximada.

Pero, qu tan aproximada es esa estimacin? El clculo del error estndar, nos permitir dar
contestacin a esta pregunta.

De acuerdo a la investigacin que se haya realizado, se presentan los casos diferentes:

1. Estimar el promedio del universo.


2. Estimar el porcentaje del universo.

El procedimiento general es el mismo, pero el clculo del error estndar se har utilizando las
correspondientes frmulas vistas anteriormente.

19.6.1. Estimacin del verdadero promedio del Universo.

Ejemplo: Con el fin de conocer la edad promedio de los 20.000 estudiantes de la Universidad
Central, se estudi una muestra de 400 alumnos, encontrndose que su promedio fue 23 aos y la
desviacin estndar 2 aos.

En base al resultado de esta muestra, se desea saber dentro de que lmites se encuentra el
verdadero promedio de los 20.000 estudiantes. Se desea poder hacer tal afirmacin con un 95%
de certeza.

Procedimiento: El error estndar de la muestra (seccin 19.4.1.) ser:


. 2 2
. = = = = 0,10

400 20
Como al tomar 2 E.E. a uno y otro lado del promedio tendremos una certeza del 95%, entonces:

X 2 E.E. = 23 2 x 0,10 = 23 0.2


es decir, que el promedio verdadero de la edad de los universitarios estara entre 22,8 aos y 23,2
aos.

Si los lmites anteriores parecieran muy amplios, es decir, si se quisiera lograr mayor exactitud en
los resultados, sera necesario aumentar el tamao de la muestra, pues como seala la frmula,
mientras mayor el nmero de individuos estudiados, mayor el denominador del quebrado y menor
por consiguiente el error estndar.

As por ejemplo, si en vez de 400 estudiantes se hubieran estudiado 1.600 y se hubiera encontrado
el mismo promedio y la misma desviacin estndar, entonces el error estndar sera:
2 2
. = = = 0,20

1600 40
y los lmites dentro de los cuales estara la edad promedio de los 20.000 universitarios sera:

23 2 x 0.05 = 23 0,1
es decir, entre 22,9 y 23, 1 aos.

19.6.2 Estimacin del verdadero porcentaje del universo.

Ejemplo: Con el fin de conocer el porcentaje de personas vacunadas contra la viruela, en una
poblacin de 20 000 habitantes se estudi una muestra de 400 personas, de las cuales 300
estaban vacunadas, es decir, un 75%.

En base al resultado anterior se desea saber dentro de que lmites se encuentra el verdadero
porcentaje de vacunados en la poblacin. Se desea hacer tal estimacin con un 95% de certeza.

Procedimiento: El error estndar de la muestra se calcula mediante la frmula:

pq
E.E. =
n
en donde

p porcentaje de personas vacunadas en la muestra (75%) y


q porcentaje de personas no vacunadas, o sea, 100 75 = 25%

75 * 25
(E. E.) = = 4.69 = 2.16
400

Como al tomar 2 errores estndar tenemos una certeza del 95%, podemos afirmar que el
verdadero porcentaje de vacunados, estar entre:
75% 2 (2.16) = 75 4.3, es decir, entre el 70.7 % y 79.3%
Lo mismo que en el caso anterior si estos lmites parecen muy amplios y se desea mayor precisin,
podr lograrse aumentando el tamao de la muestra.

As por ejemplo, si hubiera estudiado 1600 personas en vez de las 400 estudiadas y asumiendo
que si hubiera obtenido el mismo 75% de vacunados el E.E sera:

75x25
= 1.17 = 1.08
1600

y los lmites estaran entre:

75 2 (1.08) = 75 2.2, es decir, entre 72.8% y 77.2%.

19.7 Tamao de la muestra (n).

Algo que inquieta frecuentemente al investigador, es el tamao de la muestra que debe utilizar.
Esta preocupacin es obvia, pues si la muestra es demasiado pequea los resultados pueden
carecer de validez y si es demasiado grande, quizs represente al gasto de energas y recursos. El
tamao de la muestra depende principalmente, de los siguientes factores:

1. Variabilidad del universo que se estudia, pues mientras ms variable sea este, mayor ha de ser
el tamao de la muestra.
2. Precisin que se quiere en los resultados, es decir, magnitud del error que podemos tolerar. Se
comprende que para afirmar el promedio del peso de un grupo de individuos est entre 40 y 60
kilos, se necesitar una muestra mucho ms pequea que si quisiramos afirmar, que dicho
promedio est entre 50 y 51 kilos.
3. Margen de certeza que se desea obtener (95% o 99%), pues para determinada precisin
mientras mayor sea la certeza que se busca, mayor debe ser el tamao de la muestra.

4. Como la precisin a que se aspire y la certeza que se desee, dependen del problema que se
estudie, podemos sealar que el tamao de la muestra depender en parte de la aplicacin
que se va a dar a los resultados que se obtengan (ver 19.3). Para fijar el tamao de la muestra
debemos en primer lugar decidir sobre el margen de certeza que deseamos y sobre la
precisin que aspiramos en nuestros resultados. Luego, suponiendo por ejemplo, que
deseemos un 95% de certeza, mediante la igualdad: precisin deseada = 2 E.E., nos ser fcil
despejar n. Como se ilustra en los siguientes prrafos en los cuales se estudia separadamente
el caso de los promedios y de los porcentajes.

19.7.1 Tamao de la muestra en la estimacin de un promedio.

Ejemplo: para conocer el promedio de peso de un grupo de escolares, se desea tomar una
muestra, en tal forma que el promedio estimado no difiere ms de kilo del verdadero valor del
universo, y que se pueda afirmar con un 95% de certeza que dicho resultado es correcto.

Como se quiere tener un 95% de certeza, hay que tomar 2 errores estndar, pues ya sabemos que
el 95% de las observaciones se encuentran en el intervalo determinado por:

x 2 E.E.

Esto quiere decir que el promedio de la muestra no debe diferir en ms de 2 E.E, del promedio
verdadero del universo, o sea que si P es la precisin deseada o mximo error que podemos
tolerar, entonces podemos escribir:
P = 2 E.E
D.E
Y como ya sabemos que el error estndar del promedio es igual a: , reemplazando en la
n
igualdad anterior tendremos:

D.E
P=2
n

y por simple despeje algebraico encontramos que el tamao de la muestra ser:

2D.E 2
n=( ) ( )
P

Antes que debamos responder cul debe ser el nmero de individuos que hay necesidad de
estudiar, es necesario conocer el valor de la Desviacin Estndar. Es lgico que este valor solo
puede conocerse una vez que se haya hecho la investigacin, pero un valor aproximado puede
obtenerse consultando la opinin de algn experto, o basndose en un estudio previo o recurriendo
a una encuesta piloto.

Generalmente un conocimiento de la poblacin que vamos a estudiar nos permite predecir la


variacin que se encontrar. As por ejemplo podemos decir casi con seguridad sin que ello sea
difcil- que el peso de los escolares presentar variaciones entre 30 y 48 kilos.

Ahora bien, como la desviacin estndar es aproximadamente 1/6 de la amplitud total de la serie
(pues X 3D.E incluye la totalidad de la curva) podemos estimar, en el ejemplo dado, que:
48 30
D.E. = = 3
6
Si admitimos que para nuestro ejemplo presente D.E. = 3, entonces, con el fin de no cometer una
equivocacin mayor de kilo (P = 0.50), el tamao de la muestra sera:
2D.E. 2 2X 3 2
n=( ) = ( ) = 144
P 0,5

Es decir, que nuestra muestra de constar aproximadamente de 150 individuos.

19.7.2 Tamao de la muestra en la estimacin de un porcentaje.

Ejemplo: Se desea conocer con un 95% de certeza y sin cometer un error mayor de 3%, el
porcentaje de mujeres que hay en la Universidad.
Como se quiere tener un 95% de certeza hay que tomar 2 E.E. y por lo tanto; P, la precisin
deseada sera:

P = 2 E.E.
y como se sabe que el error estndar de un porcentaje es igual a 2 pq /n reemplazando en la
equivalencia anterior:

Como X = 2.58 cubre el 99% de las observaciones, si se quisiera una certeza del 99% la frmula quedara:
2.58D.E
n =( )2
p
P=2 pq /n

de donde, finalmente, se deduce que el tamao de la muestra ser:

4 pq
n = P2 ( )

De nuevo hay necesidad de tener un valor aproximado de p, es decir, conocer aproximadamente el


porcentaje de mujeres en la Universidad.

Este valor no necesita que sea muy preciso, pues note como p + q = 100, el producto de p x q es
ms o menos igual, si p vara dentro de los lmites prudenciales:

Si p = 40 entonces 40 x 60 = 2.400
Si p = 50 entonces 50 x 50 = 2.500
Si p = 60 entonces 60 x 40 = 2.400

Si en el ejemplo presente suponemos que alrededor del 20% de los estudiantes son mujeres (p =
20%), el nmero de individuos que debera tener la muestra con el fin de no cometer un error
mayor del 3% (P = 3%) sera, de acuerdo a la frmula anterior:

4 pq 420 X 80 710
n= = =
2
P2 P(3) (3)2

De la misma manera, si se supone que alrededor del 30% de los estudiantes son mujeres (p =
30%) y se quiere no cometer un error mayor del 5% (P = 5%), el tamao sera:

4 pq 4(30 X 70)
n= = = 336
P 2 (5)2

Desde luego, no es indispensable examinar exactamente 336 alumnos, ya que de acuerdo al p


que encontraremos al tomar la muestra, el nmero anterior puede variar.

La frmula slo nos da un dato aproximado, pero de todos modos, tal dato es mucho ms til que
si se tomar arbitrariamente determinado nmero de individuos.

Si se deseara una certeza del 99% la frmula quedara:


6,6 pq
n=
P2
en donde 6,6 es el cuadrado de 2,58 ya que como se recordar, el intervalo X = 2,58 E.E. cubre el 99%
de las observaciones.
CAPITULO XX

ANALISIS DE LA INFORMACION:

LOS ESTUDIOS COMPARATIVOS

20.1 Generalidades.

Ya mencionamos anteriormente que la finalidad de los estudios comparativos es averiguar si


existen diferencias entre 2 o ms grupos que se estudian y tratar de determinar las causas
capaces de explicarlas.

El hecho de que entre 2 grupos de pacientes tratados diferentemente se encuentren ciertas


diferencias, no debe hacernos concluir desde un principio que tales diferencias sean debidas a que
un tratamiento es mejor que el otro. En efecto, si suponemos que tenemos 2 grupos de pacientes,
el primero tratado con sulfadiazina y el segundo con Penicilina y que la letalidad fue
respectivamente 5% y 2%, la diferencia del 3% pudiera ser debida a una de las siguientes causas:

1. Falta de comparabilidad entre los 2 grupos, es decir, que los 2 grupos de pacientes no tenan
caractersticas semejantes.
2. Variacin explicable por azar, pues segn se ha visto, si 2 muestras son obtenidas del mismo
universo, los resultados no siempre sern exactamente iguales.
3. Mayor efectividad de la Penicilina con respecto a la Sulfadiazina.

Ahora bien, para poder concluir que el mejor resultado observado se debe a que la Penicilina es
ms efectiva, habr que descartar primero las otras 2 posibles causas:
Habr que probar en primer lugar, que los grupos son comparables, pues de no serlo, ello ya sera
una explicacin adecuada de las diferencias observadas. Ser necesario luego, demostrar que no
es probable que el azar haya producido tales diferencias, pues si ellas pueden explicarse
fcilmente por ste, no sera necesario recurrir a otras explicaciones.

20.2 Comparabilidad de los grupos.

En medicina experimental, frecuentemente se busca evidenciar si algn tratamiento es mejor que


otro, y para ello se requiere que los grupos que se estn comparando estn homogneamente
constituidos en relacin a aquellas caractersticas que tienen relacin con el problema que se
estudia.

Si por ejemplo, se est estudiando alguna enfermedad cuya mortalidad, depende en parte de la
edad, estado nutritivo y sexo de los pacientes, los 2 grupos debern estar igualmente constituidos
con respecto a estos factores.

Sucede sin embargo, que aunque igualemos los 2 grupos con respecto a las caractersticas que
son conocidas, todava pueden existir otras caractersticas desconocidas que influencian el
fenmeno que se estudia. En tal caso, la nica manera de igualar los 2 grupos es mediante el
sistema al azar, el cual, a la larga, tiende a uniformizar su composicin, hacindolos equivalentes.
Si al azar no se ha usado como sistema de eleccin de los individuos que se estudian, nunca se
podr estar seguro que los grupos son valederamente comparables y quedar duda si la diferencia
observada en la comparacin se debe a una afectividad real del tratamiento o a una falta de
comparabilidad entre los grupos.

El siguiente ejemplo ayudar a aclarar los conceptos expresados anteriormente.


Hoy en da no hay ninguna duda de que existe una estrecha relacin entre el hbito de fumar y el
cncer de pulmn, pero ha sido imposible todava probar de manera concluyente que el cigarrillo
produce la enfermedad.

Esta imposibilidad radica en que la asociacin encontrada puede tener 3 explicaciones:

1. El cigarrillo produce cncer.


2. El cncer predispone al hbito de fumar (?)
3. Tanto el cncer como el hbito de fumar son determinados por un tercer factor an
desconocido.

CIGARRILLO

FACTOR DESCONOCIDO
CNCER

Nuestros actuales conocimientos mdicos nos permiten descartar la hiptesis de que el cncer
induzca al hbito de fumar, pero la tercera de las explicaciones mencionadas todava sigue en pie.

Si se pudieran formar dos grupos al azar, de tal manera que a los individuos de un grupo se les
ordenar fumar y a los componentes del otro se les prohibiera hacerlo, podra estudiarse del
cncer en unos y otros y cualquier diferencia encontrada podra atribuirse al cigarrillo, pues el azar
al igualar los grupos, hara una distribucin ms o menos homognea de todos los factores,
conocidos o no, que pudieran influenciar la aparicin de la enfermedad.

Como tal experimento no es posible, en la primera prctica se toman 2 grupos tan semejantes
como sea posible, pero nunca se puede igualar con respecto a todas las caractersticas conocidas
que puedan tener relacin con la enfermedad y como es obvio, tampoco aquellas que son
desconocidas. En tales condiciones, de existir un factor desconocido que a la vez produjera el
cncer y el hbito de fumar, el grupo de grandes fumadores sera a la vez el que tuviera ms
cncer y viceversa, y aunque exista una indudable asociacin entre los 2 factores, dicha asociacin
no podra interpretarse en el sentido de que el hbito de fumar produce la enfermedad.

Al comparar 2 o ms grupos debe tenerse en cuenta que en ocasiones, especialmente cuando las
muestras son muy pequeas puede suceder que a pesar que el azar haya sido utilizado como
sistema de eleccin, se presenten ciertas diferencias, debidas exclusivamente al hecho de que los
resultados que se comparan no son realmente comparables.

Vamos a suponer que con el fin de probar la hiptesis de que el estado nutritivo es mejor en las
familias pudientes que en las pobres, se hubieran escogido muestras probabilsticas de 2 escuelas
diferentes: la escuela A en donde asisten solamente nios ricos y la escuela B para los nios
pobres. Supongamos que los resultados hubieran sido los siguientes:
Cuadro 217
Peso de dos grupos de alumnos, por sexo

Escuela A Escuela B
Alumno Sexo Peso Alumno Sexo Peso
1 M 34 1 M 31
2 M 36 2 M 33
3 M 33 3 M 35
4 M 34 4 M 37
5 M 32 5 F 32
6 M 35 6 F 30
7 M 33 7 F 31
8 M 35 8 F 31
9 F 29 9 F 30
10 F 31 10 F 31
11 F 32 11 F 32
12 F 32 12 F 31

Escuela A: X = 396 / 12 = 33,0 kilos


Escuela B: X = 384 / 12 = 32,0 kilos

El investigador desprevenido, calcular los promedios respectivos para las dos escuelas y al
encontrar que los alumnos de la Escuela A pesan un promedio 1 kilo ms que los de la escuela B,
dara por probada su hiptesis de trabajo.

Pero son en realidad comparables los grupos anteriores?. Puede observarse en los datos
precedentes que en la muestra de la Escuela A hay muchos ms hombres que mujeres (8 vs. 4) y
que en la Escuela B, sucede lo contrario. Como el peso es una caracterstica que en gran parte
depende del sexo, este factor no debe pasarse por alto al hacer la comparacin. Si comparamos
los promedios de los varones para las 2 escuelas y hacemos luego lo mismo con las hembras,
encontraremos:

Masculino: X A= 272/ 8=34 Kilos; X B = 136/4 =34 Kilos

Femenino: X A= 124/4=31 Kilos; X B = 248/8= 31 Kilos


Es decir, teniendo en cuenta el sexo no existe absolutamente ninguna diferencia entre dos
escuelas; por lo tanto la diferencia controlada entre los dos promedios globales era una diferencia
artificial, debida exclusivamente al hecho que se estaba comparando grupos que no eran
comparables.

Este ejemplo ilustra por consiguiente la necesidad de ver primeramente si los grupos que van a
compararse son homogneos con respecto a las caractersticas que tengan en relacin con el
problema que se estudia, pues de no serlo, una comparacin global de los resultados seria
inadecuada.

20.2.1 Importancia del grupo control

Comparar, por lo tanto involucra la existencia de un patrn de comparacin con el cual puedan
contrastarse los resultados que estars tratando de medir. Dicho de otra manera, en todo estudio
en que se pretenda probar que el tratamiento es eficaz, o se trate de determinar causa y efecto, a
lado del grupo experimental, debe haber un grupo control.

Son pocas las ocasiones en que dicho grupo control no es necesario. As por ejemplo, se ha
sealado que, ningn control fue necesario para afirmar que la Estreptomicina era efectiva en el
tratamiento de la meningitis tuberculosa, ya que la experiencia haba sealado que antes del
advenimiento de la droga, la enfermedad era siempre mortal. De la misma manera, cualquier
droga que pueda disminuir la letalidad de la rabia, no necesitar la existencia de un grupo control
para decidir que es efectiva, pues ya sabemos que la enfermedad una vez declarada conduce
inexorablemente a la muerte.

En todas las otras ocasiones, el grupo control es imprescindible y para que l sea conveniente,
debe ser escogido de tal forma, que sea perfectamente comparable con el grupo experimental.

Este grupo control puede ser escogido de dos maneras:

a. control histrico
b. control simultneo
c. individuo de grupo experimental como sus propios controles
d. el universo como grupo control.

20.2.2 Control histrico

En esta modalidad, los resultados son observados en el grupo experimental y compactados con
aquellos obtenidos en pocas pasadas. As por ejemplo, si se investiga la accin de una nueva
droga sobre la viruela, la letalidad observada en los pacientes sometidos a nuevo tratamiento, se
compara con la letalidad habitual observas en el pasado en pacientes con dicha enfermedad. Sin
embargo, para que esta comparacin fuera valedera, habra que estar seguro de que atrevas de
los aos no ha habido ningn cambio marcado en la virulencia de los grmenes, en la
susceptibilidad de los individuos, ni en las condiciones que favorece la interaccin entre grmenes
y susceptibles. Como nunca tendremos certeza sobre los puntos anteriores, solo si se excepta
los casos en los cuales hay grandes diferencias entre el grupo experimental y el control histrico,
queda la duda sobre si dichas diferencias son debidas a la accin del nuevo tratamiento o que los
grupos no son comparables.

20.2.3 Control simultaneo

Por los motivos anteriores, el grupo control debe escogerse en tal forma, que los individuos que lo
integran sean similares al grupo experimental, en todas aquellas caractersticas importantes en
relacin con el problema que se estudia. Es necesario que antes de asignar cada individuo al
grupo respectivo, se decida de antemano si l va a ser incluido o no en la investigacin, pues en
caso contrario puede llegarse a una seleccin de la muestra. Hecha esta decisin los individuos se
repartirn por cualquier procedimiento al azar que garantice, su correcta distribucin. Entre estos
procedimientos hay tres principales:

1. Alternacin. Consiste en decidir al azar, el grupo al cual pertenezca el primer individuo


escogido y los restantes, se distribuiran alternadamente en los diferentes grupos. El simple
lanzamiento de una moneda a cara o sello decidir el grupo al que ira el primer individuo, en el
caso en que se estudien dos grupos.

2. Pareamiento. Si son dos grupos, se escogen primero pares de individuos que sean tan
semejantes como sea posible, con respecto a determinado nmero de caractersticas (mismo
sexo, misma edad, mismo peso, etc.) y luego, mediante al azar, se determina el grupo al que
pertenecern los integrantes de cada par. El mismo procedimiento general se aplica cuando
se trata de ms de dos grupos.

3. Azar simple. Los individuos se asignan a los grupos mediante el uso de tablas de nmeros al
azar, segn lo explicado en el captulo sobre muestreo. En la prctica, si son, dos grupos, se
prepare una serie de sobres cerrados, la mitad para el grupo control y la otra mitad para el
grupo experimental. Una vez que se decida que el individuo formara parte de la investigacin,
se tomara un sobre para decidir el grupo en que se incluir.
20.2.4 Los mismos individuos como su propio grupo control.

En ocasiones los mismos individuos hacen a la vez de grupo experimental y de grupo control, para
lo cual se hacen determinadas indecisiones en cada individuo, antes y despus de aplicarle las
droga que se estudia o de someterlo al estmulo que se investiga. Este mtodo debe utilizarse
siempre que las condiciones de la investigacin lo permitan.

20.2.5.1 El Universo como Grupo control.

Los resultados observados en una muestra que ha sido sometida a un estmulo especial, se
comparan con lo que ocurre en el universo del cual fue extrada la muestra.

20.2.5.2 Eliminacin del azar como causa de las diferencias observadas.

Una vez seguros que las muestras son comparables y Antes que tratemos de investigar las
causas de las diferencias observadas, es necesario descartar la influencia del azar, pues ya
sabemos que debido al error por muestreo, habitualmente se observan ciertas diferencias entre
diversas muestras provenientes del mismo universo.

No hay en realidad ningn procedimiento que nos indique con certeza absoluta cuales muestras
proceden de un determinado universo y cules no, pero podemos aceptar el criterio de que
aquellas muestras que ocurren con una frecuencia menor al 1% (0 al 5%) son tan improbables
que en ausencia de informacin al respecto, se considerarn como provenientes de otro
universo.

El problema por lo tanto, se reduce a averiguar con qu frecuencia se presentan las diferentes
muestras, cuando muestras repetidas se extraen de determinados universos.

Ahora bien, se ha sealado que el azar es ordenado y al estudiar el error estndar, concluimos
que:

X 1E.E. incluye al promedio del universo en el 68.2% de los casos.


X 2E.E incluye al promedio del universo en el 95.4% de los casos.
X 2.58 E E. Incluye al promedio del universo en el 99 de los casos.
X 3 E. E. Incluye al promedio del universo en el 99.7% de los casos.
Lo anterior quiere decir que muestras cuyos promedios difieran del verdadero promedio del
universo en ms de dos errores estndar solo se presentan con una frecuencia inferior al 5%
(100 % -95% = 5%) y aquellas que difieran en ms de 3 errores estndar, solo aparecen con una
frecuencia menor al 0.3%.

Dicho de otra manera: si la diferencia entre el promedio de una muestra y el promedio del universo
es mayor que 2 veces el error estndar, tal diferencia solo puede observarse por azar en menos
del 5% de los casos y si dicha diferencia es mayor que 3 veces el error estndar su ocurrencia es
mucho menor al 0.3%.

Por consiguiente, si hemos adoptado el criterio de llamar improbables resultados que se presentan
con una frecuencia menor al 5% designaremos como tales, todas aquellas diferencias mayores a 2
errores estndar. Igualmente, si adoptamos el criterio de llamar improbables solamente aquellos
resultados que se presentan con frecuencia menor al 0.3%, se designaran como tales las
diferencias que exceden a 3 veces el error estndar.

Dichas diferencias, tan improbables en su aparicin (menos del 1% o del 5%, segn el criterio que
se adopte), se denominan estadsticamente significantes o simplemente significantes.
El hecho de que clasifiquemos como improbables las muestras qu4e se presentan con frecuencia
menor al 1% o al 5%, es una cuestin arbitraria que debe decidirse de acuerdo a cada problema
particular. Al estudiar el error estndar, sealamos que mientras ms exigente nuestro estndar
acerca de lo que es improbable (1% en vez del 5%), ms probabilidad hay de fallar en reconocer
diferencias en realidad son verdaderas. Si por el contrario, rebajamos nuestro estndar (5% en
vez del 1%), corremos el peligro de calificar como reales, diferencias que en verdad no lo son.
Recurdese seccin 19.3.

20.2.6 Interpretacin de la significancia estadstica

A menudo el investigador cree terminada su responsabilidad concluyendo que el resultado es o no


significante, lo cual se debe a que habitualmente se ignora el verdadero significado de estos
trminos.

Un resultado se denomina significante cuando no puede explicarse fcilmente por azar, pero esto
no quiere decir que no pueda haber sido producido por l.

De la misma manera, un resultado se cataloga como no significante, cuando puede ser fcilmente
producido por el azar, a pesar de que en el caso estudiad este no haya intervenido en su
produccin.

Esta aclaracin es necesaria porque un resultado significante no es una prueba concluyente de


que existan diferencias reales, de la misma manera que un resultado no significante pruebe que
ellas no pueden existir.
El resultado significante o no significante es solo una evidencia ms a favor o en contra de la
hiptesis que se busca probar y corresponde al investigador reunir esta evidencia a cualquier otra
disponible, antes de interpretar los hechos que ha observado.

Al interpretar estos resultados hay 2 importantes limitaciones que deben tenerse en cuenta:

a. Un resultado significante no puede interpretarse como evidencia de casualidad. En el estudio


de Bradford Hill y Richard Doll, sobre cncer pulmonar- Que ya hemos comentado -, la
diferencia en la aparicin de la enfermedad entre fumadores y no fumadores, es
estadsticamente significante, pero por razones entonces explicadas, no puede concluirse que
l habita de fumar sea el causante de la enfermedad

b. Un resultado estadsticamente significante no tiene ninguna importancia si no es al mismo


tiempo prcticamente significante no tiene ninguna importancia si no es al mismo tiempo
prcticamente significante. Como veremos en prximos captulos, mientras mayor sea el
tamao de la muestra, mayor ser la probabilidad que determinada diferencia sea significante.
As por ejemplo, si un tratamiento A, cura el 20% de los pacientes y otro tratamiento B, al 22%,
tal diferencia no es significante en grupos de 50 personas, pero si lo es en grupos de 10.000.
Sin embargo, como el objetivo de averiguar si determinado resultado es o no significante, es
tomar una accin subsecuente, tal diferencia del 2% es de muy escasa utilidad en el terreno
prctico.

20.3.1.1 Pruebas de significancia estadstica

Son numerosas las pruebas estadsticas utilizadas con la finalidad de medir la influencia del azar y
cada una de ellas suele tener aplicaciones perfectamente definidas. La escogencia de la prueba
ms conveniente depende principalmente de los siguientes factores:
a. Nmero de grupos que se comparan, es decir, segn se trata de 2 grupos, o 3 o ms.

b. Nmero de individuos en cada grupo, pues si son pocos, las tcnicas son por lo general mucho
ms difciles. Tales pruebas no sern estudiadas en este curso.
c. Escala de clasificacin utilizada, pues las pruebas estadsticas son mucho ms fciles cuando la
escala es cualitativa.

d. Grupos independientes o no. Cuando los individuos de un grupo son distintos a los del otro, las
muestras se llaman independientes. En los casos en los cuales los individuos se usan como
grupo control o cuando se escogen por pares semejantes antes de asignarlos al respectivo grupo,
las muestras se llaman dependientes y las tcnicas de anlisis son diferentes a las del caso
anterior.

Teniendo en cuenta os anteriores puntos, podemos resumir de la manera siguiente, las tcnicas de
anlisis que sern motivo de los prximos captulos:

A. Muestras independientes.

1. Comparacin entre 2 grupos

1. Estudio resumido por frecuencias relativas Pruebas de


2. Estudio resumido por promedios curva normal

b. Comparacin entre ms de 2 grupos:


1. Estudio resumido por frecuencias relativas:
Prueba de Chi Cuadrado
2. Estudio resumido por promedios: Prueba de
Kruskal Walles grupos no independientes

c. Comparacin entre dos grupos:

1. Estudio resumido por f. relativas. Pruebas modificadas de curva normal


2. Estudio resumido por promedios.

d. Comparacin entre ms de 2 grupos: Debido a su dificultad no se estudiaran.


CAPITULO XXI

COMPARACION ENTRE EL PROMEDIO DE UNA MUESTRA Y EL PROMEDIO


DEL UNIVERSO
EJEMPLO PRCTICO: Se investigar el nmero de pulsaciones por minuto en 16 hombres,
presumiblemente normales, obtenindose los siguientes resultados:

Cuadro 225

Pulsaciones por minuto en 16 individuos normales.

Individuos Pulsaciones x minuto Desviaciones Desviaciones al cuadrado


1 70 -4 16
2 66 -8 64
3 82 8 64
4 64 -10 100
5 65 -9 81
6 88 14 196
7 82 8 64
8 70 -4 16
9 70 -4 16
10 84 10 100
11 85 11 121
12 68 -6 36
13 84 10 100
14 76 2 4
15 65 -9 81
16 65 -9 81
Total 1184 1140

PROMEDIO = 1.184/16 =74

1140
D.E.= = 71.25 =8.45
16

Se desea saber con un 95% de certeza, si el promedio observado en este grupo se diferencia
significativamente del valor de 70 pulsaciones, considerado como normal.

21.2. Discusin.

Si de un universo de hombres normales, el promedio de pulsaciones fuera de 70 por minuto, se


extrajeran repetidas muestras de individuos y para cada una se calculara el respectivo promedio,
es indudable que los promedios as obtenidos no sern del todo exactos. Ellos se distribuirn
alrededor del verdadero promedio del universo (70 pulsaciones) formando, una curva normal
alrededor de 70 y con una desviacin estndar que se calcula mediante:

DE
n
Esta frmula se recordar, es el error estndar del promedio, donde 0 es la desviacin estndar
de la muestra que se est estudiando, calculada por el mtodo previamente aprendido y n el
nmero de personas estudiadas.

Como ya sabemos que el promedio ms o menos 2 EE, determina el lmite dentro, del cual est
el 95% de la muestra, solo quedar un 5% fuera de estos lmites. Este 5% de muestras tan
diferentes del universo y de aparicin poco frecuente, debe considerare proveniente de otros
universos, a no ser que se sepa de ante mano que proviene de l.
El ejemplo que estamos estudiando el valor:

8.45
= = 2,11
16
y por lo tanto, los lmites dentro de los cuales estar el 95% de la muestra ser:

70 2 (2.11)
es decir, entre 65,78 y 74,22 pulsaciones por minuto.

Grfico 227

Posicin de la muestra estudiada en relacin a las zonas de significancia de la curva


normal.

Como el promedio de nuestra muestra (74) se encuentra dentro de estos lmites, podemos
concluir que ella proviene de un universo cuyo promedio es de 70,o usando la terminologa
estadstica, la muestra no difiere significativamente de 70.

Anteriormente hay 2 procedimiento equivalente al anterior, que se suele emplear en su lugar:

a. Puede dividirse la diferencia que existe entre el promedio de la muestra y el promedio del
universo (74-70=4) por el error estndar:

Diferencia 74 70 4
1,89
ErrorEs tan dar 2,11 2,11
y buscar este resultado en Tablas de reas de la Curva Normal (ver pgina 202), para conocer la
probabilidad que existe de encontrar por azar una muestra que como la presente difiera en 4
pulsaciones del valor del universo. En nuestro ejemplo, buscando en tales tablas el valor 1,89
vemos que esta probabilidad es casi 6% y como hemos adoptado el criterio de que un fenmeno
que se presente con una frecuencia mayor del 5% no es improbable, concluiremos como antes,
que nuestra muestra no difiere significativamente de 70.

b. Si no se est interesado en buscar la probabilidad del suceso, sino de saber solamente si el


resultado es o no explicable por el azar, basta ver si el resultado de la divisin anterior (diferencia
sobre E.E) es mayor o menor que 2. Si es menor que 2, se concluir igualmente que la diferencia
no es significante.

21.3. Resumen del procedimiento.

Una vez obtenido el promedio y la D.E. del grupo que se estudia se seguir los siguientes pasos:

1. Obtener la diferencia entre el promedio del grupo y el promedio general del universo:

Diferencia = 74 70 = 4
2. Obtener el error estndar del grupo que se estudia mediante la frmula: / n , en donde es
la desviacin estndar de la muestra y n el nmero de personas que se han observado:

8,45 8,45 2,11


E.E.
16 4

3. Dividir la diferencia obtenida en el punto (1) por el error estndar:

Diferencia 4
1,89
E.E. 2,11

4. Buscar en una tabla de reas de la curva normal, la probabilidad correspondiente al valor que se
acaba de calcular o simplemente ver si es mayor que 2, segn se ha indicado.

21.4 Efecto del tamao de la muestra.

Note que si la misma D.E.= 8,45 se hubiera obtenido en una muestra de 25 personas en vez de 16,
entonces se hubiera concluido que el promedio de la muestra difera significativamente del
promedio de 70 pulsaciones.

En efecto en tal caso:



8,45 1,69
E.E
25 5
4
Diferencia 74 70 2,4 valor significante ().
y
E.E 1,69 1,69

En esta prueba de significancia, al igual que en las otras que se ilustran en prximos captulos, un resultado se clasificar
como significante cuando la probabilidad de que aparezca por azar sea menor al 5% es decir, cuando Diferencia Error
Estndar sea mayor que 1,96. Debe recordarse no obstante, que algunos catalogan como significantes, solamente aquellos
resultados que pueden aparecer por azar 1% o menos de las veces (diferencia / E.E. igual o mayor que 2,58) y como no
significantes cuando su aparicin es igual o superior al 5%. Si se adopta este criterio, toda diferencia que se presente con
una frecuencia entre el 1% y el 5% (diferencia / Error Estndar entre 1,96 y 2,58), se catalogar como resultado de
De una manera general, la frmula DE / n seala, que el error estndar es directamente
proporcional a la desviacin estndar e inversamente proporcional a la raz cuadrada de tamao de
la muestra. Mientras mayor el tamao de sta, menor ser el error estndar y ms probabilidades
habr de que determinada diferencia sea significante.

significancia dudosa, lo cual quiere decir que la decisin debe ser aplazada hasta que haya ms evidencia disponible.
Aunque este proceder es aparentemente acertado, parece una cautela innecesaria si se tiene siempre presente lo expuesto
en la seccin 20.31 a propsito de la interpretacin de la Significancia Estadstica (vase pgina 222).
CAPITULO XXII
COMPARACIN ENTRE EL PORCENTAJE DE UNA MUESTRA Y EL DEL UNIVERSO

22.1 Problema prctico.

En una epidemia de viruela mayor se presentaron 80 casos de los cuales murieron 24, o sea que
hubo una letalidad del 30%.

Como la fatalidad usual para esta enfermedad es 25%, se desea saber con un 95% de certeza, si
la diferencia del 5% que se observa (30-25=5) puede ser explicada por azar.

22.2 Discusin.

Si repetidas muestras de 80 casos fueron tomadas de un universo de enfermos cuya fatalidad es


25% y si en cada muestra se computara la tasa de letalidad, dichas tasas no seran exactamente
iguales, sino que se distribuiran formando una curva normal, centrada en el verdadero valor del
universo (25%) y con una desviacin estndar dada por:

pq
n

Esta frmula es error estndar de un porcentaje en la cual:

p es el porcentaje de casos que mueren en el universo (25%).


q es el porcentaje de casos que se salvan en el universo (75%).
n es el nmero de individuos estudiados, o sea 80.

Se notar que esta es la misma frmula estudiada en el captulo XIX, pero mientras all
utilizbamos los valores p y q de la muestra, por no conocer los del universo, ahora usamos p y q,
es decir los correspondientes valores del universo, ya que siendo ellos conocidos, no es necesario
estimarlos a partir de la muestra,
pq
en nuestro ejemplo, el valor
n

es igual a 4,8% y segn el criterio adoptado anteriormente, los lmites de no - significancia estarn
entre:
25% 2(4,8) , es decir, entre 15,4% y 34,6%.
Grfico 231

Posicin de la muestra estudiada en relacin a las zonas de significancia de la curva normal

Como la letalidad del 30% observada en nuestra muestra se encuentra dentro de estos lmites, se
puede concluir que la observada diferencia del 5%, muy posiblemente fue obra del azar.

En igual forma que el ejemplo del captulo anterior, hay dos procedimientos alternativos:

a. Dividir la diferencia que existe entre el universo y la muestra por el correspondiente error
estndar:

Diferencia 30 25
1,04
ErrorEstndar 4,8

y buscar en Tablas de reas de la Curva Normal (vase pgina 202), la probabilidad que existe de
encontrar por azar una muestra que difiera de su universo en el porcentaje observado. En nuestro
ejemplo, la probabilidad correspondiente a 1,04 es aproximadamente 30%, o sea, que 30 veces de
cada 100, se encontrarn por azar, diferencias como la observada, lo cual desde luego, es una
ocurrencia demasiado frecuente, para considerar significante.

b. De una manera ms breve, cuando no se est interesado en hallar la probabilidad de tal suceso,
sino en saber simplemente si la diferencia es o no significante, se dividir dicha diferencia por el
error estndar y si el resultado es mayor que 2, se concluir que es significante. En nuestro caso,

Diferencia 30 25
1,04
ErrorEstndar 4,8

valor no significante, fcilmente explicable por el azar.

22.3 Resumen del procedimiento.

1. Se buscar la diferencia entre la letalidad usual de la enfermedad y la letalidad observada en la


muestra que se estudia:

Diferencia = 30% - 25% = 5%

2. Se calcular el error estndar del porcentaje mediante:


pq
n

en donde como dijimos:

p = 25% = porcentajes de casos fatales en el universo.


q = (100-25) = 75% = porcentajes de casos que se salvan.
n = nmero de enfermos estudiados en nuestra muestra.

En nuestro ejemplo:

25 75
E.E pq 4,8
n 80

3. Se divide la diferencia obtenida en el punto (1) por el error estndar:

Diferencia 30 25 5
1,04
Estndar 4, 4,8
8

4. Se ve si el ltimo valor es mayor o menor que 2, y si es menor, se dir que la diferencia


observada no es significante, es decir, que muy posiblemente es debido al azar.

22.4 Observaciones.

a. Si en vez de porcentajes estuviramos usando por ejemplo, tasas por 1.000, el procedimiento
sera el mismo, recordando tan slo que p`+ q = 1.000.

En el problema presente, si la mortalidad en el universo fuera 250 x 1.000 y la mortalidad en la


muestra 300 x 1.000 entonces:

p = 250, q =750 y la diferencia: 300 250 = 50

E.E 250 750 48 ; y,


80
Diferencia 50
1.04 , como anteriormente.
E.E 48

b. Lo mismo que en el ejemplo del captulo XXI, mientras mayor el tamao de la muestra, mayor
ser la probabilidad de encontrar significancia estadstica. Si la muestra hubiera sido cuatro veces
mayor, el error estndar se hubiera reducido a la mitad:

25 75
E.E 2,4 ; y, entonces:
320

Diferencia 30 25
2,1
E.E 2,4
valor significante que indicara que la diferencia observada no es fcilmente explicable por el azar,
y entonces cabra suponer que el actual brote epidmico es de una gravedad mayor que la usual, o
que el tratamiento ltimamente empleado no es tan efectivo como el antiguo. En fin, la evidencia
estadstica se reunir a cualquiera otra disponible con el fin de hacer las correspondientes
deducciones.
CAPITULO XXIII

COMPARACION ENTRE LOS PROMEDIOS DE DOS MUESTRAS


INDEPENDIENTES
23.1 Ejemplo prctico.

En un problema anterior se estudi el nmero de pulsaciones de 16 hombres normales y se


encontr que el promedio fue de 74 por minuto, con una D.E. igual a 8,45.

Supongamos que al mismo tiempo se estuvieran estudiando 16 mujeres, con los resultados que a
continuacin aparecen.

Cuadro 235
Pulsaciones por minuto en 16 mujeres normales

Individuos Pulsaciones por minutos Desviaciones Desviaciones al cuadrado


1 76 -1 1
2 72 -5 25
3 79 2 4
4 65 -12 144
5 70 -7 49
6 88 11 121
7 80 3 9
8 76 -1 1
9 78 1 1
10 84 7 49
11 86 9 81
12 74 -3 9
13 84 7 49
14 78 1 1
15 70 -7 49
16 72 -5 25
Total 1.232 0 618

1.232
Pr omedio 77
16

618
D.E. 38,62 6,21
16

Se desea saber si el promedio de pulsaciones para los hombres difiere significativamente del de
las mujeres o si la diferencia observada es fcilmente explicable por el azar.

23.2 Discusin.

Aunque no hubiera ninguna distincin entre hombres y mujeres con respecto al nmero de
pulsaciones por minuto, no quiere esto decir que los promedios de las dos muestras tengan que
coincidir exactamente. En efecto, si repetidos pares de muestras de 16 individuos cada una, se
extraen del mismo universo, en cada par se podr computar el promedio para la primera y para la
segunda muestras X1 y X 2 respectivamente. La diferencia entre estos dos promedios (-) ser
unas veces cero y otras veces mayor o menor. De todas maneras, diferencias muy grandes,
positivas o negativas sern extraordinariamente raras.
Estas diferencias se distribuirn en forma de una curva normal centrada en 0 (cero) y con una
desviacin estndar dada por la frmula:

E.E X X E.E 2 E.E 2


1 2 1 2

Esta frmula se conoce con el nombre de error estndar de la diferencia entre 2 promedios. En
ella: (E.E)1 es el error estndar de la primera muestra y (E.E.)2 el error estndar de la segunda, que
sern calculados en la misma forma previamente estudiada.

Como ya sabemos que el promedio ms o menos 2 errores estndar incluir el 95% de las
muestras, slo se considerarn como provenientes de diferentes universos, diferencias ( X1 - X2 )
que se encuentran fuera de los lmites determinados.

En nuestro ejemplo: el valor E.E 2 E.E 2 , calculado por el mtodo que luego se explicar,
1 2
es igual a 2,6 y por lo tanto, los lmites dentro de los cuales estar el 95% de las diferencias entre
pares de muestras procedentes del mismo universo ser:

0 (2,6), es decir, entre 5,2 y +5,2

Grfico 237

Posicin de la diferencia observada en relacin a las zonas de significancia de la curva


normal

Como la diferencia entre los promedios de las dos muestras que estamos estudiando (77-74=3) se
encuentra dentro de estos lmites, se concluye que la diferencia observada no es significante.

Alternativamente del mismo modo que hicimos en los problemas anteriores, podemos:

a. Dividir la diferencia de los dos promedios (77-74=3) por el error estndar de la diferencia:

Diferencia 3
1,1
E.E 2,6
CAPITULO XXIV

COMPARACION ENTRE LOS PORCENTAJES


DE DOS MUESTRAS INDEPENDIENTES
24.1 Problema prctico

En un hospital se trataron por el mtodo clsico, 80 casos de viruela mayor, de los cuales murieron
24, una letalidad del 30%. Otros 120 pacientes fueron sometidos a un nuevo tratamiento, sobre
cuya efectividad exista favorables indicios, En este ltimo grupo fallecieron 30 pacientes, una
letalidad del 25%. Se desea saber si la diferencia del 5%, observada entre los dos grupos de
pacientes, puede ser atribuida al azar o si se debe buscar otra explicacin.

Cuadro 240
Viruela, Casos y Defunciones, por tratamiento

Tratamiento Casos Defunciones Letalidad x 100


Tratamiento clsico 80 24 30.0 (p1)
Tratamiento nuevo 120 30 25.0 (p2)
TOTAL 200 54 27.0 (p3)

24.2 Discusin

Si una muestra de 80 y otra de 120 fueran tomadas del mismo universo de pacientes, aunque el
tratamiento no tuviera efecto, la diferencia entre las dos tasas de letalidad no sera necesariamente
0 (cero).

Por lo tanto si se tomaran repetidas pares de muestra y se calculara la diferencia en la tasa de


letalidad de cada par, esas diferencias se distribuiran en una curva normal centrada en cero y con
una desviacin estndar dada por la frmula:

po qo po qo
(E.E) p1-p2 =
n1 n2

La frmula anterior llamada error estndar de la diferencia entre dos porcentajes y cuya
aplicacin luego veremos, nos da en nuestro ejemplo un valor igual a 6.4%.
Grfico 241

Posicin de la diferencia observada en relacin a las zonas de significancia de la curva


normal

Como X 2 E.E incluye 95% de las muestras, tomando E.E a cada lado del promedio,
encontraremos que diferencias entre muestras, que se encuentran entre 12.8% no se
consideran como significantes y por consiguiente la diferencia de 5% observada entre nuestros dos
grupos de enfermos (30%-25%=5%), puede haber sido producida por el azar.

De la misma manera que en previos ejemplos:

A) podemos dividir la diferencia observada por el error estndar de la diferencia, sea:

Diferencia 5
0.78
E.E 6.4

buscar la probabilidad que existe de encontrar por el azar una diferencia como la observada.

La probabilidad correspondiente a 0.78 es de 43% es decir, que de cada 100 veces habr 43 en
las cuales puede encontrarse por azar una diferencia como la anotada. Fenmenos que se
presentan con esta frecuencia no son raros y por consiguiente, podemos concluir que no hay
evidencia suficiente para afirmar que un tratamiento sea mejor que el otro.

B) Ver simplemente si el resultado de la divisin anterior es menor que 2, caso en el cual la


diferencia estudiada no es significante.

24.3 Resumen del procedimiento

1) Los datos deben colocarse como en el cuadro de la pgina anterior, con el fin de saber
cuntas defunciones ocurrieron en los dos grupos juntos y conocer cul fue la letalidad en el total
de pacientes. Como en el total hubo 200 pacientes, de los cuales murieron 54 la letalidad conjunta
fue del 27% es decir:

54 100
27%
200
Como no se conoce la letalidad del universo, esta letalidad conjunta de 27% se tomara como una
buena estimacin de aquella. Ella ser po , la probabilidad que un paciente muera y por lo tanto,
qo , la probabilidad que un paciente no muera, ser igual a 100-27= 73%.

2) Se calculara el error estndar de la diferencia de los dos porcentajes mediante la frmula:

po qo po qo

n1 n2

En el cual:

po = letalidad global para los pacientes de los dos grupos (27%)


qo = 100- po = 100-27 = 73%.
n1 = nmero de individuos en la primera muestra (80)
n2 = nmero de individuos en la segunda muestra (120)
En nuestro ejemplo:

27 73 27 73
6.4
80 120
(E.E.) p1 p2 =

3) Se averigua la diferencia entre la letalidad del primer grupo de pacientes y la del segundo:

Diferencia = ( 30% - 25%) = 5%

4) Dicha diferencia se divide por el Error estndar de la diferencia encontrado en el punto (2), es
decir:

Diferencia 30 25 5
0.78
E.E 6.4 6.4

5) Si el anterior valor es menor que 2 se concluir, como en el caso presente, que la diferencia
observada en la letalidad de los dos grupos de pacientes, no es significativa.

24.4 Observaciones.

En algunos textos se utilizan en lugar que el anterior la formula siguiente:

p1 q1 p2 q2

n1 n2

Es decir, en vez de tomar la letalidad conjunta de los 2 grupos ( po ) , como estimacin de la


letalidad de universo, se emplea la letalidad de la primera muestra ( p1 ) para calcular su error
estndar y la letalidad de la segunda muestra ( p2 ) para calcular el error estndar de ella.
Esta frmula es errnea aunque suele dar valores muy cercanos a la formula correcta que
explicamos en el texto, no debe utilizarse, pues en algunas ocasiones, especialmente cuando el
tamao de las dos muestras es muy diferente puede darse el caso que la formula correcta seale
diferencias estadsticamente significantes y que la frmula que estamos comentando, indique falta
de significancia en los resultados.

Considrese como ilustracin de lo anterior los siguientes datos tericos sobre 100 pacientes.

Cuadro 244

Pacientes por tratamiento y resultado

Droga Casos Defunciones Letalidad


A 80 12 15% ( p1 )
B 20 7 35% ( p2 )
Total 100 19 19% ( p3 )

Aplicando la formula correcta:

po qo po qo 19 81 19 81 9.8
E.E= 80
n1 n2 20

Diferencia 35 15
2.1 significante.
E.E 9.8

Aplicando la formula incorrecta:

p1q1 p2 q2 15 85 35 65 11.3
E.E.=
n1 80
n2 20

Diferencia 35 15
1.8 no significante
E.E. 11.3
CAPITULO XXV
CHI CUADRADO X

25.1 Introduccin

La curva normal solo puede usarse cuando son dos los grupos que se comparan.

Cuando quieren compararse 3 o ms muestras, su aplicacin es incorrecta a causa del siguiente


hecho: Al comparar 2 grupos, si tomamos 2 E.E., tenemos un 95% de certeza en nuestras
afirmaciones y podemos estar equivocados en el 5% restante de los casos. Si comparamos 3
grupos, A, B, C, por el mismo procedimiento, habra que hacer tres comparaciones diferentes, A, vs
B, A vs C, y B vs C y como en cada comparacin se puede cometer el 5% de error, el error global
cometido podra alcanzar el 15%. Si fueran 4 los grupos estudiados, habra 6 comparaciones
diferentes y el error que pudiera cometerse alcanzara al 30%.

Cuando se desea comparar ms de dos grupos, no puede aplicarse por lo tanto, las pruebes de
significancia estudiadas hasta ahora.

Si se quisiera comparar los promedios de varios grupos de individuos, habra que recurrir al
llamado Anlisis de la Variancia, cuya tcnica por ser muy complicada, no se estudiara, aunque en
el prximo captulo ilustremos un procedimiento sencillo que permite hacer correctamente tales
comparaciones.

Cuando lo que se quiere comparar es una serie de porcentajes tasa, puede recurrirse a la llamada
Prueba de Chi Cuadrado, cuya aplicacin general se ilustrara en el siguiente ejemplo.

25.2 Ejemplo Prctico

Tres drogas diferentes se ensayaron para el tratamiento del catarro comn midindose su
efectividad de acuerdo al porcentaje de pacientes que mejoraron dentro de las 24 horas siguientes
a la iniciacin del tratamiento. Los resultados de dicho tratamiento aparecen resumidos en el
siguiente cuadro:

Cuadro 247

Pacientes con catarro comn por tratamiento y resultado

Droga Curacin Fracaso Total Pacientes Porcentaje de Curacin


Droga A 12 38 50 24.00
Droga B 27 123 150 18.00
Droga C 21 79 100 21.00
Total 60 240 300 20.00

Se desea saber si las diferencias observadas se deben a distinta efectividad de los tratamientos
empleados o si ellas pueden explicarse razonablemente por el azar.

25.3 Discusin

El porcentaje general de curaciones para los 3 grupos tomados en conjunto fue de 20% (60
100/300=20%). Si tomamos dicho porcentaje como una buena aproximacin de lo que sucede en
el universo de donde proceden los pacientes que se estudian podemos darnos cuenta que si los
tres tratamientos fueran eficaces en igual grado, el porcentaje de curaciones en cada uno de ellos
fuera del 20% en vez de 24%, 18%, y 21% como se ha observado en los datos del problema.
Por lo tanto, asumiendo un porcentaje de curacin de 20% para cada uno de los grupos, se podra
calcular el nmero de pacientes que debiera mejorar con cada tratamiento.

As por ejemplo, en los pacientes del primer grupo, l nmero de curaciones seria 10 de las 12
observadas (20% de 50=10) y l nmero de persona s que no curaron seria c40, es decir 50 10 =
40.

Igualmente de los 150 pacientes que recibieron la droga B, debieron curar 30 (20% 150 = 30) y de
los que recibieron la droga C, debieron haber curado 20 en vez de 21 que curaron.

Estas frecuencias tericas (T) junto con las frecuencias observadas (O) en el experimento servirn
de base para el clculo de Chi Cuadrado.

25.4 Clculo de Chi Cuadrado

En el siguiente cuadro se resumen los clculos necesarios para la obtencin de X 2 los cuales se
explicaran a continuacin.

Cuadro 248

Cuadro de Chi Cuadrado


Curaciones Fracasos
Droga
O Total (O-T) (O-T)2/T O Total (O-T) (O-T)2/T
(1) (2) (3) (4) (5) (6) (7) (8) (9)
A 12 10 2 0.4 38 40 -2 0.1
B 27 30 -3 0.3 123 120 3 0.075
C 21 20 1 0.05 79 80 -1 0.0125
Fuente de datos del cuadro 247

Los pasos a seguir son los siguientes:

1. Se obtendrn las frecuencias tericas (T) correspondientes a cada una de las casillas del
cuadro lo cual se logra segn se acaba de explicar multiplicando el porcentaje global del
cuadro por el total de pacientes en cada tratamiento. El mismo resultado puede obtenerse,
multiplicando para cada cifra observada (O), los dos subtotales que le son comunes y
dividiendo por el total general del cuadro. As por ejemplo (vase en el cuadro 247) los dos
subtotales para los 12 pacientes que curaron con la droga A, son: 50 y 60 y por consiguiente la
respectiva frecuencia terica ser:

50 60
10
300
Igualmente para los 27 pacientes que curaron con la droga B los subtotales correspondientes son:
60 y 50 y la frecuencia terica ser:

60 150
=30
300

Estas frecuencias tericas aparecen en las columnas 3 y 7 del cuadro anterior

2. Se restara cada valor observado (O) el correspondiente valor terico (T) acabado de calcular
(columnas 4 y 8)
3. Cada una de las diferencias anteriores (O- T) se elevara al cuadrado y se dividir por la
respectiva frecuencia terica, o sea:
2 2

(12 10) (27 30)


: ; etc
10 30
4. La suma de todos los resultados anteriores (columna 5 y 9) ser el valor de Chi Cuadrado:

2
(O T )
X
2
T
El cual en nuestro ejemplo dar:
2 2 2

(12 10) (27 30) (79 80)


X 2 ......... .
10 30 80
=0.40+0.30+0.05+0.10+0.07+0.01=0.93

25.5 Interpretacin de 2
De acuerdo a lo acabado de exponer es fcil arce cuenta de:

a. Cuando las frecuencias observadas coinciden con las tericas, 2 = 0.


b. El valor de ser mayor, cuanto ms grandes sean las diferencias entre los valores
2

observados y los tericos.


c. El valor de 2 ser mayor mientras mayor sea el nmero de grupos que se estudian..

De acuerdo a este ltimo punto se comprende que para la interpretacin de , es necesario


2

tener en cuenta no solamente su valor, sino tambin el nmero de grupos y nmero de


caractersticas en las cuales se basa y as por ejemplo, un valor de
2
= 6 no podra decirse si es
significante o no hasta que no sepamos a cuntos grupos se refiere.

En estadstica se dice que es necesario conocer el grado de libertad de 2 antes de poder


interpretarlo.

La manera ms fcil de calcular el grado de libertad de 2 en la aplicacin que estamos


estudiando es la siguiente:

a. Sin tomar en cuenta los totales, se ven cuntas columnas (c) y cuantos renglones (r ) tiene la
tabla.
b. Multiplicando:
gl = (c 1 ) x (f 1 ); donde:

c = columna y f = fila. As se obtendr el grado de libertad de 2 .


En nuestro ejemplo, como son tres tratamientos, habr tres renglones como en cada tratamiento
se estudian curaciones y fracasos, habr dos columnas. Por lo tanto, el grado de libertad ser:
(3 1 ) ( 2 1) = 2 x 1 = 2

Probabilidades dadas por X.

Si se quiere saber cul es la probabilidad correspondiente a cada valor de que pueda


2

calcularse, se buscar en tablas especiales que existen para ello. En la prctica lo que
generalmente interesa es saber si las diferencias observadas entre los grupos son fcilmente
explicables por azar o no.

Si aceptamos el criterio de llamar significante toda diferencia que por azar pueda ocurrir slo 5
veces o menos en 100 experimentos anlogos, bastar conocer qu valor debe alcanzar
2

para poderse llamar significante. En la tabla siguiente aparecen algunos de dichos valores
ordenados de acuerdo al correspondiente grado de libertad.

En nuestro ejemplo encontramos que con 2 grados de libertad = 0,93. Como este valor est
2

muy por debajo de 6,0 - valor dado por la tabla concluimos que las diferencias observadas son
fcilmente explicables por azar y no hay necesidad de recurrir a otras explicaciones.

Cuadro 251
Valores de la distribucin de X
25.6 Relacin entre 2 y la Curva Normal.

Todos aquellos casos en que se comparan 2 grupos mediante la Curva Normal, pueden
compararse tambin mediante Chi Cuadrada.

En el ejemplo dado en la pgina 240, en el cual encontramos que:

Diferencia 0.78
Error Estndar

El clculo de chi cuadrado nos dara:

= (24-21.6) + (30-32.4) + (56-58.4) + (90-87.6) = 0.608


21.6 32.4 58.4 87.6

En estos casos, cuando tiene 1 grado de libertad, su valor es exactamente igual al


2

cuadrado de Diferencia/Error Estndar, es decir:

x= ( Diferencia) o lo que es lo mismo:


Error Estndar

x = Diferencia
Error Estndar

En el ejemplo acabado de citar en el cual (diferencia/E.E) = 0.78 y 2 = 0.608 note que:


0.608 = (0.78)

En la misma forma si 2 = 9 entonces Diferencia/ E.E = 3.

Si este ltimo valor fuera igual a 2, chi cuadrado sera igual a 4.

Debe recordarse que la anterior relacin solamente es cierta cuando 2 tiene 1 grado de libertad.
CAPITULO XXVI
COMPARACION ENTRE LOS PROMEDIOS DE TRES O MAS MUESTRAS INDEPENDIENTES.

26.1. Introduccin.

Con el fin de hacer correctamente comparaciones entre los promedios de tres o ms muestras se
utiliza la tcnica de Anlisis de la Variancia. Dicha tcnica no est al alcance del estudiante
corriente, pero en su lugar puede utilizarse la llamada prueba de Kruskal-Wallis, de aplicacin
sencilla y cuyos resultados son casi equivalentes a los del Anlisis de la Variancia.

26.2 Prueba Kruskal-Wallis.

Esta prueba consiste en dar un nmero de orden a cada una de las observaciones y calcular el
valor H el cual puede interpretarse con la tabla de 2 .
Con el fin de no distraerse en los clculos aritmticos, supngase que se ha tomado la estatura de
los alumnos de cuatro escuelas diferentes y se desea saber si los cuatro promedios difieren
significativamente o si tales diferencias pueden explicarse fcilmente por el azar.

26.2.1. Clculo e Interpretacin.

Para efectuar la prueba se proceder de la siguiente forma:

1. Sin tomar en cuenta el grupo al que pertenece, se dar a cada observacin un nmero de
orden de uno en adelante, empezando por la menor y terminando por la mayor. Cuando hay
varias observaciones iguales, a cada una se le dar el promedio del nmero que corresponda.
Note en el cuadro siguiente que la menor estatura observada fue 135 y a ese individuo se le
dio el nmero 1. Luego aparece un escolar con 136, a quien corresponde el 2 y otro de 137, a
quien corresponde el nmero 3. Hay en seguida tres escolares de 138 centmetros, a quienes
correspondern los puestos 4, 5 y 6 pero no miden exactamente igual, se tom el promedio de
estos tres nmeros (15/3 = 5) y a cada uno se le dio un valor de 5. Desde luego, el prximo
valor (140 cm) no ser 6 sino 7 pues los 3 valores con 5, que representan los escolares
cuarto, quinto y sexto.

En la misma forma se continuar, hasta dar un nmero de orden a cada observacin.

Cuadro 254.
Estatura en centmetros de los alumnos de cuatro escuelas.
(Clculo de la prueba de Kruskall-Wallis).

Escuela A aB Escuela C Escuela D


Estatura N de Orden Estatura N de Orden Estatura N de Orden E statura N de Orden
142 9 136 2 135 1 137 3
149 16 138 5 138 5 150 17,5
138 5 145 12 140 7 153 20
150 17,5 144 11 147 14 141 8
151 19 154 21 146 13
148 15 155 22
143 10
Suma T1 66,5 76 27 83,5
n 5 7 4 6
X 146 144 140 147

2. Para cada escuela separadamente se suman los nmeros de orden acabados de calcular
(valores T1 del cuadro anterior).

3. Calcular el valor II, mediante la frmula: H = [ 12 x T1 ] 3 (N+1)


N(N+1) n1
en donde:

12 y 3 son constantes invariables en cualquier prueba.


N es el total de personas estudiadas: 22 en nuestro ejemplo.
n1 es el nmero de individuos estudiados en cada escuela: 5, 7, 4, 6.
T1 es la suma de los nmeros de orden en cada uno de los grupos.
En nuestro ejemplo: 66.5; 76.27; 83.5.

Como indica la frmula, cada una de las sumas (T1) debe elevarse al cuadrado y dividirse por el
nmero de escolares en la respectiva escuela y luego sumar los resultados de tales divisiones.

Por lo tanto aplicando la frmula:

H = [ 12 (66.5 + 76 + 27 + 83.5) ] 3 (22 +1)


22 (22+1) 5 7 4 6

= [ 12 (884.45+825.14+182.28+1162.04) ] (3 x 23)
22 x 23
= [ 12 (3.053.88) ] - 69= 72.42-69= 3.42
506

4. Buscar en la tabla de x el valor de H es o no significante, teniendo en cuenta que el nmero


de grados de libertad es igual al nmero de grupos menos 1. En nuestro ejemplo, cmo eran
cuatro escuelas los grados de libertad son: (4-1) = 3

Para que el valor H con tres grados de libertad sea significante cuando se desea un 95% de
certeza, la tabla de x muestra que debe exceder a 7.8. Como nuestro valor calculado fue 3.42,
el cual est muy por debajo del valor d la tabla, concluimos que las diferencias en la estatura
entre las cuatro escuelas, muy posiblemente se deban al azar.
CAPITULO XXVII
COMPARACION ENTRE DOS MUESTRAS NO INDEPENDIENTES.

271. Generalidades.

Cuando los individuos que se estudian sirven como su propio control como en el caso en el cual se
le toma a cada individuo determinada medicin antes y despus de cualquier tratamiento, o
cuando con fines comparativos dos mtodos diferentes se aplican a los mismos individuos, es claro
que en tales ocasiones, los valores que quieren compararse no son independientes. As por
ejemplo, sin con el fin de evaluar la accin hipertensiva de una droga se toma la presin arterial a
un grupo de individuos antes y despus de su aplicacin, naturalmente que los valores despus
de aplicada la droga dependern de la tensin original, pues una persona cuya tensin sistlica
original sea de 150, posiblemente ascienda a 180, pero es dudoso que quien tenga inicialmente
una tensin de 100, presente luego un valor de180. Los mtodos apropiados para hacer estas
comparaciones son algo distintos de los estudiados hasta ahora y lo mismo que en el caso de las
muestras independientes, debe tenerse en cuenta si los resultados se han resumido mediante
promedios o porcentajes.

27.2. Comparacin de los promedios de dos muestras no independientes.

En el captulo XXIII se compararon las pulsaciones por minuto de 16 hombres y 16 mujeres,


llegndose a la conclusin de que las diferencias observadas eran muy probablemente debidas al
azar. Con el fin de comparar los resultados de la prueba estadstica utilizada cuando las muestras
son independientes, con la que debe utilizarse cuando las muestras no son independientes,
vamos a suponer que los valores de los hombres corresponden a los de un grupo de individuos a
quienes se les tom el nmero de pulsaciones antes de inyectarle determinada droga A y que
los valores dados entonces para las mujeres, corresponden al mismo grupo de individuos
despus de la inyeccin de la droga.

Los resultados, copiados de los cuadros 225 y 235 son los siguientes:

Cuadro 257
Pulsaciones por minuto en 16 individuos normales, antes y despus de la aplicacin de la Droga
A
(Clculo del promedio y de la D.E. de los cambios observados)

Antes Despus Cambios Desviaciones Desviaciones


Individuos
de la droga de la droga (despus antes) (cambios promedio) al cuadrado
1 70 76 6 3 9
2 66 72 6 3 9
3 82 79 -3 -6 36
4 64 65 1 -2 4
5 65 70 5 2 4
6 88 88 0 -3 9
7 82 80 -2 -5 25
8 70 76 6 3 9
9 70 78 8 5 25
10 84 84 0 -3 9
11 85 86 1 -2 4
12 68 74 6 3 9
13 84 84 0 -3 9
14 76 78 2 -1 1
15 65 70 5 2 4
16 65 72 7 4 16
Total 1184 1232 0 182
Antes de la inyeccin : Xa = 1.184/16 = 74
D.E .= 84.1 (tomado del cuadrado de 225)

Despus de la inyeccin: X d =1.232/16 = 77


D.E. = 6.21 (tomado del cuadrado de 235)

Cambios observados: Xe = 48/16 = 3


D.E. = 182/16 = 3.37

27.2.1. Prueba de significancia incorrecta.

Si se considera errneamente que las mediciones antes y despus de la inyeccin de la droga son
independientes, se aplicara la prueba estadstica vista en el Captulo XXIII a propsito de la
comparacin de 16 hombres y 16 mujeres.

En tal caso:

(E.E.)1 = 8.41/16= 2.11


(E.E.)2 = 6.21/16= 1.55
(E.E.) de la diferencia = (2.11) + (1.55) = 2.6

y conforme ya se vio:

Diferencia = 77 74 = 1.1 no significante


E.E. 2.6

27.2.2. Prueba de significancia correcta.

Para hacerse esta prueba debe trabajarse con los cambios observados de la manera siguiente:

a. Buscar los cambios observados, restando para cada individuo el valor observado Despus de
la aplicacin de la droga, el que se observ Antes de que sta hubiera sido aplicada. Debe
tenerse cuidado en conservar los signos (+) y (-).+

b. Sumar estos valores tomando en cuenta los signos algebraicos y dividir por el nmero de
individuos estudiados para obtener el promedio de los cambios (X = 48/16=3).

c. Buscar las desviaciones entre cada cambio y su promedio (Xe).

Note por ejemplo, que el tercer individuo presenta un descenso en las pulsaciones (-3) y al restar a
esta cifra el promedio (3), se obtiene:
-3 (3) = - 6
d. Elevar al cuadrado cada desviacin y sumar la columna correspondiente para obtener la
desviacin estndar por el mtodo conocido:

D.E.. = 182/16 = 3.37

e. Calcular el error estndar de los cambios, por el procedimiento ya conocido.

E.E. = 3.37 = 3.37 = 0.84


16 4

f. Para la prueba de significancia, como el promedio de los cambios:

Xe = Xd Xa = (77 74) = 3
Entonces:

Diferencia = 3 0 = 3.6 valor significante


E.E. 0.84

Note que la prueba correcta seala que las diferencias observadas son significantes, mientras que
si se hubiera utilizado incorrectamente la prueba para muestras independientes, habramos
concluido que tales diferencias no eran estadsticamente significantes.

27.3 Comparacin entre los porcentajes de dos muestras no dependientes.

Muchas veces se evala la eficacia de una nueva tcnica diagnstica comparando los resultados
que se obtienen con ella, con aquellos que se obtienen en lo mismo individuos con la utilizacin de
otra tcnica de reconocida eficiencia.

27.3.1 Comparacin incorrecta.

Si a cien nios se les hubiera aplicado PPD intradrmica en un antebrazo y PPD por escarificacin
en el otro para determinar cul procedimiento es mejor, no se obtendran todas las ventajas de
este experimento si nos contentramos con averiguar el porcentaje de nios positivos a cada una
de las pruebas.

Por lo tanto, la presentacin de tales datos, no sera correcta en tal forma, ni tampoco sera
correcta aplicar la prueba de significancia estadstica estudiada en el captulo XXIV, como si se
tratara las muestras independientes.

Cuadro 260

Resultados de la aplicacin de PPD intradrmico y por escarificacin


a un grupo de 100 nios

(Presentacin inadecuada de los datos)

Resultado Porcentaje de
Va de ubicacin Total
Negativo Positividad positividad
Intradrmica 30 70 100 30,0
Escarificacin 20 80 100 20,0
Total 50 150 200 25,0

Aplicando esta prueba:

25x75
(E.E.)1 = = 4.33
100

25x75
(E.E.)2 = = 4.33
100

(4.33)2 (4.33) = 6.12


2
E.E. de la diferencia =
por consiguiente:


Diferencia 30 20 1.63 no significante

E.E. 6.12
27.3.2 Comparacin correcta

Con el fin de comparar correctamente los resultados del experimento anterior, ellos deben
presentarse de tal manera, que se pueda averiguar cuantos nios fueron positivos o negativos a
las dos reacciones a la vez y cuntos de quienes dieron positividad a una reaccin fueron
negativos a la otra o viceversa.

Contraste el cuadro anterior, que no permite conseguir tal informacin, con el siguiente que s la
suministra:

Cuadro 261

Resultados de la aplicacin de PPD intradrmico y por escarificacin


a un grupo de 100 nios

Escarificacin
Intradrmico Total
- +
+ 16* 14 30
- 64 6* 70
Total 80 20 100

Puede apreciarse que la diferencia de 10% entre 30% de positividad al PPD intradrmico y el 20%
de positividad al escarificado, se debe al hecho de que hubo 16 individuos positivos a la primera
prueba y negativos a la segunda, mientras que solo hubo 6 nios positivos a la escarificacin y
negativos a la reaccin intradrmica, es decir:

Intradrmica (+) pero Escarificacin (-) 16 en 22 = 72,7%


Escarificacin (+) pero Intradrmica (-) 6 en 22 = 27,33%

Si los nios hubieran estado divididos en 11 y 11, entonces las dos pruebas diagnsticas habran
mostrado la misma positividad. Puede averiguarse por lo tanto, si la discordancia anterior es
significante, comparando con 50% cualquiera de los 2 porcentajes anteriores. Pues observe que
72.7% - 50% = a 22.7% e igualmente 50% - 27.3% = 22.7%. Para efectuar la prueba estadstica,
simplemente:

a. Calcule el error estndar correspondiente a los 22 individuos en los cuales las pruebas no
.
concordaron, tomando p = 50%, o sea:

p , q. 50x50 2500

22
E.E. = = 10.65
22 22

b. Divdase por este error estndar, la diferencia entre cualquiera de los 2 porcentajes en
discordancia y 50%, o sea:
50% 27.3% 22.7
= 2.13 significante.
E.E. 10.65

Mientras que la prueba correcta que se acaba de efectuar muestra una diferencia significante entre
el PPD intradrmico y el escarificado, la prueba incorrecta nos llevaba a una conclusin contraria.

27.3.3 Prueba de Mc. Nemar

En lugar de la prueba acaba de explicar, puede utilizarse la prueba de Mc. Nemar que consiste en
calcular Chi Cuadrado, en base, solamente a los valores en los cuales las dos reacciones no
concuerdan:

Wasserman
Kahn
- +
+ A B
- C D

Si llamamos estos valores, A y D, respectivamente, el clculo ser sencillamente:

2
( A D)
X 2
A D
o sea, con los datos del ejemplo anterior:
2 2

(16 6) 10
X 2 4.5
(16 6) 22
2
Buscando este valor en la tabla de X (cuadro 251) vemos que es significante, conclusin
idntica a la alcanzada con la prueba aplicada en la seccin anterior (27.3.2)

Note de paso:
(2.13)2 4.5
2
lo cual confirma nuevamente, que cuando x tiene solamente un grado de libertad, entonces:

Diferecia 2
( ) X 2
E.E.
AJUSTE DE TASAS (Tasas corregidas o estandarizadas)

Al querer comparar dos o ms poblaciones que difieran en su composicin por edad, sexo o raza,
deben tenerse en cuenta estos factores para que la comparacin sea correcta.

As por ejemplo, la tasa cruda de mortalidad en dos poblaciones puede diferir exclusivamente por
el hecho de que en una de ellas la poblacin sea ms vieja que en la otra, a pesar de que las tasas
especficas por edad sean semejantes.

Desde luego que una comparacin correcta podra hacerse comparando una a una las tasas
especficas, por edades, pero cuando se desea resumir el estudio en una simple cifra, es necesario
recurrir a un procedimiento que elimine la influencia del factor que est viciando la comparacin.
Para tal fin, son de utilidad las tasas corregidas.

Aun cuando la explicacin que sigue se refiere concretamente a la correccin de tasas por edades,
el procedimiento es el mismo para la correccin de tasa por sexo, raza, etc. Pueden inclusive
presentarse tasas corregidas simultneamente por edad y sexo o por edad y raza; segn se
requiera.

Poblacin estndar

Para l clculo de las tasas corregidas se requiere una poblacin estndar, sin que tenga mayor
importancia la poblacin que se escoja como tal.

Si se comparan dos ciudades, la poblacin estndar puede ser la suma del nmero de sus
habitantes o puede escogerse una de ellas como poblacin estndar.

Si la comparacin es entre varias ciudades de un mismo pas, puede escogerse la poblacin del
pas como estndar.

La obtencin de tasas corregidas puede hacerse por dos mtodos:

a) Mtodo directo
b) Mtodo indirecto

El mtodo directo equivale a preguntarse cul sera la mortalidad de la regin que se estudia si
ella tuviera la misma composicin etaria que la poblacin estndar o cual sera la tasa cruda de
mortalidad de las dos o ms regiones que se comparan, si ellas tuvieran la misma composicin
etaria.

El mtodo indirecto equivale a preguntarse cul sera la mortalidad de la regin que se estudia, si
ella estuviera sometida a las mismas tasas de mortalidad por edades de la poblacin estndar.

Mtodo directo.

Con el fin de facilitar la verificacin de los clculos tomemos el siguiente ejemplo terico, en donde
se comparan los datos de dos poblaciones: la primera una poblacin joven en progresin y la otra,
una poblacin vieja, estacionaria.
Cuadro 1

Habitantes, defunciones y tasas de mortalidad por grupos de edad, en las poblaciones de


San Pedro y San Juan, 1960

San pedro San juan

Mortalidad Mortalidad
Grupos de por 1.000 por 1.000
edad Habitantes Defunciones habitantes Habitantes Defunciones habitantes
(1) (2) (3) (4) (5) (6) (7)
- 15 aos 40.000 400 10,0 30.000 270 9,0
15 49 aos 50.000 300 6,0 50.000 250 5,0
50 y + aos 10.000 200 20,0 30.000 540 18.0
Todas las 100.000 900 9,0 110.000 1.060 9,6
edades

Puede verse en el cuadro que antecede que a pesar que las tasas por edad son menores en San
Juan, su tasa cruda de mortalidad es mayor que la de san Pedro, lo cual se debe desde luego, a
que en la primera ciudad hay un nmero mayor de personas de 50 y ms aos, edades en donde
la mortalidad es mayor.

Para la correccin de tasas por el mtodo directo puede seguirse cualquiera de los dos siguientes
procedimientos.

Primer procedimiento. Los pasos a seguir, resumidos en el cuadro 366, son:

1) Escoger la poblacin estndar y buscar su composicin por grupos de edad. En este


ejemplo, se ha tomado la suma de los habitantes de las ciudades, como poblacin
estndar (columna 2).

2) Averiguar el nmero de muertes que se habran producido en esta poblacin si ella hubiera
estado sometida a las tasas de mortalidad de cada grupo de edad de la primera de las
ciudades que se estudian. Para ella se multiplicara el nmero de habitantes en cada grupo
etario de la poblacin estndar por la tasa correspondiente observada en la primera ciudad
(columna 2 x 3. La suma de estos productos ser el total de muertes tericas para la
primera ciudad.

3) Repetir el paso anterior utilizando las tasas de la segunda ciudad (columna 2 x 5).

4) Dividir las muertes tericas obtenidas en los dos pasos anteriores (total de columnas 4 y
6) por la poblacin estndar total y dichos resultados representaran las tasas corregidas
para las ciudades que se estudian.
Cuadro 2

Clculos para la correccin de tasas por el mtodo directo, utilizando como poblacin
estndar, la suma de los habitantes de las 2 ciudades

SAN PEDRO SAN JUAN


Habitantes en
Grupos de Mortalidad por Mortalidad por
la poblacin Mortalidad Mortalidad
edad 1.000 1.000
estndar terica(2) * (3) terica (2) * (3)
habitantes habitantes
(1) (2) (3) (4) (5) (6)
-15 aos 70.000 10 700 9 630
15 49 aos 100.000 6 600 5 500
50 y + aos 40.000 20 800 18 720
Todas las
210.000 2.100 1.850
edades

La tasa corregida par a las dos ciudades ser:

2.100
Para San Pedro *1.000 10.0 por 1.000 habitantes
210.000

1.850
Para San Juan *1.000 8,8 por 1.000 habitantes
210.000

Las tasas anteriores sealan, que se las dos poblaciones hubieran tenido una distribucin etaria
semejante, la tasa cruda de mortalidad de San Juan habra sido inferior a la de San Pedro y no
superior como lo es en el ejemplo. De hecho, la tasa de San Juan es:

8,8 *100
88% de la de San Pedro
10
Segundo procedimiento. Un habitante de San Juan podra preguntarse cul sera la tasa de
mortalidad de su ciudad, si ella tuviera la misma distribucin etaria de San Pedro. En este caso
podemos tomar como poblacin estndar la de San Pedro.

Los clculos en todo semejantes al del ejemplo anterior, aparecen a continuacin:

Cuadro 3
Clculos para la correccin de tasas por el mtodo directo, tomando como poblacin
estndar la de la ciudad de San Pedro

SAN JUAN
Habitantes en la
Grupos de edad Mortalidad por 1.000 Mortalidad terica
poblacin estndar
habitantes (2)*(3)
(1) (2) (3) (4)
- 15 aos 40.000 9 360
15 49 aos 50.000 5 250
50 y + aos 10.000 18 180
Todas las edades 100.000 790
La tasa corregida para San Pedro, que ha sido tomada como poblacin estndar, ser su misma
tasa cruda de mortalidad (9 x 1.000). La tasa corregida para San Juan ser:

790 *1.000
7,9 x mil habitantes
100.000

De nuevo se observa que la tasa de San Juan, es:

7,9 *100
88% de la de San Pedro
9
Mtodo indirecto

Los siguientes pasos esquematizados en el cuadro 369 resumen los correspondientes clculos:

1. Escoger la poblacin estndar y buscar su tasa cruda de mortalidad y sus tasas de mortalidad
por grupos de edad (columna2.

2. Averiguar la distribucin por edades de la poblacin de cada una de las ciudades que se
comparan ( columnas 3y5)

3. Averiguar las muertes tericas que se produciran en la primera ciudad si estuviera sometida a
las tasas de mortalidad de la poblacin estndar. Para ello se multiplica cada una de las tasas
de la poblacin estndar (columna 2) por el correspondiente nmero de habitantes de la
primera ciudad (columna 3. La suma de estos productos ser el total de muertes tericas en
dicha ciudad (columna 4.

4. Repetir el procedimiento anterior para obtener el total de muertes tericas en la segunda


ciudad (columna 6.

5. En cada ciudad dividir el nmero total de muertes que realmente ocurrieron por el
correspondiente total de muertes tericas. Con esto se obtiene un factor correctivo que
expresa la relacin entre la mortalidad del aria estudiada y la mortalidad de la poblacin
estndar.

6. Obtener las tasas corregidas para las ciudades que se estudian, multiplicando los valores
encontrados en el paso anterior por la tasa cruda de mortalidad de la poblacin estndar.

Cuadro 4
Clculos para la correccin de tasas por el mtodo indirecto, utilizando las tasas de
mortalidad de una poblacin terica.

Tasa de SAN PEDRO SAN JUAN


mortalidad
Grupos de por 1.000 Mortalidad Mortalidad
edad habitantes en Habitantes (b) terica (2) * Habitantes (b) terica (2) *
la poblacin (3) (5)
estndar (a)
(1) (2) (3) (4) (5) (6)
- 15 aos 8 40.000 320 30.000 240
15 49 aos 5 50.000 250 50.000 250
50 y + aos 25 10.000 250 30.000 750
Todas las Ed. 7 100.000 820. 110.000 1.210
(a) cifras tericas, digamos para todo el pas
(b) cifras tomadas del cuadro 365

Como las muertes que relmete ocurrieron fueron (cuadro 365):

San Pedro = 900


San Juan = 1060
Se calcular:

900
Factor correctivo para San Pedro 1,10
820

1.060
Factor correctivo para San Juan 0,86
1.240

Las tasas corregidas para las dos ciudades se obtendrn aplicando los anteriores valores para la
tasa cruda de la poblacin estndar, en este caso 7 x 1000:

Tasa corregida para San Pedro: 7 x 1,10 = 7,70 x 1.000

Tasa corregida para San Juan: 7 x 0,85 = 6,02

6,02 *100
La tasa de San Juan es: 78% de la de San Pedro
7,7

Comparacin de los dos mtodos

Aun cuando el mtodo directo parece mucho ms lgico que el indirecto, este ltimo tiene como
ventajas:

1. No requiere conocer la mortalidad por edades en las reas que se comparan.

2. Cuando las poblaciones son pequeas, sus tasas de mortalidad pueden presentar grandes
fluctuaciones debidas al azar y en esos casos las tasas de poblacin estndar por ser muy
estables suministran una excelente mortalidad terica.

Se habr observado que segn la poblacin que se escoja como estndar las tasas obtenidas son
diferentes. Sin embargo, la importancia relativa de dichas tasas, que es lo que importa conocer,
permanece casi inmodificable. Puede verse que los ejemplos que sirvieron de ilustracin, a pesar
de que los valores que se encontraron para las dos ciudades variaron considerablemente segn el
mtodo y la poblacin estndar utilizada, el cambio relativo fue muy semejante en los tres
ejemplos: 88%, 88% y 78% respectivamente.

Debe tenerse en cuenta que las tasas corregidas no aaden ninguna nueva informacin a las tasas
de mortalidad especificas por edades. Por el contrario mucha informacin se pierde y por lo tanto,
ellas no deben sustituir a las tasas especficas, cuyo anlisis detallado es mucho ms importante
que el dato resumido de una tasa corregida.