Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Libro de Bioestadistica PDF
Libro de Bioestadistica PDF
Herramienta de la Investigación
I.S.B.N.: 980-233-188-0
Editado por: CDCHT-UC
Valencia, Venezuela
Impreso en Venezuela
Printed in Venezuela
4
PRÓLOGO
Este libro fue diseñado especialmente para los alumnos de Ciencias de la
Salud que se inician en el estudio y uso de la Estadística como herramienta
auxiliar en el campo de la investigación científica.
En él, hemos buscado la forma de hacerles comprender a nuestros edu
candos, de la manera más sencilla posible, el manejo de los datos, los proce
dimientos en los cálculos de los diversos estadísticos, así como sus interpre
taciones. Por lo tanto, el lenguaje empleado en su redacción responde a este
propósito. Es un lenguaje llano, sencillo y conciso, donde, de manera direc
ta vamos a la esencia del concepto o del procedimiento que queremos ense
ñar, despojándolo de todo adorno o retóricas explicaciones, las cuales ha
rían más compleja su aprehensión. Para teorías más elaboradas y conoci
mientos de mayor profundidad, será necesario consultar otras de las
muchas publicaciones que abundan en esta disciplina.
La experiencia de más de veinte años de docencia en el área de las Cien
cias de la Salud, nos ha enseñado que nuestros alumnos están más motiva
dos por el aprendizaje de aquellas asignaturas directamente relacionadas
con los procesos de salud-enfermedad; más que con cualquier otra materia.
Están ávidos de esos conocimientos, por lo tanto, lo demás lo perciben
como innecesario o distractor de su objetivo fundamental.
Consciente de esta situación, al escribir este libro hemos omitido inten
cionalmente extensas explicaciones teóricas, demostraciones, despejes de
fórmulas matemáticas, así como complejas técnicas de análisis estadístico,
en particular del campo de la Estadística Inferencia!. Por lo tanto, no es un
exhaustivo tratado de Estadística. Es fundamentalmente, un libro de texto
básico, muy didáctico y sencillo de comprender por quienes lo consulten, y
aún cuando está elaborado para alumnos de pre-grado de las Escuelas de
Medicina, Bioanálisis y Enfermería, prevemos que también será de utilidad
en otros niveles donde se utilice la metodología estadística como un auxi
liar de la investigación. Esta obra es producto de una extensa revisión bi
bliográfica y de nuestra experiencia docente, por largo años acrisolada en
las aulas de clase de esta Universidad.
Eddy Puertas López
Profesora Titular de la Facultad de Ciencias de la Salud
de la Universidad de Carabobo
CAPÍTULO/
Uso de la Estadística en el campo de la Salud
Algunas definiciones básicas en estadística: Estadística. Estadística descriptiva.
Estadística inferencia/. Variables. Escalas de medición: escalas nominales, ordi
nales, de intervalo y de razón. Parámetros y estadísticos. Bioestadísticas. Epide
miología. Estadísticas de la salud. Estadísticas vitales. Uso de la Estadística en el
campo de la salud. La Estadística en la Administración sanitaria. Aplicación de la
Estadística en la investigación. Etapa de planificación de una investigación. Ela
boración de un plan o proyecto. Planteamiento del problema: enunciado del pro
blema; importancia del problema y justificación de su estudio; formulación del
problema; control del problema. Objetivos de la investigación. Marco teórico:
marco histórico, marco conceptual, sistema teórico, definiciones de términos.
Marco metodológico: Tipos de diseños de investigación. Niveles y tipos de investi
gación: estudios descriptivos, correlacionales, comparativos, experimentales,
cuasi-experimentales, estudios transversales, retrospectivos, prospectivos. Marco
administrativo. Elaboración de las referencias bibliográficas. Bibliografia.
7
l. DEFINICIONES BÁSICAS
Estadística.- Cuando se intenta definir el término Estadística, se encuen
tran diversas opiniones que incluyen su ubicación como ciencia, método,
técnica y aún como arte. Sin embargo, como denominador común se en
cuentra el criterio de que es una rama de la matemática, utilizada para el
manejo de masas de datos numéricos y por consiguiente, para estudiar la
variación de diferentes fenómenos. También puede definirse como el méto
do empleado para la recopilación, presentación, análisis e interpretación de
datos numéricos.
G. Utni Juli, la define como la ciencia que trata de la recolección, clasifi
cación y presentación de los hechos, sujetos a una apreciación numérica
como base a la explicación, descripción y comparación de un fenómeno.
Serenko y Esmakov, la definen como la ciencia social que estudia el as
pecto cuantitativo de los fenómenos sociales en masa, en relación indisolu
ble con sus particularidades cualitativas.
Shelly Hernández habla de la Estadística como el conjunto metódico de
los hechos, de los individuos o de las cosas que suelen contarse o medirse,
de sus frecuencias, y de la ordenación y significación analítica de las cifras
obtenidas.
Gini la define como una técnica especial, apta para el análisis de los fe
nómenos de masa o colectivos, entendiendo por tales aquellos fenómenos
naturales, económicos, sociales, etc., cuya medición requiere de la observa
ción de una masa de fenómenos más simples llamados individuales o parti
culares.
Para Ledezma, la Estadística es el arte y la ciencia de manejar los núme
ros cuando expresan los valores cuantitativos de hechos similares. Serviría,
por lo tanto, para valorar observaciones o experimentos cuando éstos se ex
presan cuantitativamente, es decir, mediante números.
Para Chao, la Estadística es un conjunto de teorías y métodos que han
sido desarrollados para tratar la recolección, el análisis y la descripción de
datos muestrales con el fin de extraer conclusiones útiles... es decir, que la
Estadística moderna abarca la estadística descriptiva y la inferencia.
Kaplan sostiene que la Estadística, en su sentido más amplio, consiste en
las maneras de tratar con una multiplicidad de datos para determinar qué
9
conclusiones apoyan y cuánto apoyo les proporcionan. Desde este punto de
vista, la estadística suele ser caracterizada hoy en día como disciplina que
trata del razonamiento empleado cuando se toman decisiones frente a la in
certidumbre.
De acuerdo con los niveles de conocimientos que puede proporcionar el
estudio de una variable desde el punto de vista estadístico, la estadística
puede dividirse en dos partes:
Estadística Descriptiva, tiende a condensar o resumir un conjunto de da
tos o características de una serie de valores, describiendo ciertas caracterís
ticas del conjunto examinado. Por ejemplo, al medir la inteligencia, la ten
sión arterial, la hemoglobina de un grupo de sujetos, se pueden agrupar los
valores obtenidos en distribuciones de frecuencias, construir tablas, gráfi
cas, calcular promedios, percentiles, etc.
Estadística Inferencia/. Se refiere a los métodos estadísticos donde a
partir del estudio de una muestra (parte de la población total), se busca esti
mar o generalizar sus conclusiones a la totalidad de la población. Se ocupa
específicamente de hacer inducciones, generalizando al universo los ha
llazgos logrados en las muestras. Utiliza métodos y técnicas adecuadas para
ese proceso inductivo.
Variable estadística: Es una característica o propiedad que puede variar
(adquirir diversos valores) de un sujeto a otro, o en un mismo sujeto en di
versas oportunidades; siendo esta variación susceptible de medición. Ejem
plos: diagnóstico, síntomas, motivación intrínseca, sexo (son variables
cualitativas. Se refieren a un atributo), peso, talla, edad, temperatura (son
variables cuantitativas. Se refieren a magnitudes).
El procesamiento de estas variables da origen a las escalas de medición
nominales, ordinales, de intervalo y de razón.
Escalas de medición: Los valores de medición de cualquier variable,
para ser procesados y luego analizados, deben presentarse de manera resu
mida en clases estadísticas, cuyo número depende de las divisiones que ad
mita la variable. El conjunto ordenado de clases constituye lo que se deno
mina escala. Según la naturaleza de la variable que la origina, ésta puede
ser: nominal, ordinal, de intervalo, o de razón.
Escalas Nominales o Categóricas: Existe un tipo de variable cuya me
dición consiste simplemente en indicar si la característica está presente o
10
no en cada sujeto de estudio, o en incluir determinados elementos dentro de
las categorías que les correspondan.
A través de algunos ejemplos puede aclararse mejor el concepto. Al tra
bajar con la variable "sexo" en un grupo de sujetos, se le asigna a unos la
condición de masculinos y a otros la de femenino, en otras palabras, se ubi
can a los sujetos en una de las dos categorías que puede admitir la variable:
masculino o femenino. La variable ansiedad se distribuye en una escala no
minal cuando se ubican a las personas en las "clases" de ansiosas o no an
siosas. Del mismo modo, si se dice que unas cepas de un parásito son infec
tantes y otras no lo son. La variable "infectante" está medida en una escala
nominal con dos posibilidades: SI o NO.
En resumen, la escala de medición nominal indica la presencia o ausen
cia de un atributo en los sujetos de estudio, pero no permite cuantificar la
magnitud del atributo.
En la siguiente lista se ofrecen otros ejemplos de escalas nominales de
uso frecuente en Ciencias de la Salud, y los valores o categorías en las
cuales pueden clasificarse:
VARIABLE CLASES O CATEGORÍAS
Dermatitis, Sarampión, Cáncer, Gastroente
Diagnóstico
ritis, Neumonía.
Accidentes, Neumonías, Cáncer, Envenena
Causas de muerte
miento.
Tipo de reacción Positivo, Negativa.
Deshidratación, Herida, Parto, Intoxicación,
Causas de Admisión
Traumatismos.
Escalas Ordinales: Una variable se expresa en una escala ordinal, cuan
do los valores que asume se jerarquizan en un orden de rango o magnitud.
La variable "estado nutricional" comúnmente se presenta en escala ordi
nal, con sus clases: "Desnutrición Grado 1, Grado 2 y Grado 3 ". Cada una
de estas categorías es algo más que nominal, sin llegar realmente a lo numé
rico. La variable "Quemadura ", cuando se expresa en la misma forma, es
una escala ordinal. Cuando a la variable "Ingresos económicos " se le asig
nan los valores "ALTO ", "MEDIO ", "BAJO " también se está expresando
en una escala ordinal, entendiendo que el valor "ALTO ", numéricamente es
superior al "MEDIO "; pero no se indica cuanto es la diferencia.
11
En ocasiones las escalas ordinales son difíciles de manejar por cuanto ni
son nominales ni son numéricas y requieren ser tratadas con técnicas esta
dísticas adecuadas.
No es frecuente encontrar variables que se midan rigurosamente de ma
nera ordinal. Con frecuencia ocurre que variables de naturaleza numéricas,
por razones prácticas se expresan en escalas ordinales. Por ejemplo, cuando
se habla de dosis altas, medias o baja, originalmente las dosis fueron medi
das en escala numérica: 1 ce, 2 ce, 3 ce, ... , pero pueden manejarse como:
bajas = dosis inferiores a 1,5 ce. Medias = dosis entre 1,5 y 3 ce. Altas = do
sis superiores a 3 ce. De esta manera una variable numérica se expresa en
una escala ordinal.
Las otras dos escalas de medición: De intervalo y De razón correspon
den a variables numéricas o cuantitativas, en las cuales se asigna un valor
numérico para expresar la magnitud de la característica en estudio.
Escalas de intervalos. - Se caracterizan porque en ellas la presencia del
valor "CERO" no significa la ausencia de la característica que se está mi
diendo; sólo es un punto de referencia. Las cifras asignadas en esta escala
no indican exactamente una magnitud.
Ejemplo: Si al aplicar una prueba de Bioquímica a un alumno de Medici
na, y éste obtiene una calificación de cero puntos no significa, necesaria
mente, que el alumno carezca totalmente de conocimientos en esa asignatu
ra, sino que no supo responder adecuadamente a las preguntas formuladas
en ese momento. Así mismo, si otro alumno obtiene, en la misma prueba 16
puntos, no significa que él posee exactamente el doble de conocimientos de
otro que obtuvo sólo 8 puntos.
En Ciencias de la Salud, suele utilizarse este tipo de escala especialmen
te en el campo de la Psicología, donde muchas variables se miden a través
de Tests. Ej. Test de ansiedad, de depresión, de Locus de Control, de Inteli
gencia, de Motivación Intrinseca, de Razonamiento Abstracto, etc.
Por su parte, las escalas de razón sí están referidas a un CERO
ABSOL UTO donde su presencia significa la ausencia de la característica
medida; y las cifras numéricas realmente indican una magnitud. Por ejem
plo, un niño de 60 cm. de estatura, mide la mitad de otro cuya talla es de 120
cm. U otro de 10 kilos pesa el doble de lo que pesa otro de 5 Kilos. O un jo
ven de 21 años de edad ha vivido exactamente tres veces el tiempo vivido
12
por un niño de 7 años.
Al estudiar las variables numéricas o cuantitativas, es necesario desarro
llar otros aspectos importantes con relación a los valores que pueden tomar
dentro de las escalas. Algu nas escalas sólo admiten valores enteros, es de
cir, no pueden expresarse mediante fracciones o decimales; por ejemplo: el
número de hijos de una familia, el número de embarazos de una mujer, ha
bitantes por viviendas, glóbulos rojos, etc. En tales casos se les denominan
variables discretas.
Cuando la variable puede asumir cualquier valor, incluso decimal, se
dice que varía de manera continua. Como ejemplos se pueden citar: el
peso, la talla, los valores de hemoglobina. Tanto las variables de intervalos
como las de razón pueden variar de manera continua o discreta. Algunas va
riables que teóricamente son de naturaleza continua, como por ejemplo la
edad, son comúnmente expresadas en forma discreta. En casi todos los ca
sos la edad se expresa en números enteros.
Variabilidad.- La aplicación de la Estadística en diversas áreas de las
Ciencias de la Salud, viene dada por la naturaleza variable de muchos de los
fenómenos que se estudian en esa área: la natalidad, la morbilidad y la mor
talidad, por ejemplo, son hechos vitales afectados por factores biológicos y
sociales en forma variable, no sólo dentro de grupos humanos diferentes,
sino también dentro de los mismos individuos. Esa característica básica que
está presente en los hechos investigados y en base a la cual son diferentes o
toman valores diferentes es lo que se conoce como variabilidad. En todo fe
nómeno donde la variabilidad esté presente, la Estadística tiene aplicación.
Población o universo: Conjunto completo de individuos, objetos o
unidades que poseen alguna característica común observable. Ejemplo, la
población en edad de votar.
Muestra: Un subconjunto o parte de la población o del universo que re
fleja las características del mismo.
Parámetro: Es la medida de resumen (o valor representativo) de cual
quier característica medible en una población. Ejemplo, la tasa de mortali
dad general para una población; el porcentaje de desnutridos en una pobla
ción; el peso promedio de los niños al nacer.
Estadístico: Es la medida de una característica estudiada o calculada en
una muestra, de acuerdo con determinados procedimientos específicos. Co-
13
múnmente, se usa un estadístico para estimar el parámetro correspondiente
de una población. Por ejemplo, la media aritmética de una muestra permite
estimar la media aritmética para la población de la cual se obtuvo.
Serie estadística: Es un conjunto de datos referidos a una variable cuali
tativa o cuantitativa. Estos datos pueden estar ordenados o no.
Igualmente pueden estar agrupados en clases (series agrupadas) o pre
sentados en un listado de datos, conocidos como datos directos.
Bioestadística: Es la rama de la estadística aplicada al estudio de los fe
nómenos variables en los seres vivos.
Epidemiología: Es el estudio de la distribución de una enfermedad o
condición fisiológica en poblaciones humanas, y de los factores que influ
yen en esa distribución.
Estadística Vital: Se refiere al estudio de los hechos relacionados con el
comienzo y fin de la vida y los cambios de estado civil que ocurren durante
ella. Para Swaroop, el término estadísticas vitales se usa para denotar he
chos registrados sistemáticamente y reunidos en forma numérica que se re
lacionan o derivan de registros de eventos vitales, a saber: nacidos vivos,
muertes, muertes fetales, matrimonios, divorcios, adopciones, legitimacio
nes, etc. De hecho, las estadísticas vitales se derivan de eventos registrados
legalmente sin incluir los datos de población o las características de morbi
lidad.
Estadísticas de salud: Conjunto de datos referidos a la situación de salud
de una comunidad. Incluye todo lo relacionado con natalidad, morbilidad y
mortalidad.
14
Una revisión de la literatura sobre la Estadística en el campo de las Cien
cias de la Salud permite establecer una base de sustentación firme para la
justificación de la importancia que tiene la aplicación de la Metodología
Estadística en este campo del conocimiento.
En relación con las Estadísticas de Salud, Fayad Camel, uno de los auto
res más consultado en Venezuela, señala que éstas son indispensables para
la planificación, ejecución y evaluación de los programas de salud, ya que
permiten el diagnóstico de comunidad (descripción de la situación de salud
en una comunidad), y facilitan la aplicación de técnicas apropiadas para
medir hasta que punto se ha logrado el cumplimiento de los programas de
salud.
En el sector salud, la Estadística permite:
a) Describir el nivel de salud de la comunidad
b) Diagnosticar las enfermedades de la comunidad.
c) Encontrar soluciones a los problemas de salud y hallar las claves para
la acción administrativa.
d) Determinar prioridades para los programas de salud.
e) Dirigir y mantener el control durante la ejecución de los muestreos,
etc.
f) Promover la legislación en salud.
g) Crear estándares administrativos de actividades de salud.
h) Determinar el alcance y restricciones de las actividades de salud.
i) Difundir información confiable sobre la situación de salud y los pro-
gramas de salud.
g) Determinar el éxito o fracaso de los programas específicos de salud.
k) Pedir ayuda pública para el trabajo de salud.
Bancroft expresa que de manera cotidiana, el médico utiliza la Estadísti
ca al tener presente las variaciones entre los individuos y cuando tales va
riaciones son normales o no. Igualmente cuando hace el diagnóstico de un
paciente y el pronóstico, según su enfermedad (probabilidad de curar o de
morir). Al mismo tiempo, la introducción de nuevos tratamientos debe ir
acompañada de un análisis crítico, no sólo acerca de su superioridad de los
15
antiguos tratamientos, sino además, tener claramente establecido todo lo re
ferente al control de los experimentos: la similitud del grupo control con el
grupo experimental y si la diferencia obtenida es atribuible o no al azar.
Mainland señala, por su parte, que el método estadístico es usado por el
laboratorista al promediar dos lecturas de una pipeta, o por el clínico cuan
do determina si es o no normal la tensión arterial de un paciente o cuando se
recomienda un tratamiento fundado en el hecho de que es mejor que otro.
Del mismo modo Hill fundamenta la importancia y necesidad de la in
formación estadística, tanto en la medicina clínica como en salud pública,
al indicar que, en el primer caso, es esencial precisamente debido a la varia
bilidad humana. Por otro lado, la reacción favorable de un caso de una en
fermedad a un nuevo tratamiento puede considerarse significativa cuando
la experiencia anterior ha demostrado, luego de la observación de muchísi
mos casos, que esas reacciones no son variables. Así mismo, Hill añade que
sin el uso de la estadística no puede fundamentarse el mayor o menor valor
de un determinado tratamiento o si una droga poderosa tiene más efectivi
dad que otra en condiciones particulares.
Otros elementos que valorizan la estadística en su aplicación a la clínica
médica, son su utilización en la determinación de la variación de una enfer
medad de un paciente a otro, o si está asociada a determinadas característi
cas como edad, sexo u otra; en el seguimiento de pacientes; en la definición
de normalidad o la exactitud de procedimientos de laboratorio. En el caso
de la salud pública, la aplicación es muy amplia, refiriéndose, por ejemplo,
a la comprobación de la eficacia de medidas preventivas, tales como una
vacunación. En resumen, para Hill, la información estadística en salud pú
blica está orientada hacia dos propósitos principales: por una parte, ser utili
zada como el indicador del estado de salud de una comunidad y por la otra,
para determinar las razones fundamentales de las diferencias entre las for
mas como los indicadores se presentan en diversos sectores de la sociedad.
Otro elemento teórico que destaca la necesidad de la información esta
dística, lo encontramos en trabajos de Morichau-Beau-Chant, quien reco
noce lo indispensable de conocimientos suficientemente precisos de la si
tuación sanitaria, para la planificación en salud, al igual que para la evalua
ción de sus resultados. Indica que en general, la mortalidad es mal
conocida, lo mismo que la morbilidad. Sin embargo, cuando no es posible
disponer de información precisa, aquella que pueda obtenerse mediante un
16
sondeo, puede aproximar muy bien a la realidad, y los procedimientos y
técnicas para la realización y análisis de los sondeos son de tipo fundamen
talmente estadístico.
Si se enfoca la importancia de la estadística desde otro punto de vista, el
de la investigación en Ciencias de la Salud, tanto social como propiamente
biológica y epidemiológica, se pueden encontrar suficientes elementos de
tipo conceptual y de procedimiento que revelan el papel fundamental de la
Estadística en este campo de la investigación. Snedecor al analizar la defi
nición de Estadística, destaca la importancia de ésta, tanto para quien reali
za activamente investigación de tipo cuantitativo como para quienes van a
hacer carrera en las Ciencias Sociales. La investigación epidemiológica
tendría serias limitaciones sin un adecuado fundamento estadístico.
En la investigación biológica y social aplicada a la salud, la Estadística
juega un papel de primer orden al proveer de suficientes procedimientos y
técnicas de análisis para las pruebas de hipótesis, lo cual constituye el pilar
fundamental de la investigación experimental, aparte, naturalmente, de los
elementos de análisis que provee para los estudios de tipo descriptivo. Bel
trán resume con bastante claridad el aporte de la estadística en la aplicación
del método científico, tanto en lo referente a la planificación de la investiga
ción, como en la aplicación de los procedimientos metodológicos y en el
análisis de los resultados.
Ferrero, al referirse a la magnitud y complejidad de servicios que hoy
maneja la administración sanitaria (atención médica, seguridad social,
etc.), ha planteado la necesidad de disponer de información estadística de
forma permanente y sistemática, ya que no bastan algunos datos, sino que
es necesaria suficiente información para hacer inferencias y predicciones
sobre el comportamiento de los fenómenos en estudio. La presencia de la
variabilidad como característica de los fenómenos objeto de estudio, tanto
por la medicina como por la salud pública, determinan la necesidad del uso
de la Estadística en esas áreas del conocimiento, lo mismo es válido para el
campo de "la investigación clínica que trabaja con fenómenos eminente
mente variables, al igual que todo el campo de la biología... " (197 1 , Pg.
1 1 9).
En síntesis, los autores mencionados y muchos más, Armitage, Cañedo,
le atribuyen a la Estadística una importancia de primer orden en los diver
sos aspectos de la actividad médica en particular y de salud en general.
17
Es necesario, sin embargo, indicar que la aplicación de los métodos esta
dísticos en cada una de esas áreas, se da de manera diferente atendiendo a
los procedimientos y objetivos propios de la planificación, la administra
ción, la evaluación y la investigación en salud. También, es necesario desta
car que, como sostiene Kaplan toda medición contiene un elemento de
error. La más exacta descripción o predicción que puede hacerse es siempre
aproximada; tanto en el sentido del constante cambio o transformación de
la realidad, como en el sentido mismo de la realidad, la cual es una cons
trucción teórica, y a ella se suman las diferencias provocadas de los proce
dimientos y circunstancias de la medición.
Si una medición particular fuera totalmente exacta y libre de errores, las
repeticiones de la medición, difícilmente proporcionarían medidas idénti
cas, ya sean, de un mismo observador, en ocasiones sucesivas, o de obser
vadores diferentes, porque no verán exactamente del mismo modo lo que
puede llamarse la "misma situación".
18
tidad como nación, además de disminuir la dependencia de otros países.
La administración sanitaria no puede verse, entonces, sólo como un ins
trumento gerencial, es, además, una herramienta eficaz para el crecimiento
y desarrollo de un país. Así, el uso racional y creativo de la administración
por quienes tengan esa responsabilidad a su cargo, puede contribuir a un
mayor grado de bienestar social.
Los planteamientos anteriores sirven de marco para entender el uso de la
Estadística en el campo de la salud. Es evidente que se necesita manejar in
formación acerca del estado de salud de una población. Esta información
surge de los estudios epidemiológicos. Si se cuenta con el diagnóstico de la
comunidad en lo referente a salud, y con información adicional pertinente,
el administrador, Jefe de un Distrito Sanitario, por ejemplo, estará en capa
cidad de hacer una PLANIFICACIÓN de sus actividades para atender las
necesidades de salud diagnosticadas.
En la planificación es importante, no sólo fijar los objetivos del plan,
sino también hacer una evaluación de los recursos disponibles y considerar
los faltante, a fin de elaborar un presupuesto. Es en este momento cuando el
administrador y su equipo, debe procesar gran cantidad y variabilidad de
datos. Tendrá que analizar informes, resumir y clasificar datos, elaborar
proyecciones y tendencias. Definirá prioridades basándose en tasas e índi
ces sobre natalidad, fertilidad, morbilidad y mortalidad y asignará recursos
en función de los mismos.
En el caso de la administración de un servicio de salud público o privado,
se requiere una revisión exhaustiva de todos los parámetros disponibles
para conocer la demanda de servicios, y a la vez saber con qué recursos
cuenta para satisfacer los requerimientos. En el proceso de planificación
buscará equilibrar la demanda con la oferta, tratando de optimizar los recur
sos que posee, generalmente escasos, por lo menos en la administración pú
blica. Nuevamente entrarán en juego los datos e información que deberán
ser analizados estadísticamente.
Como puede verse, la Estadística está presente en todas las etapas del
proceso de administración en salud. Constituye una herramienta metodoló
gica para que el administrador de salud diagnostique, planifique, ejecute y
evalúe las acciones necesarias, a fin de lograr que cada individuo y cada co
munidad tengan el nivel de salud adecuado, y puedan llevar a cabo sus acti-
19
vidades normales.
20
duración de la investigación, el personal requerido y el presupuesto nece
sario, sino con elfin de realizar el estudio con metas perfectamente defini
das, evitando improvisaciones que puedan introducir errores, capaces de
invalidar o desmeritar la investigación (Camel, 1 979. p 1 7).
La planificación de un trabajo científico es una tarea ardua, y se estima
que consume aproximadamente la mitad (el 50 % ) del tiempo total necesa
rio para toda la investigación. Contiene una serie de sub-etapas, las cuales
se inician al concebir la idea de investigar sobre un tema en particular. Al
inicio el área de investigación puede ser muy amplia, lo cual obliga a anali
zar diferentes aspectos que ayuden a evaluar la conveniencia de centrar el
estudio en alguna de las múltiples facetas del tema posibles de investigar.
Para ayudar a definir el punto específico a estudiar se recomiendan dos
técnicas sencillas; la primera se llama "diluvio de ideas" y consiste en escri
bir todas las ideas que surgen espontáneamente para luego ir filtrando cada
una de ellas hasta quedarse con aquellas que sean más factibles de realizar.
La segunda técnica sugiere discusiones sistemáticas del equipo de trabajo,
acerca de los problemas apremiantes por resolver en un área determinada,
así como la factibilidad de realizar esas investigaciones. La idea de ambas
técnicas, posibles de combinar, es promover el análisis de la factibilidad de
un tema de investigación.
Cubierta esta etapa, es recomendable elaborar un plan o proyecto de in
vestigación, donde se exprese anticipadamente y en forma escrita, lo que se
espera realizar. Al escribir, el investigador se obliga a organizar sus pensa
mientos en cuanto al problema a considerar. De esta manera podrá darse
cuenta si el estudio es factible, si el diseño metodológico es consistente con
los objetivos, si cuenta con los recursos y el tiempo necesario para realizar
lo. Este plan contiene los detalles relacionados con las etapas posteriores de
la investigación, como son: la recolección de la información, la presenta
ción de los datos y el análisis de los resultados obtenidos.
Llegar a resumir en un plan escrito todos los aspectos a considerar en la
investigación, requiere de muchas horas de trabajo, consumidas en reunio
nes con el equipo de trabajo, con personal de instituciones públicas o priva
das que puedan participar en el estudio (bien con el aporte de recursos hu
manos o materiales, o facilitando la muestra o la información necesaria o el
financiamiento para la investigación), en entrevistas con expertos en el área
del conocimiento del fenómeno o problema que se estudia, en la búsqueda y
21
revisión de la bibliografia sobre el tema en cuestión, en reuniones con los
asesores y en muchas gestiones más.
Una vez seleccionado el tema, se describe de la manera más exacta posi
ble el problema específico a investigar. Esta tarea suele ser uno de los as
pectos más dificiles de concretar, especialmente para los nuevos investiga
dores, quienes tienen tendencia a divagar en sus enunciados iniciales, su
mergiéndose en generalidades que originan confusión y pérdida en la
dirección del proyecto. Ante esta situación es conveniente disponer de un
esquema sencillo, que oriente al investigador en la formulación del plantea
miento del problema, considerado el primer aspecto del proyecto.
22
sión lo que interesa estudiar.
JUSTIFICACIÓN E IMPORTANCIA DEL PROBLEMA.- No todos
los problemas enunciados tienen suficiente importancia como para justifi
car su estudio. Existen problemas poco relevantes y carecen de valor cientí
fico. Se trata de presentar argumentos sólidos sobre la validez, viabilidad,
interés y significado del problema a investigar. Implica ello la necesidad de
señalar el PORQUÉ se desea realizare dicho estudio, pudiendo esto deter
minarse, entre otras formas, por la cuantificación de individuos afectados
por el fenómeno o problema descrito (magnitud), por las consecuencias que
dicho problema traería a la población si no es atendido (trascendencia), y
por las posibilidades disponibles para resolverlo (vulnerabilidad).
FORMULACIÓN DEL PROBLEMA- Aun cuando algunos textos uti
lizan indistintamente los términos "planteamiento" y "formulación" del
problema, es prioritario aclarar que se trata de conceptos diferentes. La for
mulación del problema busca explicar con claridad los diversos elementos
que lo conforman y las relaciones que éstos guardan entre sí. Este aspecto
contempla además la descripción de como se realizará la investigación del
problema inicialmente enunciado. En la formulación se sintetizan y reflejan
los aspectos más significativos del planteamiento del problema. La formu
lación forma parte de este proceso.
COMPROBACIÓN Y CONTROL DEL PROBLEMA.- Una vez for
mulado el problema a estudiar es recomendable plantearse algunas pregun
tas, con el propósito de comprobar la claridad y precisión del problema des
crito, su viabilidad investigativa y la pertinencia de todo lo dicho, durante
las diferentes sub-etapas del planteamiento.
En síntesis, en el PLANTEAMIENTO DEL PROBLEMA se incluye:
- Enunciado del problema.
- Importancia del problema y justificación del estudio.
- Formulación del problema.
- Control del problema.
OBJETIVOS DE LA INVESTIGACIÓN
Al tener claro el planteamiento del problema, es posible definirse los ob
jetivos -mediatos o inmediatos- (PARA QUÉ), que se pretenden alcanzar
23
con la investigación. Este punto es crucial en todo trabajo, alrededor del
mismo girarán las etapas posteriores de la investigación. Los objetivos
constituyen la meta hacia donde se orienta la investigación.
La redacción de estos debe ser clara y concisa, siendo necesario cuidar la
selección de los verbos que describan la acción que se pretende lograr; por
ejemplo: describir, calcular, determinar, establecer, relacionar, comparar,
evaluar, diagnosticar, etc.
La recolección de los datos se hará en f.unción de los objetivos, a través
de un instrumento elaborado al efecto o seleccionado para tal fin. La elabo
ración y presentación de la información se orientará hacia el logro de los
objetivos y el análisis y las conclusiones estarán en función de las interro
gantes planteadas en los objetivos.
Dada la importancia de este punto, es vital la formulación de objetivos
precisos y factibles de lograr. No es conveniente plantearse propósitos inal
canzables o irreales. No deben formularse objetivos que requieran informa
ción muy dificil de obtener (confidencial) o cuya fuente no sea accesible; o
bien cuando el logro de los objetivos no dependa del equipo de investiga
ción sino de personas ajenas a ésta.
La definición o especificación de un problema va unido a la realización
de una revisión bibliográfica lo más detallada posible acerca del tema en
cuestión. El propósito es familiarizarse con el mismo, ampliar y profundi
zar el conocimiento de las variables relacionadas con éste, indagar acerca
de la forma como ha sido abordado el problema por otros investigadores,
así como los resultados obtenidos y si existen coincidencias o contradiccio
nes entre ellos. En resumen la idea es precisar cuanto se conoce en relación
con el problema de interés. La investigación es un proceso que va de lo
conocido a lo desconocido.
Son variadas las fuentes de donde se nutre el investigador para familiari
zarse con el problema. Estas fuentes pueden incluir expertos en el tema, re
vistas científicas, textos, datos estadísticos, etc., las cuales deben ser con
fiables y revisadas con sentido crítico. La información obtenida de ellas
configura el soporte teórico de la investigación, y es lo que en la literatura
especializada se denomina "Marco Teórico ".
24
MARCO TEÓRICO
Una vez que el investigador ha leído, evaluado, resumido y clasificado el
material bibliográfico pertinente, está en capacidad de conformar un marco
teórico de referencia, que le permita ubicar al fenómeno en estudio dentro
de un contexto teórico o conceptual. Sólo dentro de ese contexto los resulta
dos obtenidos pueden contribuir al conocimiento, pues los datos aislados
tienen poca utilidad o aplicabilidad.
Una buena investigación no existe en el vacío. Requiere de una exhausti
va revisión de la literatura para conformar la base de donde surgirán nuevos
conocimientos. Tal revisión debe ser crítica y objetiva, tomando en cuenta
no sólo los trabajos que apoyen las hipótesis del estudio, si no también
aquellos que las contradigan. Sin embargo, el marco teórico no puede ser
una serie de citas de diferentes autores. Las ideas planteadas en él deben te
ner coherencia y desarrollo lógico. Es necesario parafrasear o resumir con
lenguaje propio lo expresado en la literatura consultada, y establecer la rela
ción entre los aportes de esas fuentes y el problema en estudio, así como los
aspectos que ya han sido aclarados y las interrogantes aún pendientes.
El marco teórico a niveles más específicos y concretos, compren
de la ubicación del problema en una determinada situación históri
co-social, sus relaciones con otros fenómenos, las relaciones de los
resultados por alcanzar con otros ya logrados, como también defini
ciones de nuevos conceptos, redefiniciones de otros, clasificaciones,
tipologías por usar, etc. (Briones. 1981, 44).
Son múltiples las funciones que cumple el marco teórico, de allí que esté
conformado por varios subsistemas, los cuales le proporcionan sus caracte
rísticas y rasgos fundamentales. La literatura especializada en el área, co
múnmente menciona dentro de este aspecto, diversos subsistemas, siendo
los más frecuentes:
- Marco histórico.
- Marco conceptual.
- Sistema teórico.
- Definiciones de términos.
MARCO HISTÓRICO. - Referido por algunos autores como "Antece
dentes del problema" o "Puesta al día del tema". Su propósito fundamental
25
es hacer un recuento histórico del fenómeno o del problema, desde sus orí
genes hasta el momento de la investigación, a nivel internacional, nacional
y regional.
El conjunto de trabajos anteriores referidos al problema, constituye los
antecedentes del mismo, y permite determinar hasta donde ese problema ha
sido investigado. Además servirá de marco, para el análisis de los resulta
dos al comparar los propios hallazgos con los obtenidos en los anteriores
trabajos, siendo esto lo que hace posible el avance del conocimiento.
Las fuentes bibliográficas con las cuales se ha conformado el marco de
ben mencionarse en el mismo, a fin de darle crédito a sus autores, en cuyo
caso se menciona entre paréntesis, el apellido del autor de la obra y el año
de su publicación.
MARCO CONCEPTUAL o bases teóricas.- Cada ciencia posee su pro
pio cuerpo de conocimientos, con sus principios, sus leyes, sus teorías, don
de se explica el porqué de los hechos. Es justamente parte de ese cuerpo de
conocimientos donde se apoya toda investigación, sirviendo de base o fun
damentos teóricos para edificar sobre ellos nuevos conocimientos, lo cual
constituye el propósito básico de la investigación.
Las distintas disciplinas del saber ofrecen múltiples ejemplos sobre este
aspecto. En el campo de la psicología, por ejemplo, pueden aplicarse diver
sas teorías al estudiar un problema. La teoría de las motivaciones de Mas
low; o las del aprendizaje social de Rotter; o teorías de la personalidad o de
la disonancia cognoscitiva de Festinger, son de utilidad para enfocar pro
blemas de actitudes hacia la salud. Estas bases teóricas permiten, en los di
seños experimentales, formular hipótesis de trabajo, pues establecen rela
ciones entre variables claramente definidas como independientes y depen
dientes.
SISTEMA TEÓRICO el cual está conformado por las variables relacio
nadas con el fenómeno y las hipótesis de la investigación. Las variables son
características de los sujetos, las cuales pueden tomar valores diferentes en
cada uno de ellos; por ejemplo el peso, tensión arterial, edad, sexo, valores
de hemoglobina, valores de colesterol, estado de salud, hábitos alimenta
rios, hábitos de fumar, etc. Para Cerda (1991) las variables son conceptos
clasificatorios, que permiten ubicar a los individuos en categorías y clases,
siendo susceptibles de identificación y de medición.
26
Estas variables, según el caso, pueden funcionar como variables depen
dientes o independientes. Se consideran variables independientes aquellas
que NO son afectadas por otras variables; ellas "causan", "afectan" o "in
fluyen" en otras variables. Al cambiar las primeras producen variaciones en
las segundas, denominándose a estas últimas variables dependientes. Ellas
resultan "afectadas" o "influenciadas" por otras. Sin embargo, la relación
de implicación entre ellas no siempre es de tipo causal; pudiendo existir
otras relaciones diferentes, por lo cual también se habla de relaciones multi
causales.
La condición de independiente o dependiente es, en algunos casos, de
carácter relativo o metodológico. Por ejemplo, en el proyecto de investiga
ción "Uso de la medicina homeopática en el control de la obesidad ", como
variables asociadas a este problema de reducción de peso, se menciona: la
edad, el sexo, la estatura, la actividad fisica, los hábitos alimentarios, el es
tado de salud y el tratamiento homeopático (esta última como variable en
estudio). En este proyecto, el peso se considera dependiente y las demás in
dependientes. Sin embargo, en un estudio sobre "Hipertensión arterial ",
las variables: hábitos de alimentación, peso, hábitos de fumar, stress, etc.,
influyen sobre el problema en estudio. En este caso, la variable peso es ma
nejada como una variable independiente. Las variables son un recurso me
todológico utilizados por el investigador para medir y manejar ciertas ca
racterísticas de su interés.
Muchas investigaciones buscan establecer relaciones entre las variables.
Cuando esas relaciones se consideran funcionales y se sustentan teórica
mente se expresan a través de hipótesis, siendo éstas definidas como la ex
plicación temporal o tentativa de la relación entre variables. La formula
ción de las hipótesis, al menos en ciertos tipos de investigación, sugiere la
posibilidad de medir las variables y los mecanismos para esa medición. Un
ejemplo de este tipo de hipótesis puede ser:
Hi: "Los niños nacidos de madres fumadoras tienen menor peso que
los nacidos de madres nofumadoras ".
En otras oportunidades, las hipótesis se enuncian en función a valores
esperados, denominándose hipótesis operacionales. Ejemplo:
Hi: "Con el nuevo medicamento el porcentaje de curación será ma
yor del 30%, considerado normal para esa población ".
27
En el momento de redactar las hipótesis, es conveniente recordar los cri
terios establecidos para su adecuada elaboración: Las hipótesis deben ser
redactadas en términos claros y sencillos. Deben ser específicas. Deben for
mularse como afirmaciones, evitando los juicios. No deben comenzar con
verbos, ni presentarse en forma interrogativa. Deben ser congruentes con
los hechos confirmados.
Estas proposiciones tentativas sobre las posibles relaciones entre dos o
más variables se denominan hipótesis de trabajo o hipótesis de investiga
ción; y se simbolizan como Hi:
Para la verificación estadística de las hipótesis de trabajo, el investigador
se vale de la hipótesis Nula, la cual afirma que no existe relación entre las
variables independientes y dependientes. Son el reverso de las hipótesis de
investigación. Se simbolizan como Ho:
Las hipótesis nulas correspondientes a los dos ejemplos anteriores pue
den ser:
Ho: "Los hijos nacidos de mujeres fumadoras tienen el mismo peso al
nacer, que los nacidos de mujeres no fumadoras ".
Ho: "Con el nuevo medicamento el porcentaje de curación será igual
al 30%, considerado normal para esa población ".
Este tipo de hipótesis no suele presentarse de manera explícita en el plan
de trabajo, sin embargo, en el momento de efectuar las pruebas estadísticas
para verificar las hipótesis de la investigación, se da por entendida su exis
tencia.
También existen las llamadas Hipótesis estadísticas que son la transfor
mación de las hipótesis de investigación y nulas en símbolos estadísticos.
Los dos ejemplos de hipótesis de trabajo y sus respectivas hipótesis nu
las formuladas anteriormente, al expresarse como hipótesis estadísticas,
quedarían de la siguiente manera:
Hi: µ1 < µ2 ; Ho:µ 1 = µ2
Hi: P1 >30 % ; Ho: P1 = 30 %
Las variables, además de ser definidas como independientes o <lepen: ·
dientes, también pueden describirse de manera nominal y operacional. En
la definición nominal de una variable se ofrece la interpretación de su signi-
28
ficado, a fin de evitar confusiones o ambigüedades en la comprensión del
término o de la variable. Por su parte, la definición operacional se refiere a
la enumeración de los indicadores que conforman dicha variable.
En las investigaciones a nivel descriptivo este aspecto del "sistema teóri
co" puede obviarse. No así en una investigación a nivel experimental o cua
si experimental.
DEFINICIONES DE TÉRMINOS o glosario.- Cuando en un proyecto
se utilizan términos que pueden ser interpretados de diversas maneras, es
indispensable establecer claramente el significado bajo el cual será emplea
do dicho término en la investigación. Esto tiene como propósito unificar
criterios en cuanto a su uso. De allí la necesidad de elaborar este listado sólo
cuando realmente se justifiquen su uso.
MARCO METODOLÓGICO
Una vez conformado el marco teórico, se construye el marco metodoló
gico u operacional, es decir se define COMO se realizará la investigación.
Esta separación es sólo con fines didácticos, pues en la práctica el investiga
dor piensa simultáneamente en varias cosas a la vez. Al definir los objeti
vos, ya tiene una idea de como lograrlos, al definir las variables ya piensa en
como medirlas e incluso puede tener ciertas expectativas en cuanto a los po
sibles resultados.
Sin embargo, para fines de presentar el proyecto o redactar el informe fi
nal, y dado el carácter sistemático del método científico, es conveniente tra
bajar siguiendo un esquema básico de investigación.
El marco metodológico tiene como propósito describir en detalle la ma
nera como se realizará la investigación: como se hará la recolección de los
datos, como se procesará y presentará la información y como se realizará
el proceso de análisis estadístico.
Cada una de estas etapas (recolección, procesamiento y análisis) requie
re de técnicas y procedimientos particulares dependiendo de tipo de investi
gación a realizar.
29
tienden a dividirlos en: estudios descriptivos, comparativos, correlaciona
/es, experimentales y cuasi-experimentales.
Estudios descriptivos Estos permiten tener un conocimiento de como se
presenta un problema en una población (o parte de ella), la frecuencia con
que ocurre (cuántos), y quiénes presentan determinadas características. Los
estudios descriptivos buscan especificar las propiedades encontradas en la
población. Miden o evalúan diversos aspectos. Con ellos se describe un fe
nómeno en la población en función de porcentajes, tasas y promedios. Los
diagnósticos de comunidad pueden ser un buen ejemplo de los estudios des
criptivos.
Los estudios descriptivos se caracterizan porque resumen las caracterís
ticas encontradas en la población. Presentan la magnitud del problema (pre
valencia, incidencia). Describen los hechos o fenómenos pero no los expli
ca. No requieren de hipótesis centrales explícitas. Representan el primer ni
vel de investigación, aún cuando algunos autores consideran que puede
existir un nivel previo al descriptivo como lo es el nivel exploratorio, donde
se busca simplemente indagar sobre un tema o problema poco estudiado
con anterioridad. Su propósito es familiarizarse con el problema cuando
existe escasa información sobre éste.
Los estudios correlaciona/es buscan conocer la asociación o relación
entre dos o más variables estudiadas en los mismos sujetos, de una muestra.
Su utilidad radica en que permiten conocer el comportamiento de una varia
ble, en función de otra variable a ella asociada.
Los estudios correlaciona/es se distinguen de los descriptivos, funda
mentalmente en que, estos últimos buscan medir las variables encontradas
en la población, mientras que los correlacionales pretenden conocer el gra
do de relación entre dos o más variables estudiadas en una población.
Los estudios comparativos se refieren al establecimiento de diferencias
entre dos o más grupos de interés, un ejemplo puede ser la necesidad de ve
rificar si dos comunidades presentan una determinada morbilidad con la
misma frecuencia, o si el porcentaje de curación de las mismas enfermeda
des, entre dos hospitales es diferente o no. Requieren que los grupos sean
comparables a fin de que el estudio tenga sentido, y sus conclusiones sean
válidas.
30
Los estudios comparativos, también denominados analíticos o explicati
vos tienen como propósito conocer si existen diferencias estadísticamente
significativas entre los grupos comparados. Este tipo de estudio requiere el
uso de hipótesis de trabajo, tendientes a verificar las relaciones explicativas
causales. Es un nivel de investigación más avanzado que el descriptivo.
Los estudios experimentales se caracterizan por la introducción o "ma
nipulación" de una variable causal o factor de riesgo, para luego conocer su
efecto. Un experimento científico se caracteriza por presentar tres propie
dades: Manipulación de un factor (también llamado tratamiento experi
mental) que el investigador administra a un grupo pero no al otro. Control
por parte del investigador sobre una o más situaciones experimentales. La
introducción del grupo testigo o control permite garantizar esta propiedad.
Distribución aleatoria de los sujetos asignados al grupo control y al grupo
experimental.
Para poder evaluar el efecto del factor causal es imprescindible conocer
las características de ambos grupos antes de iniciar el experimento, y medir
posteriormente, de acuerdo al tiempo fijado, el cambio o efecto producido
en el grupo de estudio.
En muchas oportunidades, no es posible realizar este tipo de estudio, en
todas las ciencias. En Ciencias de la Salud, en algunas áreas y por razones
éticas, se dificulta la experimentación de manera rigurosa. En las Ciencias
Sociales, además de razones éticas en algunos casos, la complejidad de las
variables y su dificultad para manipularlas y/o controlarlas, también limitan
la investigación experimental.
En los estudios experimentales y cuasi-experimentales se intenta deter
minar la influencia de una o varias variables independientes sobre una va
riable dependiente. La diferencia estriba fundamentalmente en que en los
estudios experimentales el investigador manipula a su conveniencia la o las
variables independientes y además asigna por azar, los sujetos a cada
grupo. En los cuasi-experimentales esto último no es posible. (Polit, 1 99 1 )
En el caso de la investigación en salud muchas veces es más dificil iden
tificar un agente etiológico, que producir la medicina para combatirlo. Las
investigaciones en cáncer son un ejemplo de lo que ha costado identificar
factores cancerígenos. En oportunidades, un mismo equipo de investiga
ción, con proyectos bien definidos, trabaja un problema a diferentes nive-
31
les, pues un hallazgo conlleva a un nuevo problema y así de manera perma
nente.
Según el tipo de investigación, el estudio puede desarrollarse de manera
transversal, longitudinal, retrospectiva o prospectiva, dependiendo del mo
mento de recopilación o registro de la información sobre el fenómeno estu
diado.
En los estudios transversales se miden una sola vez las variables involu
cradas; mientras que en los estudios longitudinales se miden en varias oca
siones las variables, con el propósito de conocer la evolución de las mis
mas. Implica seguimiento a través del tiempo.
Los estudios retrospectivos permiten indagar sobre hechos ocurridos en
el pasado, empleando para ello información registrada con anterioridad a la
investigación; o buscando del pasado información sobre el origen de mani
festaciones actuales, como consecuencia de un hecho ocurrido tiempo
atrás. Por ejemplo, las exposiciones a factores de riesgo en el pasado, próxi
mo o remoto, pueden provocar en la actualidad manifestaciones de sus
efectos; lo cual hace necesario indagar en los antecedentes el origen o la
causa del fenómeno que en la actualidad se ha disgnosticado.
Por su parte, para los estudios prospectivos toda la información se reco
gerá con fines propios de la investigación, siguiendo los criterios estableci
dos en el plan. Algunos autores mencionan los estudios retro-prospectivos,
donde se utiliza información sobre hechos ocurridos anteriormente, y el re
gistro continúa una vez diseñado el estudio.
El marco metodológico incluye también la descripción del Universo
y de la Muestra, donde se realizará la investigación.
Población o Universo: Es la totalidad de sujetos o unidades de estudio
que poseen determinadas características observables. Ej., todos los habitan
tes del estado Carabobo, o todos los niños menores de 1 año del Dtto. Va
lencia, o las mujeres embarazadas atendidas en el Hospital Central de Va
lencia en el lapso 1 990- 1 997, o todos los pacientes con hipertensión arterial
atendidos en la consulta de cardiología del H.C.V. durante el año pasado.
Muestra: Pocas veces es necesario o posible estudiar a toda la pobla
ción, a menos que sea muy pequeña. Generalmente se estudia sólo una parte
de ella, la cual se denomina muestra, y se espera que esa parte o subconjun
to posea las mismas características del universo.
32
En el proyecto de investigación o plan de trabajo se incluye el diseño es
tadístico de la muestra con el propósito de asegurar que las conclusiones
obtenidas en los grupos de estudio (muestra) puedan inferirse al resto de la
población. En este diseño se describe:
1 - El Marco muestra/ que es el marco de referencia o sitio donde están
localizadas todas las unidades de estudio de la población. Este puede
ser todos los elementos o unidades que conforman la población, un
archivo de historias, un mapa fisico o plano donde estén incluidos to
das las unidades de muestreo. De la estructura del marco muestral, de
pende en gran parte, el tipo de muestra que se utilice, y las técnicas de
recolección de datos.
2- Unidad última de muestreo se refiere a cada uno de los elementos que
será objeto de estudio en la población. De cada unidad de muestreo se
toma información sobre las variables. Pueden ser individuos, fami
lias, objetos, radiografías, historias clínicas, etc.
3- El tipo de muestra a utilizar, la cual puede ser probabilística (aleatoria
simple, estratificada, de conglomerado, polietápica) o no probabilísti
ca (opináticas, errático y de voluntarios). En caso de utilizar muestras
probabilísticas, es conveniente mencionar también el procedimiento
de azar mediante el cual se seleccionan las unidades de muestreo.
4- El tamaño de la muestra, y la proporción que ésta representa del uni
verso. Es necesario que la muestra sea representativa de la población
no sólo en calidad, sino también en cantidad.
El marco metodológico incluye, además, la descripción del instrumento
de recolección de datos, así como las técnicas empleadas para tal fin. Los
instrumentos debidamente elaborados o seleccionados para obtener la in
formación de manera completa y organizada. Su elaboración puede resultar
dificil dependiendo de la cantidad de variables a estudiar, por lo cual, deben
estar en función de los objetivos del trabajo. En algunos casos puede ser ne
cesario utilizar más de un instrumento.
Cuando se trata de hacer mediciones precisas de algunas variables a tra
vés de ciertos instrumentos, es conveniente conocer su confiabilidad y vali
dez, la primera se refiere a la capacidad del instrumento para dar los mismos
valores cuando se aplica en diversas ocasiones, y la segunda a la capacidad
de medir lo que realmente se quiere medir.
33
Cuando la información es recogida por otras personas distintas al inves
tigador, es necesario asegurarse que conocen y manejan debidamente el
instrumento y la técnica de recolección a utilizar. En tal caso, deben recibir
entrenamiento previo. El uso de computadoras para procesar la informa
ción requiere de datos debidamente codificados, lo cual debe considerarse
en el momento de elaborar el instrumento. Antes de su aplicación definitiva
es recomendable efectuar una prueba piloto a objeto de determinar su fun
cionalidad.
El otro aspecto importante de la metodología es establecer claramente
las técnicas de análisis a utilizar. Estas dependen del tipo de investigación,
de los objetivos y de las variables en estudio.
MARCO ADMINISTRATIVO
Todo trabajo de investigación necesita recursos de diversa naturaleza,
según el tipo. Estos recursos deben ser previstos en el plan de trabajo y ga
rantizar la disponibilidad de ellos. Estos suelen ser: financiamiento, perso
nal, equipos, bibliografía, etc., además del tiempo; en cuyo caso es conve
niente la elaboración de un cronograma o ruta crítica para distribuir los pe
ríodos en los cuales se realizarán cada una de las etapas sub-etapas de todo
el trabajo de investigación. Siendo particularmente necesario cuando el
tiempo pueda alterar los resultados del estudio.
Por lo tanto, en el marco administrativo se elabora un listado de los Re
cursos Humanos (nombre de los investigadores, asesores y colaboradores
directos), Institucionales (patrocinantes o participantes) y Materiales
(equipos, reactivos, tratamientos, materiales de oficina, etc.) necesarios
para la investigación.
REFERENCIAS BIBLIOGRÁFICAS.
Otro elemento de presentación imprescindible en todo proyecto de in
vestigación o informe final, es la bibliografía o referencias bibliográficas de
las obras citadas en el marco teórico, o en cualquiera de sus partes; lo cual
permite conocer las fuentes documentales que dan soporte a la investiga
ción.
Por regla general, la referencia comprende cinco elementos fundamenta
les: a) autor o autores; b) fecha de la publicación; c) título de la obra; d) lu-
34
gar de la edición; e) editorial. Sin embargo, pueden requerirse otros ele
mentos, dependiendo de los documentos citados. Las referencias se orde
nan alfabéticamente, según el apellido del autor.
Tan importante es la presentación de la bibliografia como la forma en
que ésta se efectúa. De allí la conveniencia de establecer normas para su co
rrecta organización. La A.P.A. (Americam Psychological Asociation) pro
puso unificar un estilo internacional, donde se consideran cada uno de los
posibles casos:
Libros:
Comprende: Apellido del autor, coma, inicial o iniciales del nombre,
punto, fecha entre paréntesis. punto, título subrayado o en letra cursiva,
punto, ciudad donde fue editada, dos puntos, nombre de la casa editora.
Ejemplos:
a) Si es un solo autor:
Cerda, H. (1991). Los elementos de la investigación. Bogotá: El Búho.
Gilbert, N. (1981). Estadística. México: Interamericana.
b) Cuando son varios los autores, todos deben indicarse separados por co
mas, excepto el último quien va precedido de la conjunción "y".
Calello, H. y Neuhaus, S. (1990). La investigación en las ciencias hu
manas. Caracas: Fondo Editorial Tropykos.
Scheaffer, R., Mendenhall, W. y Ott, L.(1987). Elementos de muestreo.
México, D.F.: Grupo Editorial Iberoamérica.
Nota: En el momento de citar estas obras en el texto, allí sólo se incluye
el apellido del primer autor, seguido de la expresión et al y el año. Por
ejemplo: Scheaffer et al. (1987). Pero en la bibliografia todos los autores
deben nombrarse, como se mencionó anteriormente.
c) Cuando el apellido del autor es muy corriente suelen incluirse los dos
apellidos, manteniéndose igual los demás elementos. Igualmente en
caso de que el autor sea popularmente conocido con sus dos apellidos.
Ejemplos:
Hemández Sampieri, R., Femández, C. y Baptista, P. (1991). Metodolo
gía de la investigación. Bogotá: McGraw-Hill.
35
Prieto Figueroa, L. B. (1985). Principios generales de la educación. Ca
racas: Monte Avila Editores.
d) Cuando se cita el autor de un capítulo de un libro, el cual es una compila
ción; en la referencia primeramente sea menciona al autor del capítulo,
año y título. Luego la preposición "En" y seguidamente Iniciales y ape
llido del compilador, del editor o del director; mencionando entre parén
tesis esta condición: (Comp.), (Eds.) o (Dtor.). Título de la obra; luego,
entre paréntesis número de las páginas del capítulo consultado; y por úl
timo, lugar de edición y editorial, al igual que en la referencia de cual
quier libro. Ejemplos:
Bartolomé, M. ( 1 987). Estudio de las variables en la investigación en
educación. En J. Arnau (Dtor.) Métodos de investigación en las Ciencias
Humanas. (pp 1 03-1 38). Barcelona, España: Omega.
Shefter, M. (1997). Partidos interna y externamente movilizados. En J.
Preciado (Comp.) Auge y caída de las maquinarias politicas venezola
nas. (pp 1 5 1 -1 58). Valencia, Venezuela: Fuente Alterna.
Nota: En cualquier referencia donde la obra ha sido editada en un lugar
poco conocido o en ciudades cuyo nombre se repite en otros países, en la
referencia se incluye también el nombre del estado o del país.
e) Cuando existen varias ediciones de la obra, el número de la edición con
sultada se menciona después del título. Ejemplos:
Méndez, l., Guerrero, D., Moreno, L. y Sosa, C. ( 1 987). El protocolo de
investigación. Segunda edición. México, D.F.: Trillas.
Polit, D. y Hungler, B. P. ( 1 99 1 ). Investigación Científica en Ciencias de
la Salud. Tercera edición. México, D.F.: Interamericana.
t) Cuando el autor es un Organismo o Institución:
Organización Panamericana de la Salud. (1 990). Manual de organiza
ción y procedimientos hospitalarios. Sao Paulo, Brasil: O.P.S.
Consejo Nacional de la Cultura. (199 1 ). Presencia y luz de Armando Re
verán. Caracas: Arte.
Artículos de revistas :
Además de los elementos contenidos en las referencias antes menciona
das, en el caso de las revistas se le agregan otros datos, tales como: Título
36
del artículo; número de la publicación; volumen (si lo tienen); número(s) de
la(s) página(s) ocupada(s) por el artículo, y separados por guiones.
Apellido del autor e inicial del nombre. Año de publicación (entre parén
tesis). Título del artículo. Nombre de la revista (subrayado o en letra cur
siva). Número de la revista. Volumen. Números de las páginas donde
aparece el artículo.
Ejemplos:
Guzmán, C. (1997). Hablando de los libros. Revista Ciencias de la Edu
cación, 14, 261-264.
Moreno J., E. (1990). Sociedad y Ecología. Nueva Sociedad, 107, 21-26.
Ruiz B., C. (1996). La competencia tutorial. Planiuc, 22, 93-118.
Otros documentos:
a) Si la obra no ha sido aún publicada, pero se conoce su pronta publicación,
en lugar de la fecha, se escribe la expresión "(en prensa)".
Ejemplo:
Puertas, E. (en prensa). Diversos enfoque de Educación para la Salud.
b) Si el documento no ha sido publicado y se desconoce su posible publica
ción, se indica con la palabra "(paper)". Ejemplos:
Blanck, E. (1987). Un modelo para planificar y desarrollar programas
de Educación para la Salud. Valencia: Universidad de Carabobo (pa
per).
Puertas, E., Barreta, T. y Piñate, A. (1993). La revolución de los para
digmas científicos y la educación andragógica. Valencia, Venezuela:
Instituto Internacional de Andragogía (paper).
c) Cuando se trata de ponencias presentadas en Congresos, Seminarios,
Simposiums, Conferencias, etc. Se especifica autor, año, título, nombre
del evento, lugar, mes y la expresión "paper". Ejemplo:
Melet, N. (1991). Locus de control y rendimiento académico. XXIII
Congreso Interamericano de Psicología. San José, Costa Rica. 7-12 de
julio. (paper).
Puertas, E. ( 1 989).Locus de control y programas de reducción de peso.
Primer seminario internacional de Psicología de la salud. La Habana,
37
Cuba. 1-4 de noviembre. (paper).
Orden alfabético
a) La bibliografia debe ordenarse alfabéticamente según el apellido del au
tor, o primer autor, en caso de que sean varios los autores.
b) Si se citan varias obras de un mismo autor, éstas se ordenan cronológica
mente: según el año de la publicación; o si tiene varias publicaciones en
un mismo año, después del año se coloca la letra "a", "b", "c", etc., según
los meses en los cuales fueron presentadas.
c) Si un autor además es ca-autor de otras obras, donde él figura en primer
lugar, éstas se colocan posterior a las obras individuales de dicho autor,
ordenadas según el apellido del segundo autor; independientemente del
año de la publicación. Ejemplos.
Romero García, O. (1 980). Locus de control, inteligencia, estatus so
cioeconómico y rendimiento académico. Laboratorio de Psicología, 1O,
Toda.
Romero García, O. (1981 a). Necesidad de logro, locus de control y ren
dimiento académico. Laboratorio de Psicología, 19, Toda.
Romero García, O. (198 1 b). Motivación intrínseca, motivación de logro
y valor incentivo de los estudios superiores. Laboratorio de Psicología,
27, toda.
Romero García, O. (199 1 ). Motivaciones sociales y crecimiento psicoló
gico. Mérida, Venezuela: ROGYA, C.A.
Romero García, O. y Pérez de Maldonado, l. ( 1 985). Escala Levenson de
locus de control: Análisis factorial en Venezuela. Laboratorio de Psico
logía - ULA, 51, Toda.
Romero García, O. y Salón de Bustamante, C. (1990). Poder, afiliación,
estrés y estado general de salud. Memorias EVEMO, 3 , 444-449.
38
Título del trabajo.
- Planteamiento del problema:
- Enunciado del problema.
- Justificación de la investigación e importancia del problema.
- Formulación del problema.
- Comprobación y control del problema.
Objetivos de la investigación: Generales y Especificas.
- Marco teórico:
- Marco histórico o Antecedentes o Puesta al día del tema.
- Marco conceptual o Bases teóricas.
- Sistema teórico: Definición de variables e Hipótesis de Trabajo (si
las requiere).
- Definición de Términos (si las requiere).
- Marco metodológico: Nivel y tipo de investigación Descripción de la
Población y muestra. Diseño muestra!. Descripción de técnicas e ins
trumentos de recolección de datos Descripción de las técnicas para el
análisis estadístico.
- Marco administrativo:
- Cronograma de actividades o ruta crítica.
- Recursos humanos.
- Recursos institucionales.
- Recursos materiales.
- Bibliografia
- Anexos
39
- Enunciado del problema.
- Justificación de la investigación e importancia del problema.
- Formulación del problema.
- Comprobación y control del problema.
Objetivos de la investigación: Generales y Especificas.
Marco teórico:
- Marco histórico o Antecedentes o Puesta al día del tema.
- Marco conceptual o Bases teóricas.
- Sistema teórico: Definición de variables e Hipótesis de Trabajo.
- Definición de Términos (si las requiere).
Marco metodológico: Nivel y tipo de investigación Descripción de la
Población y muestra. Diseño muestra!. Descripción de técnicas e ins
trumentos de recolección de datos Descripción de las técnicas para el
análisis estadístico.
- Resultados del estudio
- Cuadros estadísticos
- Gráficos estadísticos (cuando sean necesarios)
- Análisis e interpretación de los resultados (Discusión de los resulta-
dos).
- Conclusiones y Recomendaciones.
Marco administrativo
- Cronograma de actividades o ruta crítica.
- Recursos humanos
- Recursos institucionales
- Recursos materiales.
- Bibliografia
- Anexos
BIBLIOGRAFÍA
Briones, G. (1981 ). Métodos y técnicas de investigación para las ciencias
sociales. Bogotá: Uniandes.
40
Camel V., Fayad. (1979). Estadística Médica y de Salud Pública. Cuarta
edición. Mérida, Venezuela: Talleres Gráficos Universitarios.
Canales, F., Alvarado, E. L. y Pineda, E. B. (1989). Metodología de la in
vestigación. Segunda edición. Colombia: Carvaj al, S.A.
Cañedo D., Luis. (1987). Investigación Clínica. México, D. F. Nueva Edi
torial Interamericana.
Cerda, H. (1991). Los elementos de la investigación. Bogotá: El Búho.
Ferrero, C. (1971). Estadística, Medicina Sanitaria y Administración de
Salud. Buenos Aires: El Ateneo.
Hemández Sampieri, R., Femández, C. y Baptista, P. (1991). Metodología
de la Investigación. Bogotá: McGraw-Hill.
Hill, B. (1965). Principios de Estadística Médica. Tercera edición. Buenos
Aires: El Ateneo.
Mainlan, D. (1963). Estadística Médica. Segunda edición. México, D.F. In
teramericana, S.A.
Méndez, l., Guerrero, D., Moreno, L. y Sosa, C. (1987). El protocolo de in
vestigación. Segunda edición. México, D.F.: Trillas.
Morichau-Beachaunt,J. (1971). La Salud en el Mundo. Barcelona, España:
Oikos-Tau, S.A. Ediciones.
Polit, D., Hungler, B. (1991). Investigación Científica en Ciencias de la Sa
lud. Tercera edición. México, D.F. : Interamericana. Seijas, F. (1981).
Investigación por muestreo. Caracas: División de publicaciones de la
U.C.V.
41
CAPÍTULO 11
Muestreo
Universos o Poblaciones. Universos finitos o infinitos. Poblaciones cautivas.
Muestras. Ventajas y desventajas de las muestras. Tipos de muestras: Probabilísti
cas y No probabilísticas. Muestras Probabilísticas: Muestras aleatorias simples.
Muestras estratificadas. Muestras de conglomerados. Muestras combinadas.
Muestras polietápicas. Técnicas de azar: Azar simple. Azar sistemático Tabla de
números aleatorios. Muestras No probabilísticas: Muestras opináticas. Muestras
erráticas. Muestras de voluntarios. Características de una buena muestra. Tama
ño de la muestra. Ejercicios.
43
l. UNIVERSO Y POBLACIÓN
Desde el punto de vista estadístico, se entiende por universo o pobla
ción, a un conjunto de sujetos en los cuales está presente una o varias ca
racterísticas observables, y que son objeto de estudio. Definirlo de esta ma
nera tan general, permite pensar en una gran variedad de universos: nume
rosos, escasos, simples, complejos, finitos, infinitos, etc. Sin embargo, en
todo caso lo importante es que el universo de interés debe ser delimitado,
para hacerlo manejable desde el punto de vista estadístico.
La delimitación de un universo de estudio, se da básicamente, ubicándo
lo en el espacio y en el tiempo. Es decir, el conjunto de sujetos de interés
está constituido por aquellos cuyas características se establecen en un mo
mento y en un lugar específico.
Poblaciones cautivas
Algunos universos, hablando estadísticamente, son finitos y cautivos. Es
decir, se conoce el número de elementos que lo constituyen y además se en
cuentran circunscritos en un espacio determinado. Por lo tanto pueden ser
contactados fácilmente, haciendo menos laboriosa la recolección de los da
tos. Por ejemplo, los pacientes recluidos en un hospital, los ancianos resi
dentes en una unidad geriátrica, los escolares inscritos en un Centro de En
señanza, etc. Este tipo de poblaciones ayudan a realizar estudios más com
pletos y precisos, pero lamentablemente, tienen la desventaja, de
constituirse en poblaciones con características muy limitadas por sus pro-
45
pias condiciones, proporcionando muestras representativas sólo para el
conglomerado de donde han sido extraídas.
Este tipo de universos presenta la facilidad de ofrecer, casi de manera in
mediata la lista de unidades que lo conforman, constituyendo el marco
muestra/, siendo éste indispensable para la selección de la muestra. De no
existir el marco muestral, es aconsejable construirlo antes de iniciar el pro
ceso de muestreo.
11. MUESTRAS
Independientemente del tamaño o complejidad del universo de interés,
lo usual en la investigación, es trabajar con una parte del universo que lo re
presente, es decir, con un subconjunto del mismo en el cual estén presentes
sus características de interés. Dicho subconjunto recibe el nombre de
MUESTRA.
Con una muestra se busca que, estudiando una porción reducida del uni
verso se puedan obtener conclusiones similares a las que se tendrían si se
analizara la totalidad del universo. Aún cuando las muestras permiten efec
tuar este tipo de generalizaciones siempre existe cierto margen de error, por
lo cual, tales generalizaciones no pueden ser absolutas.
Sin embargo, el margen de error, al cual está sometido todo estudio reali
zado mediante muestras, puede ser controlado y reducido, de manera tal
que no distorsione los resultados obtenidos en la muestra, con respecto a los
del universo. Dicho en otros términos: no se produzca un sesgo en los esti
mados calculados en la muestra.
(sesgo: tendencia del estimado a desviarse del parámetro real.)
(estimado: Valor de una característica en el universo, pero calculado a
partir de una muestra.)
Así mismo, el margen de error, puede resultar mayor o menor, depen
diendo del tipo de muestreo que se utilice. Para Pardiñas ( 1979), el mues
treo consiste en seguir un método, un procedimiento tal que al escoger un
grupo pequeño de la población se pueda tener un grado de probabilidad de
que ese pequeño grupo efectivamente posee las características del universo
que se está estudiando (p 79). Se estima que son más representativas de la
46
población, las muestras obtenidas mediante procedimientos aleatorios, que
aquellas seleccionadas a través de otros procedimientos.
Ventajas de las muestras: Las razones por las cuales se utilizan mues
tras en lugar de todo el universo son, entre otras:
1) Permiten ahorrar tiempo, recursos y trabajo.
2) Con ellas se puede obtener información de mejor calidad, más verás,
con menos errores, dado que es menor el número de sujetos a estu
diar, por lo tanto, disminuyen las probabilidades de equivocación.
Permiten centrar la atención en menor número de casos.
3) Permiten la obtención de datos que de otra forma serías imposible lo
grar, especialmente cuando por razones de análisis, los elementos so
metidos a estudio o a prueba deben ser destruidos en ese proceso. Ej.
una muestra de sangre para efectuar un examen de hematología com
pleta.
4) Cuando el universo es infinito o muy extenso, la única forma de reali
zar estudio en él, es mediante el uso de muestras.
A pesar de todas estas ventajas de las muestras, también se le atribuyen
algunas desventajas o limitaciones:
47
En esencia, a través de las muestras se pretende obtener estimados lo
más cercanos posible a los valores del universo o población. En este sentido
es conveniente distinguir entre la exactitud y la precisión del estimado, al
efecto, la exactitud de un estimado se refiere al grado en el cual éste se
aproxima al parámetro. La precisión mide el grado en el cual un estadísti
co representa a su parámetro. Por esta razón se hace referencia a la preci
sión de los estimados muestrales más que a su exactitud (Bisqueda, 1 989).
48
tenidos en la muestra. Solamente las muestras probabilísticas son suscepti
bles de tratamientos estadísticos, cuando se busca conocer la significancia
de los resultados.
En la conformación de las muestras probabilísticas todos los elementos
del universo tienen una probabilidad conocida y diferente de cero de perte
necer a la muestra, y será el azar el que determine quienes la conformarán;
además, las unidades se seleccionan independientemente unas de otras.
49
Muestras aleatorias estratificadas.- Para este tipo de muestreo se clasi
fican primero los elementos de la población en clases o estratos (si es que
previo a la investigación no están clasificados) y luego se seleccionan de
cada estrato, una muestra simple al azar. En cada estrato están agrupados
elementos similares, de manera que la varianza es pequeña y el grupo resul
ta homogéneo. También se busca que los estratos sean diferentes entre sí;
que entre ellos exista suficiente variación.
En el muestreo estratificado no es necesario que todos los elementos ten
gan la misma probabilidad de selección, es suficiente con que tengan algu
na probabilidad de pertenecer a la muestra.
La forma en que se eligen los elementos n de la muestra en los estratos es
denominada afzjación, y puede realizarse de dos maneras: Afijación pro
porcional, cuando se elige de cada estrato la misma proporción o porcentaje
de elementos, esto produce un muestreo proporcional, siendo éste el más
comúnmente utilizado. Según este procedimiento, aun cuando se utiliza el
mismo porcentaje en cada estrato, el número de elementos en la muestra va
ría de un estrato a otro, dependiendo del tamaño del estrato en la población.
Afzjación óptima, donde se busca que la cantidad de cada estrato sea propor
cional al número de elementos y a la desviación estándar de la variable a
medir. Este tipo de muestreo produce el menor error muestral.
Muestras de conglomerado.- En las muestras antes mencionadas, las
unidades de muestreo (sujetos u objetos elegidos para la muestra) coinciden
con las unidades de estudio, de análisis o de observación (sujetos u objetos
en quienes se observarán las variables de interés). En las muestras de con
glomerados no se presenta esta situación. En ellas se eligen al azar conjun
tos o conglomerados de individuos, en este caso, no se seleccionan sujetos
individuales, sino más bien coryuntos de individuos. Las unidades de mues
treo son conglomerados, los cuales deben ser internamente lo más hetero
géneos posibles en cuanto a las variables en estudio, pero lo más homogé
neo posible entre ellos; esto es, que las variaciones internas entre los ele
mentos sean grandes, y entre los conglomerados las diferencias sean
pequeñas.
Es importante establecer las diferencias entre estratos y conglomerados.
Los elementos dentro de cada estrato deben ser lo más homogéneos posi
bles, mientras que los de cada conglomerado deben ser internamente hete
rogéneos. Asimismo, los estratos entre sí deben ser heterogéneos (un estra-
50
to diferente a otro estrato), y los conglomerados entre sí homogéneos (un
conglomerado similar a otro).
Además, existe el muestreo de conglomerado con estratificación, tam
bién denominado Muestras combinadas o mixtas. La escogencia de los su
jetos a estudiar se realiza tomando de cada estrato del universo un determi
nado número de conglomerados. De esta manera se utilizan las ventajas de
ambos procedimientos. Se recoge la información en grupos y se mantiene la
representatividad de cada estrato del universo en la muestra.
Muestras polietápicas.- En grandes poblaciones, por su estructura, las
investigaciones suelen resultar complejas, lo cual dificulta el diseño de téc
nicas de muestreo sencillas. En estas circunstancias es conveniente realizar
un muestreo por etapas, donde se van conformando muestras sucesivas, con
técnicas diferentes, según sea el caso.
El procedimiento indica que lo primero es dividir el universo en áreas,
siendo cada una de estas áreas definidas como "unidades primarias de
muestreo ". De ellas se elige una primera muestra. Los elementos que con
forman esta muestra se consideran "unidades secundarias de muestreo ", de
las cuales se efectúa una segunda elección, para conformar la segunda
muestra. En cuyo caso, sus elementos reciben el nombre de "unidades ter
ciarias de muestreo ", de donde nuevamente puede efectuarse otra selec
ción, y así sucesivamente hasta llegar a las "unidades últimas de muestreo "
o unidades muestrales, los cuales conformarán la muestra definitiva para la
investigación.
Cada selección hecha sirve de base para otra selección más pequeña. Por
ejemplo, el universo de estudio puede ser un distrito, el cual se divide en
áreas (unidades primarias de muestreo) de donde se eligen algunas que con
formarán la primera muestra. Luego estas áreas se dividen en sectores (uni
dades secundarias de muestreo) y de ellas se selecciona la segunda muestra,
conformada en este caso, por algunos sectores. Estos sectores están distri
buidos en manzanas o cuadras (unidades terciarias de muestreo) y de ellas
se elige otra muestra referida a las cuadras. En estas cuadras se encuentran
ubicadas las viviendas ( unidades últimas de muestreo) de las cuales se eli
gen algunas que conformarán la muestra de estudio.
Distrito � Areas � Sectores � Cuadras � Viviendas.
51
Si el propósito de la investigación es obtener información sobre las ca
racterísticas de las viviendas (tipo, materiales de construcción, comodida
des, servicios, etc.), ellas serán las unidades de estudio además de unidades
últimas de muestreo. Pero si el propósito de la investigación es conocer ca
racterísticas de los moradores (edad, ocupación, grado de instrucción, in
gresos, morbilidad, etc.) de estas viviendas, ellas serán las unidades últimas
de muestreo y sus ocupantes, las unidades de estudio.
En resumen, las muestras polietápicas son muestras sucesivas, elegidas
con técnicas diferentes, puesto que las distintas muestras se obtienen sobre
fracciones o conglomerados variables del universo total.
En un estudio para conocer la morbilidad en menores de 15 años en la
ciudad de Valencia, dado lo complejo del universo es necesario precisar el
proceso de muestreo hasta llegar a las unidades de estudio, siendo en este
caso los menores de 1 5 años. En un muestreo por etapas puede procederse
de la manera siguiente:
a) Dividir a la ciudad en zonas de acuerdo a las características socio-econó
micas de las mismas.
b) Escoger de manera aleatoria dentro de cada zona, las áreas residenciales
en las cuales se ubican las unidades de muestreo: barrios, urbanizacio
nes, etc.
c) Una vez determinados las áreas residenciales, se escogen al azar calles de
cada una de los barrios o urbanizaciones seleccionados.
d) Una vez escogidas las calles, de nuevo, con un proceso aleatorio se esco
gen las viviendas (unidades últimas de muestreo) en las cuales se aplica
rá la encuesta de morbilidad.
e) En cada vivienda se determina si existen personas menores de 1 5 años
(unidad de estudio) y se hace el estudio de morbilidad respectivo. En
caso de no haber personas que satisfagan las condiciones del universo, se
sustituye la vivienda por otra a fin de no disminuir innecesariamente el
tamaño de la muestra.
TÉCNICAS DE AZAR:
En las muestras probabilísticas, las unidades de muestreo son elegidas
mediante procedimientos o técnicas de azar, como por ejemplo: azar sim-
52
ple, azar sistemático y la tabla de números aleatorios o números aleatorios
generados por computadoras.
Azar simple: Esta técnica consiste en elaborar una lista con todas las uni
dades que configuran el universo (marco muestral), numerando cada una de
ellas; luego por sorteo (loterías, bingo, papelitos, etc.) se van obteniendo los
números que corresponden a las unidades de muestreo hasta completar el
tamaño de la muestra deseado.
Azar Sistemático: Se parte también de una lista completa de las unida
des que integran el universo y se continúan los siguientes pasos:
a) Se calcula una constante, denominada K, la cual se obtiene de dividir
"N" (total de unidades en el universo) entre "n" (número de unidades
en la muestra.
N
K =
n
b) Una vez calculada "K", se efectúa un sorteo para escoger un número
igual o menor que K, ese número corresponde al primer sujeto de la
muestra. Para obtener los restantes sujetos se le suma a ese primer nú
mero el valor de K, luego al resultante se le suma K nuevamente y así
de manera sucesiva hasta completar el tamaño deseado para la mues
tra. Este método es práctico cuando el universo es numeroso.
Tabla de Números Aleatorios: Se recomienda generalmente para mues
tras pequeñas, consiste en el uso de una tabla constituida por filas y colum
nas de números distribuidos completamente al azar. Existen varias versio
nes de esta tabla, siendo las más utilizadas las preparadas por L. N. Tippett,
Fishcer, Y stes, Kendall, entre otras, y cualquiera de ellas pueden conseguir
se en los diversos textos de estadística. También, en la actualidad se pueden
generar números aleatorios por medio de la computadora usando los dife
rentes paquetes estadísticos que se encuentran a disposición en el mercado
(SPSS, STAGRAF, STATPAC, MYSTAT, SIGMA, etc.).
MUESTRAS NO PROBABILÍSTICAS
Se caracterizan éstas porque la selección de los elementos no depende de
la probabilidad, sino de otros factores diferentes al azar. La selección es
subjetiva. Aquí el procedimiento no es mecánico, ni basado en fórmulas de
53
probabilidades, éste depende de la toma de decisiones de una o varias per
sonas, o de otras circunstancias. Por esta causa, las muestras no probabilís
ticas pueden ser: opináticas o intencionales, circunstanciales o erráticas, y
de voluntarios o de autoselección.
Las muestras opináticas requieren cierto conocimiento previo de la po
blación, por tal motivo el investigador está en capacidad de indicar cuales
elementos del universo serán objeto de estudio, por considerar los "típicos "
o representativos del problema investigado. En sí es el investigador, quien
según su opinión y los objetivos del estudio, elige a los sujetos que confor
marán la muestra.
Las muestras circunstanciales o erráticas se forman con los casos o
elementos que el investigador tiene a su alcance. Están constituidas por gru
pos de personas que en determinado lapso de tiempo acuden o transitan por
un lugar específico. Son muestras formadas por sujetos errantes, para efecto
del encuestador.
Las muestras de voluntarios se conforman con los sujetos que deciden,
por voluntad propia participar en la investigación, una vez que conocen sus
propósitos.
Utilizar una muestra probabilística o una no probabilística depende de
los objetivos del estudio, del esquema de investigación y de la contribución
científica que dará dicho estudio. Existen oportunidades en las cuales se
justifica el uso de muestras no probabilística, aún cuando éstas generalmen
te producen resultados sesgados y son poco representativas del universo.
Tamaño de la muestra
El tamaño de la muestra está en función del tamaño del universo. Se dice
que debe ser proporcional a éste. Sin embargo, cuando el universo es muy
extenso, no es indispensable que la muestra sea tan numerosa como él; es
54
cuestión de determinar cual es la cantidad apropiada, a fin de que el error
muestra! no afecte los resultados, y a su vez, no se derrochen recursos, al
utilizar una muestra de mayor tamaño que la requerida.
Existen fórmulas que permiten calcular el tamaño adecuado de una
muestra cuando se espera una determinada precisión en los resultados.
Las fórmulas a utilizar dependen de la información disponible.
1) Cuando se conoce el tamaño del universo (N), se puede aplicar la si
guiente fórmula:
n = ---- 2-
l + (N x P )
donde: n = tamaño de la muestra.
N = número total de sujetos en el universo.
P = precisión (error máximo permitido entre el parámetro y el
estadístico), expresado en proporción.
2) Cuando se quiere estimar el promedio de una población y se conoce la
desviación estándar de la población:
xs
n = -p
--
2 2
z
2
55
q = porcentaje de la población que NO tiene la característica de
interés (q = 1 - p)
P = precisión.
E.JERCICIOS
1 ) Se desea saber el porcentaje de familias interesadas en los servicios de
vacunación que ofrecen los servicios de salud de la zona. Se estima que
el área de influencia de dichos servicios abarcará unas 20.000 familias.
Se decide tomar una muestra en la cual el error máximo permitido en los
resultados no sea mayor de un 5%. Se pregunta: ¿Cuántas familias deben
incluirse en la muestra?
N = 20.000 familias
P = 5% (0,05 expresado en proporción)
N=?
N 20.000 = 392,.5
n = ----2-
l + (N x P ) 1 + [20.000(0,05 2 )]
Por lo tanto, la muestra requerida debe ser aproximadamente de 393 fa
milias.
2) Un investigador tiene interés en conocer el valor promedio de glucosa en
sangre venosa de los pacientes que asisten al hospital donde él trabaja.
En la literatura revisada encuentra que el valor promedio de glucosa en
sangre es de 83 mg/ 1 00 ml., con una desviación estándar de 5 mg/ 1 00
ml, determinado con un método diferente al que él utilizará. Está dis
puesto a tolerar 2 mg/ 1 00 ml. como error máximo entre el valor del uni
verso y el de la muestra. Se pregunta: ¿Cuántos pacientes deben confor
mar la muestra?
S= 5 mg/ 1 00 ml.
P= 2 mg/ 1 00 ml.
Z= 1 ,96
n= ?
z 2 x s2 1,962 X 5 2
n = -__2__ = = 24,0 1
p 22
La muestra debe estar conformada aproximadamente por 24 pacientes.
56
3 ) Se desea realizar una investigación sobre teniasis en una población don
de, por trabajos anteriores, se ha estimado que la positividad a este pará
sito es de un 20%. Se desea saber cuantas familias deben constituir la
muestra, si el índice buscado no varíe en más de un 6% con respecto al
del universo.
p= 20%
q= ( 1 00-20) = 80%
P= 6%
Z= 1 ,96
n= ?
1,962 X p X q = 1,962 20 X 80 =
n= 1 70'73
X
p 2 62
57
que admita un error máximo de un 5%. ¿Cuántas familias deben consti
tuir la muestra? (R: n = 297 familias).
9) En un estudio realizado sobre Infecciones oportunistas y neoplasias de
mayor frecuencia en pacientes con sida, en tres hospitales de Valencia,
entre 1 990 y 1 996 se encontró un total de 88 pacientes, distribuidos de la
siguiente manera:
HOSPITAL Pacientes
, C.H.E.T. 41
GONZÁLEZ PLAZA 31 --
H.U.A.L. 16
TOTAL 88
58
Se desea realizar el diagnóstico de salud de los niños de 7 a 1 2 años de
esa zona, por lo tanto, se resolvió efectuarlo en una escuela allí ubicada.
Para efecto de la investigación se elegirá por azar una de las dos escuelas
antes descritas, de la cual se estudiará el 50% de su población escolar. En
espera de que la muestra sea representativa en cuanto a los grados, como
quedará ésta constituida y que tipo de muestra se debe utilizar.
1 1 ) En un estudio donde se busca conocer la frecuencia y características de
la infección por VPH y el uso del DIU, en mujeres que acuden a las con
sultas ginecológicas en la maternidad de la Ciudad Hospitalaria Dr. En
rique Tejera, durante el año 1 997, donde fueron atendidas 3 .070 muje
res, distribuidas de la siguiente manera:
PACIENTES PACIENTES
USO DE DIU TOTAL
SIN VPH CON VPH
SÍ 1 .368 207 1.575
NO 1 .432 63 1.495
TOTAL 2.800 270 3.070
Nº de servicios Nº de hospitales
2 20
3 30
4 14
5 16
6 20
TOTAL 1 00
59
representativa de la población.
13) Se planifica un estudio sobre el tiempo utilizado por el equipo de salud
en la atención a los pacientes recluidos en cuatro hospitales de Carabo
bo. En la tabla siguiente se ofrece información sobre el número de camas
por tipos de servicios, en los cuatro centros.
Número de camas en los hospitales:
Servicios A B e D TOTAL
Obstetricia 80 70 80 55 285
Medicina 50 25 50 35 160
Cirugía 30 30 o 30 90
Pediatría 40 25 20 10 95
TOTAL 200 1 50 1 50 130 630
¿Qué tipo de muestra aleatoria debe utilizarse para que todos los hospi
tales, con sus respectivos servicios sean incluidos para conformar una
muestra de 1 26 camas? Numéricamente, ¿cómo estará formada dicha
muestra?
BIBLIOGRAFÍA
Azorin, F. ( 1 970). Curso de muestreo y aplicaciones. Segunda edición. Ca
racas: Dirección de Publicaciones. UCV.
Bancroft, H. ( 1 960). Introducción a la Bioestadística. Buenos Aires: Edito
rial Universitaria.
Bisqueda, R. ( 1 989). Métodos de investigación educativa. Barcelona, Es
paña: Ediciones CEAC.
Camel, F. ( 1 979). Estadística Médica y de Salud Pública. Cuarta Edición.
Mérida, Venezuela: Talleres Gráficos Universitarios. Universidad de
los Andes.
Cochran, W. ( 1 985). Técnicas de Muestreo. México, D.F.: Continental.
Daniel, W., W. ( 1977). Bioestadística: Bases para el estudio en las Cien
cias de la Salud. México, D.F.: Lemusa.
60
Gómez, F. (1976). Estadística aplicada. Caracas: División de publicacio
nes de la Universidad Central de Venezuela.
Gonzalvo, G. (1978). Diccionario de Metodología Estadística. Madrid:
Morata.
Hemández Sampieri, R., Femández C. y Baptista, P. ( 1 991). Metodología
de la Investigación. Bogotá: McGraw-Hill.
Pardiñas, F. ( 1 979). Metodología y Técnicas de Investigación en Ciencias
Sociales. México, D.F.: Siglo XXI Editores.
Polit, D. y Hungler, B. (199 1 ). Investigación científica en Ciencias de la
Salud. Tercera Edición. México, D.F.: Interamericana.
Runyon, R. y Haber, A. ( 1 987). Estadística para las Ciencias Sociales.
Cuarta edición. México, D.F.: Addison-Wesley Iberoamericana.
Scheaffer, R. y Mendenhall, W. ( 1 989). Elementos de Muestreo. México:
Grupo Editorial Iberoamérica.
Seijas Z., F. ( 1 981). Investigación por Muestreo. Caracas: División de Pu
blicaciones de la U.C.V.
Slonim M., J. ( 1 960) Sampling. N ew York: Editado por Simon y Schauffer.
61
CAPÍTULO 111
Recolección de información
El proceso de recolección de los datos. Escalas de medición. Fuentes de informa
ción: Fuentes primarias y fuentes secundarias. Instrumentos de recolección de da
tos. Tipos de instrumentos. Validez y Confiabilidad. Técnicas de recolección de
datos: Observación. Interrogatorio. Revisión documental. Ventajas y desventajas
de cada una de ellas.
63
l. EL PROCESO DE RECOLECCIÓN DE LOS DATOS
La Etapa de recolección de los datos involucra una serie de actividades
estrechamente vinculadas al éxito de la investigación, el cual depende de la:
1- Elección adecuada de la fuente de información.
2- Elaboración o selección del instrumento de recolección de datos, el
cual debe ser acorde con los objetivos de la investigación y las varia
bles en estudio.
3- Administración del instrumento de recolección.
Al plantearse un problema en el área de las ciencias de la salud, es nece
sario pensar en el tipo de información requerida para resolverlo. Ese tipo de
información debe definirse en función de los objetivos del trabajo a realizar
y de la posibilidad de tener acceso a las fuentes donde se encuentra dicha in
formación. El proceso planificado y sistemático por el cual se obtiene la in
formación para resolver el problema, se conoce con el nombre de
RECOLECCIÓN, y su objetivo es compilar los datos de la investigación.
Para entender con mayor claridad los elementos fundamentales de la re
colección, es indispensable definir algunos conceptos básicos. Las unida
des de estudio, de donde se obtendrá la información pueden ser: tejidos,
bacterias, parásitos, muestras de sangre, animales de laboratorio u hom
bres; o historias médicas, expedientes, informes, etc. Cada unidad de obser
vación permite tener parte de toda la información requerida en la investiga
ción, y al ser debidamente registrada constituye lo que se denomina DATO
o conjunto de datos.
Los datos estadísticos en muchos casos constituyen una MEDICIÓN, la
cual puede definirse como la asignación de un valor numérico a una deter
minada observación o, la expresión numérica de una observación. Al reali
zar observaciones es fácil notar que aún en grupos homogéneos, no todos
los sujetos de estudio aportan iguales mediciones sobre el mismo fenóme
no. Por ejemplo, si se determina el número de colonias de bacterias en va
rias siembras, es frecuente observar que no todas las siembras tienen el mis
mo número de bacterias. Del mismo modo, al revisar un grupo de historias
clínicas en un hospital, no todos los pacientes han ingresado con el mismo
diagnóstico. Esto indica que existe una variabilidad entre los sujetos u obje
tos bajo estudio y que las características que se buscan conocer en ese uní-
65
verso, son variables.
Cuando una característica toma valores diferentes en las diversas uni
dades de estudio, se define como una variable. En forma más precisa una
variable es un recurso metodológico que permite la conversión de un con
cepto abstracto en uno observable (Sorokin, Lazarsfeld y otro, 1 977). Des
de el punto de vista estadístico lo fundamental es medir las variables de la
manera más precisa posibles, así como sus relaciones entre ellas.
Si se piensa en todas las características posibles de medir en una mues
tra, se entiende que no todas pueden ser medidas de igual forma, pues no
poseen la misma naturaleza. Para resolver este problema se han creado las
escalas de medición, donde las variables de naturaleza diferente puedan ser
expresadas en diversas escalas: nominales, ordinales, de intervalo y de ra
zón, vistas en el primer capítulo.
66
Ejemplos típicos de fuentes secundarias frecuentemente utilizados en
Ciencias de la Salud, son las historias médicas archivadas en los diferente
servicios de salud; o los Anuarios de Epidemiología y Estadísticas Vitales,
publicados por el Ministerio de Sanidad y Asistencia Social. Sin embargo,
estas fuentes, al igual que muchas otras del mismo tipo, presentan grandes
limitaciones, en cuanto a la calidad de la información que poseen. No siem
pre es totalmente confiable la veracidad de la información allí registrada
(puede haber error en el diagnóstico, por ejemplo), o son incompletas al no
poseer toda la información requerida, lo cual es muy frecuente que ocurra.
O la información sobre las variables de interés puede haber sido registradas
en escalas de medición diferentes a la prevista, limitándose así las técnicas
de análisis estadístico a aplicar. O bien, la información recopilada en esas
fuentes no está actualizada (no es oportuna), como es el caso de los Anua
rios, los cuales generalmente se publican con tres, cuatro o más años de
atraso.
La información recopilada en las fuentes secundarias ha podido ser re
gistrada de manera continua, periódica u ocasional. El registro continuo es
aquel que se efectúa diariamente, en la medida en que el fenómeno ocurre.
Requiere de una organización permanente y contiene información referida
a un largo período de tiempo. Ejemplo: Archivos de Historias clínicas, en
tal caso, el marco muestral está constituido por las historias médicas corres
pondientes al período de tiempo estudiado.
El registro periódico se efectúa cada cierto período de tiempo fijo. Por
ejemplo, cada 1O años se recopila la información de los Censos de Pobla
ción. Por su parte, la información ocasional es aquella registrada esporádi
camente, sin ninguna periodicidad y por cortos períodos de tiempo. Gene
ralmente los datos obtenidos para efectos de investigaciones son registra
dos bajo esta modalidad.
Un elemento importante a evaluar en el momento de elegir la fuente de
información es su calidad; donde se consideran dos criterios básicos: La ac
cesibilidad, y la buena información.
La accesibilidad se refiere a la posibilidad de disponer de la información
en el momento requerido, de acuerdo al cronograma elabora do para la in
vestigación. Una fuente accesible es aquella que para su consulta no presen
ta mayores dificultades de tipo administrativo, legal o ético, por supuesto
que, conservando la confidencialidad y discreción que todo caso amerita.
67
Esto en lo relacionado a la accesibilidad administrativa; dado que es
igualmente conveniente considerar la accesibilidad geográfica de la fuente.
Cuan distante se encuentra del sitio de trabajo; o que tan dispersa está; o si
el lugar donde se halla resulta "peligroso" para el investigador. De la eva
luación de estos elementos, el investigador puede orientarse para elegir la
fuente de información, en función de las características de su universo de
estudio.
Para que una información sea considerada de buena calidad, ésta debe
ser fidedigna (cierta, real, apegada a la verdad de los hechos), completa
(que aporte información sobre todas las variables de interés), oportuna (que
sea una información actualizada, vigente) y por último, que sea pertinente
(los datos deben guardar relación con las variables en estudio).
La escogencia adecuada de la fuente de información es fundamental para
que la información recogida resulte de buena calidad y permita llegar a con
clusiones válidas.
68
4.- Cada pregunta debe contener una sola idea y referirse a un sólo suje
to, de otro modo se corre el riesgo de confusión.
5.- Debe cuidarse el número de preguntas. Se ha comprobado que el ex
ceso de preguntas disminuye la calidad de las respuestas y aumentan
el porcentaje de abstención por cuanto produce fatiga o cansancio en
el interrogado.
6. - Deben incluirse solamente preguntas que tengan relación directa con
el problema en sí y con los objetivos de la investigación.
7.- Siempre que sea posible deben elaborarse preguntas cerradas (Sí o
No), o de abanico (con varias alternativas), en lugar de preguntas
abiertas, donde el interrogado responde con sus propias palabras. Es
tas últimas resultan difíciles de computar.
8 . - Siempre que sea posible, deben evitarse las preguntas sobre temas
muy personales o privados.
9.- Igualmente, debe cuidarse el orden en que se presenten las preguntas,
ya que un ítem colocado en un lugar inadecuado, puede influir en las
respuestas de otros.
En la elaboración de un instrumento de recolección de datos también es
importante la presentación del mismo, de allí la necesidad de seguir algunas
sugerencias:
1 . - Debe contener una nota de presentación: En ella se pueden incluir los
siguientes aspectos:
- Explicación de la finalidad de la encuesta, de los beneficios que los
resultados de la investigación pueden aportar a la comunidad, así
como del uso que se le dará a la información obtenida.
- Solicitud de colaboración a los encuestados y sinceridad en sus
respuestas, para lograr el éxito de la investigación. Esto también
puede hacerse a través de una carta personal.
- Nombre de la entidad o institución que realiza la investigación, lo cual
le da seriedad y responsabilidad a quien efectúa la investigación.
2.- Instructivo para contestar: Todo formulario debe ir acompañado de
un instructivo en el cual se explique la forma en que debe ser respon
dido.
69
3 .- Aspectos materiales y estéticos: La hoja o folleto debe tener un tama
ño conveniente que facilite su manipulación. Cada pregunta debe te
ner suficiente espacio para las respuestas.
Es conveniente también que los formularios se construyan ya codifica
dos para facilitar su posterior procesamiento y análisis, cuando se tiene pre
visto realizar éste a través de computadoras. El formulario debe ser exhaus
tivo, pero pertinente, es decir, contener la información requerida para el tra
bajo, evitando la información superflua.
En oportunidades, el investigador puede utilizar instrumentos de reco
lección ya elaborados con anterioridad para trabajos similares, en especial
Escalas para medir variables, generalmente de tipo Psico-social, tales como
la "Escala de lnternalidad-Externalidad ", de Levenson, para medir la va
riable Locus de Control, o la "Escala de Graffard ", para medir situación
socio-económica; o el "Inventario Multifásico de la Personalidad de Min
nesota ", para estudiar algunas psicopatologías; y muchas otras escalas o
tests de usos frecuentes.
En todo caso, bien sea que el investigador diseñe sus propios instrumen
tos de recolección de datos, o utilice uno elaborado anteriormente, es con
veniente conocer la Validez y Confiabilidad de éste, de tal manera que los
resultados obtenidos merezcan confianza, al existir mayor seguridad de
haber medido realmente la variable que se esperaba medir. La Validez y la
Confiabilidad son dos requisitos esenciales que debe reunir todo instru
mento de medición o de recolección de datos.
Validez
La validez de un instrumento de medición representa un criterio funda
mental para evaluar su calidad y adecuación, y denota el grado con el cual,
el instrumento mide la variable que con él se desea medir Por ejemplo,
quien elabora un instrumento para medir las actitudes de los médicos hacia
los enfermos de SIDA. ¿Cómo puede estar seguro de que las puntuaciones
obtenidas con ese instrumento, reflejan realmente o de manera válida tales
actitudes, y no otra variable, como podría ser, conocimiento sobre esa en
fermedad? El problema de la validez se centra alrededor de este plantea
miento. ¿El investigador está midiendo realmente el atributo que en su opi
nión intenta medir?.
70
Un instrumento válido permite hacer un diagnóstico real de la situación
o característica estudiada. Para determinar la validez de un instrumento es
necesario analizar su Sensibilidad y Especificidad.
La sensibilidad se refiere a la capacidad de un instrumento de dar un re
sultado positivo, cuando el sujeto analizado tiene realmente la variable en
estudio. El debe permitir identificar o diagnosticar a quienes poseen la ca
racterística que se busca medir. Por ejemplo, en una encuesta epidemiológi
ca la sensibilidad se refiere a su capacidad de identificar correctamente a los
enfermos que forman parte de la población.
La especificidad se refiere a la capacidad del instrumento de dar un re
sultado negativo cuando el suj eto analizado no tiene la variable en estudio.
Ese instrumento debe permitir identificar a quienes no poseen la caracterís
tica que se busca medir. En el ejemplo de la encuesta epidemiológica, la es
pecificidad se refiere a su capacidad para identificar correctamente en la
población, a las personas que no tienen la enfermedad estudiada (Cañedo,
1987).
Es de esperarse que un instrumento posea una elevada sensibilidad y es
pecificidad simultáneamente, con el fin de reducir el número de casos fal
sos positivos y de falsos negativos, así como identificar adecuadamente los
verdaderos positivos y verdaderos negativos.
También es conveniente buscar la validez en toda técnica o método de
diagnóstico.
La literatura especializada menciona cuatro tipos de validez: de conteni
do, de criterio y de constructo y predictiva. Cada una de ellas se determina
mediante procedimientos diferentes.
Además de la validez, todo instrumento debe tener precisión o confiabi
lidad.
Confiabilidad
La confiabilidad es el otro criterio para evaluar la calidad de un instru
mento, y está referida al grado en el cual, su aplicación repetida produce
iguales resultados, en la misma unidad de observación. Por ejemplo, si con
un test de inteligencia, un investigador mide este constructo en una persona,
y obtiene un puntaje de 115 puntos en una primera aplicación; luego, dos
días después, en una segunda aplicación el puntaj e de esta persona baja a 60
71
puntos, y en un tercer intento, pasados dos meses, obtiene 1 30 puntos. En
tal caso, ¿cómo se puede tener confianza en esas puntuaciones tan cambian
tes? Evidentemente que ese instrumento no es confiable (su aplicación re
petida produce resultados distintos) sus resultados no son consistentes en el
tiempo.
Con un instrumento confiable, se espera la menor variación, en medicio
nes repetidas, sobre el mismo fenómeno. Para el cálculo de esta propiedad,
existen diversos procedimientos, entre ellos: las pruebas repetidas o test
retests, la técnicas de las dos mitades o división por mitad; y las pruebas
paralelas; el Coeficiente alfa de Cronbach, y el Coeficiente KR-20 de
Küder-Richardson.
Estos dos últimos procedimientos, generalmente son utilizados para me
dir Consistencia interna, que es otro elemento de la confiabilidad. Está re
ferida a la homogeneidad de los ítems con respecto al constructo a medir.
Cuanto mide cada ítem, por separado, la variable que mide todo el instru
mento.
La validez y la confiabilidad de un instrumento no son características in
dependientes una de otra. Se afirma, que un instrumento que no sea confia
ble, posiblemente tampoco sea válido.
Cuando es el propio investigador quien diseña el instrumento de recolec
ción, o utiliza uno creado por otros investigadores, debe cerciorarse de su
validez para medir realmente la característica a medir. Es necesario que el
instrumento haya sido validado para la población donde se realizará la in
vestigación. Un instrumento utilizado para medir las variables psico-socio
lógicas, validado para una población, generalmente no posee la misma vali
dez para otras poblaciones, con culturas, valores y costumbres diferentes.
TIPOS DE INSTRUMENTOS:
Al hablar de formularios o instrumentos de recolección de datos, es
oportuno señalar las diversas modalidades que de estos existen:
- Los Cuestionarios: Son formularios para ser llenados por los mismos
sujetos interrogados, sin la intervención directa del encuestador. Exis
ten dos variedades de cuestionario: los postales y los de auto adminis
tración. Estos últimos se aplican a grupos de personas que en forma
colectiva, y con la presencia próxima del encuestador, responden el
72
instrumento. Tienen la ventaja de garantizar el aprovechamiento má
ximo del tiempo, y permiten al investigador aclarar cualquier duda
que pueda surgir, por parte de los interrogados.
Por su parte, los cuestionarios postales, son enviados, por cualquier
medio, a la muestra, y ésta responde según interprete las preguntas
formuladas. No hay quien aclare las dudas, y generalmente, es muy
bajo el número de cuestionarios devueltos debidamente respondidos.
Por lo tanto, se piensa que cuando sólo una pequeña parte de la mues
tra de informantes devuelve los formularios llenos, resulta dificil su
poner que estos constituyan un segmento "típico " de la población. En
tal situación, es inadecuado generalizar los resultados de los estudios a
toda la población, dado que se ha utilizado una muestra sesgada.
- Las Encuestas: Se conoce con este nombre genérico a los instrumen
tos de recolección utilizados para recoger información, mediante la
técnica del interrogatorio directo (entrevista estructurada).
- Listas de Cotejo o Guías de Observación: Sirven para registrar anota
ciones producto de la observación y no de un interrogatorio. Consta de
un listado de características o comportamientos, presentadas en co
lumna, y al lado de cada una de ellas, un espacio en blanco para indi
car la presencia o ausencia de la característica observada en cada
sujeto, o la frecuencia y duración conque ésta se produce. A este tipo
de instrumento también se la denomina Lista de registro.
- Las Escalas: Son instrumentos utilizados para medir en forma cuanti
tativa, el grado en que un individuo posee la característica en estudio.
Polit ( 1 99 1 ) define a las Escalas como un instrumento diseñado para
asignar un puntaje numérico que coloque a los sujetos en un continuo
respecto al atributo que se medirá (p 249). El propósito de estos ins
trumentos es distinguir cuantitativamente a las personas, según el gra
do en que poseen determinada característica. Por ejemplo, así como la
escala de un termómetro permite establecer la diferencia entre la tem
peratura de dos personas, una Escala que mida Locus de Control, pue
de detectar a los sujetos de "orientación interna " de aquellos de
"orientación externa ".
Dentro de esta categoría de Escalas también pueden incluirse los
Tests, por cuanto su "manejo" es similar. Se utilizan para medir actitu-
73
des y variables psico-sociales.
Todos los instrumentos antes mencionados se utilizan cuando el in
vestigador obtiene la información de una fuente primaria.
- Fichas: Son instrumentos utilizados para tomar una información ya
registrada, con anterioridad a la investigación, bien sea en un archivo
de historias clínicas, o un libro de registro de casos, o de ingresos a la
emergencia de un hospital, o los datos de Anuarios, o cualquier otra
fuente secundaria.
Las fichas contienen un listado de variables o información a buscar, y
sus respectivos espacios en blanco, que serán llenados por el investi
gador con información contenida en los documentos consultados, se
gún las variables en estudio.
74
Como técnica de recolección de datos, puede variar desde la no estructu
rada hasta la estructurada, siendo esta última la más recomendable, por
cuanto la observación ha de realizarse para la búsqueda de la información
requerida en el formulario elaborado.
Ventajas de la Observación:
1 .-Permite obtener la información de manera directa, sin intermediarios
y en el momento en que ocurre; con ello se evitan las deformaciones produ
cidas por el recuerdo o la memoria, o por las limitaciones de la expresión
verbal.
2.- En ocasiones, no es necesario contar con la colaboración expresa del
informante para aportar la información requerida.
3.- Permite obtener información de sujetos que no estén en condiciones
fisicas o mentales de suministrarla.
4.- Los fenómenos se analizan con carácter de totalidad y aunque no es
posible aprender los resultados de todas las interrelaciones y otros aspectos,
se trata de un procedimiento que aborda globalmente a una problemática.
Los fenómenos pueden observarse en el mismo contexto donde se desarro
llan.
Desventajas de la Observación:
1 .- Sólo permite obtener información de hechos presentes y de conduc
tas observables, quedando excluidos los hechos pasados y los aspectos sub
jetivos y opiniones de los individuos.
2.- No es adecuado su uso en muestras grandes y dispersas, pues resulta
ría muy costoso.
3.- También, es necesario destacar que la observación requiere de apren
dizaje y ejercicio. Se puede mirar todo y no observar nada. ¿Qué se quiere
ver?, ¿qué es significativo, esencial y qué no?. Son preguntas que el investi
gador debe hacerse constantemente, si quiere que sus datos sean útiles para
responderse las preguntas previamente formuladas.
El Interrogatorio: Con este método se obtiene información mediante
una serie de preguntas formuladas al interrogado. Puede utilizarse en dos
modalidades: El interrogatorio oral o entrevista y el escrito o cuestionario.
75
Ventajas del Interrogatorio:
Mediante esta técnica puede obtenerse información referida a hechos
ocurridos en el pasado y a variables biológicas y psico-sociales (opiniones,
actitudes, expectativas, deseos), los cuales, por su misma naturaleza son
casi imposible conocer desde afuera. Nadie mejor que la misma persona in
volucrada para expresar lo que piensa, siente y ha vivido.
76
- Posibilidad de obtener mayor porcentaje de respuesta, dado que es
más fácil no responder una carta que rechazar un entrevistador.
- Posibilidad de obtener una información más precisa, por cuanto en
ciertas circunstancias pueden comprobarse de inmediato las "discor
dancias" en la información suministrada, o controlar la veracidad de
las respuestas.
- Posibilidad de captar el "sabor" de las respuestas; reacciones, adema
nes, gestos, movimientos, tonos de voz, énfasis, etc. En este aspecto la
superioridad de la entrevista es evidente al permitir añadir muchas ob
servaciones que constituyen "la circunstancia" de lo registrado.
- Puede obtenerse información de analfabetas, o de personas que no es
tén en condiciones fisicas para escribir.
- Ofrece mayor flexibilidad. El encuestador puede aclarar y repetir las
preguntas y adaptarse más fácilmente a las personas entrevistadas y a
circunstancias concretas.
Con respecto al interrogatorio indirecto o cuestionarios postales, entre
sus ventajas se menciona que al utilizar el correo como vehículo no requie
re la presencia del investigador, y por lo tanto, el costo de la recolección de
los datos es menor y su cobertura geográfica puede ser mayor. Además, la
posibilidad de mantener el anonimato, facilita la sinceridad del interrogado
al momento de ofrecer sus respuestas.
En cuanto a las desventajas de los cuestionarios postales, se mencionan:
1 - El riesgo de recibir un elevado porcentaje de cuestionarios sin res
puestas.
2- La exclusión de la muestra, a quienes no saben leer o escribir.
3 - La imposibilidad de ayudar al informante cuando no comprenda las
instrucciones o las preguntas.
4 - La dificultad para verificar la información recolectada.
Como se ve, las ventajas del cuestionario postal, son las desventajas de
la entrevista y viceversa.
77
La Revisión Documental
Cuando la información está registrada en una fuente secundaria, se utili
za la revisión documental como técnica para obtener los datos necesarios
para la investigación. En estos casos, no se trata de efectuar un análisis de
contenido de diversas obras, sino de obtener información de una serie de
documentos (historias clínicas, informes, expedientes, etc.) donde se ha re
copilado información previamente, y con un propósito diferente a la inves
tigación planificada.
A través de esta técnica pueden ser contestados los planteamientos esta
blecidos y expresados en un plan. En los documentos se analizan las fre
cuencias en que los hechos ocurren. Por ejemplo, en los Anuarios de Epide
miología y Estadística Vital se buscan datos sobre morbilidad, mortalidad y
natalidad que permitan calcular tasas, tanto regionales como nacionales.
Datos para ser procesados según los objetivos establecidos.
Esto mismo puede aplicarse cuando se revisan informes de otras investi
gaciones ya realizadas, o de documentos personales.
BIBLIOGRAFÍA RECOMENDADA
Ander-Egg, E. ( 1 972). Introducción a las técnicas de Investigación Social.
Tercera Edición. Buenos Aires: Editorial Humanitas.
Goode, W. y Hatt, P. ( 1 970). Métodos de investigación Social. México: Tri
llas, S.A.
Hemández Sampieri, R., Femández, C. y Baptista, P. ( 1 99 1 ). Metodología
de la investigación. Bogotá: McGraw-Hill.
Polit, D. y Hungler, R. ( 1 99 1 ). Investigación Científica en Ciencias de la
Salud. Tercera edición. México, D.F. : Interamericana.
Sabino, C. ( 1 986). Metodología de Investigación. Una introducción teórico
práctica. 2da edición. Caracas: Lagos.
78
CAPÍTULO /V
Procesamiento y Presentación de los datos
El proceso de elaboración de los datos. Sub-etapas. Frecuencias absolutas. Ran
go. Intervalo de clase. Límite inferior y límite superior de una clase estadística.
Centros de clase. Elaboración de cuadros estadísticos. Partes de un cuadro. Cua
dros de distribución defrecuencias, de asociación y de series cronológicas. Gráfi
cos. Tipos de gráficos: Barras simples. Diagrama circular. Histograma. Polígono
de frecuencia. Curva integral. Barras múltiples. Barras proporcionadas. Líneas
de tendencia. Números índice.
79
ETAPA DE ELABORACIÓN
O PROCESAMIENTO DE DATOS
La elaboración de los datos consiste en resumirlos en cuadros o tablas, y
en gráficos estadísticos, de acuerdos a los criterios u objetivos definidos
con anticipación. Esta etapa se cumple en cuatro sub-etapas: Revisión de
los datos; Ordenación y clasificación de estos; Computación de los mismos,
y Presentación de la información.
1. - La revisión de la información en los formularios donde fue recolec
tada, tiene como finalidad verificar si ésta permite cumplir con los objetivos
formulados previamente. En caso de presentar alguna falla (recuérdese las
cuatro características de una buena información) susceptible de corrección,
se procede a hacerlo en este momento, evitando así el procesamiento de es
tos errores que conducirán a conclusiones erradas o falsas.
2.-Seguidamente, a fin de manejar con mayor facilidad la clasificación y
categorización de cada variable, los datos pueden ordenarse en las formas
más conveniente para el cómputo de las frecuencias, aun cuando este paso
no es indispensable. Si se trata de magnitudes éstas pueden ordenarse en
sentido creciente o decreciente.
Por su parte, la clasificación permite la conformación de grupos de datos
más homogéneos, colocándolos en estratos o clases estadísticas.
El procedimiento para la conformación de las clases depende del tipo de
variable en estudio, pudiendo ser éstas numéricas (discretas o continuas) o
categóricas.
81
TABLA MAESTRA # 1
INFORMACION OBTENIDA DE LA CONSULTA EXTERNA DEL
AMBULATORIO RURAL DE LA AGUADITA, ESTADO COJEDES.
1 997
EDAD 1 TALLA EDO. SEXO EDAD PESO TALLA EDO.
SEXO PESO
·-
M !A 1 2 kg 78 cm Normal M 8A 27 kg 1 26 cm Normal
!A 1 I kg 78 cm Normal 8A 28 kg 1 24 cm Normal
39 kg S/Norma 5A 1 3 kg 1 0 1 cm D. Leve
F
9A 1 54 cm
F
7A 1 2 kg 1 1 0 cm D. Moderada 4A 1 1 kg 91 cm D. Moderada
F F
2A 1 5 kg 88 cm Normal 9A 35 kg 1 3 8 cm Normal
F F
1 4 kg M 2A 1 0 kg 82 cm Leve
F
2A 87 cm Normal
F
M 4A M 1 2A 9 kg 80 cm D. Moderada
F
1 9 kg 1 14 cm S/Norma
M 5A 1 8 kg 1 1 2 cm Normal M lOA 36 kg 1 3 8 cm Normal
l A 8 kg 74 cm D. Leve M 11A 25 kg 1 30 cm D. Leve
M 3A 1 8 kg 98 cm Normal lOA 40 kg 140 cm Normal
F
4A 1 3 kg 93 cm D. Leve
F
4A 1 9 kg 102 cm Normal
3A F llm 9 kg 77 cm Normal
F
1 7 kg 95 cm Normal
F
5A 3A 1 2 kg 86 cm D. Leve
F
22 kg 1 14 cm Normal
5A 2 1 kg 1 1 0 cm Normal llA 42 kg 148 cm Normal
F F
M ll m 7 kg 68 cm D. Leve 2A 7 kg 70 cm D. Grave
M 6A 2 1 kg 120 cm Normal 6A 1 5 kg 106 cm D. Leve
F
M 9A 33 kg Normal M !A 1 1 kg 1 81 cm Nonnal
F
1 34 cm
M !A 1 5 kg 88cm S/Norma F !A 9 kg ¡ 71 cm D. Leve
3A 1 4 kg 97 cm Normal F lO m 1 7 kg 1 67 cm I D Leve
M 7A 24 kg 124 cm Normal M l A 8 kg 68 cm D Moderada
F
2A 1 2 kg 89 cm _r,Jorm__¡il__ -� F-�_�l A
� _ l__2._l<g_j__27 _c_l!l D. Moderada .
1 1
Información obtenida de las Historias Clínicas del Archivo del Ambulatorio Rural
La Aguadita. Cojedes.
82
Frecuencias
Sexo
absolutas
Femenino 36
��-
Masculino 24
Total 60
El término frecuencias absolutas se refiere a la cantidad de sujetos que
poseen una característica específica, y por lo tanto, pertenecen a una cate
goría o clase determinada. Se obtienen mediante el conteo o computación
de los datos.
En las escalas nominales las clases se ordenan en forma decreciente, to
mando en cuenta las frecuencias, con la finalidad de dar mayor énfasis a la
categoría más frecuente. Por su parte, en las escalas ordinales las clases se
ordenan en función de la jerarquía de cada categoría, y no de las frecuencias
de éstas. Igualmente, estas escalas se conforman con tantas clases como di
visiones admite la variable.
Por ejemplo, la variable Estado nutricional contenida en la tabla maestra
# 1 , puede distribuirse en cinco clase: Sobre la norma, Normal, Desnutri
ción leve, Desnutrición moderada y Desnutrición grave, con sus respecti
vas frecuencias:
--------
4
Total 60
83
R = X (max.) - X min.
Donde:
( )
84
Menor valor de la serie = 7 Kgs.
Intervalo de clase = 6 Kgs.
Peso en Kg.
Li
7-
13 -
19 -
25 -
3- 1 ----�
--
�·-
-
37
Una vez obtenidos todos los límites inferiores (Li = valor menor de cada
clase) de la escala se calculan los límites superiores de cada clase. El límite
superior (Ls) es el valor mayor incluido en una clase estadística.
Dado que en una buena escala sus clases deben ser mutuamente exclu
yentes (los valores contenidos en una clase no se repiten en la siguiente), el
límite superior de la primera clase debe ser una unidad (o una décima o cen
tésima, etc., en caso de utilizar valores decimales) menor que el límite infe
rior de la segunda clase.
En el presente ejemplo, el límite inferior de la segunda clase es 1 3 , por lo
tanto el límite superior de la primera clase es 12. Una vez obtenido el límite
superior de la primera clase, los demás se obtienen mediante la suma conse
cutiva del intervalo de clase utilizado en el ejemplo mencionado se tienen:
1 2 + 6 = 1 8; 1 8 + 6... y así de manera sucesiva.
Peso en Kg.
Li -Ls
7 a 12
13 a 18
--··-�--�·----
1 9 a 24
25 a 30
-
3 1 a 36
--- ··
37 a 42
85
Es conveniente aclarar que en escalas numéricas continuas existen dos
tipos de límites superiores: Límite superior aparente y Límite superior real.
El primero es el que se escribe en la escala, mientras que el real es tácito. En
el ejemplo utilizado, el límite superior aparente de la primera clase es 12;
sin embargo, esta clase realmente llega hasta 12 kilos y 999 gramos, es de
cir, 0,001 gr antes de llegar a 13 kilos. Por tal motivo y para fines prácticos,
se considera que el límite superior real de cada clase es igual al límite infe
rior de la clase siguiente. Tal criterio es convencional y puede variar de un
autor a otro.
En cada clase de la escala utilizada en el ejemplo, quedan incluidos seis
pesos diferentes (le= 6). En la primera clase, por ejemplo, se ubicarán a los
niños de 7; 8; 9; 10; 11 y 12 kgs. En la última clase estarán los de 37; 38; 39;
40; 41 y 42 kgs.
Una vez formada la escala se computa cuantos sujetos corresponden a
cada clase, es decir, se obtiene lafrecuencia absoluta de cada clase.
86
2,2 puede redondearse a 2 años. Al hacer esta aproximación por defecto,
se pierden fracciones importantes del intervalo, por lo cual será necesario
formar una clase más de lo previsto.
Edad en años f
Oal 16
2a3 12
4a5 10
6a7 8
�·
8a9 8
10 a 1 1 6
Total 60
Peso en Kg f
7- 11 21
1 2 - 16 14 --
17 -2 1 8 --
22 -26 7
27 -3 1 3
32 -36 4
37 - 41 2
42 - 46 1
Total 60
87
Una buena escala, además de tener clases mutuamente excluyentes tam
bién debe ser exhaustiva, lo cual significa que debe disponer de las clases
necesarias para que todos los valores o datos de la serie estadística puedan
ser ubicados en su clase respectiva. Ningún valor debe quedar sin ubica
ción. Por tal motivo, en el ejemplo anterior hubo necesidad de agregar la
clase de 42 a 46 kgs, dado que el límite superior de la séptima clase fue 4 1 ,
dejando fuera al niño de 42 kgs. y en tal caso, la escala no sería exhaustiva.
Para que esto no ocurra se adicionan las clases necesarias, sin hacer modifi
caciones a los cálculos realizados anteriormente.
Cuando los sujetos son ubicados en sus respectivas clases, pierden el ca
rácter individual que tenían en la serie original, por lo cual es necesario bus
car para cada clase, un valor que represente a todos los valores contenidos
en ellas.
Este valor representativo de los valores de cada clase se conoce con el
nombre de centro de clase o punto medio o marca de clase. Es el valor cen
tral de cada clase, por lo cual la divide en dos partes iguales. Se simbolizan
como Xm o Ce, y se calculan mediante la fórmula:
Li + Ls ( real)
Xm =
2
Xm = Punto medio o Centro de clase
Li = límite inferior de la clase
Ls (real) = límite superior real de la clase. (Recuerde que el límite supe
rior real de una clase es el mismo límite inferior de la clase si
guiente, cuando la variable es continua).
Ejemplo:
Peso en Kg. Xm (t)
1 7 a 12 10 25
2 13 a 18 16 14
3 19 a 24 22 9
4 25 a 30 28 5
5 3 1 a 36 34 4
6 37 a 42 40 3
Total 60
88
Xm(]) = - - = - = l O Kgs
7 + 1 3 20
2 2
Xm<2l = = 1 6 Kgs. . .
13 + 19
-
-
2
37 + 43 =
Xm0 6) = 40 Kgs
2
Se calculan tantos centros de clase como clases tenga la escala. Cada uno
de ellos representa el promedio de su clase. Por ejemplo, los 25 niños de la
primera clase tienen un peso promedio de 1 O kgs.
Los centros de clase (Xm) NO se redondean.
Peso en Kg Xm
7- 11 9,5
12 - 1 6 14,6
1 7 -2 1 1 9,5
22 -26 24,5
27 -3 1 29,5
32 -36 34,5
37 - 41 39,5
42 - 46 44,5
89
SEXO
Edad en años Total
Femenino Masculino
Oa l 8 8 16
2a3 8 4 12
4a5 6 4 10
6a7 5 3 8
8a9 5 3 8
10 a 1 1 4 2 6
Total 36 24 60
CUADROS ESTADÍSTICOS
En los Cuadros estadísticos la información se presenta de manera precisa
y detallada, lo cual permite el análisis minucioso de los datos. Para cumplir
con este propósito el cuadro debe ser completo, con sus cuatro partes y no
sólo la tabulación de los datos.
90
Cuadro # 1
Evaluación nutricional de pacientes menores de 12 años,
distribuidos según sexo. Ambulatorio Rural JI,
La Agu adita. Edo. Cojedes. Marzo, 1997.
Sexo f F. R.
Femenino 36 60 %
Masculino 24 40 %
Total 60 1 00 %
Fuente: Archivo de Historia Médicas del Ambulatorio Rural II, La Aguadita, Edo.
Cojedes.
91
cada fila, si esta última lo requiere. También pueden colocarse otras co
lumnas referidas a cálculos adicionales que permitan procedimientos o
análisis posteriores, como por ejemplo los centros de clase y lasfrecuen
cias acumuladas, entre otras.
D- El pie. En la parte inferior del cuadro se coloca lafuente de donde se ob
tuvo la información presentada. Cuando sea necesario pueden anexarse
notas explicativas que faciliten la comprensión de la información mos
trada en el cuadro. Estas notas se colocan después de la fuente.
Cuadro # 2
Evaluación nutricional de pacientes menores de 12 años,
distribuidos según Estado nutricional. Ambulatorio Rural II.
La Aguadita. Edo. Cojedes. Marzo, 1 997.
Estado nutricional f F. R.
Sobre la norma 5 8%
Normal 31 52 %
Desnutrición leve 12 20 %
Desnutrición moderada 8 13 %
Desnutrición grave 4 7%
Total 60 100 %
Fuente: Archivo de Historias Médicas. Ambulatorio Rural II. La Aguadita, Edo. Co
jedes.
92
Cuadro # 3
Evaluación nutricional de pacientes menores de 12 años,
distribuidos según edad. Ambulatorio Rural //,
La Aguadita, Edo. Cojedes. Marzo, 1997.
Edad en años f F. R.
O-1 16 27 %
2-3 12 20 %
4-5 10 17 %
6-7 8 13 %
8-9 8 13 %
10 - 1 1 6 10 %
Total 60 100 %
Fuente: Archivo de Historias Médicas. Ambulatorio Rural II, La Aguadita, Edo. Co
jedes.
Cuadro # 4
Evaluación nutricional de pacientes menores de 12 años,
distribuidos según peso. Ambulatorio Rural //,
La Aguadita, Edo. Cojedes. Marzo, 1997.
Peso en Kgs f F. R.
7 - 12 25 42 %
13 - 1 8 14 23 %
19 - 24 9 15 %
25 - 30 5 8%
3 1 - 36 4 7%
37 - 42 3 5%
Total 60 1 00 %
Fuente: Archivo de Historias Médicas. Ambulatorio Rural II, La Aguadita, Edo. Co
jedes.
93
Los cuadros de Asociación se construye para estudiar la posible relación
entre dos o más variables. Por lo tanto, incluyen al menos dos variables de
manera simultánea, y regularmente varios sub-totales y un gran total. Un
ejemplo típico de este tipo de cuadro es aquel donde se muestra la distribu
ción de un grupo de sujetos por edad y sexo al mismo tiempo.
Los cuadros de asociación también incluyen las frecuencias relativas, las
cuales pueden ser calculadas de diversas maneras, de acuerdo a los objeti
vos planteados.
Cuadro # 5
Evaluación nutricional de pacientes menores de 12 años,
distribuidos según edad y sexo. Ambulatorio Rural JI,
La Aguadita, Edo. Cojedes. Marzo, 1997.
SEXO
Edad en años Femenino Masculino Total
f F. R. f F. R.
O- 1 8 (22 %) 8 (33 %) 16
2-3 8 (22 %) 4 ( 1 7 %) 12
4-5 6 ( 1 7 %) 4 ( 1 7 %) 10
6-7 5 ( 1 4 %) 3 ( 1 2.5 %) 8
8-9 5 ( 1 4 %) 3 ( 12.5 %) 8
10 - 1 1 4 ( 1 1 %) 2 (8 %) 6
Total 36 ( 1 00 %) 24 ( 1 00 %) 60
Fuente: Archivo de Historias Médicas. Ambulatorio Rural JI. La Aguadita, Edo.
Cojedes.
Este cuadro (nº 5) muestra la distribución de los sujetos según las varia
bles cuantitativa (edad, en la escala principal) y cualitativa (sexo, en la es
cala secundaria).
El cuadro nº 6 está referido a dos variables cualitativas: estado nutricio
nal y sexo.
94
Cuadro # 6
Evaluación nutricional de pacientes menores de 12 años,
distribuidos según estado nutricional y sexo. Ambulatorio Rural,
La Aguadita, Edo. Cojedes. Marzo, 1997.
SEXO
Estado Nutricional Femenino Masculino Total
f F. R. f F. R.
Sobre la norma 2 (6 %) 3 ( 12.5 %) 5
Normal 18 (50 %) 13 (54 %) 31
Desnutrición leve 8 (22 %) 4 ( 1 7 %) 12
Desnutrición moderada 5 ( 1 4 %) 3 ( 12.5 %) 8
_Qesnutrición grave 3 (8 %) (4 %) 4
Total 36 ( 1 00 %) 24 ( 1 00 %) 60
Fuente: Archivo de Historias Médicas. Ambulatorio Rural JI, La Aguadita, Edo.
Cojedes.
95
Cuadro # 7
Tuberculosis. Morbilidad y tasas por 1 OO. 000 habitantes.
Estado Carabobo. 1992-1996
Cuadro # 8
Mortalidad general diagnosticada y no diagnosticada.
Venezuela, 1992-1996.
DIAGNOSTICADA NO DIAGNOSTICADA
Año Total
Muertes Porcentaje Muertes Porcentaje
1 992 70.760 85.8 1 1 .710 1 4.2 82.470
1 993 7 1 .635 85.6 12.050 1 4.4 83.685
1 994 73.288 84.4 1 3.546 1 5.6 86.834
1 995 77.245 85.5 1 3 . 1 00 14.5 90.345
1 996 78.591 85.8 1 3.007 14.2 9 1 .598
Fuente: M.S.A.S. Memoria y Cuenta 1 .992- 1 .996. Venezuela.
96
Cuadro # 9
Dengue hemorrágico. Morbilidad y mortalidad. Venezuela.
Septiembre 1996-Marzo 1997.
�
Febrero 2.788 12
Marzo
-
276 1
Fuente: Trabajo de investigación "Dengue hemorrágico en Venezuela". Castillo, E.
y otros. 1 997.
GRÁFICOS ESTADÍSTICOS
En ocasiones, es conveniente presentar la información de manera gene
ral, sin los detalles de los cuadros estadísticos. Normalmente, cuando la
idea es trasmitir la información a .un público no especializado, o simple
mente destacar la variación importante de un fenómeno, suelen utilizarse
los gráficos estadísticos, por su ventaja de presentar fácilmente los mensa
jes que se desean transmitir.
Para su construcción existe una serie de recomendaciones que facilitan
su confección; entre ellas:
1- Todo gráfico debe ser completo. Deben contener: Encabezamiento, grá
fico propiamente dicho y fuente.
97
- El encabezamiento, ubicado en la parte superior del gráfico. Contiene
Número y Título, el cual requiere los mismos elementos que los títu
los de los cuadros.
- El gráfico propiamente dicho generalmente se construye sobre un sis
tema de coordenadas, donde en la abscisa (eje horizontal) se colocan
las clases en que ha sido dividida la variable, y en la ordenada (eje ver
tical) se colocan las frecuencias, generalmente relativas.
En la parte inferior del gráfico se coloca el pie, en el cual se menciona
la fuente de donde se obtuvo la información y notas explicativas,
cuando el gráfico las amerita.
2- Se recomienda que exista relación entre la longitud de la abscisa y de la
ordenada, con el propósito de mantener la proporción del gráfico. Se es
tima que por cada centímetro de longitud de la ordenada se dé entre uno
y dos centímetros a la abscisa. Podría hablarse de un promedio de 1 ,5
aproximadamente.
3- La abscisa se divide en tantas partes como clases se deban presentar. El
número de partes en que se divide la ordenada queda a criterio de quien
elabora el gráfico; teniendo cuidado de que todos los segmentos sean de
igual tamaño, y aumenten con un mismo intervalo, por ejemplo, de 1 O en
1 0: O - 1 0 - 20 - 30 - 40. Otro puede ser de 5 en 5: O - 5 - 1 0 - 1 5 - 20 - 25,
etc. La ordenada siempre comienza en cero y termina en la mayor fre
cuencia (generalmente relativa) a presentar, o en un valor próximo a
ésta.
4.- Cuando la frecuencia menor a representar en el gráfico está muy alejada
de cero, se aconseja realizar un corte en el inicio de la ordenada, por en
cima de cero, y colocar por encima del corte la frecuencia menor. Este
corte sugiere que se ha desechado el segmento sin uso en la ordenada. De
esta manera se mantiene la proporción del gráfico.
5- Dado que existen diferentes gráficos, estos se eligen según el propósito y
el tipo de cuadro que lo origina; así como la escala de medición de la va
riable a representar. Para ellos puede utilizarse como guía, el siguiente
esquema:
98
ESCALA DE
TIPO DE
MEDICIÓN DE LA TIPO DE GRÁFICO
CUADRO
VARIABLE
Barras Simples y Diagra
Nominal, ordinal Y Numé-
ma Sectorial o Gráfico de
ricas Discretas
Distribución Torta
de Frecuencias Histogramas y Polígonos
Numéricas Continuas de frecuencias. Además,
Curva Integral
Numérica y nominal o nu
Polígono de frecuencias
mérica y ordinal
Cuadrosde Ambas Nominales o Am-
Barras múltiples y Barras
Asociación bas ordinales o Nominal y
Proporcionadas
ordinal
Ambas Numéricas Diagrama de puntos
Series Tiempo (años, meses, se Línea de tendencia, Núme
Cronológicas manas, días, etc.) ros Indices y Barras
99
cación de esta ordenada puede ir aumentando de 15 en 1 5 , partiendo de cero
hasta llegar a 60 %, siendo ésta la frecuencia relativa máxima mostrada en
el cuadro.
Una vez divididas las coordenadas, se construyen los rectángulos o ba
rras de igual base y a la altura que lo indiquen las frecuencias relativas a re
presentar. Luego se identifica la variable llevada a la abscisa y las frecuen
cias llevadas a la ordenada. Por último, en la parte inferior del gráfico se in
dica la fuente de donde se obtuvo la información, y si se requiere, se
escriben las notas explicativas pertinentes.
Cuadro # 1
Evaluación nutricional de pacientes menores de 12 años,
distribuidos según sexo. Ambulatorio Rural JI,
La Aguadita. Edo. Cojedes. Marzo, 1997.
Sexo f F. R.
Femenino 36 60 %
Masculino 24 40 %
Total 60 100 %
Fuente: Archivo de Historias Médicas del Ambulatorio Rural II, 'La Aguadita, Edo.
Cojedes.
1 00
Gráfico # 1
Evaluación nutricional de pacientes menores de 12 años,
distribuidos según sexo. Frecuencias expresadas en porcentajes.
Ambulatorio Rural JI, La Aguadita. Edo. Cojedes. Marzo, 1997.
70
60
p 50
o
e
e
40
L_
e
j 20
10
Sexo
Fuente: Archivo de Historias Médicas del Ambulatorio Rural II, La Aguadita, Edo.
Cojedes.
101
Cuadro # 2
Evaluación nutricional de pacientes menores de 12 años,
distribuidos según Estado nutricional. Ambulatorio Rural /l.
La Aguadita. Edo. Cojedes. Marzo, 1 997.
Grados de
Estado nutricional f F. R.
circunferencia
Sobre la norma 5 8% 29
Normal 31 52 % 187
Desnutrición leve 12 20 % 72
Desnutrición moderada 8 13 % 47
Desnutrición grave 4 7% 25
Total 60 100 % 360
Fuente: Archivo de Historias Médicas. Ambulatorio Rural JILa A guadita. Edo. Co
jedes.
Gráfico # 2
Evaluación nutricional de pacientes menores de 12 años,
distribuidos según Estado nutricional. Ambulatorio Rural 11.
La Aguadita. Edo. Cojedes. Marzo, 1 997.
Desnutrición leve
20%
102
HISTOGRAMA Y POLÍGONO DE FRECUENCIAS
El histograma, al igual que las barras, también se construye sobre un
sistema de ejes de coordenadas. Está conformado por un conjunto de rec
tángulos, cuyas bases tienen una longitud proporcional al intervalo de la
clase que representan y la altura es proporcional a la frecuencia relativa de
cada clase. A diferencia de las barras simples, los rectángulos del histogra
ma están unidos por sus lados, es decir, no hay separación entre ellos.
La información contenida en los cuadros # 3 y 4 puede presentarse gráfi
camente en un histograma o en un polígono de frecuencias, dado que se tra
ta de cuadros de distribuciones de frecuencias de escalas numéricas (de ra
zón).
Para construir histogramas se recomienda seguirlos siguientes pasos:
1 - En la parte superior escribir el número y título del gráfico. Luego trazar
la ordenada y la abscisa, manteniendo proporción en sus longitudes
( 1 : 1 ,5 aproximadamente).
2- Dividir el eje horizontal en tantas partes como clases se deban presentar,
indicando en cada segmento el límite inferior de cada clase. En caso de
construir un histograma con la información del cuadro # 3, será necesa
rio dividir la abscisa en seis partes iguales, indicando en cada división el
límite inferior de cada clase.
3- Igualmente, dividir el eje vertical en partes iguales. Identificar la escala
desde cero hasta su valor máximo correspondiente a la mayor frecuencia
relativa a representar. En el cuadro # 3 el mayor porcentaje es 27 %, por
lo tanto, la ordenada puede dividirse en 3 partes iguales y aumentar de 9
en 9 hasta llegar a 27; o puede llevarse hasta 30 %, e igualmente dividirla
en 3 parte y aumentar de 1 0 en 10.
4- Luego se construye cada rectángulo con bases proporcionales a cada in
tervalo de clase y a la altura que lo indiquen las frecuencias relativas. Se
identifica la variable llevada a la abscisa y las frecuencias colocadas en
la ordenada.
5- Por último, en la parte inferior se indica la fuente de donde se obtuvo la
información y las notas explicativas si son necesarias.
103
Cuadro # 3
Evaluación nutricional de pacientes menores de 12 años
distribuidos según edad. Ambulatorio Rural JI,
La Aguadita, Edo. Cojedes. Marzo, 1 997.
Edad en años f F. R. Xm
O-1 16 27 %
2-3 12 20 % 3
4-5 10 17 % 5
6-7 8 13 % 7
8-9 8 13 % 9
10 - 1 1 6 10 % 11
Total 60 100 %
Fuente: Archivo de Historias Médicas. Ambulatorio Rural /1, La Aguadita, Edo.
Cojedes.
Gráfico # 3
Evaluación nutricional de pacientes menores de 12 años
distribuidos según edad, expresada en porcentaje.
Ambulatorio Rural 11, La Aguadita, Edo. Cojedes. Marzo, 1997.
25
p
o 20
e
e 15
n
t
a 10
104
Por su parte, el polígono de frecuencias es un gráfico lineal construido
por una serie de puntos unidos por líneas rectas, en un sistema de ejes de co
ordenadas.
Para su elaboración se siguen prácticamente los mismos pasos del histo
grama. Sólo varia el cuarto paso donde, una vez indicados los límites infe
riores de cada clase, en cada uno de los segmentos en que ha sido dividida la
abscisa, se señalan además, los centros de clase (Xm). Luego se levantan
los puntos sobre los centros de clase, a una altura proporcional a la frecuen
cia de la misma, y seguidamente, se unen dichos puntos con trazos rectos.
El resto de los pasos también son similares al del histograma.
Gráfico # 3 - B
Evaluación nutricional de pacientes menores de 12 años distribuidos
según edad, expresada en porcentaje. Ambulatorio Rural 11,
La Aguadita, Edo. Cojedes. Marzo, 1997.
30
27
25
p
o 20
e
e 15
13
n
a 10 10
- ---- - - -- - - - - - - - - - - - -� ---- �
Años
105
se obtienen mediante la suma consecutiva de las frecuencias absolutas de
cada clase.
El gráfico permite saber cuántos sujetos hay hasta un determinado valor
o a partir de éste. Del mismo modo pueden expresarse las frecuencias relati
vas en forma acumuladas.
Este gráfico también se construye sobre el sistema de ejes de coordena
das. Cada clase se representa por un punto colocado en el límite superior de
cada clase, a la altura indicado por la frecuencia acumulada.
Para su construcción igualmente se siguen casi todos los pasos del polí
gono de frecuencias, una vez acumuladas las frecuencias. La diferencia bá
sica radica en que no requiere de los centros de clase. Además, en la abscisa
se indican los límites superiores de cada clase, y cada punto se marca sobre
cada uno de estos, a la altura indicada por la frecuencia acumulada corres
pondiente a cada clase. Luego se unen los puntos mediante rectas. La curva
producto de la unión de estos puntos, siempre tiene una sola dirección, ge
neralmente en sentido ascendente.
Los cuadros # 3 y 4 también pueden representarse mediante este gráfico.
Como ejemplo se tomará la información del cuadro # 4, para lo cual es ne
cesario calcular las frecuencias acumuladas de cada clase.
Cuadro # 4
Evaluación nutricional de pacientes menores de 12 años,
distribuidos según peso. Ambulatorio Rural 1l
La Aguadita, Edo. Cojedes. Marzo, 1997.
Peso en Kgs f F. R. F. A.
7 - 12 25 42 % 25
13 - 18 14 23 % 39
1 9 - 24 9 15 % 48
25 - 30 5 8% 53
3 1 - 36 4 7% 57
37 - 42 3 5% 60
Total 60 1 00 %
Fuente: Archivo de Historias Médicas. Ambulatorio Rural 11, La Aguadita, Edo. Co
jedes.
106
Gráfico # 4
Evaluación nutricional de pacientes menores de 12 años, distribuidos
según peso, expresada en frecuencias acumuladas. Ambulatorio Rural II,
La Aguadita, Edo. Cojedes. Marzo, 1997.
F 70
e
e
u
60
e
n
50
e
1 40
a
e
A 30
u
m 20
1
10
d
a
a
7-12 1 3-18 19-24 25-30 31-36 37-42
Kgs.
Fuente: Archivo de Historias Médicas. Ambulatorio Rural II, La Aguadita, Edo. Co
jedes.
107
Cuadro # 5
Evaluación nutricional de pacientes menores de 12 años,
distribuidos según edad y sexo. Ambulatorio Rural /1
La Aguadita, Edo. Cojedes. Marzo, 1997.
SEXO
Edad en años Femenino Masculino Total
f F. R. f F. R.
O-1 8 (22 %) 8 (33 %) 16
2-3 8 (22 %) 4 ( 1 7 %) 12
4-5 6 ( 1 7 %) 4 ( 1 7 %) 10
6-7 5 ( 1 4 %) 3 ( 12.5 %) 8
8-9 5 ( 1 4 %) 3 ( 12.5 %) 8
10 - 1 1 4 ( 1 1 %) 2 (8 %) 6
Total 36 ( 1 00 %) 24 ( 1 00 %) 60
Fuente: Archivo de Historias Médicas. Ambulatorio Rural 11. La Aguadita, Edo.
Cojedes.
Gráfico # 5
Evaluación nutricional de pacientes menores de 12 años, distribuidos
según edad y sexo, expresados en porcentajes. Ambulatorio Rural IL
La Aguadita, Edo. Cojedes. Marzo, 1997.
30
p 25
o
20
e
--Femenino
e " w•w �Masculino
n 15
t
.....................'•
'•,
..
.... ,..... .......
10
L -��
0-1 2-3 4-5
Años
6-7 8-9
Cojedes.
108
BARRAS PROPORCIONADAS
Se utilizan para mostrar la variación proporcional de una variable con
respecto a la otra. Por lo tanto, es indispensable calcular porcentajes. Cada
sub-total (de columnas o de filas, según sea el caso) se iguala a 1 00, y en
función de ello se obtienen los porcentajes respectivos, por consiguiente,
todas las barras tendrán la misma altura (100).
Se construyen con la información presentada en cuadros de asociación
con dos escalas nominales u ordinales, o nominal y ordinal.
El cuadro # 6 corresponde a este tipo, en él se tiene una escala nominal y
la otra ordinal. Para representarlo gráficamente se puede construir de dos
maneras diferentes, según lo que se desee mostrar. Si interesa mostrar la
proporción de los diversos estados nutricionales en cada uno de los sexos,
se construyen barras proporcionadas, como las mostradas a continuación.
Se elaboran dos barras, y cada una representa el 100% de cada sexo. En este
caso, cada barra se divide en cinco segmentos, correspondiente a los cinco
estados nutricionales mostrados en el cuadro # 6. El área correspondiente a
cada segmento es proporcional a la frecuencia relativa a representar. Todas
las demás indicaciones para su elaboración son similares a las utilizadas en
la construcción de barras simples.
Cuadro # 6
Evaluación nutricional de pacientes menores de 12 años, distribuidos
según estado nutricional y sexo. Ambulatorio Rural,
La Aguadita, Edo. Cojedes. Marzo, 1997.
SEXO
Estado Nutricional Femenino Masculino Total
f F. R. f F. R.
Sobre la norma
Normal 13
2 (6 %) 3 ( 1 2 . 5 %) 5
Desnutrición leve
18 (50 %) (54 %) 31
Desnutrición moderada
8 (22 %) 4 ( 1 7 %) 12
Desnutrición gra��-
5 ( 1 4 %) 3 ( 1 2.5 %) 8
Total
3 (8 %) (4 %) 4
36 ( 100 %) 24 ( 1 00 %) 60
Fuente: Archivo de Historias Médicas. Ambulatorio Rural 11, La Aguadita, Edo. Co-
jedes.
109
Gráfico # 6
Evaluación nutricional de pacientes menores de 12 años, distribuidos
según estado nutricional y sexo. Ambulatorio Rural,
La Aguadita, Edo. Cojedes. Marzo, 1997.
90%
80%
p 70%
o
r so%
111D Desnutrición grave
e 50%
D Desnutrición moderada
n � Desnutrición leve
40%
t • Normal
ª 30%
D Sobre la norma
e 20%
10%
Femenino Masculino
Sexo
1 10
Cuadro # 6
Evaluación nutricional de pacientes menores de 12 años, distribuidos
según estado nutricional y sexo. Ambulatorio Rural, La Aguadita, Edo.
Cojedes. Marzo, 1997.
SEXO
Estado Nutricional Femenino Masculino Total
f F. R. f F. R.
Sobre la norma 2 (3.3 %) 3 (5 %) 5
Normal 18 (30 %) 13 (2 1 .6 %) 31
Desnutrición leve 8 ( 1 3.5 %) 4 (6.6 %) 12
Desnutrición moderada 5 (8 %) 3 (5 %) 8
Desnutrición grave 3 (3 %) (2 %) 4
Total 36 (60 %) 24 (40 % ) 60
Fuente: Archivo de Historias Médicas. Ambulatorio Rural JI, La Aguadita, Edo.
Cojedes.
Gráfico # 6 - B
Evaluación nutricional de pacientes menores de 12 años, distribuidos
proporcionalmente según estado nutricional cada sexo. Ambulatorio
Rural, La Aguadita, Edo. Cojedes. Marzo, 1997.
30
P 25
o
e
e
20
O Sobre la norma
B Normal
� Desnutrición leve
n 15 O Desnutrición moderada
IIIIIJ Desnutrición grave
e
10
Femenino Masculino
Sexo
111
DIAGRAMA DE DISPERSIÓN PARA CUADROS DE ASOCIA
CIÓN CON DOS ESCALAS NUMÉRICAS: DISCRETAS O CON
TINUAS.
El Diagrama de Dispersión o de puntos es un gráfico utilizado para mos
trar la asociación existente entre dos variables numéricas de intervalo o ra
zón, continuas o discretas. Se construye utilizando el eje de coordenadas,
colocando en la abscisa la variable considerada independiente (X) y en la
ordenada, la variable dependiente (Y). Para cada valor X, hay un valor Y.
Cuadro # 7
Tuberculosis. Morbilidad y tasas por 1 OO. 000 habitantes.
Estado Aragua. 1992-1996.
1 12
Gráfico # 7
Tuberculosis. Morbilidad y tasas por 1 OO. 000 habitantes.
Estado Aragua. 1992-1996.
21
20.5
T 20
a
S 19,5
a
s
19
18,5
18
1 13
influye en el fenómeno. Una vez decidido el año o período base, su fre
cuencia rel ativa se iguala a cien, siendo éste el primer número índice. El se
gundo y los demás números índice se calculan haciendo una simple regla de
tres. Con la información del cuadro # 8 pueden calcularse estos val ores.
En ese cuadro, para la columna de muertes diagnosticadas, puede tomar
se como período base el año 1 992, en el cual se iguala a 1 00 su frecuencia
rel ativa de 85,8 %. Para los años restantes, l os demás números índices se
cal culan por simples reglas de tres. Para 1 993 se tiene:
85,8 % - 1 0 0
85•6 x l 00 =
85, 6 % - X , X = 99,8 (segundo # índice)
85,8
Para el año 1 994 :
85,8 % - 1 00
84•4 x I OO =
84 ,4 % - X , X = 98,4 (tercer # índice)
85,8
y así sucesivamente para los años siguientes.
Para la col umna correspondiente a muertes no diagnosticadas, la fre
cuencia relativa del año 1 992 se toma como período base, por l o cual , 14,2
% es equivalente a 1 0 0, y en función de esto se plantean las regl as de tres. ·
Para el año 1 993 se tiene:
1 4 ,2 % -=-- 1 0 0
1 4 •4 x l OO =
1 4 ,4 % - X , X = 1 0 1,4 (segundo # índice)
1 4,2
Para el año 1 994 :
1 4 ,2 % - 1 0 0
1 5 •6 x l 00 =
15, 6 % - X , X = 1 09,9 (tercer # índice)
1 4,2
Una vez obtenidos estos val ores se elabora el gráfico de números índi
ces. Para ello, se procede como se indicó en el gráfico de líneas de tenden
cia, con la única diferencia que en el eje de la ordenada se ubican los val ores
de los números índices calculados. El gráfico siguiente es l a representación
1 14
de un gráfico de números de índices con los valores correspondientes al
cuadro # 8.
Cuadro # 8
Mortalidad general diagnosticada y no diagnosticada.
Venezuela, 1992-1996.
DIAGNOSTICADA NO DIAGNOSTICADA
Año Números Números Total
Muertes Porcentaje Índices Muertes Porcentaje Índices
1 992 70.760 85.8 1 00.0 1 1 .7 1 0 14.2 1 00.0 82.470
1 993 7 1 .635 85.6 99.8 1 2.050 14.4 1 0 1 .4 83.685
1 994 73.288 84.4 98.4 1 3.546 1 5.6 109.9 86.834
1 995 77.245 85.5 99.7 1 3 . 1 00 14.5 1 02.1 90.345
1 996 78.59 1 85.8 1 00.5 1 3 .007 14.2 97.2 91 .598
Gráfico # 8
Mortalidad general diagnosticada y no diagnosticada, expresada en
Números índices. Venezuela, 1992-1996.
115
110 ..
n
105
--- Diagnosticada
. . . •·
· · • · No dia nosticada
e
100
e
95
90
1992 1993 1994 1995 1996
Años
1 15
RECOMENDACIONES FINALES.
Una vez completado el proceso de elaboración de la información, el si
guiente paso es el análisis de los datos. Antes de iniciar ese punto, es conve
niente efectuar algunas revisiones importantes.
1 . - Es necesario, en primer lugar, una revisión de los cuadros y gráficos a
fin de verificar y entender que tipo de información contienen. Es decir,
examinar detenidamente el título para ver de QUE se trata, COMO está
distribuida la información, DONDE Y CUANDO fue recogida.
2.- La segunda recomendación es revisar el contenido, verificar si las clases
están apropiadamente construidas, si las cifras son las correctas y otros
detalles (fuentes, notas explicativas, etc.) que permitan alcanzar conclu
siones válidas.
3.- Verificar si hay correspondencia entre los objetivos del trabajo y la in
formación presentada. Esto permite evaluar la pertinencia de los datos.
4.- Comprobar que las formas de presentación se ajustan al tipo de análisis
que se realizará.
1 16
2,500 M 3,290 F
2,800 F 2,000 M
3,250 F 3,500 F
2,980 F 3,800 M
3,950 M 2,500 M
1 ,900 M 3,3 1 0 M
2,980 F 3,000 M
1 17
EDAD DIAGNÓSTICO EDAD DIAGNÓSTICO
a gastroenteritis 3 a rubeola
�·
1
7 a sarampión 4 a varicela
9 m. bronquitis 2 a sarampión
6 m. amigdalitis 3 a otitis
5 a otitis a amigdalitis
1
1
9 a rubeola 9 a bronquitis
4 a sarampión 1 a varicela
8 m. gastroenteritis m. -
a gastroenteritis 7 a sarampión
10
a amigdalitis 2 a bronquitis
2
3
8 a bronquitis 1 a rubeola
3 a bronquitis 4 a sarampión
6 a otitis 5 a neumonía
4 a 3 a sarampión
8 a sarampión 2 a amigdalitis
1 18
TABLA MAESTRA N º 2
1 19
B) Preséntela en un CUADRO DE DISTRIBUCIÓN DE FRECUEN
CIAS.
C) Elabore el gráfico adecuado al cuadro de Distribución de frecuencias,
anteriormente construido.
D) Presente en un cuadro asociado la información referente a las dos va
riables CUALITATIVAS.
E) Elabore un gráfico donde se muestre la relación de las dos variables
cualitativas.
F) Elabore un GRÁFICO que muestre la VARIACIÓN PROPORCIO
NAL de los factores de riesgo para cada uno de los resultados inmu
noensayo.
G) Elabore un gráfico que muestre la VARIACIÓN PROPORCIONAL
de los resultados del inmunoensayo para cada uno de los factores de
riesgo.
H) Elabore un cuadro de asociación donde se relacione la EDAD y LOS
RESULTADOS del inmunoensayo.
1) Elabore un cuadro de asociación donde se relacione la EDAD y LOS
FACTOES de riesgo.
G) Elabore los gráficos adecuados para presentar la información de los
dos cuadros anteriores.
BIBLIOGRAFÍA CONSULTADA
Camel, F. (1979). Estadística Médica y de Salud Pública. Cuarta edición.
Mérida, Venezuela: Talleres Gráficos Universitarios.
Hernández Sampieri, R., Fernández, C. y Baptista, P. (1991). Metodología
de la Investigación. Bogotá: McGraw-Hill.
120
CAPÍTULO V
Técnicas de Análisis Univariado
Etapa de análisis estadístico. Medidas de tendencia central: Media Aritmética.
Mediana. Moda. Media ponderada. Medidas deposición: Cuartiles, Deciles y Per
centiles. Medidas de dispersión: Desviación media. Desviación estándar. Varian
za. Coeficiente de variación. Intervalo intercuartil. Rango. Indice endémico.
Frecuencias relativas. Tasas Generales: de mortalidad, de fecundidad, de natali
dad. Tasas de morbilidad por una causa específica. Tasas de incidencia, Tasas de
prevalencia. Tasas específicas de mortalidad para un grupo de edad o causa espe
cífica. Tasa de letalidad. Tasas de mortalidad infantil, neonatal, perinatal, fetal,
temprana, temprana propiamente dicha. Tasa de mortalidad materna. Tasas de
mortalidad proporcionada por una causa o a una edad específica. Indice de Swa
roop. Medidas de riesgo: riesgo absoluto, relativo y atribuible.
121
EL PROCESO DE ANÁLISIS ESTADÍSTICO
La etapa de análisis estadístico involucra la aplicación de técnicas esta
dísticas a una serie de datos u observaciones, con la finalidad de describir
los, analizarlos, interpretarlos y hasta inferir resultados, según sea el caso:
de estadísticas descriptivas o estadística inferencia!, en función de los obje
tivos de la investigación.
En el presente capítulo se tratará sólo lo relacionado con las técnicas de
análisis descriptivas para variables cualitativas y cuantitativas.
Durante el proceso de elaboración se aprecia como el carácter individual
de las observaciones es sustituido por el interés de conocer los valores refe
ridos a los grupos, es decir, el carácter colectivo de éstas. Esos valores refe
ridos al grupo, se expresan a través de medidas estadísticas que se transfor
man en valores típicos o representativos del conjunto de datos. Ellos dan in
formación sobre la manera en que los valores del conjunto se agrupan o se
dispersan en una distribución.
De acuerdo al tipo de información requerida pueden calcularse:
- Medidas de tendencia central
- Medidas de posición.
- Medidas de dispersión.
Existen además, otras medidas que dan información acerca de la forma
de la distribución como el caso de la "simetría" y la "curtosis". Sin embar
go, en esta oportunidad sólo se revisará lo concerniente a las tres primeras
mencionadas.
123
La Media Aritmética
La media aritmética es un valor intermedio, que oscila entre el menor y
el mayor de los números incluidos en una serie estadística. Es la medida de
concentración o de tendencia central más estable y posee mayores propie
dades matemáticas que la Mediana y el Modo. Se simboliza como X.
Esta medida de tendencia central (X) es muy representativa de la serie si
ésta es simétrica o ligeramente asimétrica. En su cálculo intervienen todos
los valores de la serie estadística, por lo cual no debe utilizarse cuando algu
no de los valores extremos presenta una gran diferencia con respecto a los
demás valores. Así mismo, no puede calcularse cuando se desconoce el va
lor máximo o el mínimo de la distribución.
La media aritmética de un conjunto de n valores (x), se define como el
cociente de la sumatoria de todos los valores de la serie, dividida entre el
número total de ellos. La expresión matemática es:
¿ X = X l + X2 + X 3+. . . Xn
X=
n n
donde:
_¿ = Sumatoria.
x = cada valor que ha tomado la variable en los sujetos estudia
dos.
n = el número total de casos u observaciones.
El cálculo se ilustra a través del siguiente ejemplo:
5 . 1 . Los valores de la presión sistólica de 5 pacientes atendidos en un
hospital son los siguientes:
XI = 131 mm de Hg
X2 = 116 mm de Hg
X3 = 11O mm de Hg
X4 = 99 mm de Hg
X5 = 121 mm de Hg.
Aplicando la fórmula, la media aritmética de estos cinco valores es:
1 24
131 + 116 + 11O + 99 + 121 = 577 =
X= 115 '4 mm de Hg
5 5
Cuando los datos están agrupados en clases de intervalo uno, se multi
plica cada valor por la frecuencia absoluta de la clase respectiva; en este
caso, el valor de la media se calcula con la siguiente fórmula:
¿ ( Xi · fi) = Xi · f l + X2 · f 2 +. . . + Xn · fn
X=
n f l + / 2 + / 3 + . . . + fa
Donde:
¿ = Sumatoria
Xi = Valores de la variable en cada clase
fi = frecuencia absoluta de cada clase
n = frecuencia total
Ejemplo 5.2:
Presión arterial Sistólica en 1O pacientes
Presión Sistólica
f Xi . fi
mm de Hg
131 3 393
116 2 232
110 3 330
99 99
121 121
n 10 1.175
(31 x 3 ) + (116 x 2) + (1 l O x 3 ) + (99) + (121)
X=
10
- = 1175
X -- = 117 � mm de Hg
10
La media se obtiene mediante la sumatoria de los productos de los valo
res por su frecuencia, dividida entre el número total de datos, y se interpreta
como el valor representativo de esos valores, es decir, el valor de la media
resume a todos los valores de la serie.
125
Cuando el rango de la variable es amplio, los datos pueden agruparse en
clases para facilitar su manejo, aun cuando hoy en día, con el auxilio de las
computadoras, en realidad este proceso tiende a obviarse, a menos que con
venga expresamente la agrupación en clases. Al agrupar los datos en clases,
se asume que los valores en cada una se distribuyen de manera igual a lo lar
go de ella, perdiendo su carácter individual, por lo cual pasan a ser repre
sentados por los centros de clase o puntos medios. La media así calculada es
una aproximación a la media de los datos no agrupados, pues, al hacer la
agrupación se pierde precisión.
En este caso, la media de la distribución es igual a la sumatoria de las fre
cuencias multiplicadas por el centro de cada clase, y dividido luego entre el
total de la frecuencia.
(X - )
X = ¿ m fi
n
Donde:
L = Sumatoria.
Xm = Puntos medios o centros de clase.
fi = frecuencias absolutas de cada clase.
n = total de las frecuencias.
Ejemplo 5.3:
Distribución de 71 pacientes de acuerdo a su edad
Edad fi Xm Xm.fi
20 - 24 5 22,5 1 1 2,5
25 - 29 6 27,5 1 65,0
30 - 34 12 32,5 390,0
35 - 39 11 37,5 41 2,5
40 - 44 8 42,5 340,0
45 - 49 15 47,5 71 2,5
50 - 54 14 52,5 735,0
Total 71 2.867,5
126
¿ (Xm · ji) = 2·867� =
X= 40,.19 años
n
La media aritmética es el valor alrededor del cual tienden a agruparse los
valores del conjunto de observaciones. Podría decirse que si no existiera va
riación, todos los sujetos habrían tomado el mismo valor de la media en esa
serie. Por lo tanto, en el ejemplo anterior, todos los valores tienden a agru
parse al rededor de 40,39 años.
La Mediana
Es una medida descriptiva ubicada en el centro de la distribución, por lo
cual, divide a la serie en dos partes iguales. Indica el punto por debajo del
cual se encuentra el 50% de los casos, de tal forma que la mitad de los datos
toman valores menores a la mediana y la otra mitad, valores superiores a
ésta. Se simboliza como Md.
Cálculo de la Mediana en series no agrupadas:
Ejemplo 5.4:
Se tiene la siguiente serie: J O, 11, 9, 12, 8 años de edad.
1 .- Se ordenan los valores en forma creciente o decreciente:
8, 9, J O, 11, 12
2.- Se busca la posición o lugar de la mediana:
Lugar de Md = -- n +l =-5 +1 6
=- =3
n 2 2
3 .- En la Serie, se busca el valor de la observación que está en el lugar de
la mediana. En este ejemplo, en el tercer lugar se encuentra el valor
1 0. Por lo tanto, la Md = 1 0 años.
Nótese en este caso, que el número de observaciones es impar (n = 5),
por lo tanto, la mediana es el valor observado en el centro de la serie,
luego de ordenados los datos.
Ejemplo 5.5:
Si el número de datos fuera par: 8, 8, 1O, 11, 14 y 15 años; la posición de
la mediana sería:
127
n +l 6+1 7
n
Lugar = -- = -- = - = 3,5
2 2
Al estar ordenados los datos, la posición 3,5 es un lugar intermedio entre
el 3ro. y el 4to., en consecuencia, el valor de la mediana es el promedio en
tre los dos valores que ocupan esos lugares centrales, es decir, entre 1 O y 1 1 .
1O + 1 1 21
Md = = = l 0,5
2 2
Donde:
Li =límite inferior de la clase donde está la mediana.
F .A = Frecuencia acumulada hasta la clase anterior a aquella
donde se encuentra la mediana.
fi = frecuencia absoluta de la clase donde está la mediana.
le = Intervalo de la clase donde está la mediana.
n = frecuencia total, o total de datos.
Ejemplo 5.6:
A través del siguiente ejemplo se ilustrará el cálculo de la mediana para
los datos agrupados.
Distribución de 100 estudiantes de acuerdo a la edad
128
Edad en
años
fi FA
5 -7 4 4
8 - 10 7 11
1 1 - 13 26 37
14 - 1 6 41 78
17 - 19 14 92
20 - 22 9 101
Total 101
1 .- Determinación del lugar de la mediana.
n + l 1 02
Lugar = -- = - = 5 1
2 2
2.- Obtener las Frecuencias acumuladas:
Al examinar la columna de las FRECUENCIAS ACUMULADAS, se
aprecia que la observación número 5 1 está contenida entre las 78 fre
cuencias acumuladas hasta la cuarta clase, por lo tanto, en ella se en
cuentra la mediana. Nótese que hasta la tercera clase sólo hay 37 obser
vaciones, por lo tanto, allí no puede encontrarse la observación número
51.
La mediana se encuentra en la clase de 1 4 a 1 6 años (4ta clase), por lo
tanto,
Li = 14
fi = 4 1
l e = 3 , o sea 1 7 - 1 4 = 3 (resta de dos límites inferiores consecutivo)
F.A= 37 (Frecuencia acumulada hasta la 3ra clase).
2.- Cálculo de la Md:
Md = 1 4 + (5 1 - 37 ) 2_
41
+
Md = 1 4 ( 1 4 x 0,07)
Md = l4 + 1 ,02
Md = 1 5,02 años.
129
Lo cual significa que 15,02 años es la edad por debajo de la cual está el
50% de los estudiantes, en otras palabras, que la mitad de los estudiantes
tienen una edad igual o inferior a 15,02 años.
130
el punto medio de la distribución. Del mismo modo, es útil cuando se tie
nen series abiertas o valores muy altos o muy bajos en los extremos de la
sene.
3.- La moda se utiliza cuando se desea una estimación aproximada y rápida
de la tendencia central. En grupos pequeños la moda puede ser comple
tamente inestable.
Servicios X de días n
#1 60 1 00
#2 50 600
#3 40 300
Total 1 .000
131
48 días fue el promedio de hospitalización de estos 1 .000 pacientes.
9 9 8
10 9 9
10 10 10
Estas tres series, referidas a una misma variable presenta varias caracte
rísticas comunes:
- Todas contienen la misma cantidad de datos, n = 7
- Todas tienen extremos comunes, por lo tanto, el mismo rango:
JO - 6 = 4 kgs.
· . . ( n - 1) ( 7 - 1) 8
- Todas tienen 1a misma medrnna: - -; --; - = 4
2 2 2
En el 4° lugar se encuentra el valor 8. Md = 8 kgs.
.
- Todas tienen . . . . ¿ X 56
1a misma medta antmetlca:
' X = -- = - = 8 Kg
n 7
Sin embargo, las tres series no son similares en cuanto a su forma de dis
tribución. En la primera serie (grupo A), los valores tienden a agruparse en
los extremos, mientras que en la última (grupo C), los valores tienden a
agruparse en el centro de la distribución. Aun cuando tienen tantos elemen
tos comunes, tienen una gran diferencia: la dispersión o variación de sus va
lores.
1 32
Para describir o analizar una distribución de datos en forma completa, se
necesita conocer la variación de sus valores con relación a su medida de
tendencia central. La necesidad de calcular e interpretar las medidas de dis
persión viene dada por el hecho de que al construir una distribución y calcu
lar las medidas de tendencia central, aún cuando son los valores representa
tivos que resumen el conjunto, no todos los datos de la serie coinciden con
ellas, sino que se desvían. Esta desviación se expresa con las medidas de
dispersión. De allí, la necesidad de conocer también las medidas de disper
sión o de variabilidad. Entre estas medidas se tiene: el Rango, la Desviación
Media, la Desviación Estándar, la Varianza y el Intervalo Intercuartil.
n
Donde:
x = valor de cada observación.
X = Media aritmética de la serie.
n = número total de datos.
lx - X I = diferencia entre cada valor y la Media, ignorando signos.
Ejemplo 5.9:
Peso de los niños del grupo A: 6 - 6 - 7 - 8 - 9 - 10 - 10 kgs.
133
1. - Se calcula la media:
X=
6 + 6 + 7 + 8 + 9 + 1 0 + 1 0 = 56 = 8 kgs
7 7
2.- Cálculo de la desviación media:
Xi Xi - X I Xi - X I
6 6-8=-2 2
6 6-8=-2 2
7 7-8=- 1 1
8 8-8=O o
9 9-8=1 1
10 10 - 8 = 2 2
10 10 - 8 = 2 2
n=7 = 10
lO =
3.- Aplicando la fórmula DM = 1,43 kgs
7
Desviación estándar
Es la medida de variación frecuentemente utilizada para mostrar la dis
persión de los valores individuales alrededor de la media en una distribu
ción. La desviación estándar es el promedio de desviaciones de las puntua
ciones con respecto a la media. Cuanto mayor es la dispersión de los datos,
mayor es la desviación estándar. Se simboliza como "s" (en minúscula), o
la letra griega sigma ( cr).
Para su cálculo se utilizan las siguientes fórmulas:
Para datos no agrupados o datos directos:
X -X) (X - X)
s = P) o s = IL,
n n-l
Se define como la raíz cuadrada de la sumatoria de las desviaciones de
cada puntuación con respecto a la media, elevadas al cuadrado, y dividida
entre el número total de datos; o entre el total de datos menos uno (n - 1 ),
cuando se tienen menos de 30 observaciones (muestra pequeña) y los datos
no han sido agrupados en clases.
134
Ejemplo 5.10:
Peso de los niños del grupo A: 6 - 6 - 7 - 8 - 9 - J O - J O kgs.
1. - Se calcula la media aritmética de la serie:
6 + 6 + 7 + 8 + 9 + 10 +10 = 56 =
X= 8 kgs
7 7
2. - Cálculo de las desviaciones medias:
Xi Xi - X (Xi - X)2
6 6-8=-2 4
6 6 -8=-2 4
7 7 - 8= - 1 1
8 8-8=O o
9 9-8=1 1
10 10 - 8 = 2 4
�-
10 10 - 8 = 2 4
n=7 L = 18
3. - Aplicando la fórmula,
18 = {18 = �
s=�
7 -1 �6
s = 1, 7 kgs.
En series agrupadas, para calcular la desviación estándar o desviación tí
pica, se utiliza la siguiente fórmula:
- (X - X) 2
s = � fi :
Donde:
s = Desviación estándar
fi = frecuencia absoluta de cada clase
Xm = Centro de cada clase
X = Media aritmética
n = total de datos
135
Ejemplo 5. 1 1 :
Distribución de 248 pacientes atendidos por
intoxicación alimentaria. HUAL. 1997.
Edad en años fi Xm f . Xm
10 - 1 1 36 11 396
12 - 1 3 56 13 728
14 - 17 80 16 1 .280
18 - 19 46 19 874
20 - 25 30 23 690
Total 248 L =3.968
Para calcular la desviación estándar (s):
L Xm · Ji 3968
X= = -- = 16 anos
. . . _
A- Se ca1cu1a 1a medrn antmetlca:
,
n 248
X = 16 años
B- Se obtienen los desvíos medios, restando la media a cada centro de clase
[Dm = (Xm - X)}.
C- Cada desvío medio se eleva al cuadrado.
D- Cada desvío medio al cuadrado se multiplica por la frecuencia absoluta
de la respectiva clase.
E- Se suman los productos de estas multiplicaciones [fi.(Xm - x2)].
F- Se divide el total de la sumatoria entre el total de la frecuencia. Este re
sultado se denomina varianza.
G- Se extrae la raíz cuadrada de la varianza.
136
(B ) (D)
Edad en años fi Xm
(C)
(Xm - X) (Xm - X)2 fi.(Xm-X)2
10 - 1 1 36 11 1 1 - 1 6 = -5 25 900
12 - 13 56 13 1 3 - 1 6 = -3 9 504
14 - 17 80 16 16 - 16 = O o o
18 - 19 46 19 1 9 - 16 = 3 9 414
20 - 25 30 23 23 - 1 6 = 7 49 1 .470
Total 248 3.968 (E) 3.288
(G) s = 3, 64 años
3,64 años, valor que indica la forma como se dispersan las observaciones
alrededor de la media.
Varianza (cr2)
Es la desviación estándar elevada al cuadrado, y se simboliza como "S2".
Es un concepto estadístico muy importante, especialmente en pruebas
cuantitativas, sin embargo, para fines descriptivos se utiliza preferiblemen
te la desviación estándar.
El Coeficiente de Variación.
En oportunidades es necesario comparar la variabilidad de diversas se
ries estadísticas, expresados en diferentes unidades de medida, por ejemplo
en kgs, cms, años, pulsaciones por minuto, etc. En tal caso, no es posible
utilizar directamente la desviación estándar para determinar en cual de ellas
existe menor o mayor variación. En su lugar, se utiliza el coeficiente de va
riación, el cual mide la variación porcentual de los valores en la distribu
ción. Es una medida de variación relativa, y se expresa en porcentaje.
El coeficiente de variación se define como el cociente entre la desviación
estándar y la media, multiplicado por 1 00.
s
Cv = = x l OO
137
A mayor coeficiente de variación, más heterogéneo es el grupo, hay ma
yor dispersión, el grupo está menos concentrado. A menor coeficiente, hay
más homogeneidad en la serie, mayor concentración de los valores y la me
dia es más representativa de los valores que conforman la serie.
Ejemplo 5. 1 2: ¿Cuál de estas dos series es más heterogénea?
s
Talla 1 ,75 Mts 0,08 mts.
Peso 60 kg 1 ,5 kg
008
Cv (talla) = -'- x 1 00 = 4,57 %
1,75
l,5
Cv (peso) = x 1 00 = 2,5 %
60
El mayor coeficiente de variación es el de la variable talla (4,6%). Por lo
tanto, este grupo de valores es más heterogéneo; su media es la menos re
presentativa de la serie. En la talla se aprecia mayor variación entre sus da
tos.
MEDIDAS DE POSICIÓN
Las medidas de posición se refieren a los lugares donde se ubican deter-
minados valores de la distribución.
Son medidas de posición:
- Los cuartiles (Q)
- Los deciles (D)
- Los percentiles (P)
Cuartiles.
Son aquellas medidas que dividen una serie de datos en cuatro porciones
iguales, en términos de la proporción de observaciones en cada una de ellas.
Q 1 = valor por debajo del cual está el 25% de las observaciones.
( + l)
Para calcular el lugar: Lugar = n
4
138
Q2= valor por debajo del cual está el 50% de las observaciones.
2 (n + l)
Para calcular el lugar: Lugar = - -
4
Q3= valor por debajo del cual está el 75% de las observaciones.
3 (n + 1)
Para calcular el lugar: Lugar = ---
4
Ejemplo 5. 1 3 :
Como ilustración, se calculará el tercer cuartil (Q3 ) en la distribución si
guiente:
Edad (Xi) ti F.A
20 años 2 2
2 1 años 1 3
22 años 3 6
23 años 16 22
24 años 12 34
25 años 5 39
26 años 9 48
27 años 8 56
28 años 13 69
29 años 11 --�
80---��-
Total 80
Procedimiento:
3 ( n + l) = 3 x 8 1 = 243 =
Posición del Q3= 60,75 (es el lugar)
4 4 4
Al observar la columna de frecuencias acumuladas, se nota que el lugar
60,75 está incluido en la clase # 9; por lo tanto, el Q3 tiene un valor de 28
años, dado que el intervalo de la distribución es igual a 1, es decir, el 75% de
los sujetos de la distribución son menores de 28 años.
Si los datos están agrupados en clases con intervalos de 2 o más, una vez
ubicada la clase donde se encuentra el cuartil buscado, se siguen los mismos
pasos utilizados anteriormente para calcular la mediana, según la fórmula:
139
Q (buscado) = Li + {[(lugar del Q buscado) - F. AJ le/ji}
Donde:
Q (buscado) = Cuartil buscado el cual puede ser 1; 2 ó 3
Li = límite inferior de la clase donde está el Q buscado
F. A = Frecuencia acumulada hasta la clase anterior a aquella
donde está el Q buscado.
ji = frecuencia absoluta de la clase donde está el Q buscado.
Je = Intervalo de la clase donde está el cuartil buscado
n = frecuencia total, o total de datos.
Deciles
Son los valores o puntos de la serie que la dividen en 1 O partes iguales. El
primer decil o D 1 , es el valor por debajo del cual está el 1 0% de los casos de
la distribución. Para calcular, por ejemplo el D4 en la serie anterior, se pro
cede de la manera siguiente:
4(n + 1) 4 x 8 1 3 24
Lugar = = = = 3 2,4
10 10 10
El decil 4 está en el lugar 3 2,4. Este lugar corresponde a la clase # 5 don
de se encuentran los sujetos de 24 años; por lo cual, el decil 4 corresponde a
un valor de 24 años. El 40% de los sujetos tienen una edad igual o menor de
24 años.
Si los datos están agrupados en clases con intervalos de 2 o más, una vez
ubicada la clase donde se encuentra el Decil buscado, se siguen los mismos
pasos utilizados anteriormente para calcular la mediana, según la fórmula:
D buscado = Li + [(lugar del D buscado) - F. AJ le/ji
Percentiles.
Son puntos o valores que dividen la serie en 1 00 partes iguales. Es decir,
por debajo de un determinado percentil se encuentra un cierto porcentaje de
casos, por ejemplo, el percentil 60 es el punto por debajo del cual se encuen
tra el 60% de los sujetos.
Para ilustrar se calculará el percentil 25 (P25), en la serie anterior.
140
El lugar del P25 =
25 x 8 1 2º25
= = 20,25
1 00 100
En esta distribución, la posición 20,25 está ubicado en la cuarta clase,
donde están las personas de 23 años. Luego, el percentil 25 es de 23 años, lo
cual indica que el 25 % de los sujetos tienen edades iguales o inferiores a 23
años.
Si los datos están agrupados en clases con intervalos de 2 o más, una vez
ubicada la clase donde se encuentra el Percentil buscado, se siguen los mis
mos pasos utilizados anteriormente para calcular la mediana, según la fór
mula:
P buscado = Li + {[(lugar del P buscado) - F. AJ lc/fi}
Donde:
P buscado = Percentil buscado (el cual puede ser cualquier va
lor entre 1 y 100)
Li = límite inferior de la clase donde está el Percentil buscado.
F. A = Frecuencia acumulada hasta la clase anterior a aquella
donde está el Percentil buscado.
fi = frecuencia absoluta de la clase donde está el Percentil bus
cado.
le = Intervalo de la clase donde está el Percentil buscado.
n = frecuencia total, o total de datos.
141
Ejemplo 5.14:
Edad de 1 04 pacientes hipertensos.
Consulta de medicina interna CHET. Valencia, 1997
Edad fi F.A
43 - 47 7 7
48 - 52 18 25
53 - 57 24 49
58 - 62 36 85
63 - 67 13 98
68 - 72 4 102
73 - 77 2 104
Total 1 04
Calcular Percentil 75
l) 75(104 + 1) = 75 x 105 = 7.875 =
l.- Lugar de/ P75 = 75(n + = 78 75
1 00 100 1 00 1 00 '
Lugar del Percentil 75 = 78,75
2.- Según la columna de Frecuencias acumuladas, el percentil 75 está con
tenido en la cuarta clase, correspondiente a las edades de 58 a 62 años.
142
Intervalo lntercuartil
Se emplea con el fin de superar la limitación del rango como medida de
dispersión. Su mayor utilidad radica que entre sus límites se encuentra el
50 % de las observaciones centrales de la distribución, que no son afecta
das por los valores extremos de la serie.
El intervalo intercuartil, también denominado intervalo semi-intercuar
til, mide la dispersión de los valores de la serie, pues, mientras más próxi
mos son sus límites, existe mayor concentración de las observaciones alre
dedor de la mediana. Es igual a la mitad de la distancia entre el Primero y el
Tercer cuartil.
QJ - Q1 p1s - P2s
Q=
2 2
EL ÍNDICE ENDÉMICO
Un problema fundamental en el campo de la salud pública, es conocer el
comportamiento de las enfermedades, es decir, su evolución y cambios tan
to en su capacidad para producir daños, como en la frecuencia con que se
presentan. En este último aspecto, el trabajador de la salud cuenta con un in
dicador muy importante, que provee información para decidir si el número
de casos de una enfermedad representa una situación normal en una comu
nidad en un momento determinado o si se está en presencia de una epide
mia. El índice endémico muestra tal situación.
Para elaborar el índice endémico, se procede de la manera siguiente:
1 . - Averiguar la morbilidad de la enfermedad estudiada en los últimos 5 ó 7
años, especificada por meses o semanas. No se debe usar menos de 5
años debido a las fluctuaciones que se presentan de un año a otro, ni más
de 7 por cuanto en largos períodos las condiciones de la comunidad pue
den cambiar notoriamente. La especificación por semanas o meses, se
hará de acuerdo con el número de habitantes de la región y con la fre
cuencia de la enfermedad estudiada.
2.- Se ordenan los casos por meses (o por semanas), independientemente de
los años.
143
3.- Se calcula la media aritmética y la desviación estándar en las series co-
rrespondientes a cada mes. La media indica el promedio de casos espe-
rados por mes, siendo considerado el índice endémico. La media más
una desviación y menos una desviación (Mx + y - 1 s) serán las medidas
de las fluctuaciones de un año a otro.
Ejemplo 5. 1 5:
Casos de meningo-encefalitis viral por meses Caracas, 1990-1996
Total
Años Meses del año
anual
E F M A M J J A s o N D
1 990 62
1 99 1 65
8 2 4 6 5 8 6 7 5 5 5
1 992 1 13
4 2 7 5 4 6 6 18 3 4 5
1 993 154
2 8 4 7 6 13 18 13 17 11 2 12
1994 1 72
13 14 8 10 18 15 22 20 12 7 5 10
1995 120
15 21 10 16 26 21 10 7 20 4 14 8
1 996 1 04
6 6 4 10 9 13 11 10 16 20 10 5
6 13 18 9 6 16 9 6 7 6 6 2
Fuente: anuario de Epid. y Estad/Vital, M.S.A.S, Venezuela, 1990-1996.
1 44
Con la columna X-s, se construye la primera curva; con los promedios la
segunda, y con los valores de X + s la tercera, mostrando así las 4 zonas de
la curva endémica: Zona de éxito, zona de seguridad, zona de alarma y zona
de epidemia.
18
ZONA DE EPIDEMIA
16
e
14
A
12
S 10
o
S 8
2
ZONA DE EXITO
ENE FEB MAR ABR MAY JUN JUL AGO SEP OCT NOV DIC
Meses
1 45
sarla en porcentaje; y para las tasas, multiplicarlas por 1 on (la "n" puede to
mar el valor de 1 00, 1.000, 1 0.000 o más, según la tasa que se calcule).
La importancia de las frecuencias relativas, como medida de resumen,
radica en que:
1 - Permiten comparar varias muestras, aún cuando sean de tamaños dife
rentes.
2- En cierto modo, envuelven la noción de probabilidades o de riesgo de la
existencia del referido atributo, en los individuos de la población.
En Ciencias de la Salud, el uso de las tasas es muy frecuente cuando se
busca analizar los fenómenos de morbilidad, mortalidad o natalidad, en una
población. Ellas indican el riesgo o probabilidad de que estos aconteci
mientos ocurran, en esa población en un período determinado. La expresión
matemática genérica es:
Tasa =
Número de veces que ocurre un fenómeno en un lugar y tiempo determinado
X IO"
Total de veces que ese fenómeno pudo ocurrir, en ese lugar y tiempo determinado
Indica el riesgo o probabilidad que tuvo esa población de morir por cual
quier causa en el período estudiado.
1 46
Tasa de Natalidad:
--- . ---
Nacimientos vivos ocurridos durante un período, en un lugar determinado
T.N. = X 1 .000
Población total del lugar, para el 1 ° de julio del año en estudio
Tasa de Incidencia:
º
T .I. = __ N de casos nuevos de determinada enfermedad, en un lugar y período determinado X ] 0"
Población total del lugar, para el 1 º de julio del año en estudio
Tasa de Prevalencia:
Total de enfermos por determinada ca11sa, existentes en un lugar y período determiriado
T.P. = x 1 O"
Población total del lugar, para el 1 º de julio del año en estudio
147
TASAS DE MORTALIDAD ESPECÍFICAS, POR CAUSA O POR
EDAD.
Nº de muertes ocurridas por determinada causa, en un lugar y período determinado
T.M.E. = X IOn
Población total del lugar, para el I º de julio del año en estudio
Tasa de Letalidad
Nº de muertes ocurridas por determinada causa, en un lugar y período determinado
T.L. = X 100
Total de enfermos por esa causa, en ese lugar y período determinado
Indica el riesgo que tienen los niños menores de un año, de morir antes
de haber cumplido su primer año de edad, en ese lugar y período en estudio.
Además de esta tasa de mortalidad infantil, también pueden calcularse
las Tasas de:
a) Mortalidad Precoz (Incluye sólo las defunciones de niños menores de 7
días).
b) Mortalidad Neonatal (Defunciones de niños menores de 28 días.)
c) Mortalidad Residual (Defunciones de niños de 28 días a 11 meses).
Para el cálculo de estas tres tasas, el denominador es igual al de mortali
dad infantil, o sea, nacimientos vivos ocurridos durante el año; y el numera
dor dependerá de la tasa a calcular.
148
Tasa de Mortalidad Temprana:
Nº de Muertes en menores de 5 años, ocurridas en un lugar y período determinado
T.M.T. = - - - - ---- - - - - - --- � � � --- - - - x 1 .000
Población menor de 5 años de edad, de ese lugar y período en estudio
Indica el riesgo que tienen los niños menores de 5 años, de morir antes de
haber cumplido 5 años de edad, en ese lugar y período en estudio.
149
Tasa de Mortalidad Proporcionada por edades:
Nº de muertes ocurridas a determinada edad, durante el año en un lugar específico
T.M.Pe. = X 100
Total de muertes ocurridas durante el año, en el lugar estudiado
Indica la probabilidad de que por cada 100 muertes ocurridas en ese lu
gar por cualquier causa, determinada cantidad haya sucedido a una edad es
pecífica, durante el período estudiado.
Indica la probabilidad de que por cada 100 muertes ocurridas en ese lu
gar por cualquier (todas) causa, determinada cantidad haya sucedido en
personas que ya han cumplido 50 o más años de vida, durante el período es
tudiado.
Medidas de riesgo
La incidencia además de reflejar la velocidad con que aparecen nuevos
casos de una enfermedad, también sirve para calcular el riesgo relativo de
contraer la enfermedad; siendo igualmente útil para conocer la etiología de
una enfermedad.
Por su parte, la Prevalencia mide la totalidad de casos existentes de una
enfermedad en la población durante un determinado período. La prevalen
cia se ve afectada por tres factores:
Incidencia (Casos nuevos que se suman.)
Duración de la enfermedad (agudas o crónicas).
- Mortalidad (casos que se restan).
Sin embargo, cuando una población ha estado expuesta a un factor, que
puede ser considerado de riesgo, es necesario estimar la probabilidad que
tiene esa población de que en ellas aparezcan o no los efectos producidos
por ese factor. En este caso, se estiman tres medidas: Riesgo Absoluto,
Riesgo Relativo, Riesgo atribuible; las cuales no indican que todas aquellas
personas expuestas al factor de riesgo desarrollarán la enfermedad, sino que
150
tienen mayor probabilidad que los no expuestos.
Riesgo Absoluto.- Es similar a la incidencia, y se utiliza para calcular
los otros dos valores. Para ello se calcula la tasa de incidencia de la enfer
medad en el grupo de individuos expuestos al riesgo y en la de los no ex
puestos (Cañedo, 1 987).
Riesgo Relativo. - Expresa la incidencia de la enfermedad en el grupo de
expuestos al factor, con respecto al grupo de los no expuestos.
Riesgo relativo =
Incidencia en el grupo expuesto al riesgo
Incidencia de los no expuestos
15 1
540
R. absoluto (grupo expuesto) = - x 100 = 58,69 %
9 20
70
R. absoluto (grupo NO expuesto) = - x 100 = 38,8 9 %
180
. . 58,69 %
R1esgo relatlvo = = 1,..,,
38,8 9 %
Riesgo atribuible = 58, 6 9 % - 38,8 9 % = 19 ,8 %
Adicionalmente, en estos estudios epidemiológicos se utiliza la prueba
de Chi cuadrado (X2) para estimar si existe asociación entre el factor de
riesgo y la aparición de la enfermedad. Los datos se presentan en tablas de
contingencia de 2 x 2 de la siguiente manera:
Aparición de la enfe rmedad
Expuestos a riesgo Total
SI NO
SI
NO
TOTAL
Cómo calcular e interpretar el chi cuadrado se explicará en el capítulo
VIII.
Cuadro N º 1
Pacientes con osteoporosis, distribuidos por edad. Valencia, 1998
Edad en años Nº de pacientes
30 - 40 10
41 - 50 62
51 - 60 97
61 - 70 59
71 - 85 22
TOTAL 250
Fuente: Archivo de consulta privada: CEMET y CMGM. 1 993- 1 998.
152
Con esta información calcule:
A) Media aritmética (X) y Desviación estándar (s). Interpretación.
B) Mediana (Md), Percentil 25 y 75. Interprete los resultados.
C) Los intervalos de clase y los centros de clase de cada una. Indique su
significado.
2) Observe la siguiente información:
Mortalidad por ACV, según edad. C.H.E.T. Valencia. 1 995 - 1997.
EDAD en años Frecuencia absoluta
20 - 33 5
34 - 44 1
45 - 52 8
53 - 60 4
61 - 68 16
69 - 76 10
77 - 84 2
85 y más 6
TOTAL 52
Fuente: Archivo central de C.H.E.T.
CALCULE:
A) La medida de tendencia central adecuada para esta distribución. In
terprete el resultado.
B) La medida de dispersión apropiada a esta serie. Exprese su significa
do.
C) Los intervalos de clase y los centros de clase de cada una.
3 ) Observe la siguiente información:
1 53
Escolares con enfermedades infecto-contagiosas,
distribuidos por años de edad.
Escuela Básica "Carabobo " Valencia, 1998.
EDAD Nº de escolares
7 años 14
�.
8 años 16
9 años 16
10 años 24
1 1 años 20
1 2 años 9
BIBLIOGRAFÍA
Camel, F. ( 1 979). Estadística Médica y de Salud Pública. Cuarta edición.
Mérida, Venezuela: Talleres Gráficos Universitarios.
Cañedo D., Luis. ( 1 989). Investigación clínica. México, D.F: Nueva Edito
rial Interamericana.
Escotet, M. A. ( 1 973). Estadística Psicoeducativa. México, D.F.: Editorial
Trillas.
Hernández Sampieri, R., Fernández, C. y Batista, P. ( 1 99 1 ). Metodología
de la Investigación. Bogotá: McGraw-Hill.
154
CAPÍTULO VI
Probabilidades y Curva Normal
Teoría de las probabilidades. Propiedades de las probabilidades. Principios. Pro
babilidades simples. Probabilidades de eventos mutuamente excluyentes. Proba
bilidades de eventos no excluyentes. Probabilidades de eventos independientes.
Probabilidades de eventos dependientes. Probabilidades condicionales. Distribu
ción de probabilidades. Distribución Binomial. Distribución Normal. Tabla de
áreas de la curva normal. Problemas.
155
PROBABILIDADES, DISTRIBUCIONES DE PROBABILIDADES.
CURVA NORMAL
TEORÍA DE LA PROBABILIDAD
La teoría de probabilidades representa el fundamento de la inferencia es
tadística. El primer concepto manejado sobre las probabilidades, es el cono
cido como probabilidad clásica o apriori, atribuido a los matemáticos Pas
cal y Fermat. De acuerdo a este concepto, la probabilidad de un evento se
conoce antes de realizar el experimento.
Posteriormente aparece un nuevo concepto propuesto por Bernoulli y se
fundamenta en la frecuencia relativa. Según este autor, al realizar un expe
rimento un elevado número de veces, la frecuencia relativa se aproxima a su
probabilidad. A este tipo de probabilidad se le conoce como probabilidades
a posteriori. En estas se encuentran incluidas las tasas.
El concepto más reciente, es el llamado personalista o subjetivo según el
cual la probabilidad es una medida de confianza personal acerca de una pro
posición particular. La base axiomática de la probabilidad fue presentada
por el ruso Andres Kolmogorov, dándole así el carácter teórico a la misma.
Estos diversos enfoques o conceptos de probabilidades no son incompa
tibles entre sí, siendo de utilidad en diversas disciplinas.
Definición: Probabilidad es una medida matemática de la posibilidad
de que se produzca un acontecimiento o un hecho, en una serie de ensayos
repetidos en condiciones similares y con determinada frecuencia (Wein
traub. 1985, 61).
En términos matemáticos, la probabilidad de que un evento "favorable"
ocurra, viene dado por la razón geométrica entre el número de "casos espe
rados o favorables" ("a") y la totalidad de casos, posibles" ("n"); suponien
do igualdad de condiciones y posibilidades de ocurrencia, para todos los
elementos de un espacio muestral dado.
_ Número de resultados favorables al evento A _ a
P(A) - --
Número total de casos posibles n
1 57
PROPIEDADES DE LAS PROBABILIDADES
Cuando se calculan las probabilidades de que ocurra un determinado
evento, su resultado siempre será:
1 - Un valor de signo positivo, y
2- Un valor que oscila entre cero y uno (O P 1 ).
(el "cero" corresponde a la imposibilidad de ocurrencia, y el "uno" a la
certeza absoluta de la probabilidad de dicha ocurrencia).
Además, la suma de las probabilidades de ocurrencia de un evento "fa
vorable" más las probabilidades de los "no favorables" es igual a la totali
dad (a + b= 1). Simbolizándose igualmente como "p" los casos favorables
y "q" los no favorables (p + q = 1 ).
Cuadro # 1
Intoxicaciones en menores de 6 años. 150 casos
distribuidos según edady sexo. Valencia, 1998.
SEXO
Edad TOTAL
Masculino Femenino
O- 1 20 15 35 -�
�-
2-3 55 22 77
--
4-5 30 8 38
TOTAL 105 45 150
Fuente: Historias Médicas.
P = � = _!!__ = O
n 150
158
C. - La probabilidad de que al extraer una Historia Médica de esta muestra,
corresponda a una niña.
a 45
n 150
P = - = - = 0,30
159
Cuadro # 2
Partos prematuros. 200 casos distribuidos según
Tipo de parto y lugar de atención. Valencia, 1997.
CENTRO HOSPITALARIO
Tipo de
Clínica TOTAL
parto Público I.V.S.S.
Privada
Vaginal 65 38 40 143
Cesárea "--
1 5 � -"
32 10 57
TOTAL 80 70 50 200
Fuente: Historias clínicas.
Ejemplo 6.1.-
De la información presentada en el cuadro # 2, Calcular:
A) La probabilidad de que una mujer de esa muestra haya tenido un parto
por vía vaginal.
a 143
P = - = - = 0 72
A
( ) n 200 '
Esta probabilidad también puede expresarse en forma de porcentaje, por
lo tanto, existe un 72 % de probabilidades de que al extraer por azar una his
toria médica de esa muestra, corresponda a una mujer que haya tenido un
parto por vía vaginal.
B) La probabilidad de que una mujer de esa muestra haya sido atendida en
un hospital público.
P = !!_ = = O 40 ó 40 %
80
(A ) n 200 ,
1 60
2.- Probabilidades de eventos mutuamente excluyentes
Denominada también probabilidades completas o totales. Se entiende
por eventos mutuamente excluyentes aquellos donde al ocurrir un evento
determinado, impide que ocurra simultáneamente su complemento, en un
solo experimento. En tal caso, cuando se busca como acierto, un evento "a"
entre varios resultados que son mutuamente excluyentes, la probabilidad de
ese acierto es igual a la suma de las probabilidades de cada evento por sepa
rado. Se utiliza la regla de suma o de adición de las probabilidades.
p( A o B ) = P( A ) + P(B)
Ejemplo 6.2.-
De la información presentada en el cuadro # 2, Calcular:
A) La probabilidad de que una mujer de esa muestra haya sido atendida en
un hospital público o en el l. V.SS.
p( A o B ) = p(A ) + p(B )
Ejemplo 6.3.-
De la información presentada en el cuadro # 2, Calcular:
A. ) La probabilidad de que una mujer de esa muestra haya sido atendida en
el l. V.S.S. o tenido un parto por vía vaginal.
p( A o B ) = P( A ) + P(B) - P(A y B )
16 1
50 143 40
º B ) = - + - - - = 0,25 + 0,72 - 0,20 = 0,77
200 200 200
p( A
Ejemplo 6.4.-
De la información presentada en el cuadro # 2, Calcular:
A) La probabilidad de que de dos mujeres de esa muestra, una haya sido
atendida en un hospital público y la otra haya tenido un parto por vía
vaginal.
P( A ) X p( B)
=
p( A y B )
80 143
-' = - X - = 0,40 x 0,715 = 0,286
200 200
p(A · B )
162
A. ) La probabilidad de que al extraer tres historias (una a una y sin reposi
ción), la primera corresponda a una mujer que tuvo un parto por vía va
ginal, la segunda sea de una mujer atendida en una clínica, y la tercera
también.
p( A y B y C ) = p( A ) X p(B) X p(C )
Ejemplo 6.6.-
De la información presentada en el cuadro # 2, Calcular:
A. ) La probabilidad de que a una mujer de esa muestra se le haya practica
do una cesárea, dado que fue atendida en una clínica privada.
(# cesárea en clínica) / n
, . !(.ltmca
p(Cesarea .. ) =
(
atendz.das en c/zmcas
' . )/n
3 2 / 200 = 32 =
= 0 46
A
= p( y B )
70 / 200 70 '
p( A I B )
pB
1 63
B.) La probabilidad de que una mujer de esa muestra haya tenido un parto
por vía vaginal, dado que fue atendida en una clínica privada.
DISTRIBUCIONES DE PROBABILIDADES
Uno de los objetivos del cálculo de probabilidades es determinar distri
buciones que puedan servir de modelos a los variados fenómenos aleatorios
que se presentan en las ciencias experimentales y sociales.
Existen dos tipos de distribuciones que son importantes en las aplicacio
nes prácticas, las discretas y las continuas. Una distribución Discreta surge
al contar (el número de hijos, de partos, de caries, accidentes, etc.), una con
tinua aparece cuando se mide la temperatura, los valores de glicemia, úre�,
hemoglobina, hematocrito, etc. Se tratará, por ahora de las distribuciones
unidimensionales.
Se estudiará la binomial como distribución discreta y la normal como
distribución continua, siendo ésta última una de las más aplicadas en el
campo de la salud. Todas estas distribuciones tienen sus probabilidades cal
culadas, por lo cual se consideran distribuciones teóricas o modelos mate
máticos.
Esas probabilidades suelen compararse con las obtenidas de forma em
pírica según el tipo de variable, y de esta manera puede determinarse el tipo
de distribución teórica que sigue un conjunto de datos empíricos, a lo cual
se les denomina ajuste; así una variables discreta, de acuerdo a su probabili
dad y al número de repeticiones del experimento, se puede ajustar al mode
lo binomial o al normal.
Distribución Binomial
Propiedades:
µ = np ; cr2 = npq ;
Condiciones para las aplicaciones:
Si n es grande, la distribución binomial tiende hacia la normal y la proba
bilidad del evento se puede obtener tipificando la variable mediante la ex
presión:
z = X - µ / cr
164
Si la probabilidad del evento es muy pequeña, (P < O, 1, y np < 5), las ci
fras decimales resultan muy largas, y al redondear se cometen errores signi
ficativos, por lo cual se recomienda ajustar la binomial a otro modelo.
Un ejemplo de distribución binomial se muestra a continuación:
X f p
o 11 1 1/1 83
1 134 1 34/1 83
2 22 22/ 1 83
3 11 1 1/1 83
4 3 3/1 83
5 2 2/1 83
1 83 1 ,00
165
a) Se busca la probabilidad de elegir por azar una mujer con 3 varones (3
p ó p3 ) y 2 hembras (2 q ó q2) = p q , lo cual corresponde al tercer tér
mino de la ecuación, por lo tanto, esa probabilidad es de 0,3125, o de
3 2
31,25 %.
b) Por lo menos 3 varones: 0,03125 + O, 15625 + 0,3125 = 0,5
c) Entre 2 y 5 varones: 0,3125 + 0,3125 + 0,15625 + 0,03125 = 0,8125
d) Que no tenga varones: 0.03125
Ejemplo 6.8.-
Se sabe que al 3 6% de los pacientes con urolitiasis, vistos por primera
vez en la consulta de urología infantil del Hospital Universitario "Angel
Laralde", en el transcurso del año se les realizó exámenes de creatinina. Si
se toma una muestra de 5 pacientes, calcule:
a) la probabilidad que a ninguno se le haya realizado dicho examen.
b) la probabilidad que se le haya practicado el examen a entre 2 y 3 pa
cientes, ambos inclusive.
c) la probabilidad que se le haya realizado el examen a más de 3 pacien
tes.
Para encontrar el valor de dicha probabilidades se desarrolla el Binomio
de Newton.
Si se designa por "p", la condición de paciente con examen de creatinina,
y por "q" los pacientes sin ese examen, se tiene que el binomio toma la for
ma:
( p + q Y = ( p + q) s
p 5 + 5 p 4 q +10 p 3 q 2 + 10 p 2 q 3 + 5 pq 4 + q 5
En este caso, la probabilidad de p y q no son iguales; el ejemplo plantea
que:
p = 36 % q = 100 - 36 = 64 % . Expresado en proporción, se tiene:
p = 0,36 y q = 0,64.
Sustituyendo "p" y "q" por su valor:
(0,36)5 + 5(0,36)4 (0,64) + 10(0,36)3 (0,64)2 + 10(0,36)2 (0,64)3 +
1 66
5 (0,36)(0,64)4 + (0,64)5=
= 0,006 + 0,054 + 0, 1 9 1 1 + 0,3397 + 0,30 + 0, 1 07 = 1 ,00.
a) La primera pregunta formulada se refiere a la probabilidad de que a
ninguno de los pacientes se le haya practicado examen de creatinina,
lo cual corresponde a q5 , por lo tanto, la probabilidad = 0, 107.
b) 0, 1 9 1 1 + 0,3 397 = 0,5308
c) 0, 1 9 1 1 + 0,054 + 0,006 = 0,25 1 1
Ejemplo 6.9.-
Se sabe que al 3 8% de los pacientes con urolitiasis, vistos por vez prime
ra en la consulta de urología infantil del HUAL, en el trimestre anterior, se
les practicó examen de glicemia. Si se toma una muestra aleatoria de 6 pa
cientes. Calcule: a) la probabilidad que se le haya realizado el examen a más
de 2. b) la probabilidad que se le haya practicado a menos de 5. c) la proba
bilidad de que entre 3 y 5 pacientes, ambos inclusive, hayan sido examina
dos.
Ejemplo 6. 1 0.-
Si al 29% de los pacientes del ejemplo anterior se le ha practicado el exa
men de fósforo sérico, y se toma una muestra de7 de ellos, cuál es la proba
bilidad de que: a) a 2 se les haya realizado dicha prueba?. b) entre 2 y 5 ha
yan sido examinados?.
Ejemplo 6. 1 1.-
En una muestra aleatoria de 1 O pacientes, al 45% de ellos se le practicó
urocultivos, calcule la probabilidad que: a) a 3 se le haya realizado dicho
examen. b) entre 3 y 7 hayan sido examinados. c) a más de 4 personas se les
haya practicado el examen. d) hayan sido examinados menos de 7.
Distribución normal
Cuando "n" es grande y "p" se aproxima a 0,50, el modelo de la distribu
ción binomial se aproxima a otro modelo teórico denominado distribución
normal. La importancia de esta distribución es que muchos fenómenos
tienden a seguir este modelo, el cual presenta sus propias características, ta
les como:
167
campana, originando así la curva normal.
1 .- La distribución normal es simétrica y al graficarla tiene forma de
normal
Para aplicar una distribución normal a una distribución empírica se
tipifica la variable en estudio (x), mediante el cambio a la variable z. z =
(X - X)ls.
En una distribución normal típica, z indica la dirección y grado en que un
valor individual (x) se aleja del promedio. Si el valor de x es mayor a la me-
168
dia, z es de signo positivo, y se encuentra en el lado derecho de la curva nor
mal. Si por el contrario, x es un valor inferior a la media, z es de signo nega
tivo y se ubica en el área izquierda.
O 1 ,54
1 69
b) La µ y -1 ,73 sigmas
o
L_
1
- 1 ,73
- 1 ,32 o 1 ,1 5
En la tabla se obtiene:
para -1 ,32 � 0,4066
para 1 , 1 5 � 0,3749
Se suman las dos áreas, dado que limitan a ambos lados la ordenada má
xima: 0,4066 + 0,3749 = 0,78 1 5. En porcentaje = 78, 1 5 %. Entre -1 ,32 y
1 , 1 5 sigmas se encuentra el 78, 1 5 % del área central de una curva normal.
d) Entre 0,66 y 1 ,78 sigmas.
- -
O 0,66 1 ,78
En la tabla se obtiene:
1 70
para 1, 78 � 0,4625
para 0,66 � 0,2454
Estas áreas corresponden a la zona que va desde la ordenada máxima
hasta 1, 78 sigmas y desde la ordenada máxima hasta 0,66 sigmas. Dado que
el área buscada no limita la ordenada máxima, debe descartarse la zona
comprendida entre ésta y 0,66 sigmas, de tal manera que sólo quede el área
comprendida entre 0,66 y 1, 78 sigmas.
0,4625 - 0,2454 = 0,217 1 .
Expresado en porcentaje se tiene que entre 0,66 y 1, 78 sigmas se encuen
tra el 21, 71 % del área de la curva normal.
e) Por encima de 2,00 sigmas.
o 2,00
O 0,74
171
Hasta la mitad de la curva hay un área de 50 %, por lo cual, sólo habrá
que buscar en el cuerpo de la tabla a cuantas sigmas se aleja la ordenada que
limita el 27 % (50 + 27 = 77) por encima de la ordenada máxima. Al buscar
0,2700 en el cuerpo de la tabla, este valor no aparece, por lo cual, se toma el
valor más próximo a él, siendo 0,2704, correspondiéndole O, 74 sigmas.
El percentil 77 se encuentra a 0,74 sigmas.
6. 1 4) ¿A cuántas sigmas se encuentra el percentil 20?
30%
-0,84 O
- 1 ,04 o 1 ,04
1 72
El 35 % ó 0,3500 se extiende hasta 1,04 sigmas; por lo tanto, el 75 %
central se encuentra entre -1,04 y 1,04 sigmas.
Así mismo estas características de la curva normal pueden ser aplicadas
a una variable empírica mediante el cambio de esa variable a z, utilizado la
fórmula:
(X - X )
z = ---
s
Ejemplo 6.16.-
En una investigación acerca del estado nutricional de los escolares de
1ro a 3er grado en las escuelas de la Vivienda Rural de Bárbula, se encontró
que los niveles de hemoglobina se distribuyeron siguiendo una curva nor
ma, con una media aritmética de 12,39 gr./100cc y una desviación típica de
3,22 gr./100 ce. Si el tamaño de muestra fue de 64 escolares, se desea saber:
a) la probabilidad de que al seleccionar un escolar, éste presente un valor
de hemoglobina igual o menor que JO gr./100 ce.
P(X<lO)
10 1 2,39
----�---- ----- -------- - - - - - -�
10 - 12,.39 =
z= -0,74 s1gma
3,22
En la tabla, 0,74 sigma corresponde a un área de 0,2704, pero al ser una
zona extrema, perteneciente a una cola, se resta de 0,5000.
0,5000 - 0,2704 = 0,2296 ó 22,96 %
Existe 22,96 % de probabilidades de seleccionar por azar un niño con va
lores de hemoglobina igual o inferior a 1O, mg/100 ce. en la muestra de es
colares estudiados.
b) probabilidad de encontrar escolares que presenten valores de hemoglo
bina entre 11, 5 y 12, 7.
173
P(l 1 ,5 < X < 1 2,7)
1 1 ,5 1 2,39 1 2,70
l l,5 - l 2,3 9 =
z= -0,28 sigma (0, 1 103 en la tabla)
3,22
1 2 7 - l 2,3 9 =
z1 = • OJ O sigma (0,0398 en tabla)
3,22
0, 1 1 03 + 0,0398 = 0, 1 50 1 ó 1 5,0 1 %
e) probabilidad de que al seleccionar un estudiante, en forma aleatoria,
presente niveles de hemoglobina iguales o mayores que 12.
12 1 2,39
---- ---------- ------ -------· --- ------
1 2 - 1 2,3 9 =
-
¡---------
1
------
P(9,6 < X < l l ,6)
1 9,6 1 1 ,6 1 2, 39
�--- ------ - -- - -
1 74
9,6 - 1 2,.39
z= = -0 '87 . z = l l,6 -12,.39 = -0,25 ·
3,22 ' 3,22
En la tabla a 0,87 sigmas le corresponde 0 ,3 0 78;
1 1 ,39 1 2,39
30%
o
Como el 20 % es un área extrema de la curva, se resta de 5 0 %, y la dife
rencia se busca en el cuerpo de la tabla, para conocer a cuantas sigmas se
encuentra.
50% - 20% = 30%, se busca en la tabla, 0,3000, o un valor aproximado.
En este caso, el valor más próximo es 0,2995, al cual le corresponde sig
ma = 0,84. Se utiliza con signo negativo por cuanto se refiere a un área de la
175
izquierda de la curva.
Existe un 20 % de probabilidades de que quienes tienen menores valores
de hemoglobina estén a - 0,84 sigmas.
f) ¿ Qué valores de hemoglobina tiene el 20 % de los niños que presentan
menores valores de hemoglobina?
Por el resultado del ejercicio anterior se sabe que el 20 % de los niños
con menores valores de hemoglobina se encuentran a - 0,84 z.
Como z es un valor conocido, se puede despejar X (valor buscado) de la
fórmula:
X -X
z = ---
s
X = X + ( z · s)
Por lo tanto, sustituyendo en la fórmula se tiene:
X = 1 2,39 + (- 0,84 x 3.22) = 1 2,39 - 2.70
X = 9,69 gr/100 ce
g) ¿A cuantas sigmas se encuentra el 40 % de los escolares que tienen los
valores mayores de hemoglobina?
o
50% - 40% = 1 0%, se busca en el cuerpo de la tabla O, 1 000, al cual le co
rresponde 0,25 sigmas.
Existe la probabilidad de que el 40 % de los escolares con altos valores
de hemoglobina se encuentren a 0,25 sigmas, con respecto a X.
h) ¿ Qué valores de hemoglobina tienen los escolares que se encuentran a
1,25 sigmas?
1 76
1 ,25
X = X + (z · s)
X = 1 2,39 + (1 ,25 x 3,22) = 1 2,39 + 4.03
X = 1 6,42 gr/100 ce
i) ¿ Qué valores de hemoglobina tienen los escolares que se encuentran a
-1, 50 sigmas?
-1 ,50
�.J
X = X + (z · s)
X = 1 2,39 + ( -1 .50 x 3.22) = 1 2,39 - 4.83
X = 7.56 gr/l OOcc
j) ¿ Qué valores de hemoglobina le corresponde al percentil 80?
¡ --
El percentil 80 se encuentra a 0,84 sigmas. Se buscó en la tabla el área
0,3000 (diferencia de 80 % - 50 % = 30 %, y luego transformado en propor
ción).
1 77
X = X + (z · s)
X = 1 2,39 + (0,84 x 3 . 22) = 1 2,39 + 2,70
X = 1 5 ,09 gr/l OOcc.
k) ¿ Qué porcentaje de escolares tiene valores de hemoglobina entre 9 y
13, 5 gr/100 ce. ?
9 1 3,50
900 - 1 2,39 = -3 ,3 9 = .
z1 = ' - - -1,05 sigma (0.353 1 en la tabla)
3,22 3 ,22
1 3,.50 - 1 2,39 = 1,1 1 =
z2 = - 0,3 4 sigma (0. 1 33 1 en la tabla)
3,22 3 ,22
Se suman estas dos áreas, dado que están a ambos lados de la curva:
0.353 1 + 0. 1 33 1 = 0.4862. Expresado en porcentaje indica que existe la
probabilidad de que el 48,62 % de estos niños tengan valores de hemoglobi
na entre 9 y 1 3,5 gr/1 00cc.
1) ¿ Qué porcentaje de escolares tiene más de 13,5 gr/100 ce?
1 3,50
__J
1 3,.50 - 1 2,39 =
L_________ ____ _ _ _ _ �
_ _____
1 78
5 0 % - 13,31 % = 3 6,69 %
Existe la probabilidad que el 36,69 % de esos escolares tengan valores de
hemoglobina superiores a 13,5 0 gr/l OOcc.
m) ¿Qué porcentcefe de escolares tiene más de 11,39 gr/100 ce?
1 1 ,39
1 0,39
---- - �------- ·----- ----- ----�- -
179
Por el ejercicio anterior se sabe que el 26, 76 % de los escolares tienen va
lores de hemoglobina inferiores a 10.39 gr/l OOcc. Asimismo, los datos
aportados en el problema indican que se utilizó una muestra de 64 escola
res. Por lo tanto, puede calcularse cuántos niños representan ese 26, 7 6 % de
64 escolares.
(26,76 X 64) / 100 = 7,16
Existe la probabilidad de que 7 escolares tengan valores de hg. inferiores
a 10.39 gr./100 ce.
6.17 Ejemplo:
Se sabe que los valores de hemoglobina en un grupo de 7-1O años, de es
colares de l ro a 3 er grado, de la Vivienda Rural sigue una curva normal con
una media aritmética de 9,72 mg/lOOcc. y una desviación estándar de 2,3 1
mg/100cc. El número de estudiantes de dicha escuela es de 720. Se requiere
saber la probabilidad de que al seleccionar un estudiante, éste presente va
lores de hemoglobina:
a) Igual o menor que 9.
b) Mayor o igual a 11.
c) Entre 8 y 13.
d) Igual a 10.
f) ¿Qué valores de hemoglobina le correspondió como máximo al 20%
de los estudiantes que presentaron los niveles más bajos?
g) ¿Qué valores de hemoglobina le correspondió como mínimo, al 30%
de los estudiantes que presentaron los niveles más altos?
h) ¿Qué valor de Hemoglobina le correspondió a los percentiles 27; 60 y
75?
i) ¿Cuántos estudiantes presentaron los niveles de hemoglobina igual o
menor de 13?
Ejemplo 6.17:
Se sabe que los valores de hemoglobina en 64 escolares, seleccionados
al azar, en el Ciclo Básico "M. V. Romero García", se distribuyen normal
mente con una media de 14,04mg/100cc y una desviación estándar de 1,8
mg/l OOcc. Se requiere saber la probabilidad de que al seleccionar un estu-
180
<liante, presente niveles de hemoglobina:
a) Superiores a 1 3.
b) Menores a 1 5 .
c) Entre 1 1 y 14,5, ambos inclusive.
d) Igual o menor a 1 4,75.
e) Igual o mayor a 1 O.
f) Igual a 1 2.
g) ¿ Cuántos estudiantes presentan valores de hemoglobina entre 8 y 1 4?
h) ¿Qué valores de hemoglobina les corresponde a los percentiles 30, 40,
60?
Ejemplo 6. 1 8:
Se sabe que los niveles de Hematocrito en lactantes alimentados con le
che materna en el Centro Materno Infantil "La Guacamaya", en el transcur
so de estos años sigue una curva normal. Al seleccionar por azar a 32 lac
tantes, se encuentra una media aritmética de 3 1 ,4 con una desviación están
dar de 3,08; determine la probabilidad de que al seleccionar un lactante,
presente niveles de hematocrito:
a) Igual o menor a 28.
b) Entre 28 y 25, ambos inclusive.
c) Igual o mayor a 30.
d) Igual a 32.
e) ¿Qué niveles de hematocrito le corresponden como máximo, al 1 0%
de los lactantes que presentaron los niveles más bajos?
f) ¿Qué valores les corresponden a los percentiles 30, 40 y 60?
Ejemplo 6. 1 9:
Se ha determinado que la edad de pacientes con E. T. S, que asistieron a la
Unidad Sanitaria de Valencia durante los dos últimos años, se distribuyen
normalmente con una media aritmética de 27,5 años y una desviación es
tándar de 7,7 años. Si el número de pacientes fue de 1 23, determine la pro
babilidad que al seleccionar un paciente éste tenga una edad:
a) Igual o mayor a 20 años.
181
b) Entre 20 y 49 años.
c) Igual a 30 años.
d) Igual o menor a 15 años.
e) ¿ Cuál es la edad máxima del 20% de los pacientes más jóvenes?
f) ¿Qué edad le corresponde a los percentiles 40, 58 y 76?
BIBLIOGRAFÍA
Daniel, W. (1977). Bioestadística. México, D.F.: Limusa.
Remington, R. y Schork, A. (1977). Estadística Biométrica y Sanitaria. Se
gunda edición. México, D.F.: Prentice/Hall Internacional.
Weintraub, J., Douglas, Ch. y Gillings, D. (1985). Bioestadística en Salud
bucodental. Carolina del Norte. U.S.A.: Publicación de OPS.
182
Areas de la curva normal
z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
.O .0000 .0040 .0080 . 0 1 20 .0160 .0199 .0239 .0279 .03 1 9 .0359
.1 .0398 .0438 .0478 .05 1 7 .0557 .0596 .0636 .0675 .0714 .0753
.2 .0793 .0832 .087 1 .09 1 0 .0948 .0987 . 1 026 . 1 064 . 1 103 . 1 141
.3 . 1 1 79 .1217 . 1 255 . 1 293 . 13 3 1 . 1 368 . 1406 . 1 443 . 1 480 .1517
.4 . 1554 . 1 59 1 . 1 628 . 1 664 . 1 700 . 1 736 . 1 772 . 1 808 . 1 844 . 1 879
1 .0 .34 1 3 .3438 .3461 .3485 .3508 .353 1 .3554 .3577 .3599 .362 1
1.1 .3643 .3665 .3686 .3708 .3729 .3749 .3770 .3790 .3810 .3830
1 .2 .3849 .3869 .3888 .3907 .3925 .3944 .3962 .3980 .3997 .401 5
1 .3 .4032 .4049 .4066 .4082 .4099 .41 1 5 .41 3 1 .4147 .4162 .41 77
1 .4 .4192 .4207 .4222 .4236 .41 5 1 .4265 .4279 .4292 .4306 .43 1 9
1 .5 .4332 .4345 .4357 .4370 .4382 .4394 .4406 .44 1 8 .4429 .4441
1 .6 .4452 .4463 .4474 .4484 .4495 .4505 .45 1 5 .4525 .4535 .4545
1 .7 .4554 .4564 .4573 .4582 .4591 .4599 .4608 .461 6 .4625 .4633
1 .8 .4641 .4649 .4656 .4664 .4621 .4678 .4686 .4693 .4699 .4706
1 .9 .47 1 3 .47 1 9 .4726 .4732 .4738 .4744 .4750 .4756 .4761 .4767
2.0 .4772 .4778 .4783 .4788 .4793 .4798 .4803 .4808 .48 12 .48 1 7
2.1 .4821 .4826 .4830 .4834 .4838 .4842 .4846 .4850 .4854 .4857
2.2 .4861 .4864 .4868 .4871 .4875 .4878 .4881 .4884 .4887 .4890
2.3 .4893 .4896 .4898 .4901 .4904 .4906 .4909 .49 1 1 .4913 .49 1 6
2.4 .49 1 8 .4920 .4922 .4925 .4927 .4929 .493 1 .4932 .4934 .4936
2.5 .4938 .4940 .494 1 .4943 .4945 .4946 .4948 .4949 .4951 .4952
2.6 .4953 .4955 .4956 .4957 .4959 .4960 .4961 .4962 .4963 .4964
2.7 .4965 .4966 .4967 .4968 .4969 .4970 .4971 .4972 .4973 .4974
2.8 .4974 .4975 .4976 .4977 .4977 .4978 .4979 .4979 .4980 .498 1
2.9 .4981 .4982 .4982 .4983 .4984 .4984 .4985 .4985 .4986 .4986
3.0 .4987 .4987 .4987 .4988 .4988 .4989 .4989 .4989 .4890 .4890
183
CAPÍTULO VII
Estadística Inferencia/
Inferencia estadística. Distribución muestra!. Distribución de la Media de la
muestra. Error estándar. Estimación de los parámetros. Estimación por puntos.
Estimación de intervalos. Estimación de la Media poblacional. Estimación de una
proporción poblacional. Prueba de hipótesis. Nivel de significación. Selección de
estadísticos a prueba. Regla de decisión. Pruebas de Hipótesis para una media de
población. Para un porcentaje de población. Para diferencia entre dos Medias de
Población. Diferencia entre dos Proporciones poblacionales. t de Student.
Ejercicios.
1 85
1 86
ESTADÍSTICA INFERENCIAL
El presente capítulo trata de los procedimientos inferenciales necesarios
para llegar a conclusiones valederas sobre poblaciones, tomando como
base, la información obtenida en una muestra. La función primordial de la
inferencia estadística es apoyar el razonamiento para llegar a decisiones só
lidas a pesar de la falta de un conocimiento verdadero del universo, y real
mente es tan importante esta función que se suele hablar de la estadística
como "el estudio de decisiones ante la incertidumbre". La inferencia puede
ser deductiva o inductiva.
La primera es un juicio o generalización basado en axiomas o premisas,
de las cuales se deriva una conclusión mediante un razonamiento dialécti
co, a priori. La inferencia inductiva por su parte, es un juicio o generaliza
ción derivado de observaciones empíricas o experimentales, y la conclu
sión se obtiene de un procedimiento a posteriori. La inferencia estadística
es por tanto inductiva y llega a generalizaciones sobre las características de
una población basándose en observaciones empíricas realizadas en mues
tras aleatorias.
Es frecuente que las medidas obtenidas en una muestra (estadísticos)
sean diferentes al parámetro de la población. A la diferencia entre estas dos
medidas se le denomina error. Determinar el tamaño de ese error sólo sería
posible si se conociera el parámetro de la población, pero éste, por lo gene
ral, se desconoce. La única forma de conocer dicho valor sería realizando
todas las observaciones posibles de todo el universo, lo cual es sumamente
dificil e impráctico en función del costo y tiempo. De esta dificultad surge
la inferencia estadística la cual permite presumir las características del uni
verso a partir de las muestras.
De la media de una muestra se hacen inferencias sobre la media de la po
blación, por supuesto no se sabe la diferencia entre esas dos medias, que
como se dijo anteriormente, la última es desconocida en la mayoría de los
casos; lo que se conoce es la probabilidad de que esta diferencia no sea ma
yor, por ejemplo de tres o dos errores típicos.
El valor obtenido en una muestra (estadístico) puede considerarse como
un estimador del parámetro de la población. Un estimador es una función de
las puntuaciones de la muestra que da lugar a un valor, el cual suministra in
formación sobre el parámetro. Un estadístico que se calcula partiendo de
187
una muestra al azar es una variable aleatoria y por consiguiente, tiene una
distribución de probabilidades propias, la cual es conocida como distribu
ción muestral de un estadístico. Así puede tenerse una distribución muestra!
de medias, cuando el estadístico es la media aritmética; distribución mues
tral de proporciones, cuando el estadístico es una proporción o porcentaje, y
así sucesivamente.
DISTRIBUCIÓN MUESTRAL
Una distribución muestral es una distribución de probabilidades de un
estadístico calculado a partir de todas las muestras posibles de tamaño n,
elegidas al azar en una población determinada. Si de una población se selec
cionan sucesivas muestras de tamaño n, y a cada una de esas muestras se les
calcula un estadístico, distribuido en forma normal, se tendrán distribucio
nes de frecuencias de los valores promedios de esa variable, en cada una de
las muestras. Al representar gráficamente esos valores muestrales (Media
aritmética, por ejemplo), se encontrará que también siguen una forma de
curva normal.
188
X 10 12 14 16 18
10 1 0 + 10 1 0 + 12 1 0 + 14 10 + 16 10 + 18
(X + 1 0) (X = 1 1 ) (X = 1 2) (X = 1 3) (X = 1 4)
(S2 = O) (S2 = 1 ) (S2 = 4) (S2 = 9) (S = 1 6)
12 1 2 + 10 1 2 + 12 1 2 + 14 12 + 16 12 + 18
(X = 1 1) (X = 1 2) (X = 1 3) (X = 14) (X = 1 5)
(S2 = 1 ) (S2 = O) (S2 = 1) (S2 = 4) ( S = 9)
14 14 + 1 0 14 + 12 1 4 + 14 14 + 1 6 14 + 18
(X = 1 2) (X = 1 3) (X = 14) (X = 1 5) (X = 1 6)
(S2 = 4) (S2 = 1 ) (S2 = O) (S2 = 1 ) ( S = 4)
16 16 + 10 16 + 12 16 + 14 16 + 16 1 6 + 18
(X = 1 3 ) (X = 1 4) (X = 1 5) (X = 1 6) (X = 1 7)
(S2 = 9) (S2 = 4) (S2 = 1 ) (S2 = O) (S = 1 )
18 18 + 10 18 + 12 18 + 14 18 + 16 1 8 + 18
(X = 1 4) (X = 1 5) (X = 1 6) (X = 1 7) (X = 1 8)
(S = 1 6) (S = 9) (S = 4) (S = 1 ) (S = O)
10 1 __ I
14
--
11 2 13 14 15
12 3 12 13 14 15 16
13 11 12 13 14 15 16 17
4
10 11 12 13 14 15 16 1 7 18
--
14 5
X = 14
---
15 4
16 3
17 2 --
�
18 1 ¡I
Total 1
25 ji
189
- = ¿ ( Xi · fi) 380 = _
X = - 14 anos
n 25
En esta distribución muestra}, de 25 muestras posibles, de tamaño dos, la
media aritmética es igual a 14 años, (X = 14 años) y la varianza es de 4 años
(S2 = 4 años).
L ( dm 2 . fi)
si = [ioo = J4 años
n
=
�25
Lo cual confirma la teoría de que en una población distribuida en forma
normal, la X de las medias = µ de la población (X = 14 años y µ = 14 años) y
que la varianza de las medias de la muestra (S2 = 4 años) es igual a la varian
za de la población dividida entre el tamaño de las muestras (cr 2 = 8; 8/2 = 4
años).
Sin embargo, estas condiciones no se cumplen cuando las muestras se
forman sin reemplazo o la población no está distribuida normalmente, en
cuyo caso, se aplica un teorema matemático conocido como Teorema del
Límite Central el cual contempla que:
"Dada una población con una media µ y varianzafinita cr2, la dis
tribución muestra/ de X calculada a partir de muestras de tamaño n
de esa población, está distribuida aproximadamente en forma nor
mal con media µ y varianza cr2In, cuando el tamaño de la muestra es
grande. "
Cuando la población es finita y las muestras se toman sin reposición, y n
< 30, es necesario utilizar el factor de corrección �( N - n) / ( N -1); por lo
cual, la expresión es:
cr2
N- n
n N -I
- - --
190
ERROR ESTÁNDAR
Teóricamente en una distribución muestral las medias se distribuyen en
forma normal alrededor del promedio, de la misma manera como se distri
buyen los valores individuales en una distribución de frecuencias. Allí, la
medida de dispersión es la desviación estándar, y en la distribución mues
tra! es el error estándar, el cual no es más que el promedio de los errores
muestrales. Ello significa que las distintas medias de la distribución mues
tra! contienen una fracción de error en sus estimaciones con respecto a la
media poblacional.
El error estándar puede definirse como la diferencia que existe entre el
valor estimado en la muestra (estadístico) y el verdadero valor representati
vo de la población (parámetro), por lo tanto, mientras menor sea el error es
tándar mayor será la aproximación del estadístico al parámetro.
Al error estándar también se le conoce como error por muestreo y está en
función del tamaño de la muestra. Mientras mayor sea la muestra, menor es
la magnitud del error estándar.
En teoría pueden existir distribuciones muestrales para los diferentes es
tadísticos conocidos: media aritmética, desviación típica, mediana, porcen
tajes, etc. por lo cual es posible calcular el error estándar para cada uno de
estos estadísticos obtenidos en las muestras.
(1) S- = _!_
X ¡;;
Donde:
s = Desviación estándar de la muestra.
n = Tamaño de la muestra.
S x = Error estándar.
191
Para calcular el error estándar de una proporción o porcentaje:
(2) S (P) = ��
-----;;-
Donde:
p = porcentaje de sujetos con la característica en estudio.
q = ( 1 00 - p) porcentaj e de sujetos sin la característica en estudio.
n = tamaño de la muestra utilizada.
Para calcular el error estándar diferencial:
(3)
ESTIMACIÓN
En páginas anteriores se ha dicho que la inferencia estadística permite
hacer generalizaciones hacia el universo a partir de la información obtenida
en una muestra. En este sentido, mediante la inducción, es posible obtener
un valor representativo de la población, el cual se conoce con el nombre de
estimador.
Para que resulte de mayor utilidad, un buen estimador debe tener: Con
sistencia, ausencia de sesgo y eficiencia.
1 .- Consistencia: Un estimador consistente es aquel que tiende a aproxi
marse al valor del parámetro de la población, en la medida que el tamaño
de la muestra crece.
2.- Ausencia de sesgo: Se dice que un estimador es insesgado si la media de
la distribución de medias de las muestras, es igual al valor del parámetro
192
estimado. La media X es un estimado insesgado de µ.
3.- Eficiencia: Se refiere a la precisión con la cual tales medidas pueden es
timar un parámetro. Es más eficiente aquel estimador que tenga menor
error típico.
Estimación es un proceso mediante el cual, en una muestra se obtiene un
determinado valor, denominada estadístico, para luego, en función de él,
calcular (estimar) su valor en la población correspondiente. Este valor po
blacional recibe el nombre de parámetro.
La estimación puede efectuarse por puntos o por intervalo.
Estimación por puntos
La estimación por puntos plantea un solo valor numérico como paráme
tro del universo, estimado a partir de una muestra. Es probable que al consi
derar un solo punto como estimador de un parámetro se cometa un error, ya
que, la muestra no es más que una pequeña parte de un conjunto mucho más
grande, por lo tanto, es aventurado afirmar que el valor correspondiente a la
población sea el mismo valor calculado para la muestra. Pero si el número
de observaciones es suficientemente grande, se obtendrá una medida muy
similar a la del parámetro. Sin embargo, a menudo hay limitaciones en
cuanto a recursos y tiempo, por lo cual es necesario decidir sólo sobre la
base de algunas observaciones, y determinar cuanta probabilidad existe de
que el valor estimado en la muestra coincida con el valor del parámetro. En
este caso, no se estará utilizando el método de estimación puntual sino de
intervalo.
Estimación de intervalo:
Consiste en estimar dos valores numéricos extremos, los cuales confor
man un intervalo, entre cuyos límites se considera está incluido el paráme
tro, según el nivel de confianza o de acierto, previamente establecido.
Una estimación de intervalo de un parámetro, es un segmento en el con
tinuo de la escala de números, donde en algún punto del cual se supone se
halla el valor del parámetro considerado. Es decir, en lugar de tener un solo
punto como estimación de un parámetro, se tiene ahora todo un conjunto de
puntos adyacentes, esto es, un intervalo entre cuyos puntos, probablemente
alguno coincida con el valor del parámetro, con nivel de probabilidades de
acierto conocido. Fijando de esta manera lo que se denomina intervalo de
193
confianza; el cual se obtiene mediante la fórmula general:
Estimador ± (valor crítico x Error estándar)
Antes de continuar, es necesario recordar que el valor crítico o desvia
ción sigma, tal como se vio en la unidad anterior, es un valor que indica la
distancia (en sigmas) que existe desde la ordenada principal hasta cualquier
otra ordenada paralela, en una curva normal. Dichos valores se encuentran
en las tablas de áreas de la curva normal, y permiten conocer la probabilidad
de que un evento ocurra por azar.
194
12,38 gr %, y una desviación estándar de 0,8 7 gr %. Se desea conocer,
con 95% de corifianza, el valor promedio de hemoglobina para esa po
blación de escolares, de donde se extrajo la muestra aleatoria de 144 ni
ños.
DATOS:
X = 12,3 8 gr %
s = 0, 8 7 gr %
n = 144 niños
nivel de confianza = 95 % (a =0,05), el cual equivale a 1,96 sigma (cr).
0•8 7 gr%
= 12,.3 8 gr% ± (1,96 · )
M4
= 12,.3 8 gr% ± (1,96 · 0,07 )
12,52 gr% (como límite superior)
= 12,.3 8 gr% ± 0,14 {
12,24 gr% (como límite inferior)
195
Para estimar una proporción o porcentaje poblacional, se extrae del uni
verso de interés, una muestra aleatoria, en la cual se calcula el porcentaje de
sujetos con la característica en estudio, y luego se aplica la fórmula general
para estimar intervalo de confianza:
Estimador ± (valor crítico x Error estándar)
En el caso específico para estimar una proporción o porcentaje, pobla
cional, la fórmula expresa:
--
-
- - < P < p + Z · {p-q
p - Z · {p-q -
� -;; � -;;
n
o de manera más sencilla:
p ± (Z. Es) = Intervalo de confianza
p q
Siendo Es = � �
De donde:
Es = Error estándar
p = porcentaje de sujetos con la característica en estudio.
q = ( 1 00 - p) porcentaje de sujetos SIN la característica en estu
dio.
n = tamaño de la muestra. •
Z = valor crítico o valor sigma (cr), según el nivel de confianza.
Ejemplo:
7.2) Del mismo trabajo de donde se extrajeron los datos del ejemplo 7. 1, el
investigador encontró que en esa muestra de 144 niños, el 7 %de ellos
presentaba algún grado de desnutrición. Se desea conocer, con 99 % de
confianza, cuál es el porcentaje de niños desnutridos en esa población
de escolares.
DATOS
n = 144 niños
p=7%
q = ( 1 00 - p)= 93 %
nivel de confianza = 99 %, el cual equivale a 2,58 sigmas (cr)
196
7% ± (2,58 · t;� 3
) � Intervalo de confianza
7% ± ( 2.ss - �) �
7% ± (2,.58 X 2) 3) =
1 2,.50% (como límite superior)
7% ± 5,.5 0 = {
1,50% (como límite inferior)
Cuadro N º 1
Distribución de Medias aritméticas y error estándar, de las variables:
Peso, Frecuencia cardíaca y Porcentaje de antecedentes
En una clínica En el hogar
Variables
(n = 50) (n = 3 5)
Peso 70,6 Kgs ±.1,5 Kgs 81,3 Kgr ± 1,9 Kgs
Frecuencia cardíaca
72,3 l/m ± 1 .6 l/m 82,9 l/m ± l .9 1/m
(latidos p/minuto)
Antecedentes familia-
34.8 % ± 4.1 % 41,7 % ± 6.8 %
res positivos
Para cada una de las variables presentadas en el cuadro, estime los res
pectivos parámetros de tales variables en la población. Utilice niveles de
confianza de 95 % y 99 %.
1 97
bución muestral y hace posible la toma de decisiones acerca de una pobla
ción, según la información obtenida en una muestra.
Por lo general, en el campo de la salud, el investigador busca conocer si
un determinado factor (variable) es o no la causa de un efecto. Podría pen
sarse que con sólo observar y comparar la frecuencia de aparición de tal
efecto, en un grupo expuesto a riesgo y en otro no expuesto, sería más que
suficiente. Sin embargo, el rigor científico exige la comprobación de que
las diferencias observadas entre los dos grupos no se deben al azar, dado
que las muestras utilizadas están conformadas por sujetos con tales caracte
rísticas. Es necesario demostrar que esas diferencias son estadísticamente
significativas, con lo cual podría atribuírsele la diferencia al factor en estu
dio, y no al azar. Normalmente las hipótesis tratan de explicar esas diferen
cias.
Una hipótesis se define como una afirmación que está sujeta a verifica
ción o comprobación; o una conjetura sobre la posible relación entre va
riables (Kerlinger. 1 985: 1 8); o como la define McGuigan (1977: 53) una
afirmación comprobable de una relación potencial entre dos o más varia
bles. Para Van Dalen y Meyer ( 1 98 1 ), una hipótesis es una explicación po
sible o provisional que tiene en cuenta los factores, sucesos o condiciones
que el investigador procura comprender.
Todas estas definiciones presentan a las hipótesis como una afirmación o
suposición y no un hecho establecido. Tales suposiciones o posibles rela
ciones entre las variables se denominan hipótesis de trabajo o hipótesis de
investigación; las cuales pueden ser descriptivas, correlacionales, de dife
rencias entre grupos, de causalidad. Se simbolizan como Hi.
Dado que las hipótesis de investigación no pueden ser sometidas a prue
bas estadísticas, el investigador se vale de las hipótesis nulas para la com
probación empírica de las primeras.
La Hipótesis nula niega la relación entre las variables dependiente y la
independiente, por lo cual, se considera el reverso de las hipótesis de inves
tigación. Una hipótesis nula es simplemente un planteamiento de "ninguna
diferencia". Se simboliza como Ho.
1 98
PROCEDIMIENTO METODOLÓGICO PARA LA PRUEBA DE
HIPÓTESIS
En la comprobación o prueba de hipótesis se siguen los siguientes pasos
metodológicos:
1 .- Planteamiento de las hipótesis: Hi y Ho.
2.- Fijación del nivel de significación o del nivel de confianza.
3.- Selección del Estadístico a Prueba.
4.- Regla de decisión para rechazar Ho.
5.- Cálculos del estadístico a prueba.
6.- Decisión Estadística.
7.- Conclusiones.
A.
Cuando se establecen hipótesis donde uno de los valores es menor, me
nos eficaz, o inferior que otro; o el caso contrario, uno de los valores es ma
yor, más eficaz, o superior; las pruebas son unilaterales, y por lo tanto las
hipótesis se plantean de la siguiente manera:
1 99
B) Hi: µ < a un valor, o Hi: P l < P2, o Hi: µ 1 < µ 2.
C) Hi: µ > a un valor, o Hi: P l > P2, o Hi: µ 1 > µ2.
Ho: µ = a un valor, o Ho: P l = P2, o Hi: µ 1 = µ2.
En estos casos las pruebas son unilaterales o de una sola cola.
NIVEL DE SIGNIFICACIÓN
El nivel de significación o de significancia es la probabilidad de equivo
carse (riesgo de equivocación) que tiene el investigador al tomar la decisión
de rechazar o no una hipótesis nula.
Dado el carácter aleatorio de las observaciones muestrales, es posible
que el estadístico pueda desviarse tanto de lo esperado, que se decida des
cartar la hipótesis de nulidad (aun siendo cierta). Es deseable que sea pe
queña esa probabilidad de descartar una hipótesis nula que es cierta. De allí
que los investigadores utilicen con mayor frecuencia los niveles de signifi
cación de 0,05 ó 0,0 1 .
En el nivel de significación d e 0,05 el investigador tiene un 5 % de riesgo
de equivocación, mientras que cuenta con un 95 % de seguridad (nivel de
confianza) de llegar a una conclusión correcta. De igual manera, el nivel de
significancia de 0,01 implica un 99 % de probabilidad de estar tomando una
conclusión correcta y sólo un 1 % de riesgo de error, al formular esa conclu-
200
sión. Aún cuando el uso de estos niveles son arbitrarios (0,01 y 0,05), puede
decirse que están basados en la experiencia y en el razonamiento lógico de
investigador.
A la magnitud de la probabilidad del riesgo de equivocación se le deno
mina nivel de significancia o de significación.
El complemento al nivel de significación es el nivel de confianza, por lo
cual, según esta óptica, el área de la curva normal queda dividida en dos
partes: una zona de NO rechazo de la Ho, y una (o dos) zona de rechazo de
Ho.
La ubicación de la zona de rechazo, depende de lo expresado en la hipó
tesis de trabajo (Hi). Si ésta no indica la dirección de la diferencia, la zona
de rechazo estará ubicada en ambos extremos de la curva (prueba bilateral o
de dos colas).
zona
No rechazo
zona de réé o de Ho Ho zona de hazo de Ho
o
a = 0,05/2 = 0,025
zona de zona de
aceptación aceptación
de Ho de Ho
a = 0,05
El término significancia se refiere a que la diferencia entre el valor hipo
tético y el resultado muestra! se considera importante, es decir, demasiado
grande para atribuírsele al azar (es decir, al simple hecho de que por azar se
haya utilizado esa muestra y no otra, con valores diferentes).
20 1
SELECCIÓN DEL ESTADÍSTICO A PRUEBA
Un estadístico a prueba es un valor numérico que se calcula a partir de
los datos de una muestra y es utilizado para tomar la decisión de rechazar o
no una hipótesis nula.
Los estadísticos de prueba utilizados dependen del tamaño de la muestra
y de si se conoce o no la varianza de la población.
Si los datos provienen de una población distribuida normalmente con va
rianza conocida, se utiliza como estadístico la prueba Z.
X -µ
Z = -
Es
Cuando el muestreo se hace de una población normalmente distribuida y
se desconoce su varianza, el estadístico de prueba a utilizar para compro
bar la media poblacional es t.
X -µ
t=
Es
Cuando n es grande, la distribución t se aproxima a la distribución nor
mal y se puede utilizar como estadístico de prueba Z, aún cuando se desco
nozca la varianza de la población.
REGLA DE DECISIÓN
Para establecer la regla de decisión es necesario conocer el valor crítico
o valor en unidades sigmas donde se levanta la ordenada que limita las zo
nas de rechazo y aceptación, dependiendo del nivel de significación, en las
curvas de probabilidades.
Reglas de Decisión, refiriéndose a la distribución normal:
- Se rechaza Ho si, -Zc > Z > +Zc, (para pruebas bilaterales).
- Se rechaza Ho si, -Zc > Z (para prueba unilateral de cola iz-
quierda).
- Se rechaza Ho si, Z > +Zc (para prueba unilateral de cola dere
cha).
Los valores críticos (Z) se hallan en las tablas de áreas de la curva nor
mal. Zc es el valor de Z calculado mediante la fórmula planteada en el punto
202
anterior.
Comparar los resultados obtenidos en la prueba estadística y la regla de
decisión permite rechazar o no la hipótesis nula. Al tomar tal decisión se
plantean cuatro posibilidades:
a) Rechazar una hipótesis que esfalsa (decisión correcta)
b) Aceptar una hipótesis que es cierta (decisión correcta)
c) Rechazar una hipótesis que es cierta (error tipo I)
d) Aceptar una hipótesis que esfalsa (error tipo 11)
El siguiente cuadro resume las situaciones anteriores:
Ho es: Acepta Rechaza
Cierta: No hay error Error tipo I (a)
Falsa: Error tipo II (B) No hay error
CÁLCULOS Y CONCLUSIONES
Utilizando las fórmulas del error estándar (fórmulas 1; 2 ó 3, según sea el
caso) y del estadístico de prueba, se determina si el error de muestreo es tan
grande como para concluir que "las diferencias NO son estadísticamente
significativas", por lo cual se NO se rechaza la hipótesis nula. O ese error
es tan pequeño, que NO afecta los resultados, y se puede concluir que "las
diferencias son estadísticamente significativas ", por tanto, se "rechaza la
hipótesis nula ", y se tienen elementos para considerar como válida la hipó-
203
tesis de trabajo.
Resumiendo, en el proceso de comprobación de hipótesis se siguen los
siguientes pasos:
1 - Formulación de hipótesis
2- Establecer el nivel de significación
3- Selección del estadístico a prueba
4- Establecer la regla de decisión
5- Realizar los cálculos necesarios
6- Decisión estadística. Interpretación.
7- Conclusiones.
204
tal" , y el otro, donde está ausente dicha variable, se considera Grupo con
trol.
En este caso, se trata de conocer los valores representativos (estadísti
cos) obtenidos en ambos grupos, y al compararlos determinar si existe dife
rencia significativa entre los dos estadísticos.
Si la diferencia resulta significativa, ella puede ser consecuencia de la
variable en estudio, en cuyo caso se rechaza la hipótesis nula. Pero, si la di
ferencia no es significativa, se le atribuye al proceso de azar, al cual fueron
sometidos los sujetos al momento de elegirlos para formar las muestras.
Con este propósito se aplican pruebas de hipótesis para comparar las me
dias de dos muestras, y las proporciones o porcentaj es de dos muestras in
dependientes.
11-1) Contraste de hipótesis de los promedios de dos muestras indepen
dientes.
11-2) Contraste de hipótesis de las proporciones de dos muestras inde
pendientes.
Todos estos planteamientos pueden comprenderse mejor al resolver el
siguiente ejercicio, donde se someten a prueba cada una de las cuatro moda
lidades de contraste mencionadas.
Ejemplos:
7.4) En un estudio realizado en el "Hospital Universitario Angel Larra/
de ", para conocer las medidas antrométricas de los recién nacidos, du
rante los últimos años, se encontraron los siguientes datos:
PESO (kgs) ESTATURA (cms)
VARONES: 256
n=
X= 4,300 Kgs. 55 cms
s= 0,550 Kgs. 2,5 cms
µ= 3,500 Kgs. 5 1 cms
HEMBRAS: n = 225
X= 3,900 Kgs. 53 cms
s= 0,500 Kgs. 2,2 cms
µ= 3,000 Kgs. 50 cms
205
De acuerdo con estos datos, se quiere probar que:
a) Las niñas nacidas en ese centro tienen una estatura significativamente
superior a 50 cms, considerados como normal para esa población. Ni
vel de confianza: 99 %.
b) La diferencia en el peso promedio de los varones es estadísticamente
significativa con respecto a su promedio normal. Nivel de significa
ción: 0,0 1 .
c) En ese centro hospitalario, el porcentaje de nacimientos de hembras es
menor al porcentaje esperado (50%). Nivel de confianza: 95 %.
d)La estatura promedio de los varones es significativamente superior a la
de las hembras, nacidas en ese centro. Nivel de significación: 1 O %
e) Estadísticamente es significativa la diferencia entre el porcentaje de
nacimiento de varones con respecto al porcentaje de nacimiento de
hembras, en ese centro.
206
Por lo tanto, la zona de rechazo se ubica en la cola derecha de la curva; en un
área de 0,0 1 . Para saber a que valor crítico corresponde esta zona, se recurre
a la tabla de áreas de la curva normal. Como esta tabla sólo presenta la mi
tad de la curva (0,5000), se resta de ella el área crítica:
0,5000 - 0,0 1 = 0,4900
En el cuerpo de la tabla se busca el 0,4900 (o el más próximo a él) para
saber a cuantas desviaciones sigmas (cr) corresponde, y con ello fijar poste
riormente la regla de decisión.
3- Estadístico a prueba: Z.
(Aun cuando se desconoce la varianza de la población, puede utilizarse
"Z", dado que la muestra es grande).
X -µ
Z = --
s/--Jn
4- Regla de decisión:
Se rechaza Ho si Z calculada es mayor a 2,33. (Zc < 2,33).
5- Cálculos del estadístico a prueba:
X - µ 53 - 50 3 3
s/--In 2;2./ Jm 2;2./15 0)47
Z= = = -- = __ = 20 4 1
'
zona de
No rechazo
de Ho
o 2,33
6- Decisión: Dado que la Z calculada (20,4 1 ) es mayor a 2,33, se rechaza
la hipótesis nula. La diferencia encontrada no podría ser explicada por el
azar. Tal diferencia es estadísticamente significativa. Por lo cual se tienen
suficientes evidencias para considerar la posibilidad de que sea cierta la hi
pótesis de trabajo, con más de 99 % de confianza.
7-Conclusión:
207
Las niñas nacidas en los últimos años en el Hospital Universitario "An
gel Larra/de ", tienen una estatura promedio superior a lo considerado
como normal para esa población.
208
3- Estadístico a prueba: Z
4 - Regla de decisión:
Se rechaza Ho si Z calculada es menor a -2,575, o mayor a 2,575.
(-2,575 < Zc < 2,575).
5- Cálculos del estadístico a prueba:
z= X - µ = 4,.3 00 - 3,.5 00 = 0,800 =
23,25
0 ,.5 50/-fis6 0 ,.55 0/16 0,0344
zona de
No rechazo
de Ho
-2,575 o 2,575
6- Decisión:
Dado que la Z calculada (23.25) es mayor a 2,575 se rechaza la hipótesis
nula, con más de 99 % de probabilidades de certeza. La diferencia observa
da no podría ser atribuida al azar; es estadísticamente significativa, por lo
tanto hay evidencias para considerar que lo planteado en la hipótesis de tra
bajo pueda ser cierto.
7 - Conclusiones:
Es significativa la diferencia observada entre la estatura de los varones
nacidos en el Hospital Universitario Angel Larralde, en los últimos años,
con respecto al promedio considerado como normal para esa población.
209
DATOS
Total de nacimientos = 481
Nacimiento de niñas = 225 niñas
nacimiento de hembras 255
p= x 1OO = x 1OO = 4 ?%
Total de nacimientos 481
P = 50 % (porcentaje normal del universo)
Q = 50 %
Nivel de confianza = 95 %.
1- Hipótesis a prueba:
Hi: P < 50 %
Ho: P = 50 %
2- Nivel de significancia: a = 0.05
Prueba unilateral de cola izquierda, por lo tanto:
0,5000 - 0,05 = 0,4500
3- Estadístico a prueba: Z
P-p
Z = --
Es
(P Q )
Es = � �
4- Regla de decisión:
Se rechaza Ho si Z calculada es menor de -1,645
(-1,645 < Zc)
5- Cálculos del estadístico a prueba: Z;
Pero antes es conveniente calcular el error estándar.
(P · Q ) = (50% x 50%) = .[1T,Ji
Es = �
n 225
Es = 3,33
z= p - P = 47% - 50% = -3% = -0,90
Es 3,33 3,33
2 10
zona
No rechazo
Ho
-1 ,645 -0,90 0
6- Decisión:
Dado que el valor Z calculado (Z= -0,90) es mayor al valor crítico esta
blecido (-1,645), no se rechaza la hipótesis nula. Con una confianza de 95
%, se puede afirmar que la diferencia no es estadísticamente significativa.
Esta diferencia pudo ser por azar; podría ser por la muestra utilizada.
7 - Conclusión:
La proporción de niñas nacidas en los últimos diez años en el Hospital
Universitario Angel Larralde, no fue menor a lo normal.
211
La Prueba es unilateral, hacia la cola derecha:
0,5000 - O, 1 O = 0,4000
3- Estadístico a prueba: Z;
4- Regla de decisión:
Se rechaza Ho si Z calculada es mayor de 1 ,28. (Zc > 1 ,28)
5- Cálculos del estadístico a prueba: pero antes conviene calcular el error
estándar de la diferencia.
µ1 - µ2
Es<difl
Z=
si s
F:
Es1 = -- Es2 = -2-
.¡;;;
Esl = -- = 0,1 5625 Es2 = -- = 0,1 4666
2,2
ms
2,5
Í256
Aplicando la fórmula del Error estándar de la diferencia, se tiene:
Es(difl = �(0,1 5625) 2 + (0,14666) 2
Es(difl = 0,2 1
5 5 cms - 53 cms 2 cms
Z= = = 9,523
0,21 0,2 1
zona de
aceptación
de Ho
o 1 ,28 9,523
2 12
7- Conclusión:
Se tienen evidencias para pensar que los niños (varones) nacidos en el
H.U.A.L. durante los últimos años, tienen una estatura superior a las ni
ñas nacidas en ese centro.
2 13
4- Regla de decisión:
Se rechaza Ho si Z calculada es menor a - 1,96 o mayor a 1,96
5 - Cálculos del estadístico a prueba. Pero antes es conveniente obtener el
error estándar diferencial:
(P Q )
Es2 = � ·
n2
En esta fórmula, para calcular el error estándar se utilizan los porcentajes
de la población (parámetros).
(50% X 50%) (50% X 50%)
Es1 _ Es2 =
256 225
Es1 = .J9,7 656 Es2 = .Jl l) l l l
En este caso, no es necesario resolver la raíz cuadrada de estos errores
estándares, dado que la fórmula del error estándar de la diferencia los eleva
al cuadrado nuevamente.
Es(difl = 4,569
53% - 47 % = 6% =
Z= l,3 l
4,569 4,569
zona de
No rechazo
de Ho na de
�!><.i-������-4-������-!-!.l>!:ll!!..!!azo de Ho
-1 ,96 o 1 ,31 1 ,96
6- Decisión:
Como el valor calculado de Z (1,31) es un valor inferior a 1,96 no se re
chaza la Ho. Se tienen evidencias para creer que la diferencia observada
2 14
entre los porcentajes no es estadísticamente significativa, con 95 % de
confianza.
7- Conclusión:
En el H.U.A.L., en la última década no ha habido diferencia significativa
entre la proporción de nacimiento de varones y de hembras.
El profesor Fayad Camel ( 1 979) señala que para calcular el error están
dar de la diferencia, algunos textos utilizan los porcentajes de la primera
muestra para obtener su error estándar, y los porcentajes de la segunda
muestra para conocer el error estándar de ésta; y aun cuando puedan dar va
lores muy cercanos a los obtenidos con la fórmula correcta, no debe caerse
en ese error, dado que en ocasiones, especialmente cuando el tamaño de las
dos muestras es muy diferente, puede darse el caso que lafórmula correcta
señale diferencias estadísticamente significativas, y que laformula comen
tada, indique falta de significancia en los resultados (p 244).
En la fórmula correcta se utilizan los porcentajes (P, Q) de la población,
y no los obtenidos en las muestras.
Otro ejemplo de diferencia de dos proporciones poblacionales:
7.5.- En un estudio sobre una dermatitis se sometieron a investigación
200 pacientes afectados por este problema. Para efectos del estudio se dis
tribuyeron aleatoriamente en dos grupos con características similares. El
primer grupo quedó conformado por 1 04 pacientes, quienes recibieron un
nuevo medicamento, logrando en un mes la curación de 82 pacientes. El se
gundo grupo, de 96 pacientes, fue tratado con un medicamento ya conoci
do, lográndose en el mismo tiempo la curación de 72 pacientes. Los investi
gadores se preguntan si estos resultados indican que el nuevo medicamento
es mejor que el tradicional. Desean una confianza de 99 % al realizar sus
conclusiones.
Datos:
Grupos: n curados porcentaje
Experimental 104 82 78,85 %
Control 96 72 75,00 %
Desarrollo en forma metodológica:
2 15
1. -Hipótesis:
Ho: P l = P2
Hi: P l > P2
2. - Nivel de significancia: a = 0,01 (prueba unilateral)
p - P2
3 . - Estadístico a prueba: Z = 1
Es
4. - Regla de decisión: Se rechaza Ho si Z calculada es mayor a 2,3 3 .
5. - Cálculo del estadístico a prueba:
p1 - P2
Z=
�(Es1 ) 2 + (Es2 ) 2
2 16
= (J1 7 ,0288 y + (J1 8,4479 y = .J35,4767 = 5:)65
zona de
No rechazo
de Ho
o 2,33
2 17
Este planteamiento hace entender la existencia de una familia de curvas
de distribuciones t, dado que existe una curva diferente para cada tamaño de
muestra o posibles grados de libertad.
Como modelo matemático la distribución t está calculado en una tabla,
donde se presenta su valor, según los grados de libertad (n-1) y el nivel de
significación. Dicho modelo es producto del trabajo realizado por W.
Gosset, bajo el seudónimo de "Student ". Se calcula con valores correspon
dientes a variables cuantitivas, mediante la fórmula:
X -µ
t = -
Es
Ejemplo7.6:
2 18
Un investigador está interesado en obtener una estimación del nivel pro
medio de nitrógeno excretado en muestras de orina de 24 horas de pacientes
que han recibido yodo radiactivo como terapia. Para ello tomó la informa
ción de 1 6 pacientes sometidos al tratamiento, y obtuvo una media de 7 ,87
grs por 100 ce, y una desviación estándar de 1, 65 gr. Establezca el intervalo
de confianza para µ, con sólo 5 % de riesgo de equivocación.
Datos:
X = 7,8 7 grs.
s = 1 ,65 grs.
n = 1 6 pacientes.
Nivel de confianza: 9 5 %, el cual equivale a un a = 0,05 .
Dado que la curva es bilateral, se divide alfa entre dos, y se tiene un ries
go de equivocación de 0,02 5 a ambos lados de la curva. Se busca en la tabla
de distribución t, bajo la columna 0,02 5 (ó 0,975 ) en la fila de 1 5 gl (grados
de libertad = n - 1 ; en este caso, 1 6 - 1 = 1 5 gl), donde se encuentra un valor t
= 2, 1 3 1.
Se aplica la fórmula para calcular el intervalo de confianza:
X ± ( t · Es) = Intervalo de confianza
Antes de sustituir los términos por sus valores, es conveniente calcular el
error estándar.
1,65 1,65
Es = _!__ = = =O 413
,,¡;, Íl6 4 '
Sustituyendo los términos en la formula, se tiene:
7 ,8 7 ± (2,1 3 1 x 0,4 1 3) = Intervalo de confianza
8 75 s
6;)9 grs
7 ,8 7 ± 0,88 { ' gr
2 19
B.- COMPARACIÓN DE DOS MEDIAS, en muestras pequeñas inde
pendientes.
En el contraste de hipótesis de muestras pequeñas se sigue la misma me
todología empleada para muestras grandes, diferenciándose de ésta sola
mente en el estadístico a prueba utilizado, en cuyo caso se calcula la prueba
t.
Igualmente pueden plantearse pruebas de hipótesis unilaterales o bilate
rales, dependiendo de si en la hipótesis de investigación se estima o no la di
rección de la diferencia.
- Prueba de hipótesis de una media poblacional
Ejemplo 7.7:
En un grupo de 1 O personas mayores de 65 años se realizó un estudio con
el propósito de conocer el promedio de una enzima en la población de an
cianos. En esta muestra se obtuvo un valor promedio de la enzima igual a
22, con una desviación estándar de 6, 71. Con este hallazgo, ¿el investigador
podría concluir que el nivel promedio de esta enzima en los ancianos es di
ferente de 25, considerado como normal para la población adulta?. Alfa =
0,05 .
1.- Hipótesis a prueba:
Hi: µ i= 25
Ho: µ = 25
2.- Nivel de significación: a = 0,05.
Pero siendo la prueba bilateral, se tiene 0,05: 2 = 0,025.
. X-M
3 .- Estad,1sttco a prueba: t = ---
Es
4.- Regla de decisión: Se rechaza Ho si la t calculada es menor de -2,262 o
mayor de 2,262 (valor buscado en la tabla de distribución t, en la colum
na 0.025 (ó 0.975) prueba bilateral, con fila 9 gl).
22 - 25
5.- Cálculos de t =
Es
220
6,7 1 6 71
Es = � = = , = 2J 2
� ../10 3 J 6
-3
t = - = -1 41 5
2J 2
6.- Decisión: No se rechaza la Ho, dado que la t calculada (- 1 ,4 1 5) es mayor
a -2,262 (t de la tabla).
7. - Conclusión: El investigador no tiene base estadística para afirmar que el
valor promedio de la enzima en estudio es diferente, significativamente
en esa población de ancianos.
C.- COMPARACIÓN DE D OS MEDIAS, en muestras relacionadas.
Cuando se usan muestras pequeñas, frecuentemente el grupo experi
mental puede ser su propio control. En estos estudios las muestras no son
independientes, ya que están constituidas por los mismos individuo, lo cual
hace presumir la existencia de cierto grado de dependencia o de correlación
entre las dos medias. Se trata de estudios donde se busca una diferencia en
tre las mediciones de un fenómeno ANTES Y DESPUÉS de determinado
evento.
Para calcular t en este caso, se determinan las diferencias entre los valo
res anteriores y posteriores, considerándolas siempre en la misma direc
ción. Se obtiene así el valor medio de las diferencias, la cual se somete a
prueba para determinar si es significativamente diferente de cero. Este pro
cedimiento conduce a establecer la desviación estándar de las diferencias y
luego, error estándar.
Ejemplo 7.8:
En un estudio sobre artrosis femoropatelar, se probó una nueva técnica
de intervención a fin de mejorar la movilidad del miembro lesionado. El
propósito de la intervención fue reducir el ángulo Q. Se estudiaron 1 1 ca
sos, de quienes se obtuvo la siguiente información:
22 1
Grados del ángulo valores de las diferencia
ANTES DESPUÉS entre el Pre y Post operatorio
20 16 4
18 14 4
22 16 6
22 15 7
17 4
24 16 8
13
15 11 4
8 5 3
14 4
20 14 6
10
16 11 5
Media del ángulo antes de la intervención:
- 1 96 =
X = - 1 7 82 grados
11
Media del ángulo después de la intervención:
- 141 =
X = - 1 2'82 grados
11
La Desviación estándar se obtiene a partir de las diferencias encontradas
entre los valores de "Antes y después".
2
(d) (d)
4 16
4 16
6 36
7 49
4 16
8 64
4 16
3 9
4 16
6 36
5 25
r= 299
222
Desviación estándar en datos directos:
(d) 2 = 299 = .J
s=� � 2 9$ = 5,4 7
n-1 1 1 -1
s = 5,47 grados.
Una vez obtenidos los promedios y la desviación estándar, ya se dispone
de la información necesaria para realizar la prueba de hipótesis.
1 . - Hipótesis a prueba:
Hi: µ1 > µ2
Ho: µ 1 = µ2
2. - Nivel de significación: a = 0,05. (prueba unilateral)
. X A - XD
3 . - Estad'1stlco a prueba: t = ----
Es
4. - Regla de decisión: Se rechaza Ho si la t calculada es mayor de 1,8 1 25.
17 ,82 - 12,82
5 .- e a, lculos de t = ---
Es
- -
5,47 = 5,47 =
Es = _!.._ = 165
,f;; .Ju 3,.32 '
5
1 '65
t = - = 3 03
223
40 mg/ 1 00 ml. En una muestra de 1 2 1 pacientes con cáncer, se encontró
un valor promedio de haptaglobina de 1 55 mg/ 1 00 ml. ¿Este hallazgo
haría pensar que en los pacientes con cáncer hay una concentración ma
yor de haptaglobina?
2) El valor promedio normal de protombina es aproximadamente de 20
mg/1 00 de plasma. En una muestra de 400 pacientes con deficiencia de
vitamina K, quienes presentaron un valor promedio de protombina de 1 7
mg/1 00 ml; con una varianza de 1 6 mg/100 ml. ¿Estos resultados podrían
sugerir que la carencia de Vitamina K reduce los niveles de protombina
en plasma?
3) Se sabe que el valor normal de hematocrito en lactantes es de 34 % apro
ximadamente, con una desviación estándar de 3 .08. ¿Cuál es la probabi
lidad de que al tomar una muestra de 25 lactantes, la media sea igual o
mayor de 3 1 %?
4) En una muestra de 557 adolescentes de 1 4 años se calculó una media de
tensión arterial de 85, 1 0 mm de Hg, y una desviación estándar de 1 1 ,09
mm de Hg. Determine el intervalo de confianza para la media de la po
blación con una probabilidad de 99 %.
5) Un investigador desea estimar el valor promedio de hemoglobina de los
estudiantes del C.B. "M. V. Romero". Para ellos seleccione a una mues
tra aleatoria de 64 estudiantes, encontrando una media de 1 4.04 gr/1 00cc
y una desviación estándar de 1 ,8 gr/ l OOcc. Con una confianza de 95 % se
quiere saber cuáles son los límites de confianza para la media de la po
blación.
6) Se quiere estimar el porcentaje de niños desnutridos que asisten al servi
cio de pediatría del H.U.A.L. en 1 994, para ellos se tomó una muestra
aleatoria de 48 historias médicas y se encontró que a 9 de se les diagnos
ticó desnutrición grados l. Con 95 % de confianza, determine el porcen
taje de niños desnutridos que asisten a ese servicio.
7) En una muestra de 400 personas se encontró que el peso promedio era de
67 Kgs, con una desviación estándar de 2,5 kgs. Calcule los límites entre
los cuales se encuentra al peso verdadero, con un nivel de confianza de
95,46 %.
8) De los ingresos a un hospital en el transcurso de este año se tomó una
muestra de 1 00 historias, encontrándose un porcentaje de curación de 20
224
%. Estime el porcentaje de curación en dicho hospital, con 95,46 % de
confianza.
9) Un grupo de odontólogos ha diseñado una nueva técnica para tratamien
to de conducto con la cual éste se realiza en un tiempo promedio de 30
minutos, con una desviación estándar de 5 minutos, en una muestra de
1 44 pacientes. ¿Este equipo de odontólogos podría concluir que su nue
va técnica reduce de manera significativa el tiempo de trabajo, con res
pecto a la técnica habitualmente empleada en estos caso, la cual requiere
de un promedio de 60 minutos por paciente?
1 O) Un odontólogo evaluó el estado de salud bucal de los ancianos residen
tes de dos geriátricos de Valencia. Diagnosticó un índice periodontal por
paciente, tal como se presenta en el siguiente cuadro:
Residencia "A" (n = 36 ancianos) Residencia "B" (n = 49 ancianos)
Xa = 1,7 Xb = 2,5
Sb = 0,6 Sb = 1,2
Según estos resultados, ¿se puede afirmar que existe una diferencia sig
nificativa entre el índice periodontal promedio de los dos grupos geriá
tricos? Nivel de p = 0,05.
11.- En un internado para señoritas, un grupo de 140 jóvenes participaron
en una investigación para probar dos nuevas vacunas anticaries. De és
tas, 70 recibieron la vacuna denominada "Cariestal", y a las 70 restantes
se les administró la vacuna "Carident". Un año después, al examinar a
estas internas, 1 7 presentaban caries, de donde 7 habían sido vacunadas
con "Cariestal", y 1O con "Carident".
Dado que al realizar la vacunación ninguno de las jóvenes tenían caries,
y habían mantenido hábitos higiénicos similares, ¿podría concluirse con
99 % de confianza que la vacuna "Cariestal" da mayor protección contra
la caries?
1 2.- En unas jornadas de trabajo de campo sobre salud bucal, en una pobla
ción costeña se pudo detectar que de 1 80 personas examinadas, el 62%
presentó caries, lo cual hace pensar que en esa comunidad la prevalencia
de caries es inferior al 73% reportado por diversos investigadores, como
el porcentaje frecuentemente diagnosticado en la población. Trabaje con
una p = 0,01 para probar esta hipótesis.
225
1 3.- En una muestra de 64 niños de una escuela pública se encontró un pro
medio de índice de tártaro simplificado de 0,35 y un error estándar de
0,02. Así mismo, en una muestra de 8 1 niños de un colegio privado, se
encontró un índice de tártaro promedio de 0,3 1 y una desviación están
dar de 0,05. Estos hallazgos indican que el índice promedio de tártaro es
menor en los niños de las escuelas privadas que en los de las públicas.
Pruebe esta hipótesis con 99% de confianza.
14.- En una investigación realizada en una comunidad sobre niveles de pro
teínas totales en la sangre, se tomó una muestra de 1 5 individuos, elegi
dos al azar de esa comunidad, cuyos resultados fueron:
X = 5,64 s = 0,72
¿Cuál será el verdadero promedio de proteínas totales en la sangre para
la población de donde fue extraída esa muestra?
Niveles: 95% y 99% de confianza.
15.-En una investigación realizada en dos grupos de individuos normales,
del mismo sexo, edades similares y condiciones socioeconómicas simi
lares, se tomaron los datos relativos de la actividad de la colinesterasa en
el suero, obteniéndose los siguientes resultados:
Grupo A Grupo B
2,29 1 ,59
2,67 1 ,09
3,09 2,02
2,65 2,26
2,52 2,60
1 ,75 1,16
2, 12 2,76
1 ,59 2, 14
1 ,94 2,76
1 ,82 2,00
Procediendo en forma metodológica, se desea saber si la diferencia ob
servada entre los grupos (apreciada por su medida central) tiene signifi
cación estadística o es razonablemente explicable por el azar.
226
16.- En un estudio realizado sobre niveles de inmunoglobulina se conoció
que en un grupo de 28 niños entre 1 2 y 72 meses de edad, de bajas condi
ciones socioeconómicas, la inmunoglobulina A tenía los siguientes va
lores:
X = 1 77 mg/100 ml. y s = 54,26 mg/100 ml.
Se quiere saber si este valor difiere significativamente del valor 108
mg/1 00 ml, considerado como normal para este grupo etario.
Proceda metodológicamente.
17.- Se determina la hemoglobina corpuscular media, calculada en micro
gramos para dos grupos de lactantes de diez meses de edad.
Los grupos eran comparables respecto a todos los factores conocidos
que podrían conducir a una deficiencia de hierro. En un grupo, los cordo
nes umbilicales fueron ligados luego que la placenta comenzó a descen
der a la vagina, y en el otro los cordones umbilicales fueron ligados in
mediatamente después del nacimiento.
Los resultados en ambos grupos fueron:
Hemoglobina corpuscular media en microgramos en lactantes de diez
meses de edad
Individuos
Lactantes cuyos cordones fueron
Lactantes cuyos cordones fueron
ligados después que la placenta co-
ligados después del nacimiento
1 7, 1 3 1 ,5
menzó a descender a la vagina
2 25,6 20,3
3 3 1,1 26,5
4 1 7,3 23,3
5 1 8, 1 27, 1
6 20,9 21,1
7 22,2 30,5
8 1 5,8 26,3
9 29,8 36,1
10 22,0 30,0
11 23,9 24,0
12 27,8 25,0
13 1 7,3 28,7
14 1 7,9
15 20,0
227
Se pregunta: ¿Hay diferencia significativa entre la hemoglobina corpus
cular media de ambos grupos?
Niveles: 95% y 99% de confianza
Proceda metodológicamente
1 8.- En un estudio realizado sobre los tiempos de supervivencia en ratas sin
alimentos, se encontró que algunas de ellas morían en 4 días mientras
que otras sobrevivían 26 días o más.
Tratando de descubrir qué condiciones contribuyen a esta variación, se
consideró el efecto de la temperatura ambiente para lo cual se dejó morir
de hambre a 1 4 ratas a una temperatura constante de 30 ºc, mientras que a
otras 7 se dejaron morir de hambre a una temperatura que fluctuaba alre
dedor de los 20 ºc. Los resultados fueron:
Días de supervivencia a 30 ºc. Días de supervivencia a 20 ºc.
4 4
7 8
10 8
11 10
14 10
16 12
16 12
21 12
23
25
26
26
26
30
Se desea saber si a l bajar la temperatura ambiente, desciende significati
vamente el tiempo promedio de supervivencia.
Niveles: 95% y 99%
Proceda metodológicamente.
1 9.- A un grupo de mujeres embarazadas (primer trimestre) se les ha deter
minado la albúmina circulante. En la primera determinación los valores
resultaron patológicos y fueron sometidos a un tratamiento durante un
228
lapso de tiempo. Luego se les practicó un nuevo examen. Estas determi
naciones se dan a continuación:
Individuo Albúmina Total Circulante (gramos)
Número Antes del tratamiento Después del tratamiento
1 1 89 1 19
2 1 93 1 33
3 1 98 121
4 1 86 1 29
5 1 95 1 36
6 1 99 138
7 1 94 1 43
8 1 87 123
Determinar si la diferencia observada en el grupo es significativa o no.
¿Resultó efectivo el tratamiento aplicado? Proceda metodológicamente.
Niveles: 95% y 99%
20.- En un experimento para comprobar si la ingestión de alimentos tiene
algún efecto sobre la velocidad con que el hígado elimina sulfobromfta
leina inyectada en la corriente sanguínea, obteniéndose los siguientes re
sultados:
En ayunas Alimentados
1 6,2 9,5
1 6,7 1 1 ,3
1 6,3 9,5
1 8,5 1 3,5
1 5,9 8,8
1 6, 1 9,3
1 6,5 10,4
1 5,9 1 1,7
1 7,5 10,8
1 6,4 9,8
229
Se desea saber si la diferencia entre los resultados(representada por sus
valores promedios) es significativa.
Niveles: 95% y 99%
Proceda metodológicamente
21.- Se ha realizado una investigación para determinar:
1.- Los efectos de la distensión abdominal por ascitis sobre la capacidad
de ventilación pulmonar.
2.- Los mecanismos por los cuales la distensión abdominal produce dis
nea.
3.- Establecer sin el alivio producido por la reducción en la distensión
está acompañado por un cambio medible en la función pulmonar; los
pacientes fueron estudiados antes del tratamiento y después de una
acentuada reducción de ascitis durante un régimen de dieta pobre en
sodio y ditpéticos mercuriales por un período de diez días.
Se dan a continuación los datos para un grupo de 7 pacientes con en
fermedad cardíaca reumática y artericaótica en relación con su máxi
ma capacidad respiratoria.
Capacidad respiratoria
Pacientes
Antes del tratamiento Después del tratamiento
l 102 1 34
2 89 118
3
-�
32 50
4 82 82
5 36 61
6 56 64
7 79 92
230
22.- En una investigación realizada en una comunidad sobre niveles de cal
cio en el suero de individuo adultos normales, se tomaron dos muestras
cuyos resultados fueron los siguientes:
s
12 8,45 mgrs/100 ce 1 ,23 mgrs/100 ce
N
Grupo A
Grupo B 15 10,34 mgrs/100 ce 1 ,75 mgrs/100 ce
Se desea saber al 98% de confianza si la diferencia observada entre los
promedios de ambos grupos es significativa estadísticamente o es expli
cable por azar.
Proceda metodológicamente
23.- En un preparado alimenticio infantil se especifica que según análisis
garantizado, el contenido mínimo de proteínas es de 42%. Para compro
bar lo mencionado se tomó una muestra de 1 O preparados, los cuales fue
ron analizados encontrándose un promedio de proteínas de 40%, y una
desviación estándar de 3,5%. Con estos datos, ¿se puede sostener lo es
pecificado, para un alfa de 0,05, suponiendo normalidad en la distribu
ción de la variable contenido proteico?
24.- A 1 0 pacientes que sufren incapacidad física, se les pidió que realiza
ran determinada tarea, computándose el tiempo empleado para realizar
la. El tiempo promedio consumido fue de 7 minutos, con una desviación
estándar de 2 minutos. Suponiéndose normalidad, construya los interva
los de confianza al 90, 95 y 99%, para tiempo promedio verdadero para
que este tipo de pacientes realice esta tarea.
25. - En una muestra de 1 6 individuos normales se encontró un promedio de
proteínas totales en la sangre = 6,2 grs, con una desviación estándar de
0,80 grs. ¿Cuál será el parámetro de esa variable en la población de don
de se extrajo la muestra? Niveles de confianza: 95%.
23 1
Tabla ll
Percentiles de la distribución t
g.l. f90 f95 f975 f99 [995
3.078 6.3 138 12.706 3 1 .821 63.657
2 1 .886 2.9200 4.3027 6.965 9.9248
3 1 .638 2.3534 3 . 1 825 4.541 5.8409
4 1 .533 2.13 1 8 2.7764 3.747 4.6041
5 1 .476 2.0150 2.5706 3.365 4.0321
6 1 .440 1 .9432 2.4469 3. 143 3.7074
7 1 .415 1.8946 2.3646 2.998 3.4995
8 1 .397 1 .8595 2.3060 2.896 3.3554
9 1 .383 1 .8331 2.2622 2.821 3.2498
10 1 .372 1 . 8 1 25 2.2281 2.764 3.1693
11 1 .363 1 .7959 2.2010 2.71 8 3.1058
12 1 .356 1 .7823 2. 1 788 2.681 3.0545
13 1 .350 1 .7709 2. 1 604 2.650 3.0123
.1 4 1 .345 1 .7613 2. 1448 2.624 2.9768
15 1 .341 1 .7530 2.1315 2.602 2.9467
16 1 .337 1 .7459 2. 1 199 2.583 2.9208
17 1 .333 1 .7396 2. 1 098 2.567 2.8982
18 1 .330 1 .734 1 2. 1 009 2.552 2.8784
19 1 .328 1 .729 1 2.0930 2.539 2.8609
20 1.325 1 .7247 2.0860 2.528 2.8453
21 1 .323 1 .7207 2.0796 2 .5 1 8 2.8314
22 1 .321 1.7171 2.0739 2.508 2.8 1 88
23 1.319 1 . 7 1 39 2.0687 2.500 2.8073
24 1.318 1 .7 1 09 2.0639 2.492 2.7969
25 1.316 1 .708 1 2.0595 2.485 2.7874
26 1.315 1 .7056 2.0555 2.479 2.7787
27 1.314 1 .7033 2.05 1 8 2.473 2.7707
28 1.313 1 .70 1 1 2.0484 2.467 2.7633
29 1.31 1 1 .6991 2.0452 2.462 2.7564
30 1.310 1 .6973 2.0423 2.457 2.7500
35 1 .3062 1 .6896 2.0301 2.438 2.7239
40 1 .303 1 1 .6839 2.02 1 1 2.423 2.7045
45 1 .3007 1 .6794 2.0141 2.412 2.6896
50 1.2987 1 .6759 2.0086 2.403 2.6778
60 1 .2959 1 .6707 2.0003 2.390 2.6603
70 1 .2938 1 .6669 1 .9945 2.38 1 2.6480
80 1 .2922 1 .6641 1 .9901 2.374 2.6388
90 1 .2910 1 .6620 1 .9867 2.368 2.63 16
100 1 .2901 1 .6602 1 .9840 2.364 2.6260
120 1 .2887 1 .6577 1 .9799 2.358 2.6175
140 1.2876 1 .6558 1 .9771 2.353 2.6 1 1 4
160 1 .2869 1 .6545 1 .9749 2.350 2.6070
180 1 .2863 1 .6534 1.9733 2.347 2.6035
200 1 .2858 1 .6525 1 .9719 2.345 2.6006
00 1 .282 1 .645 1 .96 2.326 2.576
232
BIBLIOGRAFÍA
Bancroft, H. (1979). Introducción a la Bioestadística. Buenos Aires: Eude
ba.
Camel, Fayad. (1979). Estadística Médica y de Salud Pública. Cuarta edi
ción. Mérida, Venezuela: Talleres gráficos Universitarios.
Cañedo D., L. (1987). Investigación clínica. México, D.F.: Interamericana.
Daniel, W. (1981). Estadística con aplicaciones a las Ciencias Sociales y a
la Educación. Bogotá: Editorial McGraw-Hill.
Haber, A. y Runyon R. (1973). Estadística general. México, D.F.: Fondo
Educativo Interamericano.
Hemández Sampieri, R., Femández, C. y Baptista, P. (1991). Metodología
de la Investigación. Bogotá: McGraw-Hill.
Polit, D. y Hungler, B. (1987). Investigación Científica en Ciencias de la
Salud. Tercera edición. México, D.F: Interamericana.
Schefler, W. (1981). Bioestadística. México, D.F.: Fondo Educativo Intra
mericano.
233
CAPÍTULO VIII
Técnica de Análisis Bivariado
Medidas de asociación. Coeficiente de correlación de Pearson. Coeficiente de de
terminación, Coeficiente de correlación de Spearman. Chi cuadrado. Su uso en
Prueba de independencia, de bondad de ajuste, de homogeneidad. Pruebas no pa
ramétricas. Ejercicios. Tabla de chi cuadrado. Bibliografia.
235
MEDIDAS DE ASOCIACIÓN
Cuando se plantean estudios correlacionales es indispensable contar con
pruebas estadísticas apropiadas para conocer si existe relación o indepen
dencia entre dos variables, que podrían estar asociadas. Tales pruebas están
dentro del renglón de las pruebas paramétricas (Ej. Coeficiente de correla
ción de Pearson) o de las NO paramétricas (Coeficiente de correlación de
Spearman, Coeficiente de correlación de Kendall, Chi cuadrado, etc.).
237
- 1 ,00 correlación negativa perfecta + 1 ,00 correlación positiva perfecta
- 0,90 correlación negativa muy fuerte + 0,90 correlación positiva muy fuerte
- 0,75 correlación negativa considerable + 0,75 correlación positiva considerable
- 0,50 correlación negativa media + 0,50 correlación positiva media
- 0,10 correlación negativa débil + 0, 10 correlación positiva débil
0,00 no existe correlación entre las variables, o de existir, ésta no es lineal. (Hemández Sampieri,
1 .991 , p 384)
En donde:
X = media aritmética de la variable X.
X = cada uno de los valores de la variable X.
Y = media aritmética de la variable Y.
Y = cada uno de los valores de la variable Y.
DmX = Desvíos medios de X = (X- X).
238
DmY = Desvíos medios de Y = (X-Y)
Ejemplo 8. 1 :
Los siguientes datos corresponden a las edades y presión sistólica de 1 O
muJeres.
Edad en años (X) Presión sist. (Y)
42 1 30
46 1 15
42 148
76 158
80 1 56
72 1 58
64 1 55
75 170
55 1 50
48 1 30
Hi: A mayor edad, mayor presión.
Se aplica la fórmula del coeficiente de Pearson para probar la hipótesis
de trabajo.
1 .- Calcular las medias aritméticas de las variables X y Y.
Y = -- = 1 74 anos
- = 600
X - = 60 anos _ - 1 470 _
10 10
2.- Calcular los desvíos medios de la variable X y de la variable Y, teniendo
especial cuidado en los signos de estas operaciones (+ o -). Desvío me
dio es igual a la diferencia de cada valor menos la media.
(X - X) y ( Y - Y )
3.- Se multiplica cada desvío medio de X por el respectivo desvío medio de
Y. Teniendo especial cuidado con los signos negativos y positivos, pro
ducto de estas operaciones.
4.- Se suman ALGEBRAICAMENTE los productos de estas multiplicacio
nes de los desvíos medios. Esta sumatoria representa el numerador en la
fórmula, y el signo de éste determina el signo del resultado final del coe
ficiente.
239
5.- Luego se elevan al cuadrado cada uno de los desvíos medios de X.
6.- Igualmente se elevan al cuadrado cada uno de los desvíos medios de Y.
7. - Se suman todos los desvíos medios calculados. Tanto los de X como los
de Y.
8.- Se multiplican entre sí los resultados de estas dos sumatorias. Este valor
representa el denominador en la fórmula.
9.- Se extrae la raíz cuadrada del producto de esta multiplicación. Este re
sultado es el denominador en la fórmula.
10.- Se divide el resultado de la sumatoria algebraica de los desvíos medios
de X por lo de Y (obtenidos en el paso 4) entre el resultado de la raíz cua
dra, obtenida en el paso 9.
X Dm = (X - X) y Dm = (Y_ - Y) (Dm X . Dm Y) (X - X)2 (Y - Y}2
42 -18 1 30 -17 306 324 289
46 -14 1 15 -32 448 1 96 1 .024
42 -18 1 48 1 -18 324 1
76 16 1 58 11 1 76 256 1 2 1--
80 20 1 56 9 1 80 400 8 1 --
72 12 1 58 11 132 1 44 121
64 4 1 55 8 32 16 64
__?_µ_
55
15
-5
1 70
1 50
23
3
345
-15
225
25
529
9
--
48 -12 130 -17 204 1 44 289
600 1 .470 1 .790 2.054 2.528
1.790 =
r= 0 7855
2278,71
Según este resultado se acepta la hipótesis de trabajo, considerando que
existe una correlación positiva considerable entre la edad y presión sistóli
ca.
Coeficiente de determinación.- Al elevar al cuadrado el valor del coefi
ciente de Pearson se puede conocer el porcentaje de la variación de una va-
240
riable debido a la variación de la otra. A este estadístico se le conoce como
Coeficiente de determinación:
En el ejemplo anterior, el coeficiente de correlación es 0.7855, por lo
cual, el coeficiente de determinación es (0,7855)2 = 0,61 7. Significa esto
que la variación de la edad contribuye a explicar casi el 62 % de la variación
de presión.
Donde:
6 es constante.
D = Diferencia entre los pares de rango para cada sujeto.
n = número de observaciones o de sujetos observados.
Ejemplo 8.2:
En un estudio donde se busca conocer la relación entre irritabilidad de
las personas y número de cigarrillos consumidos diariamente. La variable
irritabilidad fue medida mediante un test validado para medir esta variable,
en un rango creciente de 1 a 1 O, indicando éste último el mayor grado de
irritabilidad. Los resultados son los siguientes:
24 1
Nº de cigarrillos diarios Nivel de irritabilidad
4 2
6 2
20 8 1
18 5 --�
15 3 --�
40 8
20 6
40 10
Hi: A mayor número de cigarrillos fumados por día, mayor nivel de irri
tabilidad.
El nivel de irritabilidad es una variable medida en escala ordinal o de
rango, mientras que la variable número de cigarrillos fumados por día está
medida en una escala de razón, por lo tanto, ésta última debe transformarse
en una escala de rango. Por ello se procede a asignarle un orden jerárquico a
los valores de esta última escala.
-
Nº de cigarrillos Transformación Nivel de Diferencia entre Diferencias
---- �-
diarios a Escala de rango irritabilidad dos escalas (D) al cuadrado
4 1 2 -1 1
6 2 2 o ---
o
20 .
5,5 8 - 2,5 6,25--
-
--
18 4 5 ------
-1 1 --
15 3 -
3 o o -�
1 5,00 !
6 " D2
rho = l - º L.,¿2 = 1 - 6 x l 5 = 1 - 90 = 1 - 0 1 78 5 = 0 82 1 5
n (n - 1) 8 (64 - 1) 504 '
242
Se puede concluir que existe una correlación positiva considerable entre
el número de cigarrillos y los niveles de irritabilidad. Se acepta la hipótesis
de trabajo: a mayor número de cigarrillos fumados por día, mayor irritabili
dad.
243
tienen tres grados de libertad. Al haber calculado 1 estadístico en un con
junto de datos se tienen n - 1 grados de libertad.
Niveles de significación.- De este término ya se ha hablado en los capítu
los anteriores. Las conclusiones que se establecen en función a un análisis
estadístico, se formulan en términos de probabilidades. Esto implica la pro
babilidad de equivocarse, de cometer errores. Así como se mide la probabi
lidad de acertar, también se mide la de equivocarse. En las pruebas de hipó
tesis existen dos probabilidades de equivocación: una es rechazar la hipóte
sis nula, cuando es realmente cierta; y la otra es aceptar la hipótesis nula,
cuando es falsa. El primer error se denomina "error tipo I", y la probabili
dad de cometerlo se conoce como nivel de significación, y se designa con la
letra griega alfa (a). Cuando se dice que a = 0,05, se corre el riesgo de co
meter un error tipo I en cinco de cada cien oportunidades. El otro error, el
Tipo II se refiere a la probabilidad de aceptar una hipótesis nula siendo fal
sa, y se designa como beta (f3). El nivel de significación sirve como referen
cia para rechazar o aceptar una hipótesis.
Condiciones para el uso de Chi cuadrado
Aún cuando es una prueba de fácil cálculo, es conveniente utilizarla con
cautela, porque presenta algunas limitaciones que deben tomarse en cuenta,
en el momento de su uso.
1 .- El tamaño de la muestra debe ser mayor de 20 casos. Si es inferior, se
debe emplear la Prueba de Fisher.
2.- Si !amuestra tiene entre 20 y 40 casos distribuidoss en tablas de 2 x 2,
puede usarse el chi cuadrado si todas las frecuencias esperadas son ma
yores que 5. Si esta condición no se cumple, se recomienda utilizar en su
lugar la Prueba de Fischer.
3.- Ninguna de las frecuencias esperadas puede ser menor de 1 , y no más del
20 % de ellas, debe ser inferior de 5, en tablas con más de 1 grado de li
bertad.
4.- No debe utilizarse esta prueba cuando alguna de las casillas está vacía.
Aplicación del Chi cuadrado (X2)
Al igual que las pruebas estadísticas vistas en el capítulo anterior, el X2
se utiliza como prueba de hipótesis, aun cuando ésta debe se formulada de
244
manera diferente según la información que se desea obtener. En este senti
do, el chi cuadrado puede ser utilizado como prueba de independencia,
como prueba de homogeneidad o de proporciones o como prueba de bon
dad de ajuste. En cada caso, la hipótesis de trabajo debe evidenciar el uso
dado a la prueba.
PASOS METODOLÓGICOS PARA LA APLICACIÓN DE X2
1.- Planteamiento de las hipótesis: Ha y Hi.
2.- Determinar el nivel de significación (a).
3 .- Establecer la regla de decisión, en función de los grados de libertad
(g. l. ).
4.- Calcular el valor del chi cuadrado.
5.- Decisión de rechazar o no Ha, en función del valor obtenido y lo estable
cido en la regla del paso número 3.
6.- Conclusión, en función del paso anterior y lo establecido en las hipótesis
planteadas en el paso 1 .
245
Ho: La muestra utilizada proviene de una distribución teórica determina
da (normal, binomial o de Poisson).
= (fo - fe)
2
fe
x2
= (l fo - fel ) - 0 ,5 )
2
fe
x2
246
Sin embargo, algunos autores consideran que en muestras grandes el uso
de esta corrección no tiene efecto. Y otros, aún más drásticos están en con
tra de su uso. Wayne Daniel ( 1 977, p. 347) señala:
En general, se ha convenido en que no se necesita corrección al
guna para tablas de contingencia más grandes. Aunque la correc
ción de Yates ha sido usada con amplitud en el pasado, investigado
res recientes, por ejemplo Grizzle, Lancaster, Pearson y Plackett
han cuestionado su uso. El trabajo de Grizzle, en particular, ha re
forzado el caso contra el uso de la corrección, basándose en que con
demasiada.frecuencia, conduce a una prueba muy conservadora, es
decir el uso de la corrección, con demasiadafrecuencia, conduce al
no rechazo de la hipótesis nula. Como resultado, algunos médicos,
por ejemplo, Remington y Schork, están en contra de su uso. Aparen
temente ésta es una recomendación que es razonable aceptar ".
Luego de calcular el valor de chi cuadrado, se confronta éste con la regla
de decisión, para determinar si se acepta o se rechaza la Ha.
Chi cuadrado como Prueba de independencia.-
Uno de los usos más frecuentes de este estadístico es como prueba de in
dependencia. Se aplica cuando se tiene una sola muestra y se desea probar si
dos criterios de clasificación son independientes. La hipótesis nula plantea
que existe independencia entre los dos criterios, es decir, las variables son
independientes en la población de estudio.
Ejemplo 8.3.
Cuadro 8.1
Pacientes que recibieron antibioterapia profiláctica
y el motivo que justificó su empleo.
Maternidad del C.H.E.T. Valencia, Junio - Agosto 1997
Pacientes que recibieron antibioterapia
Causa TOTAL
SI NO
PARTO VAGINAL 23 655 678
ABORTO 39 1 83
CESÁREA 57 1 39
144
82
TOTAL 1 19 1
88 1 1 .000
247
1.- Hipótesis:
Hi: las variables están asociadas.
Ho: las variables son independientes.
2.- Nivel de significación: a = 0,05
3- Regla de decisión: Rechazar Ho si X2 calculado es mayor a 5,991
fe
Para aplicar la fórmula anterior, es necesario calcular las frecuencias es
peradas de cada casilla; las cuales se obtienen multiplicando los sub-totales
de las filas por los sub-totales de las columnas respectivas, y luego dividien
do este producto entre el gran total. Por ejemplo, para conocer la frecuencia
esperada de la primera casilla, formada por la intersección de la primera co
lumna por la primera fila, se multiplica el sub-total de la primera columna
por el subtotal de la primera fila y el producto se divide entre el gran total.
248
Pacientes que recibieron antibioterapia
Causa SI NO TOTAL
fo (fe) fo i (fe)
PARTO VAGINAL 23 (80,68) 655 (597,32) 678
ABORTO 39 (21 ,78) 144 ( 1 6 1 ,22) 1 83
CESÁREA 57 (1 6,54) 82 (1 22,46) 1 39
TOTAL 1 19 ( 1 1 9 00) 881 (88 1 00) 1.000
Aplicando la fórmula:
( fo - fe) 2 =
X2 =
fe
Ejemplo 8.4:
En el mes de agosto del presente año, un grupo de 30 niños participantes
en un campamento vacacional, sufrieron una intoxicación alimentaria lue
go de haber ingerido el almuerzo preparado para esa ocasión. Al efectuar un
estudio epidemiológico de la situación se obtuvo la siguiente información:
Consumieron en- INTOXICADOS
Total
salada con atún SI NO
SI 11 5 16
NO 6 8 14
Total 17 13 30
249
Se sospecha que la ensalada con atún fue el alimento que produjo la into
xicación.
1 .- Hipótesis:
Hi: Las variables están asociadas:
Ho: Las variables son independientes.
2.- Nivel de significación: a = 0,05
3.- Regla de decisión: Rechazar Ho si X2 calculada es mayor a X2 tabular
(0,05. 1 g.l.) 3,8 1 1
4.- Calcular X2
Se puede utilizar la fórmula con factor de corrección de Y ates.
= (1 /o - /el )
2
2
fe
X
250
x 2 = 0,25 + o,32 + 0,2s + 0,375 = 1,225
Decisión.- Dado que el valor del X2 calculado (1 ,227) es menor al X2 ta
bulado (3,8 1 1 ) no se rechaza Ho.
Conclusión. No hay asociación entre el consumo de ensalada y la intoxi
cación alimentaria. Son independientes.
Prueba de bondad de ajuste.-
El uso de chi cuadrado como prueba de bondad de ajuste es una prueba
de concordancia entre una distribución empírica y una distribución hipoté
tica. Resulta apropiada cuando se desea conocer si una distribución de fre
cuencias observadas se ajusta a un modelo teórico, tales como distribución
binomial, normal o de Poisson.
Ejemplo 8.5:
Prueba de bondad de ajuste a la binomial.- Este tipo de prueba es de uso
frecuente en el área de la genética, de donde tomamos el siguiente ejemplo.
En un laboratorio, del cruce de ratones heterocigotos negros (B) y pardos
(b) han nacido 26 ratones pardos y 1 4 ratones negros. De acuerdo con las le
yes de la genética, este cruce producirá descendientes de la siguiente mane
ra:
.•138· negros·
25 1
Ratones f. observadas f. esperadas
Pardos 26 30
Negros 14 10
Total 40 40
Hipótesis:
Hi: La distribución observada no se ajusta a la distribución binomial.
Ho: La distribución observada se ajusta a la distribución binomial.
Nivel de significación: a = 0,05
Regla de decisión: Rechazar Ho si X2 calculada es mayor a 3,811 (X2 ta
bulado, 0,05. 1 g.1)
x z = ( fo - fe) (26 - 30) 2 (14 -10) 2 =
+ 0,.533 + 16 = 2) 3 3
2
fe 30 10
Decisión: E1 X2 calculado (2,133) es menor a1 X2 tabulado (3, 8 1 1), por lo
tanto, no se rechaza Ho.
Conclusión: No es significativa la diferencia entre las frecuencias obser
vadas y las esperadas. La distribución se ajusta a la distribución binomial.
Prueba de homogeneidad.
Así como en las pruebas de independencia se busca conocer si son inde
pendientes los dos criterios de clasificación de los sujetos de la muestra, en
las pruebas de homogeneidad se desea probar si las muestras extraídas pro
vienen de poblaciones que son homogéneas con respecto a algún criterio de
clasificación. En este caso, la hipótesis nula plantea que las muestras pro
vienen de la misma población; por lo tanto, las muestras son homogéneas,
en cuanto a la variable en estudio.
El procedimiento, para esta prueba es similar a los pasos planteados en
las pruebas de independencia.
PRUEBAS NO PARAMÉTRICAS.
En las pruebas paramétricas, es necesario suponer que en la población, la
variable en estudio tiene una distribución normal. Por ser normal, puede es-
252
timarse el error que se comete al realizar deducciones o inferencias sobre la
población, en función de los datos muestrales. Cuando la población no si
gue una distribución normal, el error puede ser grande y no es posible esti
marlo. Esta situación plantea la necesidad de contar con pruebas estadísti
cas, en las cuales no sea necesario partir de una suposición fuerte acerca de
la distribución de la población. A estas pruebas se les denomina Pruebas no
paramétricas.
Las pruebas no paramétricas cumplen con los siguientes requisitos:
1.- No es necesario suponer que en la población, la variable en estudio tiene
una distribución normal, ni ninguna otra suposición fuerte acerca de la
distribución de la población. Por este motivo, a este tipo de prueba tam
bién se les denomina "pruebas libres de distribución".
2. - Se utilizan con datos correspondientes a escalas nominales (categóricas)
y ordinales u ordenadas por rango.
Entre las pruebas no paramétricas más conocidas están:
- Chi cuadrado.
- Coeficiente de correlación de rango de Spearman.
- Prueba McNemar. Se utiliza para conocer si existe independencia
entre dos variables categóricas provenientes de dos muestras depen
dientes o conocer si hay cambios significativos entre "ante" y "des
pués" de un tratamiento. Requisitos para su uso: Variables nominales
y dicotómicas.
- Prueba de signos. Se utiliza para medir la dirección de los cambios,
sin importar las magnitudes, en los experimentos de "antes y des
pués". Esta prueba no está sujeta a las restricciones de la prueba t de
Student. En ella se calcula la mediana y no la media. Requisito: Escala
de rango dicotomizada.
- Wilcoxon. Puede utilizarse para medir dirección y magnitud de los
cambios, en una variable estudiada en muestras dependientes, bien
sean grandes o pequeñas. Requisitos: Variable medida en escala ordi
nal.
- Prueba de Mano Whitney. Se utiliza cuando se quiere comparar si
dos muestras independientes provienen de una misma población. Re
quisitos: Variables en escala ordinal.
253
- Prueba de Kolmogorov-Smirnov. Se utiliza como prueba de bondad
de ajuste. Requisitos: Escala ordinal.
- Prueba de Kruskal-Wallis. Se utiliza para análisis de varianza, con
un solo criterio de clasificación por rangos. Sustituye al análisis de va
rianza al comparar dos o más grupos independientes, resumidos a par
tir de la mediana.
Coeficiente de correlación de Kendall. Para escalas ordinales.
254
Los datos obtenidos en la investigación se muestran a continuación:
Nº de tragos velocidad de reacción
5 2
7 3
8 7
9 16
10 8
11 11
14 12
15 10
16 12
15 13
255
cual se tuvo como hipótesis de trabajo que es más frecuente el nacimien
to de niños prematuros de mujeres fumadoras que en las no fumadoras.
La investigación arrojó los siguientes resultados:
Nacimiento Mujeres Mujeres
Total
de niños fumadoras No fumadoras
Prematuros 70 61 1 39
No premah!ros __ 54--- - - ·· 69 123
TOTAL 1 32 1 30 262
Según estos datos, ¿se puede aceptar la hipótesis de trabajo, a un nivel de
95 % de confianza?
5.- De una investigación sobre osteoporosis y fracturas espontáneas, se to
maron los siguientes datos:
Pacientes No Sedentarios Sedentarios Total
Con fracturas 10 19 29
Sin fracturas 16 16 32
TOTAL 26 35 61
Según estos datos ¿es posible asociar el sedentarismo con la aparición de
fracturas espontáneas en pacientes con osteosporosis? Nivel de confian
za: 95 %.
6.- En un estudio acerca de lo informado que están los hipertensos sobre los
riesgos de salud a los cuales están sometidos al sufrir esta enfermedad, se
logró la siguiente información de un grupo de 228 pacientes con esta ca
racterística
con
Pacientes sin conocimientos Total
---- --·--- ------
conocimientos
--· - - --
controlados 75 56 131
no controlados 68 29 97
TOTAL 143 85 228
¿Podría pensarse que existe asociación entre el hecho de poseer conoci
mientos sobre los riesgos de la hipertensión y el control que tienen los
pacientes sobre su situación?
7.- Observe la siguiente información:
256
Cuadro N º 6
Evaluación nutricional de pacientes menores de 1 2 años, distribuidos
según estado nutricional y sexo. Ambulatorio Rural, La Aguadita, Edo.
Cojedes. Marzo, 1 997.
Femenino Masculino
Estado Nutricional Total
f -- -
f
--------------
Sobre la norma 2 3 5
Normal 18 13 31
Desnutrición leve 8 4 12
Desnutrición moderada 5 3 8
Desnutrición �g�ra
_v_e____ 3 4
Total 36 24 60
Fuente: Archivo de Historias Médicas. Ambulatorio Rural II, La Aguadita, Edo. Ca
rabobo.
257
Esquema de Coeficiente de Correlación según tipo de Variable
N
V,
6 12.592 1 6.8 12
7 14.067 1 8.475
8 1 5 .507 20.090
9 1 6. 9 1 9 2 1 .666
10 1 8.307 23.209
11 19.675 24.725
12 2 1 .026 26.2 17
13 22.362 27.688
14 23.685 29. 141
15 24.996 30.578
16 26.296 32.000
17 27.587 33.409
18 28.869 34.805
19 30. 144 36. 1 9 1
20 3 1 .410 37.566
21 32.67 1 38.932
22 33.924 40.289
23 35. 1 72 4 1 .638
24 36.41 5 42.980
25 37.652 44.3 14
26 38.885 38.932
27 40. 1 1 3 46.963
28 41 .337 48.278
29 42.557 49.588
30 43.773 50.892
35 49.802 57.342
40 55.758 63.691
45 6 1 .656 69.957
50 67.505 76. 1 54
60 79.082 88.379
70 90.531 100.425
80 1 0 1 .879 1 1 2.329
90 1 1 3.1 15 124. 1 1 6
100 124.342 135.807
259
BIBLIOGRAFÍA
Camel, F. ( 1 979). Estadística Médica y de Salud Pública. Cuarta edición.
Mérida, Venezuela: Talleres Gráficos Universitarios.
Cañedo, L. ( 1 987). Investigación clínica. México, D.F.: Nueva Editorial
Interamericana.
Escotet, M. A. ( 1 973). Estadística Psicoeducativa. México, D. F.: Editorial
Trillas.
Hemández Sampieri, R., Femández, C. y Baptista, P. ( 1 .99 1 ). Metodología
de la Investigación. Bogotá: McGraw-Hill.
260
ÍNDICE
PRÓLOGO . . . . . 5
CAPÍTULO I
Uso de la Estadística en el campo de la Salud . . . . . . . . . . . . 7
l. DEFINICIONES BÁSICAS . . . . . . . . . . . . . . . . . . . 9
11. USO DE LA ESTADÍSTICA EN EL CAMPO DE LA SALUD . 14
- APLICACIÓN DE LA ESTADÍSTICA EN LA ADMINIS
TRACIÓN SANITARIA . . . . . . . . . . . . . . . . . . . 18
- APLICACIÓN DE LA ESTADÍSTICA EN LA INVES-
TIGACIÓN . . . . . . . . . . . . . . . 20
III. ETAPA DE PLANIFICACIÓN . . . . . . 20
- PLANTEAMIENTO DEL PROBLEMA 22
- MARCO TEÓRICO . . . . . . . 25
- MARCO METODOLÓGICO . . 29
- MARCO ADMINISTRATIVO . 34
BIBLIOGRAFÍA 40
CAPÍTULO II
Muestreo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
l. UNIVERSO Y POBLACIÓN . 45
- Universos finitos e infinitos 45
- Poblaciones cautivas . . . . 45
11. MUESTRAS . . . . . . . . . 46
- Desventajas de las muestras 47
- TIPOS DE MUESTRA: Probabilísticas y no Probabilísticas. 48
- TIPOS DE MUESTRAS PROBABILÍSTICAS . . . . . . . 49
- TÉCNICAS DE AZAR: . . . . . . . . . . . . . . . . . . . 52
- MUESTRAS NO PROBABILÍSTICAS . . . . . . . . . . 53
- CARACTERÍSTICAS DE UNA BUENA MUESTRA . . . 54
26 1
CAPÍTULO 111
Recolección de información 63
I. EL PROCESO DE RECOLECCIÓN DE LOS DATOS . 65
11. FUENTES DE INFORMACIÓN . . . . . . . . . . . . 66
III. INSTRUMENTOS DE RECOLECCION DE DATOS . 68
IV. TÉCNICAS DE RECOLECCIÓN DE DATOS. 74
BIBLIOGRAFÍA 78
CAPÍTULO IV
Procesamiento y Presentación de los datos . . . . . . . . . . . . . 79
ETAPA DE ELABORACIÓN
O PROCESAMIENTO DE DATOS . 81
CUADROS ESTADÍSTICOS . . . . 90
- Partes de un Cuadro Estadístico 90
- Tipos de Cuadros Estadísticos . 92
GRÁFICOS ESTADÍSTICOS . . . . 97
- Gráficos de Barras Simples. . . 99
- Gráfico Circular o Diagrama Sectorial . 1O 1
- Histograma y Polígono de Frecuencias. 103
- Curva Integral o Diagrama de Frecuencias Acumuladas . 105
- Polígono de Frecuencia para Cuadros de Asociación con Va-
riable Numérica como Variable Principal 107
- Barras Proporcionadas . . . . . 109
- Gráfico de Líneas de Tendencia 112
- Recomendaciones Finales . 116
EJERCICIOS . . 116
BIBLIOGRAFÍA 120
CAPÍTULO V
Técnicas de Análisis Univariado 121
EL PROCESO DE ANÁLISIS ESTADÍSTICO 123
262
- Medidas de Tendencia Central . . . . . 1 23
- Medidas de Dispersión o Variabilidad . 1 32
- Medidas de Posición . . . . . . . . . . 138
EL ÍNDICE ENDÉMICO. . . . . . . . . . . 1 43
TÉCNICAS DE ANÁLISIS DESCRIPTIVO PARA VARIABLES
CUALITATIVAS . . . . . . . . . . . . . . . . . . . . . . . . . . 1 45
- Tasas Generales Brutas: Tasa General de Mortalidad, Tasa
General de Fecundidad, Tasa de Natalidad . 1 46
EJERCICIOS . . 152
BIBLIOGRAFÍA 1 54
CAPÍTULO VI
Probabilidades y Curva Normal . . . . . . . . . . . . . . . . . . . 155
TEORÍA DE LA PROBABILIDAD . . . . . . . . . . 157
- PROPIEDADES DE LAS PROBABILIDADES 1 58
- PRINCIPIO DE LAS PROBABILIDADES . 159
DISTRIBUCIONES DE PROBABILIDADES. 1 64
- Distribución binomial 1 64
- Distribución normal 1 67
EJERCICIOS . . . . . . . 1 80
BIBLIOGRAFÍA . . . . . 1 82
TABLA DE ÁREAS DE LA CURVA NORMAL 1 83
CAPÍTULO VII
Estadística Inferencial 185
ESTADÍSTICA INFERENCIAL . . . . . . . . . . . . 1 87
DISTRIBUCIÓN MUESTRAL . . . . . . . . . . . . 1 88
DISTRIBUCIÓN DE LA MEDIA DE LA MUESTRA . 1 88
- Error Estándar . . . . . . . . . . . . 191
ESTIMACIÓN . . . . . . . . . . . . . . . 1 92
- Estimación de la Media del Universo. 1 94
263
- Estimación de la Proporción Poblacional . . . . . . . . . 1 95
PRUEBA DE HIPÓTESIS O CONTRASTE DE HIPÓTESIS . . 1 97
- Procedimiento Metodológico para la Prueba de Hipótesis . 1 99
- Prueba de Hipótesis o de una Media Poblacional. . . . 206
- Prueba de Hipótesis de una Proporción de la Población . . 209
- Prueba de Hipótesis de la Diferencia entre dos Medias . . . 21 1
- Prueba de Hipótesis de la Diferencia entre dos Proporciones. 213
PRUEBA t PARA MUESTRAS PEQUEÑAS Y PARA MUES-
TRAS RELACIONADAS . . . . . . . . . . . . . . . . 217
EJERCICIOS . . . . . . . . . . . . . . . . . . . . . . 223
TABLA DE PERCENTILES DE LA DISTRIBUCIÓN t 232
BIBLIOGRAFÍA . . . . . . . . . . . . . . . . . . . . 233
CAPÍTULO VIII
Técnica de Análisis Bivariado 235
MEDIDAS DE ASOCIACIÓN . . . . . . . . . . . . . 237
COEFICIENTE DE CORRELACIÓN DE PEARSON . . . . . . . . 23 7
- Cálculo del coeficiente de Pearson (r) . . . . . . . . . . . . . 238
COEFICIENTE DE CORRELACIÓN POR RANGO DE SPEAR-
MAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 1
DISTRIBUCIÓN CHI CUADRADO. 243
PRUEBAS NO PARAMÉTRICAS. 252
EJERCICIOS . . . . . . . 254
TABLA VALORES DE X 2 . 259
BIBLIOGRAFÍA 260
ÍNDICE . . . . . 261
264
Bioestadística, Herramienta de la Investigación de Eddy Puertas López, Jesús
Urbina M., M. Elvira Blanck, Daisy Granadillo, Maritza Blanchard, José
Antonio García, Pedro Vargas V. y Ana Chiquito, se terminó de imprimir en
mayo de 1998 en Compugráfica (tlf. 234765-245256-235537) en su primera
edición de 500 ejemplares, utilizándose papel Bond 20 y fuentes Times New
Roman en su composición.