Está en la página 1de 17

Bioestadística:maquetaEIR.

qxp 22/07/09 12:57 Página 1166

1 Bioestadística

INTRODUCCIÓN Estadístico
Función definida sobre los valores numéricos de una muestra.
La estadística se ocupa de los métodos y procedimientos para recoger, clasificar,
resumir, hallar regularidades y analizar los datos, siempre y cuando la variabili- Organización de los datos
dad e incertidumbre sea una causa intrínseca de los mismos; así como de reali-
zar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones Variables estadísticas (EIR 93-94, 29; 94-95, 2; 03-04, 73)
y en su caso formular predicciones. De forma general, se consideran dos tipos: Cuando se habla de variable se hace referencia a un símbolo (x, y, a, b, etc.)
que puede tomar cualquier modalidad (valor) de un conjunto determinado,
• Estadística descriptiva (EIR 99-00, 5; 04-05, 16). Describe, analiza y re- que se denomina dominio de la variable o rango. En función del tipo de do-
presenta un grupo de datos utilizando métodos numéricos y gráficos minio, las variables se clasifican del siguiente modo:
que resumen y presentan la información contenida en ellos.
• Estadística inferencial. Apoyándose en el cálculo de probabilidades y a • Variables cualitativas, cuando las modalidades posibles son de tipo no-
partir de datos muestrales, efectúa estimaciones, decisiones, predic- minal. Por ejemplo, el grupo sanguíneo tiene por modalidades los gru-
ciones u otras generalizaciones sobre un conjunto mayor de datos. pos sanguíneos posibles: A, B, AB, O.
• Variables cuasi cuantitativas u ordinales (EIR 01-02, 64) son las que,
Conceptos básicos aunque sus modalidades son de tipo nominal, es posible establecer un
orden entre ellas. Por ejemplo, si se estudia el grado de recuperación
Elementos, población, muestra de un paciente al aplicarle un tratamiento, se puede tener como moda-
Se establecen a continuación algunas definiciones fundamentales como son: lidad el grado de recuperación, que se puede considerar como nada,
elemento, población, muestra, caracteres, variables, etc., a las cuales se hará poco, moderado, bueno o muy bueno. A veces se representan este tipo
referencia continuamente a lo largo del capítulo. de variables en escalas numéricas, por ejemplo, puntuar el dolor en una
escala de 1 a 5. Hay que evitar sin embargo realizar operaciones alge-
Individuos o elementos braicas con estas cantidades, es decir, un dolor de intensidad 4 no duele
Personas u objetos que contienen cierta información que se desea estudiar: el doble que otro de intensidad 2.
• Variables cuantitativas o numéricas son las que tienen por modalidades
• Caracteres: propiedades, rasgos o cualidades de los elementos de la po- cantidades numéricas con las que se pueden hacer operaciones aritmé-
blación. Estos caracteres pueden dividirse en cualitativos y cuantitativos. ticas. Dentro de este tipo de variables se pueden distinguir dos grupos:
• Modalidades: diferentes situaciones posibles de un carácter. Las mo- – Discretas, cuando no admiten siempre una modalidad interme-
dalidades deben ser a la vez exhaustivas y mutuamente excluyentes, dia entre dos cualesquiera de sus modalidades. Un ejemplo es el
es decir, cada elemento posee una y sólo una de las modalidades po- número de hijos en una población de familias; número de hijos
sibles. posibles: 0, 1, 2, 3, 4, 5, etc.
• Clases: conjunto de una o más modalidades en el que se verifica que – Continuas, cuando admiten una modalidad intermedia entre dos
cada modalidad pertenece a una y sólo una de las clases. cualesquiera de sus modalidades, por ejemplo el peso X de un
niño al nacer.
Población
Conjunto de individuos o elementos que cumplen ciertas propiedades comu- Ocurre a veces que una variable cuantitativa continua por naturaleza, aparece
nes. En relación al tamaño, puede ser: como discreta. Este es el caso en que hay limitaciones en lo que concierne a la
precisión del aparato de medida de esa variable, como si se mide la altura de
• Finita, como es el caso del número de personas que llegan al servicio una persona en metros con una regla que ofrece dos decimales de precisión, en
de urgencia de un hospital en un día. cuyo caso se podrán obtener alturas medidas en cm: 150, 151, 152, 153, etc.
• Infinita, si por ejemplo se estudia el mecanismo aleatorio que describe
la secuencia de caras y cruces obtenida en el lanzamiento repetido de En realidad lo que ocurre es que con cada una de esas mediciones se expresa
una moneda al aire. que el verdadero valor de la misma se encuentra en un intervalo de radio 0,005.
Por tanto, cada una de las observaciones de X representa más bien un intervalo
Muestra que un valor concreto. Tal como se ha citado anteriormente, las modalidades son
Es un subconjunto representativo de una población. las diferentes situaciones posibles que puede presentar la variable. A veces
éstas son muy numerosas (p. ej.: cuando una variable es continua) y conviene
Parámetro reducir su número, agrupándolas en una cantidad inferior de clases. Estas cla-
Es la función definida sobre los valores numéricos de características medibles ses deben ser construidas de modo que sean exhaustivas y excluyentes, es decir,
de una población. cada modalidad debe pertenecer a una y sólo una de las clases.

1166
Bioestadística:maquetaEIR.qxp 22/07/09 12:57 Página 1167

bioestadística

Te conviene recordar...

4 La estadística se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos,
siempre y cuando la variabilidad e incertidumbre sea una causa intrínseca de los mismos; así como de realizar inferencias a par-
tir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones.
4 La estadística descriptiva describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resu-
men y presentan la información contenida en ellos.
4 La estadística inferencial, apoyándose en el cálculo de probabilidades y a partir de datos muestrales, efectúa estimaciones, de-
cisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos.
4 Los caracteres de un elemento pueden ser de muy diversos tipos, por lo que se pueden clasificar en dos grandes clases: varia-
bles cuantitativas y variables cualitativas o atributos.

TÉCNICAS DE RECUENTO – Porcentaje. La frecuencia relativa es un tanto por uno, sin embargo,
hoy día es bastante frecuente hablar siempre en términos de tan-
Hoy en día, para realizar un estudio estadístico importante se recurre a los or- tos por ciento o porcentajes, por lo que esta medida resulta de mul-
denadores, ya sea por medio de programas de estadística específicos (BMDP, tiplicar la frecuencia relativa por 100. Quedará denotada por pi.
SPSS) o bien utilizando herramientas informáticas de propósito general como
bases de datos u hojas de cálculo. pi = fi • 100%

Distintos tipos de frecuencia • Frecuencia absoluta acumulada. Para poder calcular este tipo de fre-
cuencias hay que tener en cuenta que la variable estadística ha de ser
Uno de los primeros pasos que se realizan en cualquier estudio estadístico es cuantitativa o cualitativa ordinal. En otro caso no tiene mucho sentido
la tabulación de resultados, es decir, recoger la información de la muestra re- el cálculo de esta frecuencia. La frecuencia absoluta acumulada de un
sumida en una tabla en la que a cada valor de la variable se le asocian deter- valor de la variable es el número de veces que ha aparecido en la
minados números que representan el número de veces que ha aparecido, su muestra un valor menor o igual que el de la variable y se representa
proporción con respecto a otros valores de la variable, etc. Estos números se como Ni.
denominan frecuencias. Así, se puede hablar de los siguientes tipos de fre- • Frecuencia relativa acumulada. Al igual que en el caso anterior la fre-
cuencia: cuencia relativa acumulada es la frecuencia absoluta acumulada divi-
dida por el tamaño de la muestra, y queda representada como Fi.
• Frecuencia absoluta. La frecuencia absoluta de una variable estadística
es el número de veces que aparece en la muestra dicho valor de la va- Ni
Fi =
riable; se representa como ni. N
• Frecuencia relativa. La frecuencia absoluta es una medida que está in-
fluida por el tamaño de la muestra, es decir, al aumentar el tamaño de – Porcentaje acumulado. Análogamente se define el porcentaje acu-
la muestra aumentará también el tamaño de la frecuencia absoluta. mulado como la frecuencia relativa acumulada por 100 (Pi).
Esto hace que no sea una medida útil para poder comparar. Para esto
es necesario introducir el concepto de frecuencia relativa, que es el co- Pi = Fi • 100%
ciente entre la frecuencia absoluta y el tamaño de la muestra. Se repre-
senta como fi, donde N = tamaño de la muestra. En la Tabla 1 se puede observar un ejemplo en el que se han tomado datos re-
n lativos a las personas activas. En este ejemplo se puede ver fácilmente cómo
fi = i se calculan estas frecuencias.
N

Tabla 1. Ejemplo práctico del cálculo de las distintas frecuencias

Personas activas Número familias


Xi ni fi pi Ni Fi Pi
1 16 16/50 32 % 16 16/50 32 %
2 20 20/50 40 % 36 36/50 72 %
3 9 9/50 18 % 45 45/50 90 %
4 5 5/50 10 % 50 50/50 100 %
Total 50

1167
Bioestadística:maquetaEIR.qxp 22/07/09 12:57 Página 1168

Manual DAE de enfermería. EIR. Oposiciones ••

Medidas estadísticas • Media armónica. La media armónica de N observaciones es la inversa


de la media de las inversas de las observaciones y se representa como
Las variables estadísticas cuantitativas se dividen o clasifican en discretas o H. Al igual que en el caso de la media geométrica su utilización es poco
continuas, por lo que hay que precisar cómo se calculan dichas medidas en frecuente.
cada caso.
Mediana (EIR 93-94, 31)
En las variables cuantitativas continuas, dado que la tabulación de los datos La mediana es el valor central de la variable, es decir, supuesta la muestra or-
se hace mediante intervalos, es necesario tomar un valor del intervalo para denada en orden creciente o decreciente, el valor que divide en dos partes la
poder operar. Este valor se denomina marca de clase y es el punto medio del muestra. Para calcular la mediana hay que tener en cuenta si la variable es dis-
intervalo. creta o continua.

Las medidas estadísticas pretenden resumir la información de la muestra para Moda (EIR 94-95, 3)
poder tener así un mejor conocimiento de la población. Se clasifican en: La moda es el valor de la variable que tenga mayor frecuencia absoluta, la
que más se repite. Es la única medida de centralización que tiene sentido es-
• Medidas de centralización: que sirven para determinar los valores cen- tudiar en una variable cualitativa, pues no precisa la realización de ningún
trales o medios de la distribución. cálculo.
• Medidas de dispersión: dan una idea sobre la representatividad de
las medidas centrales; a mayor dispersión menor representativi- Por su propia definición, la moda no es única, pues puede haber dos o más va-
dad. lores de la variable que tengan la misma frecuencia siendo ésta máxima. En
• Medidas de localización: útiles para encontrar determinados valores ese caso se habla de una distribución bimodal o polimodal, según el caso.
importantes, para una clasificación de los elementos de la muestra o po-
blación. Medidas de dispersión
• Medidas de simetría: sirven para ver si la distribución tiene el mismo Hasta el momento se han estudiado los valores centrales de la distribución,
comportamiento por encima y por debajo de los valores centrales. pero también es importante conocer si los valores en general están cerca o ale-
jados de estos valores centrales, es por lo que surge la necesidad de estudiar
Algunas consideraciones las medidas de dispersión.
El estadístico Yule ha definido algunas propiedades deseables para una me-
dida estadística: Rango (EIR 96-97, 1)
Se define como la diferencia existente entre el valor mayor y el menor de la
• Debe definirse de manera objetiva: dos observadores distintos deben distribución. Se representa como R. Realmente no es una medida muy signi-
llegar al mismo resultado numérico. ficativa en la mayoría de los casos, pero indudablemente es muy fácil de cal-
• Usar todas las observaciones y no algunas de ellas solamente, de ma- cular.
nera que si varía alguna observación la medida considerada debe refle-
jar esta variación. Desviación
• Tener un significado concreto: la interpretación debe ser inmediata y Se puede hablar de desviación con respecto a cualquiera de las medidas de
sencilla. centralización, sin embargo, la más utilizada es con respecto a la media. Así,
• Ser sencilla de calcular. la desviación es la diferencia que se observa entre el valor de la variable y la
• Prestarse fácilmente al cálculo algebraico, lo que permitirá demostra- media aritmética. Se representa como di .
ciones más elegantes.
• Ser poco sensible a las fluctuaciones muestrales. Esta condición es im- En realidad no es una medida, sino que son muchas medidas, pues cada valor
prescindible en la estadística matemática y en la teoría de sondeos. de la variable lleva asociada su correspondiente desviación, por lo que se ne-
cesita una medida que resuma dicha información. Para resolver este pro-
Medidas de centralización blema, existen dos caminos:

Media (EIR 93-94, 30) • Tomar el valor absoluto de las desviaciones: desviación media.
• Media aritmética. La media aritmética de una variable se define como • Elevar al cuadrado las desviaciones: varianza.
la suma ponderada de los valores de la variable por sus frecuencias re-
lativas y se representa como –x. Desviación media
– Propiedades: si se multiplican o dividen todas las observaciones Es la media de los valores absolutos de las desviaciones, y se representa como
por un mismo número, la media queda multiplicada o dividida dm.
por dicho número. Si se les suma a todas las observaciones un
mismo número, la media aumentará en dicha cantidad. Varianza
Es la media de los cuadrados de las desviaciones, y se representa como S2x o
Además de la media aritmética existen otros conceptos de media, como son también como σ2x. Este estadístico tiene el inconveniente de ser poco signi-
la media geométrica y la media armónica. ficativo, pues se mide en el cuadrado de la unidad de la variable. Por ejemplo,
si la variable viene dada en cm, la varianza vendrá en cm2.
• Media geométrica. La media geométrica de N observaciones es la raíz
de índice N del producto de todas las observaciones. Se representa como Otros dos estadísticos importantes son la cuasi varianza y la cuasi desviación
G. Sólo se puede calcular si no hay observaciones negativas. Es una me- típica, que como se verá más adelante, son los estimadores de la varianza y
dida estadística poco o nada usual. desviación típica poblacionales respectivamente.

1168
Bioestadística:maquetaEIR.qxp 22/07/09 12:57 Página 1169

bioestadística

• Cuasi varianza. Es una medida de dispersión, cuya única diferencia con • Q2 = Valor de la variable que deja a la izquierda el 50% de la distribu-
la varianza es que se divide por N-1. Se representa como S2N-1 o σ2N-1. ción = mediana.
• Cuasi desviación típica. Es la raíz cuadrada de la cuasi varianza y se re- • Q3 = Valor de la variable que deja a la izquierda el 75% de la distribu-
presenta como ción.

SN-1 o σ N-1. SN-1 = σ N-1 = N •σ . Al igual que ocurre con el cálculo de la mediana, el cálculo de estos estadís-
x
N-1 ticos depende del tipo de variable.

Todas estas medidas de dispersión vienen influidas por la unidad en la que se Deciles
mide la variable, esto implica que si se cambia de unidad de medida, los va- Medida de localización que divide la población o muestra en 10 partes igua-
lores de estos estadísticos se verán a su vez modificados. Además, no permite les. No tiene mucho sentido calcularlas para variables cualitativas discretas.
comparar, por ejemplo, en un grupo de alumnos si los pesos o las alturas pre-
sentan más dispersión, pues no es posible comparar unidades de distinto tipo. Percentiles (EIR 04-05, 17)
Se necesita, por lo tanto, una medida escalar, es decir, que no lleve asociada Medida de localización que divide la población o muestra en 100 partes
ninguna unidad de medida. iguales. No tiene mucho sentido calcularlas para variables cualitativas dis-
cretas.
Coeficiente de variación
Es un estadístico de dispersión que tiene la ventaja de que no lleva asociada Medidas de simetría (EIR 02-03, 106)
ninguna unidad, por lo que permitirá decir, entre dos muestras, cuál es la que Las medidas de la simetría, al igual que la curtosis, van a ser medidas de la
presenta mayor dispersión. Se denomina C.V. forma de la distribución. Es frecuente que los valores de una distribución tien-
dan a ser similares a ambos lados de las medidas de centralización. La sime-
Medidas de localización: cuartiles, deciles y percentiles tría es importante para saber si los valores de la variable se concentran en una
Las medidas de localización dividen la distribución en partes iguales, sirven determinada zona del recorrido de la variable (Ver Imagen 1).
para clasificar a un individuo o un elemento dentro de una determinada po-
blación o muestra. Así, en psicología, los resultados de los test o pruebas que Para medir la asimetría se atenderá básicamente a dos criterios:
se realizan a un determinado individuo, sirven para clasificar a dicho sujeto en
una determinada categoría en función de la puntuación obtenida. • Comparación de la media y la moda.
• Comparación de los valores de la variable con la media.
Cuartiles (EIR 02-03, 110)
Medida de localización que divide la población o muestra en cuatro partes Medidas de apuntamiento, curtosis
iguales. La curtosis es una medida de apuntamiento, que indicará si la distribución es
muy apuntada o poco apuntada. Como se puede observar en la Imagen 2, el
• Q1 = Valor de la variable que deja a la izquierda el 25% de la distribución. coeficiente de curtosis mide el grado de apuntamiento de la distribución.

As < 0 As = 0 As > 0

Asimetría negativa a la izquierda Simétrica Asimetría positiva a la derecha

100 100 100

90 90 90

80 80 80

70 70 70

60 60 60

60 60 60

40 40 40

30 30 30

20 20 20

10 10 10

0 0 0
11 29 47 65 83 101 119 137 155 173 191 11 29 47 65 83 101 119 137 155 173 191 11 29 47 65 83 101 119 137 155 173 191

Imagen 1. Gráficos que representan las medidas de simetría o asimetría

1169
Bioestadística:maquetaEIR.qxp 22/07/09 12:57 Página 1170

Manual DAE de enfermería. EIR. Oposiciones ••

Curtosis negativa Curtosis nula Curtosis positiva

Platicúrtica Mesocúrtica Leptocúrtica

100 100 100

90 90 90

80 80 80

70 70 70

60 60 60

60 60 60

40 40 40

30 30 30

20 20 20

10 10 10

0 0 0
11 29 47 65 83 101 119 137 155 173 191 11 29 47 65 83 101 119 137 155 173 191 11 29 47 65 83 101 119 137 155 173 191

Imagen 2. Curtosis

Te conviene recordar...

4 Uno de los primeros pasos que se realizan en cualquier estudio estadístico es la tabulación de resultados, es decir, recoger la
información de la muestra resumida en una tabla en la que a cada valor de la variable se le asocian determinados números que
representan el número de veces que ha aparecido, su proporción con respecto a otros valores de la variable, etc. Estos núme-
ros se denominan frecuencias.
4 Las medidas estadísticas pretenden resumir la información de la muestra para poder tener así un mejor conocimiento de la po-
blación. Se clasifican en:
– Medidas de centralización.
– Medidas de dispersión.
– Medidas de localización.
– Medidas de simetría.
– Medidas de apuntamiento.

PROBABILIDAD (EIR 01-02, 52, 105; 02-03, 109; 04- significa el hecho de que la probabilidad de error ante esa afirmación sea
05, 18) de 0,05.

La Teoría de la Probabilidad constituye la base o fundamento de la Estadística, Así pues, es corriente hablar de la probabilidad de un suceso, entendiendo
ya que las ingerencias sobre la población o poblaciones en estudio se move- como tal un número entre 0 y 1, de forma que si éste es más cercano a 0 o a
rán dentro de unos márgenes de error controlado, el cual será medido en tér- 1, el suceso tiene poca o mucha probabilidad, respectivamente, de ocurrir o
minos de probabilidad. haber ocurrido, aunque ya en el ejemplo anterior se trasluce, por un lado, una
probabilidad científica de que el informe estuviera equivocado, y, por otro,
Dado que la Estadística se utiliza con mucha frecuencia hoy en día, incluso unas probables causas para estos resultados. Conviene, por tanto, precisar en
en el lenguaje cotidiano, es conveniente entender con toda precisión qué es cada caso de qué se está hablando, tratando de evitar afirmaciones tan comu-
lo que se dice, por ejemplo, en los medios de comunicación, cuando se hace nes en los medios de comunicación como la de “mañana es posible que llueva
referencia a la probabilidad de algún suceso. pero no es probable”.

Así, es corriente oír que la probabilidad de que un recién nacido sea varón Espacio muestral
es aproximadamente del 50 %, que es muy poco probable que llueva en To-
rremolinos en la segunda quincena del mes de julio, o, incluso, se pueden La Estadística, y por tanto el cálculo de probabilidades, se ocupan de los de-
leer en la prensa cosas tales como que “en una evaluación internacional nominados fenómenos o experimentos aleatorios. El conjunto de todos los
sobre matemáticas y ciencias, desarrollada por la National Assessment of resultados posibles diferentes de un determinado experimento aleatorio se
Educational Progress de Estados Unidos, entre escolares españoles de 13 denomina espacio muestral asociado a dicho experimento y se suele repre-
años, los chicos muestran un mejor rendimiento en matemáticas que las sentar por el símbolo Ω. A los elementos de Ω se les denomina sucesos ele-
chicas”, haciendo esta afirmación con un margen de error muy pequeño mentales.
(del 5 %). El informe no afirma, claro está, que los niños tengan una mayor
aptitud o una mayor capacidad para las matemáticas, sino que “probable- Así, por ejemplo, el espacio muestral asociado al experimento aleatorio con-
mente” estos resultados son la consecuencia de unos determinados com- sistente en el lanzamiento de una moneda es: Ω = {cara, cruz}; el espacio
portamientos sociales. En todo caso, es interesante tener muy claro qué muestral asociado al lanzamiento de un dado es: Ω = {1, 2, 3, 4, 5, 6}, siendo

1170
Bioestadística:maquetaEIR.qxp 22/07/09 12:57 Página 1171

bioestadística

cara y cruz los sucesos elementales asociados al primer experimento alea- Se puede considerar como espacio muestral Ω1 = {ω1, ω2, ω3} donde ω1 =
torio y 1, 2, 3, 4, 5 y 6 los sucesos elementales del segundo experimento. bola roja, ω2 = bola blanca y ω3 = bola verde, aunque también se podía haber
considerado como espacio muestral el conjunto Ω1= {ω1, ω2, ω3, ω4, ω5, ω6}
A pesar de la interpretación que tiene el espacio muestral, no es más que un donde ωi = bola roja, i = 1, 2, 3; ωi = bola blanca, i = 4, 5 y ω6= bola verde,
conjunto abstracto de puntos (los sucesos elementales), por lo que el len- haciendo las bolas distinguibles.
guaje, los conceptos y propiedades de la teoría de conjuntos constituyen un
contexto natural en el que desarrollar el cálculo de probabilidades. Ambos pueden ser considerados espacios muestrales del experimento des-
crito, eligiendo el que más convenga, por ejemplo, a la hora de asignar la pro-
Sea A el conjunto de las partes, es decir, el conjunto de todos los subconjun- babilidad a los sucesos elementales de uno u otro espacio muestral.
tos de Ω. En principio, cualquier elemento de A, es decir, cualquier subconjunto
del espacio muestral, contendrá una cierta incertidumbre, por lo que se inten- Conceptos de probabilidad
tará asignarle un número entre 0 y 1 como medida de su incertidumbre. En
cálculo de probabilidades dichos subconjuntos reciben el nombre de suce- En la sección anterior se ha visto que a cada suceso A le corresponde su pro-
sos, siendo la medida de la incertidumbre su probabilidad. La tripleta (Ω, A, babilidad P(A), pero, ¿este número viene dado?, ¿es un número descono-
P) recibe el nombre de espacio probabilístico. cido?, ¿hay que calcularlo?

Por tanto, asociado a todo experimento aleatorio existen tres conjuntos: el es- En los casos más sencillos bastará con asignar la probabilidad a los suce-
pacio muestral, la clase de los sucesos, es decir, el conjunto de los elementos sos elementales de un experimento aleatorio. La probabilidad de los demás
con incertidumbre asociados a un experimento aleatorio A, y una función real, sucesos se podrá calcular utilizando las propiedades que más adelante se
P:A[0, 1], la cual asignará a cada suceso (elemento de A) un número entre 0 verán.
y 1 como medida de su incertidumbre.
En los casos más complicados (que habitualmente se corresponderán con las
No obstante, la elección del espacio muestral asociado a un experimento alea- situaciones reales) se asignará un modelo probabilístico al experimento en
torio no tiene por qué ser única, sino que dependerá de qué sucesos elemen- cuestión, como ideal que se cree corresponde a la situación en estudio, ideal
tales se quieran considerar como distintos y del problema de la asignación que habrá que chequear inferencialmente. Más adelante se tratará el tema
de la probabilidad sobre esos sucesos elementales. de la asignación de probabilidades.

Respecto a la clase de los sucesos A, es natural que ésta tenga una estruc- Conceptualización
tura tal que permita hablar no sólo de sucesos sino también de su unión,
intersección, diferencia, complementario, etc., debiendo ser la clase A, en Concepto frecuentista
consecuencia, cerrada a dichas operaciones entre conjuntos (entre suce- Es un hecho empíricamente comprobado que la frecuencia relativa de un su-
sos). Esta es la situación del conjunto de las partes cuando es finito o in- ceso tiende a estabilizarse cuando la frecuencia total aumenta.
cluso numerable (caso, por ejemplo, del espacio muestral asociado al
experimento aleatorio consistente en lanzar una moneda hasta que salga Surge así el concepto frecuentista de la probabilidad de un suceso como un
cara por primera vez). número ideal al que converge su frecuencia relativa cuando la frecuencia total
tiende a infinito.
En otras ocasiones en las que sea un conjunto continuo (por ejemplo, cuando
se estudia el tiempo que tarda un isótopo radioactivo en volverse inestable), Así, se suele afirmar que la probabilidad de que salga un seis al tirar un dado
deberá ser A un conjunto estrictamente más pequeño que el conjunto de las es 1/6 porque al hacer un gran número de tiradas su frecuencia relativa es
partes de Ω. aproximadamente esa. El problema radica en que al no poder repetir la expe-
riencia infinitas veces, la probabilidad de un suceso ha de ser aproximada por
En todo caso, A es el conjunto que contiene todos los elementos de interés, es su frecuencia relativa para un n suficientemente grande, y ¿cuán grande es un
decir, todos los sucesos a los que les corresponde una probabilidad. n grande?, o, ¿qué hacer con aquellas experiencias que sólo se pueden repe-
tir una vez?
Hay que destacar además algunas peculiaridades del cálculo de probabi-
lidades respecto a la teoría de conjuntos. Aquí, el conjunto vacío 0 recibe Concepto clásico
el nombre de suceso imposible, definido como aquel subconjunto que no Está basado en el concepto de resultados igualmente verosímiles y motivado
contiene ningún suceso elemental y que corresponde a la idea de aquel por el denominado Principio de la Razón Insuficiente, el cual postula que si no
suceso que no puede ocurrir. De forma análoga, el espacio total recibe el existe un fundamento para preferir una entre varias posibilidades, todas deben
nombre de suceso seguro al recoger dicha denominación la idea que repre- ser consideradas equiprobables.
senta. Serán sucesos incompatibles aquéllos cuya intersección sea el su-
ceso imposible. Así, en el lanzamiento de una moneda perfecta la probabilidad de cara debe
ser igual que la de cruz y, por tanto, ambas iguales a 1/2. De la misma ma-
Por último, la inclusión de sucesos A B se interpreta aquí como que siempre nera, la probabilidad de cada uno de los seis sucesos elementales asociados
que se cumpla el suceso A se cumple el B; por ejemplo, siempre que salga el al lanzamiento de un dado debe ser 1/6.
2 (suceso A) sale par (suceso B).
Laplace recogió esta idea y formuló la regla clásica del cociente entre casos fa-
Ejemplo: urna vorables y casos posibles, supuestos éstos igualmente verosímiles. El pro-
Se considera un experimento aleatorio consistente en extraer una bola al azar blema aquí surge porque, en definitiva, igualmente verosímil es lo mismo
de una urna compuesta por tres bolas rojas, dos blancas y una verde. que igualmente probable, es decir, se justifica la premisa con el resultado.

1171
Bioestadística:maquetaEIR.qxp 22/07/09 12:57 Página 1172

Manual DAE de enfermería. EIR. Oposiciones ••

Además ¿qué ocurre cuando se considera un experimento donde no se da esa global un modelo probabilístico a la característica que se estudie, el cual re-
simetría?, o, ¿qué hacer cuando el número de resultados posibles es infinito? cibe el nombre de distribución de probabilidad. No obstante, en esa modeli-
zación global de la realidad, siempre será posible descender hasta la
Concepto subjetivo probabilidad que tiene asociada.
Se basa en la idea de que la probabilidad que una persona da a un suceso
debe depender de su juicio y experiencia personal, pudiendo dar dos perso- La asignación, tanto en un nivel elemental como en forma de distribución
nas distintas probabilidades diferentes a un mismo suceso. Estas ideas pue- modelo, podrá ser contrastada con las observaciones del experimento alea-
den formalizarse, y si las opiniones de una persona satisfacen ciertas torio, de forma que se pueda estar razonablemente seguro de las conclusio-
relaciones de consistencia, puede llegarse a definir una probabilidad para nes.
los sucesos.
Dentro de las posibles asignaciones de probabilidad existe una que destaca,
El principal problema a que da lugar esta definición es que dos personas di- tanto por ser una de las más utilizadas como por obtenerse de ella interesan-
ferentes pueden dar probabilidades diferentes a un mismo suceso. tes propiedades. Se trata del denominado modelo uniforme.

Ejemplo Modelo uniforme


Un estudio sobre el color de los ojos en niños recién nacidos de una población
determinada dio la distribución de frecuencias relativas que se muestra en la En esta sección se expondrá un caso particular muy importante, el cual se co-
Tabla 2. rresponde con una situación en la que los sucesos elementales del espacio
muestral puedan ser considerados como equiprobables.
Suponiendo que no se considere el componente genético que esta caracte-
rística tiene, esto es, no teniendo en cuenta el color de ojos de los padres, se Ejemplo 1
podría considerar esta distribución de frecuencias como una buena aproxi- El experimento aleatorio consiste en lanzar una moneda al aire. En el espacio
mación de la probabilidad y decir, por ejemplo, que la probabilidad que tiene muestral asociado, Ω = {cara, cruz}, ambos sucesos elementales pueden con-
un recién nacido de esta población de tener los ojos claros es: P {ojos claros} siderarse como equiprobables.
= P {azules} + P {verdes} = 0,05 + 0,02 = 0,07.
Ejemplo 2
A veces es precisamente la asignación de la probabilidad la que determina Si se selecciona al azar una carta de una baraja española, los 40 sucesos ele-
el espacio muestral. Así, en el ejemplo del experimento aleatorio consis- mentales correspondientes a las 40 cartas pueden ser considerados como
tente en extraer una bola al azar de una urna compuesta por tres bolas rojas, equiprobables, estando de nuevo ante un esquema de modelo uniforme.
dos blancas y una verde, si se considera como espacio muestral Ω2 = {ω1, ω2,
ω3, ω4, ω5, ω6} en donde era ωi = bola roja, i = 1, 2, 3; ωi = bola blanca, i Ejemplo 3
= 4, 5; y ω6 = bola verde, los seis sucesos elementales pueden ser conside- El experimento aleatorio consiste en dividir el intervalo [0,1] en tres trozos
rados como equiprobables, siendo en ese caso P(ωi) = 1/6, mientras que si eligiendo dos puntos x1, x2 Є [0, 1] al azar. De nuevo, al ser al azar la elección
se considera como espacio muestral Ω1 = {ω1, ω2, ω3} en donde era ω1 = de los puntos, es un modelo uniforme.
bola roja, ω2 = bola blanca y ω3 = bola verde, los sucesos dejan ya de ser
equiprobables, por lo que, en una situación más compleja, la elección de un Ejemplo 4
espacio muestral en el que los sucesos elementales sean equiprobables El experimento aleatorio consiste en lanzar al aire una moneda dos veces. El
puede ser más adecuada. espacio muestral que razonablemente vendrá asociado será = {(C, C), (C, X),
(X, X)}, siendo C y X, respectivamente, la cara y la cruz de la moneda.
Aquí, por las propiedades estudiadas en la sección anterior, es equivalente
utilizar Ω2 con sucesos elementales equiprobables, que utilizar Ω1 con P(ω1) En este espacio muestral los sucesos no son equiprobables, aunque puede
= 3/6, P(ω2) = 2/6 y P(ω3) = 1/6. conseguirse esta simetría si se considera como espacio muestral = {(C, C),
(C, X), (X, C), (X, X)}.
Sin embargo, la mayoría de los fenómenos aleatorios que se observan en la
naturaleza admiten un esquema tan sencillo que ni será necesario detallar En todos estos casos de modelos uniformes, en especial en los que el espa-
esta asignación en los sucesos elementales en la mayoría de las situaciones cio muestral es finito, Ω ={ω1, ω2, ..., ωn} el cálculo de las probabilidades de
reales. Se podrá actuar en una forma más encapsulada, asignando de forma los sucesos resulta sencillo, ya que al ser los sucesos elementales incompati-
bles y equiprobables, será 1 = P(Ω) = P(ω1) + ... + P(ωn) = n · P(ωi), con
lo que P(ωi) = 1/n, ∀ i=1, ..., n. Por tanto, si un suceso A es unión de k su-
Tabla 2. Frecuencias relativas en estudio sobre el cesos elementales, será:
color de los ojos P(A) = nk = casos favorables a A
casos posibles

Color Fi con lo que, en definitiva, el cálculo de probabilidades de sucesos en un mo-


delo uniforme se limita a contar el número de casos favorables a dicho suceso
Azules 0,05 y el número de casos posibles.
Verdes 0,02
Castaños 0,69 No obstante, dicho cómputo no resulta siempre fácil por lo que es conve-
Negros 0,24 niente tener presente las fórmulas de las variaciones, combinaciones y permu-
taciones, ya que éstas facilitarán el cálculo.

1172
Bioestadística:maquetaEIR.qxp 22/07/09 12:57 Página 1173

bioestadística

Si de un grupo de N elementos se toman n importando el orden de los n ele- que ahora la probabilidad (condicionada) de obtener negra se habrá redu-
mentos seleccionados, habrá variaciones y, si no importa el orden, combina- cido y habrá aumentado la de blanca.
ciones. Además, si se admite la posibilidad de que entre estos n pueda haber
elementos repetidos, se tratará, respectivamente, de variaciones y de combi- Teorema de la probabilidad total. Teorema de Bayes
naciones con repetición. (EIR 01-02, 55; 03-04, 74)
Por último, si solamente se quiere contar el número posible de reordenacio- Teorema de la probabilidad total
nes de un conjunto de elementos, se habla de permutaciones con o sin repe- En el cálculo numérico de probabilidades tiene una gran aplicación práctica
tición dependiendo de que se admita o no la posibilidad de que haya el siguiente resultado. Sea un espacio probabilístico (Ω, A, P) y {An} ⊂ A una
elementos repetidos. partición de sucesos de Ω. Es decir, ∪n An = Ω y Ai ∩ Aj = Ø para todo i ≠ j.

Las fórmulas son: Entonces, para todo suceso B ⊂ A es P(B) = Σn P(B/An) · P(An).
• Variaciones de N elementos tomados de n en n: V N, n = N · (N - 1) · ... ·
(N - n +1). Resultado que se puede parafrasear diciendo que la probabilidad de un suceso
• Variaciones con repetición de N elementos tomados de n en n: VR N, n = Nn. que se puede dar de varias formas es igual a la suma de los productos de las

• Combinaciones de N elementos tomados de n en n: C N, n = n =


N!
N
() probabilidades de éste en cada una de esas formas, P(B/An), por las probabi-
lidades de que se den estas formas, P(An).

n! (N – n)! Ejemplo
Una población está formada por tres grupos étnicos: A (un 30%), B (un 10%)
• Combinaciones con repetición de N elementos tomados de n en n: y C (un 60%). Además se sabe que el porcentaje de personas con ojos claros
en cada una de estas poblaciones es, respectivamente, del 20%, 40% y 5%.
(n )(
N–1 )
CRN,n = N + n – 1 = N + n – 1 = (N + n – 1)!
n! (N – 1)!
Por el teorema de la probabilidad total, la probabilidad de que un individuo
elegido al azar de esta población tenga ojos claros es: P(ojos claros) = P(A) ·
P(ojos claros/A) + P(B) · P(ojos claros/B) + P(C) · P(0jos claros/C ) = 0,3 ·
• Permutaciones de N elementos: PN = N! = N · (N - 1) · ... · 2 · 1 0,2 + 0,1 · 0,4 + 0,6 · 0,05 = 0,13.
• Permutaciones con repetición de N elementos, uno de los cuales se re-
pite n1 veces, otro n2 veces, ..., otro nr veces: PR n1,...,nr = N! Teorema de Bayes
N n1!. n2!.....nr! El siguiente teorema es un resultado con una gran carga filosófica detrás, el
cual mide el cambio que se va produciendo en las probabilidades de los su-
Ejemplo 5 cesos a medida que se van haciendo observaciones. Paradójicamente a su
Una enciclopedia en seis volúmenes es colocada en una estantería de forma importancia, su demostración no es más que la aplicación de la definición de
aleatoria. La probabilidad de que resulte colocada de forma correcta, supuesto probabilidad condicionada seguida de la aplicación del teorema de la proba-
que esto signifique empezar a contar por la izquierda, será: bilidad total.

P(A) = casos favorables 1 1


casos posibles = 6! = 720 Sea un espacio probabilístico (Ω, A, P) y {An} ⊂ A una partición de sucesos de
Ω y B A un suceso con probabilidad positiva. Entonces, para todo suceso Ai es
P(Ai).P(B/Ai)
Probabilidad condicionada. Sucesos independientes P(Ai/B)=
∑ P(An).P(B/An)
n
Probabilidad condicionada
Mediante un espacio probabilístico se da una formulación matemática a un Este teorema tiene una interpretación intuitiva muy interesante. Si las cosas
fenómeno aleatorio que se esté observando. Parece por tanto razonable que que pueden ocurrir están clasificadas en los sucesos Ai de los cuales se cono-
si se observa algo que aporte información al fenómeno aleatorio, ésta deba cen sus probabilidades P(Ai), denominadas a priori, y se observa un suceso B,
alterar el espacio probabilístico de partida. la fórmula de Bayes da las probabilidades a posteriori de los sucesos A, ajus-
tadas o modificadas por B.
Por ejemplo, la extracción de una bola de una urna con tres bolas blancas y
dos negras puede formalizarse con un espacio probabilístico en el que los su- Ejemplo
cesos elementales sean las cinco bolas y donde la probabilidad sea uniforme Hay una urna de la cual sólo se sabe que o es la urna A1 con 3 bolas blancas
sobre estos cinco sucesos elementales, es decir, igual a 1/5. y 1 negra, o es la urna A2 con 3 bolas negras y 1 blanca.

Si se extrae una bola de la urna, es decir, si se observa el suceso A bola negra, Con objeto de obtener más información acerca de qué urna es, se realiza un
y no se devuelve a la urna, es razonable que el espacio probabilístico cambie experimento consistente en extraer una bola de la urna desconocida. Si se
en el sentido no sólo de que ahora ya habrá únicamente cuatro sucesos ele- supone que la bola extraída resultó blanca 1B y a priori ninguna de las dos
mentales, sino que además la función de probabilidad deberá cambiar en urnas es más verosímil que la otra, P(A1) = P(A2) = 1/2, entonces la fórmula
orden a recoger la información que la observación del suceso A proporcionó. de Bayes dice que las probabilidades a posteriori de cada urna son P(A1/1B)
=3/4 y P(A2/1B) =1/4, habiendo alterado de esta forma la creencia sobre la
Es decir, en el nuevo espacio probabilístico deberá hablarse de probabilidad urna. Antes se creía que eran equiprobables y ahora que es tres veces más
condicionada al suceso A, de forma que se recojan hechos tan evidentes como probable que la urna desconocida sea la A1.

1173
Bioestadística:maquetaEIR.qxp 22/07/09 12:57 Página 1174

Manual DAE de enfermería. EIR. Oposiciones ••

Pero, ¿qué ocurrirá si se extrae otra bola? Lógicamente, en la fórmula de Bayes La distribución de frecuencias por marcas de clase será (Ver Tabla 5), la cual
habrá que tomar ahora como probabilidades a priori las calculadas, 3/4 y 1/4, Σ
6
x . n i 388,5
pues éstas son las creencias sobre la composición de la urna, antes de volver i- l i
proporciona una media aritmética de a =— n =— = 11,426.
a realizar el experimento. 34
Para el cálculo de la mediana es necesario tomar la tabla de frecuencias ab-
Si se supone que la bola no fue reemplazada (se deja para el lector el caso de solutas acumuladas (Ver Tabla 6).
reemplazamiento), y sale una bola negra 2N, la fórmula de Bayes devolvería
la incertidumbre inicial, ya que sería P(A1/2N) = 1/2 y P(A2/2N) =1/2. Al ser n/2 = 17 y estar 11 < 17 < 21, la mediana estará en el intervalo [10,5,
—34 - 7
Si hubiera salido blanca, la fórmula de Bayes, al igual que la lógica, también 12), y aplicando la fórmula se obtiene: Me = 10,5 + — 2 . 1,5 = 11,4.
sería concluyente, P(A1/2B) =1 y P(A2/2B) =0. 10

La utilización de la fórmula de Bayes, es decir, la utilización de distribuciones


de probabilidad a posteriori como modelos en la estimación de parámetros,
al recoger ésta tanto la información muestral, P(B/Ai), como la información
Tabla 4. Distribución de frecuencias
a priori sobre ellos, P(Ai), constituye una filosofía inferencial de gran desarro-
llo en los últimos años, la cual, no obstante, tiene el inconveniente (o la ven- Ii ni fi Ni Fi
taja) de depender de la información a priori, la cual en muchas ocasiones es
subjetiva y por tanto, pudiendo ser diferente de un investigador a otro. 7,5-9 3 0'088 3 0'088
9-10,5 8 0'236 11 0'324
Ejemplo: niveles de colinesterasa 10,5-12 10 0'294 21 0'618
Se midieron los niveles de colinesterasa en un recuento de eritrocitos en 12-13,5 10 0'294 31 0'912
μmol/min/ml de 34 agricultores expuestos a insecticidas agrícolas, obtenién- 13,5-15 1 0'029 32 0'941
dose los datos que se reflejan en la Tabla 3. 15-16,5 2 0'059 34 1
34 1
Aplicando la fórmula de Sturges para el cálculo del número de intervalos en
que se dividen las observaciones se obtiene: k = 1 + 3,322 log10 34 = 1 +
3,322 · 1,53148 = 6,08757, es decir, una sugerencia de 6 intervalos. Como
el mayor valor es x(34) = 16,5 y el menor x(1) = 7,8, la longitud sugerida es 0,35
16,5–7,8
a= = 1,45 . 0,30
6
0,25
Parece, por tanto, razonable tomar como amplitud 1,5, obteniendo como
intervalos en los que clasificar los datos [7,5 – 9) , [9 – 10,5) , [10,5 – 12) , 0,20
[12 – 13,5) , [13,5 – 15) , [15 – 16,5]. Los datos agrupados en los interva-
0,15
los obtenidos proporcionan las cuatro siguientes distribuciones de frecuen-
cias (Ver Tabla 4). 0,10

0,05
Al tener los intervalos igual amplitud, la representación gráfica de su histo-
grama será la que muestra la Imagen 3.
7,5 9 10,5 12 13,5 15 16,5
Y el polígono de frecuencias relativas acumuladas tendrá una representación
gráfica de la forma que se refleja en la Imagen 4. Imagen 3. Histograma

Tabla 3. Ejemplo práctico del cálculo de las distintas frecuencias


Individuo Nivel Individuo Nivel Individuo Nivel
1 10,6 13 12,2 25 11,8
2 12,5 14 10,8 26 12,7
3 11,1 15 16,5 27 11,4
4 9,2 16 15,0 28 9,3
5 11,5 17 10,3 29 8,6
6 9,9 18 12,4 30 8,5
7 11,9 19 9,1 31 10,1
8 11,6 20 7,8 32 12,4
9 14,9 21 11,3 33 11,1
10 12,5 22 12,3 34 10,2
11 12,5 23 9,7
12 12,3 24 12,0

1174
Bioestadística:maquetaEIR.qxp 22/07/09 12:57 Página 1175

bioestadística

Se determina a continuación la séptima decila, para ello se vuelven a necesi-


tar las frecuencias acumuladas. Como es:
1,2 r . n = 7 . 23 = 23,8 . 21 < 23,8 < 31 el intervalo a considerar será
k 10
1 23,8 -21 . 1,5 = 12,42.
[12, 13,5), siendo p7/10 = 12 + —
10
0,8

0,6 El recorrido es: R = 15,75 – 8,25 = 7,5. La varianza en este ejemplo será: s2
= 133,97 - (11,426)2 = 3,42. La desviación típica de la distribución de fre-
0,4 cuencias es s = 1,1906 y el coeficiente de variación de Pearson es:
1, 85 . 100 = 16,19.
0,2 Vp = —
11,426
0 Una distribución es simétrica cuando su mediana, su moda y su media arit-
7,5 9 10,5 12 13,5 15 16,5 mética coinciden. Claramente la distribución de este ejemplo no es, por tanto,
simétrica. De la misma manera, se observa una ligera asimetría a la izquierda,
al ser el coeficiente de asimetría de Pearson: Ap = — 11,426 - 12 = 0,31.
Imagen 4. Polígono de frecuencias relativas acumuladas
1,85

Tabla 5. Distribución de frecuencias por marcas de clase


Intervalo Ii 7,5-9 9-10,5 10,5-12 12-13,5 13,5-15 15-16,5
Marca de Clase xi 8,25 9,75 11,25 12,75 14,25 15,75
Frecuencia ni 3 8 10 10 1 2 Σni = 25

Tabla 6. Frecuencias absolutas acumuladas


Intervalo Ii 7,5-9 9-10,5 10,5-12 12-13,5 13,5-15 15-16,5
Frecuencia ni 3 8 10 10 1 2
Frecuencia acumulada Ni 3 11 21 31 32 34

Te conviene recordar...

4 La Teoría de la Probabilidad constituye la base o fundamento de la Estadística, ya que las ingerencias sobre la población o po-
blaciones en estudio se moverán dentro de unos márgenes de error controlado, el cual será medido en términos de probabili-
dad.
4 Teorema de Bayes: teorema con una gran carga filosófica detrás, mide el cambio que se va produciendo en las probabilidades
de los sucesos a medida que se van haciendo observaciones. Paradójicamente a su importancia, su demostración no es más
que la aplicación de la definición de probabilidad condicionada seguida de la aplicación del teorema de la probabilidad total.

DISTRIBUCIONES DE PROBABILIDAD (EIR 97-98, 5; Si una variable real, X, es una variable aleatoria entonces sus valores depen-
98-99, 5; 00-01, 14) den del azar. Por ejemplo, si se lanzan dos dados y X es el número de veces
que sale un 6, entonces X es una variable aleatoria, y toma, al azar, uno de los
Introducción valores 0, 1 ó 2.

Las variables aleatorias están ligadas a experimentos aleatorios. Se dice que El estudio de las distribuciones de probabilidad es similar al de la variable es-
se ha definido una variable aleatoria cuando a cada elemento del espacio tadística, el equivalente de la frecuencia relativa en la variable aleatoria es la
muestral se le ha asociado un número. probabilidad.

1175
Bioestadística:maquetaEIR.qxp 22/07/09 12:58 Página 1176

Manual DAE de enfermería. EIR. Oposiciones ••

Variables aleatorias Ejemplo


Un jugador lanza un dado corriente. Si sale un número impar gana dicho nú-
Considérese un experimento aleatorio y sea E el espacio muestral asociado, S mero de euros, pero si sale par entonces pierde esa cantidad en euros. Estu-
= conjunto de sucesos y p = probabilidad asociada a cada suceso. La terna diar si el juego es equitativo.
(E, S, p) se denomina espacio probabilístico.
Solución
Definición Los resultados posibles xi (euros que gana o pierde al lanzar el dado) y sus
Se denomina variable aleatoria o variable estocástica, X, a toda aplicación que respectivas probabilidades son los que se muestran en la Tabla 7. Los núme-
asocia a cada elemento del espacio muestral, E, un número real x. ros negativos indican el hecho de perder cuando sale par.

Dicho de manera informal: es el valor numérico que “de alguna manera” se E(X) = — 1 +3. — 1 +5. — 1 -2. — 1 -4.— 1 -6. — 1 =-— 3 =
6 6 6 6 6 6 6
asigna a un suceso. El conjunto imagen de la aplicación se llama recorrido de
la variable. Suele confundirse variable aleatoria con recorrido. -—1 ; luego no es equitativo. Se dice que un juego de dinero es legal o equi-
2
Ejemplo 1 tativo si E = 0 y desfavorable si E < 0.
Si se lanzan tres monedas al aire y X es el número de caras que salen, los va-
lores que toma X son 0, 1, 2 y 3. Varianza y desviación estándar (o típica) (EIR 94-95, 1; 97-98,
101)
Ejemplo 2 Al igual que para las variables estadísticas, la esperanza mide, en cierto sen-
Si de una camada de 6 cachorros se cuenta el nº de hembras, la variable alea- tido, el “valor promedio” de X. El concepto siguiente, el de la varianza, va a
toria toma los valores X = 0, X = 1, ..., X = 6. medir la dispersión o distanciamiento de X respecto de la media.

Ejemplo 3 Sea X una variable discreta que toma los valores x1, x2..., xn con función de
Al extraer una bombilla de una población y observar si es o no defectuosa, X probabilidad f. Se llama varianza de X y se designa por var (X) a: var (X) =
tomaría los valores 1 y 0 según sea o no defectuosa. n
∑ (xi – E (X))2 f(xi) =Σ xi2 f(xi) – E(X)2 = E(X2) – E(X)2.
i-l
En los ejemplos anteriores se habla de variable aleatoria discreta (toma valo-
res discretos). Es decir, la media de la variable al cuadrado menos el cuadrado de la media.
La desviación estándar o típica se define como la raíz cuadrada de la varianza.
Ejemplo 4
Si se toma como X la estatura de los soldados de un reemplazo, X puede tomar Normalización o tipificación de una variable aleatoria
todos los valores (dentro de unos límites). Sea X una variable aleatoria con media, la variable aleatoria X* normalizada
X-μ
que corresponde a X se define por: X* = — σ . Se verifica E(X*) = 0; y
Función de probabilidad y de distribución
Una función de probabilidad no es más que la asignación a cada valor de la Var(X*) = 1.
variable de la probabilidad que le corresponde. Es decir, la función de proba-
bilidad, f, se define así: f(xi) = P(X = xi). Distribución binomial
En el ejemplo de la introducción: Se parte de una experiencia en la que sólo se consideran dos sucesos: A y su
5 .—
5 —25 contrario Ac. Sus probabilidades son P(A) = p; y P(Ac) = q = 1-p.
f(0) = P(X = 0) = p(no salga ningún 6) = —
6 6 = 36 ; f(1) = P(X =
El suceso A es el suceso favorable, al que se suele llamar éxito, mientras que
1 .—
1) = 2 . — 5 =—
10 ; f(2) = P(X = 2) = —1 a su contrario se le denominaría fracaso.
6 6 36 36
Media o esperanza de una variable aleatoria Si se repite n veces la experiencia, y el interés radica en el número de éxitos,
Sea X una variable aleatoria discreta, que toma los valores x1, x2, x3..., xn con la variable aleatoria X indicará éstos y tomará los valores 0, 1, 2..., n. Se trata
función de probabilidad f. de una distribución de probabilidad discreta, que se llama distribución bino-
mial de parámetros n (nº de repeticiones) y p (probabilidad del éxito). Se de-
Se llama media o esperanza (o valor esperado) de X a: E(X) = x1 f(x1) + x2 f(x2) signa B(n, p). La probabilidad de obtener k éxitos es p(X = k) = n pk qn-k.
( )k
+... + xn f(xn).
Ejemplo
Es análoga a la definición de la media para una distribución de frecuencias. Un jugador de tenis tiene una probabilidad de ganar una partida de 0,25. En

Tabla 7. Resultados posibles xi y sus respectivas probabilidades


xi 1 3 5 -2 -4 -6
f(xi) 1/6 1/6 1/6 1/6 1/6 1/6

1176
Bioestadística:maquetaEIR.qxp 22/07/09 12:58 Página 1177

bioestadística


el caso de que juegue 4 partidas, se deberá calcular la probabilidad de que √ npq . Cuando n · p > 5 se puede considerar que la distribución es nor-
gane más de la mitad. mal.

Solución Ejemplo
Es una binomial con n = 4 y p = 0,25, lo que se pide es calcular P(X = 3) + La probabilidad de que en una empresa haya un empleado enfermo es de
P(X = 4) donde: 0,02. Sabiendo que hay 300 empleados hallar la esperanza matemática y la
varianza de la distribución correspondiente.
P(X = 3) = 4 0,253 0,75 ; P(X = 4) = 4 0,254; etc.
() ()
3 4 Solución
Parámetros Como se trata de una distribución binomial de parámetros n = 300 y p =
0,02, se verifica: E(X)= n · p = 300·(0,02) = 6; Var(X) = n·p·q = 300 ·
La media es μ = n · p, la varianza σ = n · p · q, y la desviación típica σ2 = (0,02) · (0,98) = 5,88.

Te conviene recordar...

4 Las variables aleatorias están ligadas a experimentos aleatorios. Se dice que se ha definido una variable aleatoria cuando a cada
elemento del espacio muestral se le ha asociado un número.
4 Si una variable real, X, es una variable aleatoria sus valores dependen del azar. Por ejemplo, si se lanzan dos dados y X es el nú-
mero de veces que sale un 6, entonces X es una variable aleatoria, y toma, al azar, uno de los valores 0, 1 ó 2.
4 El estudio de las distribuciones de probabilidad es similar al de la variable estadística, el equivalente de la frecuencia relativa
en la variable aleatoria es la probabilidad.

ESTADÍSTICA INFERENCIAL Tamaño muestral


Los dos tipos de problemas que resuelven las técnicas estadísticas son la estima- El tamaño muestral desempeña el mismo papel en estadística que el au-
ción y el contraste de hipótesis. En ambos casos se trata de generalizar la infor- mento de la lente en microscopia: si no se ve una bacteria al microscopio,
mación obtenida en una muestra a una población. Estas técnicas exigen que la puede ocurrir que:
muestra sea aleatoria. En la práctica rara vez se dispone de muestras aleatorias,
por la tanto la situación habitual es la que se esquematiza en la Imagen 5. • La preparación no la contenga.
• El aumento de la lente sea insuficiente.
Entre la muestra con la que se trabaja y la población de interés, o población
diana, aparece la denominada población de muestreo: población (la mayor Para decidir el aumento adecuado hay que tener una idea del tamaño del ob-
parte de las veces no definida con precisión) de la cual la muestra es una jeto. Del mismo modo, para decidir el tamaño muestral:
muestra aleatoria. En consecuencia la generalización está amenazada por dos
posibles tipos de errores: error aleatorio, que es el que las técnicas estadísti- • En un problema de estimación hay que tener una idea de la magnitud
cas permiten cuantificar y críticamente depende del tamaño muestral, pero a estimar y del error aceptable.
también de la variabilidad de la variable a estudiar; y el error sistemático, que • En un contraste de hipótesis hay que saber el tamaño del efecto que se
tiene que ver con la diferencia entre la población de muestreo y la población quiere ver.
diana y que sólo puede ser controlado por el diseño del estudio.
Estimación de parámetros (EIR 00-01, 102; 01-02, 53;
02-03, 108)
En general, de las variables experimentales u observacionales no se conoce la
Población muestreo fpd. Se puede conocer la familia (normal, binomial, etc.) pero no los pará-
metros. Para calcularlos habría que tener todos los posibles valores de la va-
riable, lo que no suele ser posible.
Error aleatorio
La inferencia estadística trata de cómo obtener información (inferir) sobre
Error sistemático los parámetros a partir de subconjuntos de valores (muestras) de la vari-
(sesgo) ble.
Muestra
• Estadístico: variable aleatoria que sólo depende de la muestra aleato-
ria elegida para calcularla.
Población diana • Estimación: proceso por el que se trata de averiguar un parámetro de la
población representado, en general, por q a partir del valor de un esta-
^
Imagen 5. Estadística inferencial dístico llamado estimador y representado por θ.

1177
Bioestadística:maquetaEIR.qxp 22/07/09 12:58 Página 1178

Manual DAE de enfermería. EIR. Oposiciones ••

El problema se resuelve en base al conocimiento de la distribución muestral Recuérdese que la probabilidad de que m esté en este intervalo es 1 - α. A
del estadístico que se use. P. ej.: en
— la media (m); si para cada muestra
— posi- un intervalo de este tipo se le denomina intervalo de confianza con un nivel
ble se calcula la media muestral ( X) se obtiene un valor distinto ( X es un es- de confianza del 100 (1 - α)%, o nivel de significación de 100 α %. El nivel
tadístico: una variable
— aleatoria y sólo depende de la muestra), habrá por de confianza habitual es el 95%, en cuyo caso α = 0,05 y Zα/2 = 1,96. Al
tanto una fpd para X, llamada distribución muestral de medias. La desviación — —
valor X se le denomina estimación puntual y se dice que es X un estimador de m.
típica de esta distribución se denomina error típico de la media. Evidente-
mente, habrá una distribución muestral para cada estadístico, no sólo para la Ejemplo
media, y en consecuencia un error típico para cada estadístico. Si de una población normal con—varianza 4 se extrae una muestra aleatoria de
tamaño 20 en la que se calcula X = 5,3 se puede decir que m tiene una pro-
2
Si la distribución muestral de un estadístico estuviera relacionada con algún babilidad de 0,95 de estar comprendida en el intervalo 5,3 ± 1,96  − =
√ 20
parámetro de interés, ese estadístico podría ser un estimador del parámetro. (4,42 6,18) que sería el intervalo de confianza al 95% para m.

Distribución muestral de medias En general esto es poco útil, en los casos en que no se conoce m tampoco
suele conocerse s2; en el caso más realista de s2 desconocida los intervalos de
Si se tiene una muestra aleatoria de una población N(m, s), se sabe (Teorema confianza se construyen con la t de Student (otra fdp continua para la que
del límite central) que la fdp de la media muestral es también normal con — s− , o, haciendo énfasis en que s/√−
hay tablas) en lugar de la z: X± t α/2  n
media m y varianza s2/n. Esto es exacto para poblaciones normales y aproxi- √n
mado (buena aproximación con n > 30) para poblaciones cualesquiera. Es — —
es el error estándar estimado de la media, X ± r α/2 EE ( X ).
decir, es el error típico, o error estándar de la media.
Esta manera de construir los intervalos de confianza sólo es válida si la varia-
¿Cómo se usa esto en un problema de estimación? 1er problema: no hay ble es normal. Cuando n es grande (> 30) se puede sustituir t por z sin mucho
tablas para cualquier normal, sólo para la normal m=0 y s=1 (la llamada error.
—μ
z); pero haciendo la transformación (llamada tipificación): z = —X-
— Estimación de proporciones
σ/√ n
una normal de media m y desviación s se transforma en una z. Sea X una variable binomial de parámetros n y p (una variable binomial es el
número de éxitos en n ensayos; en cada ensayo la probabilidad de éxito (p)
es la misma, por ejemplo: número de diabéticos entre 2.000 personas). Si n
Llamando zα al valor de una variable normal tipificada que deja a su dere- es grande y p no está próximo a 0 ó 1 (np35) X es aproximadamente normal
cha un área bajo la curva de α, es decir, que la probabilidad que la variable con media np y varianza npq (siendo q = 1 - p) y se puede usar el estadís-
sea mayor que ese valor es α (estos son los valores que ofrece la tabla de X
tico p̂ = —

X-μ n (proporción muestral), que es también aproximadamente nor-
la normal) se podrán construir intervalos de la forma, z1-α/2 < — — —
pq , en consecuencia, un IC para p al 100
σ/√ n mal, con error típico dado por √—
n
< zα/2 , para los que la probabilidad es 1 – α (Ver Imágenes 6 y 7). —
(1 - α)% será p̂ ± z α/ 2 √— , es decir, la misma estructura que antes:
pq
n
θ̂ ± z α/ 2 EE(θ̂).
Teniendo en cuenta la simetría de la normal y manipulando algebraicamente
— σ− <µ<—X+z — σ , que también se puede escribir —X± z Obsérvese que, para construirlo, se necesita conocer p. Si n es grande (> 30)
X-zα/2— α/2 √− α/2 se pueden sustituir p y q por sus estimadores sin mucho error, en cualquier
√n n
σ − — caso como pq ₤ 0,25 si se sustituye pq por 0,25 se obtiene un intervalo más
— − o, haciendo énfasis en que σ/√ n es el error estándar de la media, X±
√n conservador (más grande).

zα/2EE( X).

1−α

α α/2 α/2

Ζα Ζ 1−α/2 Ζ α/2
Imagen 6. Valor de una variable normal tipificada Imagen 7. Intervalos

1178
Bioestadística:maquetaEIR.qxp 22/07/09 12:58 Página 1179

bioestadística

Ejemplo —
0,80 . 0,20
En una muestra de 100 pacientes sometidos a un cierto tratamiento se obtie-
nen 80 curaciones. Calcular el intervalo de confianza al 95% de la eficacia del

IC 0,95% 0,80 ± 1,96 — = 0,80 ± 0,0784.
100
tratamiento: ¿Qué significa este intervalo? La verdadera proporción de curaciones está com-
p̂ = 0,80 q̂= 0,20 n=100 z0,025 = 1,96 prendida entre, aproximadamente, el 72% y el 88%, con un 95% de proba-
bilidad. ¿Es suficientemente preciso? Habrá que juzgarlo con criterios clínicos.

Te conviene recordar...

4 Los dos tipos de problemas que resuelven las técnicas estadísticas son: estimación y contraste de hipótesis. En ambos casos se
trata de generalizar la información obtenida en una muestra a una población. Estas técnicas exigen que la muestra sea alea-
toria.
4 El tamaño muestral desempeña el mismo papel en estadística que el aumento de la lente en microscopia.

MUESTREO EN ESTADÍSTICA ción tiene las mismas oportunidades de ser incluido en dicha muestra. Esta
condición garantiza la representatividad de la muestra porque si en la pobla-
En estadística se conoce como muestreo la técnica para la selección de una ción un determinado porcentaje de individuos presenta la característica A, la
muestra a partir de una población. Al elegir una muestra se espera que sus extracción aleatoria garantiza matemáticamente que por término medio se
propiedades sean extrapolables a la población. Este proceso permite ahorrar obtendrá el mismo porcentaje de datos muestrales con esa característica.
recursos, obteniendo resultados parecidos a los que se obtendrían si se reali-
zase un estudio de toda la población. El muestreo aleatorio simple puede ser de tres tipos:

Cabe mencionar que para que el muestreo sea válido y se pueda realizar un • Sin reposición de los elementos: cada elemento extraído se descarta
estudio fiable (que represente a la población), debe cumplir ciertos requisi- para la subsiguiente extracción. Por ejemplo, si se extrae una muestra
tos, lo que lo convertiría en una muestra representativa. de una población de bombillas para estimar la vida media de las bom-
billas que la integran, no será posible medir más que una vez la bom-
En el muestreo, si el tamaño de la muestra es más pequeño que el tamaño de billa seleccionada.
la población, se pueden extraer dos o más muestras de la misma población. • Con reposición de los elementos: las observaciones se realizan con re-
Al conjunto de muestras que se pueden obtener de la población se le deno- emplazamiento de los individuos, de forma que la población es idén-
mina espacio muestral. La variable que asocia a cada muestra su probabilidad tica en todas las extracciones. En poblaciones muy grandes, la
de extracción se nombra con el término distribución muestral. probabilidad de repetir una extracción es tan pequeña que el muestreo
puede considerarse sin reposición aunque, realmente, no lo sea.
Técnicas de muestreo (EIR 95-96, 3; 99-00, 102) • Con reposición múltiple: en poblaciones muy grandes, la probabilidad
de repetir una extracción es tan pequeña que el muestreo puede con-
Existen dos métodos para seleccionar muestras de poblaciones: el muestreo siderarse sin reposición. Cada elemento extraído se descarta para la
no aleatorio o de juicio y el muestreo aleatorio o de probabilidad. En este úl- subsiguiente extracción.
timo todos los elementos de la población tienen la oportunidad de ser esco-
gidos en la muestra. Una muestra seleccionada por muestreo de juicio se basa Para realizar este tipo de muestreo, y en determinadas situaciones, es muy
en la experiencia de alguien con la población. Algunas veces una muestra de útil la extracción de números aleatorios mediante ordenadores, calculadoras
juicio se usa como guía o muestra tentativa para decidir cómo tomar una o tablas construidas al efecto.
muestra aleatoria más adelante. Las muestras de juicio contribuyen al análi-
sis estadístico, el cual es necesario para hacer muestras de probabilidad. Muestreo estratificado
Consiste en la división previa de la población de estudio en grupos o clases que
Muestreo probabilístico se suponen homogéneos respecto a la característica a estudiar. A cada uno de
Forman parte de este tipo de muestreo todos aquellos métodos para los que estos estratos se le asignaría una cuota que determinaría el número de miem-
puede calcularse la probabilidad de extracción de cualquiera de las muestras bros del mismo que compondrán la muestra. Dentro de cada estrato se suele
posibles. Este conjunto de técnicas de muestreo es el más aconsejable, aun- usar la técnica de muestreo sistemático.
que en ocasiones no es posible optar por él. En este caso se habla de mues-
tras probabilísticas, pues no es razonable hablar de muestras representativas Según la cantidad de elementos de la muestra que se han de elegir de cada
dado que no se conocen las características de la población. uno de los estratos, existen dos técnicas de muestreo estratificado:

Muestreo aleatorio simple (m.a.s.) • Asignación proporcional: el tamaño de cada estrato en la muestra es
Es la extracción de una muestra de una población finita, en la que el proceso proporcional a su tamaño en la población.
de extracción es tal que garantiza que cada uno de los elementos de la pobla- • Asignación óptima: la muestra recogerá más individuos de aquellos es-

1179
Bioestadística:maquetaEIR.qxp 22/07/09 12:58 Página 1180

Manual DAE de enfermería. EIR. Oposiciones ••

tratos que tengan más variabilidad. Para ello es necesario un conoci- dición a todas las unidades, es decir, los miembros del grupo, o se le podría
miento previo de la población. aplicar sólo a algunos de ellos, seleccionados al azar. Este método tiene la
ventaja de simplificar la recogida de información muestral.
Por ejemplo, para un estudio de opinión, puede resultar interesante estudiar
por separado las opiniones de hombres y mujeres pues se estima que, den- Cuando, dentro de cada conglomerado, se extraen los individuos que forma-
tro de cada uno de estos grupos, puede haber cierta homogeneidad. Así, si la rán parte de la muestra por m.a.s., el muestreo se llama bietápico.
población está compuesta de un 55% de mujeres y un 45% de hombres, se
tomaría una muestra que contenga también esa misma proporción. Las ideas de estratificación y conglomerados son opuestas. El primer método
funciona mejor cuanto más homogénea es la población respecto del estrato,
Para una descripción general del muestreo estratificado y los métodos de in- aunque más diferentes son éstos entre sí. En el segundo, ocurre lo contrario.
ferencia asociados con este procedimiento, se ha de suponer que la pobla- Los conglomerados deben presentar toda la variabilidad, aunque deben ser
ción está dividida en h subpoblaciones o estratos de tamaños conocidos N1, muy parecidos entre sí.
N2..., Nh tal que las unidades en cada estrato sean homogéneas respecto a la
característica en cuestión. La media y la varianza desconocidas para el i-ésimo Homogeneidad de las poblaciones o sus subgrupos
estrato son denotadas por mi y s12, respectivamente. Homogéneo significa, en el contexto de la estratificación, que no hay mucha
variabilidad. Los estratos funcionan mejor cuanto más homogéneos son cada
Muestreo sistemático uno de ellos respecto a la característica a medir. Por ejemplo, si se estudia la
Se utiliza cuando el universo o población es de gran tamaño, o ha de exten- estatura de una población, es bueno distinguir entre los estratos mujeres y
derse en el tiempo. Primero hay que identificar las unidades y relacionarlas con hombres porque se espera que, dentro de ellos, haya menos variabilidad, es
el calendario (cuando proceda). Luego hay que calcular una constante, que se decir, sean menos heterogéneos. Dicho de otro modo, no hay tantas diferen-
denomina coeficiente de elevación K= N/n; donde N es el tamaño del universo cias entre unas estaturas y otras dentro del estrato que en la población total.
y n el tamaño de la muestra. Determinar en qué fecha se producirá la primera
extracción, para ello hay que elegir al azar un número entre 1 y K; de ahí en Por el contrario, la heterogeneidad hace inútil la división en estratos. Si se dan
adelante tomar uno de cada K a intervalos regulares. Ocasionalmente, es con- las mismas diferencias dentro del estrato que en toda la población, no hay
veniente tener en cuenta la periodicidad del fenómeno. por qué usar este método de muestreo. En los casos en los que existan gru-
pos que contengan toda la variabilidad de la población, lo que se construye
Esto quiere decir que si hay un determinado número de personas que es la po- son conglomerados, que ahorran algo del trabajo que supondría analizar toda
blación y se quiere escoger de esa población un número más pequeño, el cual la población. En resumen, los estratos y los conglomerados funcionan bajo
es la muestra, se dividirá el número de la población por el número de la mues- principios opuestos: los primeros son mejores cuanto más homogéneo es el
tra que se quiere tomar y el resultado de esta operación será el intervalo, en- grupo respecto a la característica a estudiar y los conglomerados, si represen-
tonces se escoge un número al azar desde uno hasta el número del intervalo, tan fielmente a la población, esto es, contienen toda su variabilidad, o sea,
y a partir de este número se escogen los demás siguiendo el orden del inter- son heterogéneos.
valo.
Muestreo por juicio
Muestreo por estadios múltiples Aquél para el que no puede calcularse la probabilidad de extracción de una
Esta técnica es la única opción cuando no se dispone de lista completa de la determinada muestra. Se busca seleccionar a individuos que se juzga de an-
población de referencia o bien cuando por medio de la técnica de muestreo temano tienen un conocimiento profundo del tema bajo estudio, por lo tanto,
simple o estratificado se obtiene una muestra con unidades distribuidas de tal se considera que la información aportada por esas personas es vital para la
forma que resultan de difícil acceso. En el muestreo a estadios múltiples se toma de decisiones.
subdivide la población en varios niveles ordenados que se extraen sucesiva-
mente por medio de un procedimiento de embudo. El muestreo se desarro- Muestreo por cuotas
lla en varias fases o extracciones sucesivas para cada nivel. Es la técnica más difundida, sobre todo en estudios de mercado y sondeos de
opinión. En primer lugar es necesario dividir la población de referencia en va-
Por ejemplo, si hay que construir una muestra de profesores de primaria en un rios estratos definidos por algunas variables de distribución conocida (como
país determinado, éstos pueden subdividirse en unidades primarias, repre- el género o la edad). Posteriormente se calcula el peso proporcional de cada
sentadas por circunscripciones didácticas, y unidades secundarias, que serían estrato, es decir, la parte proporcional de población que representan. Final-
los propios profesores. En primer lugar se extrae una muestra de las unidades mente se multiplica cada peso por el tamaño de n de la muestra para deter-
primarias (para lo cual hay que tener la lista completa de estas unidades) y minar la cuota precisa en cada estrato. Se diferencia del muestreo estratificado
en segundo lugar se extrae aleatoriamente una muestra de unidades secun- en que una vez determinada la cuota, el investigador es libre de elegir a los
darias de cada una de las primarias seleccionadas en la primera extracción. sujetos de la muestra dentro de cada estrato.

Muestreo por conglomerados Muestreo de clandestinidad


Técnica similar al muestreo por estadios múltiples, se utiliza cuando la po- Indicado para estudios de poblaciones clandestinas, minoritarias o muy dis-
blación se encuentra dividida, de manera natural, en grupos que se supone persas pero en contacto entre sí. Consiste en identificar sujetos que se inclui-
que contienen toda la variabilidad de la población, es decir, la representan rán en la muestra a partir de los propios entrevistados. Partiendo de una
fielmente respecto a la característica a elegir. Pueden seleccionarse sólo algu- pequeña cantidad de individuos que cumplen los requisitos necesarios, éstos
nos de estos grupos o conglomerados para la realización del estudio. sirven como localizadores de otros con características análogas.

Dentro de los grupos seleccionados se ubicarán las unidades elementales, por Muestreo subjetivo por decisión razonada
ejemplo, las personas a encuestar, y podría aplicársele el instrumento de me- En este caso las unidades de la muestra se eligen en función de algunas de sus

1180
Bioestadística:maquetaEIR.qxp 22/07/09 12:58 Página 1181

bioestadística

características de manera racional y no casual. Una variante de esta técnica es • i: precisión con que se desea estimar el parámetro (2i es la amplitud
el muestreo compensado o equilibrado, en el que se seleccionan las unidades del intervalo de confianza).
de tal forma que la media de la muestra para determinadas variables se acer-
que a la media de la población. Estimación de una media
Los datos que hay que incluir en la fórmula para calcular el número de suje-
Tamaño de la muestra tos necesarios en la muestra (N) son:

En estadística el tamaño de la muestra es el número de sujetos que compo- • Zα: valor de Z correspondiente al riesgo α fijado. El riesgo α fijado
nen la muestra extraída de una población, necesarios para que los datos ob- suele ser 0,05 y Zα de 1,96.
tenidos sean representativos de la población. • s2: varianza de la distribución de la variable cuantitativa que se supone
que existe en la población.
Objetivos de la determinación del tamaño adecuado de una • i: precisión con que se desea estimar el parámetro (2i es la amplitud
muestra del intervalo de confianza).
• Estimar un parámetro determinado con el nivel de confianza deseado.
• Detectar una determinada diferencia, si realmente existe, entre los gru- Contraste de hipótesis
pos de estudio con un mínimo de garantía.
• Reducir costes o aumentar la rapidez del estudio. Para conocer el tamaño de la muestra en un estudio de investigación en el que
se quieren conocer las diferencias existentes entre dos hipótesis, hay que co-
Por ejemplo, en un estudio de investigación epidemiológico, la determina- nocer previamente:
ción de un tamaño adecuado de la muestra tendría como objetivo su factibi-
lidad. Así: • Error tipo I y tipo II: Hay que establecer el riesgo de cometer un error de
tipo I que se está dispuesto a aceptar. Normalmente de forma arbitra-
• Si el número de sujetos es insuficiente habría que modificar los cri- ria se acepta un riesgo del 5%. Además hay que establecer el riesgo
terios de selección, solicitar la colaboración de otros centros o am- que se acepta de cometer un error tipo II, que suele ser entre el 5 y el
pliar el periodo de reclutamiento. Los estudios con tamaños 20%. El error tipo I también es conocido como hipótesis nula, y el error
muestrales insuficientes no son capaces de detectar diferencias entre tipo II, como hipótesis alternativa.
grupos, llegando a la conclusión errónea de que no existe tal dife- • Si la hipótesis es unilateral o bilateral: el planteamiento de una hipóte-
rencia. sis bilateral o “de dos colas” requiere mayor tamaño muestral.
• Si el número de sujetos es excesivo, el estudio se encarece desde el • Definir la magnitud de la diferencia efecto o asociación que se desea detec-
punto de vista económico y humano. Además es poco ético al someter tar: a mayores diferencias preestablecidas en el planteamiento de la hipóte-
a más individuos a una intervención que puede ser menos eficaz o in- sis, menor tamaño muestral, y a menor diferencia, mayor tamaño muestral.
cluso perjudicial. • Conocer la variabilidad del criterio de evaluación en la población.

Cálculo del tamaño de la muestra Comparación de dos proporciones


El tamaño de la muestra se determina para obtener una estimación apro-
piada de un determinado parámetro poblacional. Para calcular el número de sujetos necesarios en cada una de las muestras
(n), se debe prefijar:
Estimación de parámetros
• 1,96 = Valor Z correspondiente al riesgo deseado.
La estimación de parámetros consiste en el cálculo aproximado del valor de • 1,96 = Valor Z correspondiente al riesgo deseado, si es de dos colas.
un parámetro en la población, utilizando la inferencia estadística, a partir de • 0,13 = Valor de la proporción en el grupo de referencia, placebo, con-
los valores observados en la muestra estudiada. Para el cálculo del tamaño de trol o tratamiento habitual.
la muestra en una estimación de parámetros son necesarios los conceptos de • 0,44 = Valor de la proporción en el grupo del nuevo tratamiento, inter-
intervalo de confianza, variabilidad del parámetro, error, nivel de confianza, vención o técnica.
valor crítico y valor α. • 0,29 = Media de las dos proporciones p1 y p2.
• j = En estadística el tamaño de la muestra es el número de sujetos que
Estimación de una proporción componen la muestra extraída de una población, necesarios para que
Los datos que hay que incluir en la fórmula para calcular el número de suje- los datos obtenidos sean representativos de la población.
tos necesarios de la muestra (N) son:
Coeficiente de correlación
• Zα: valor de Z correspondiente al riesgo α fijado. El riesgo α fijado
suele ser 0,05 y Zα de 1,96. La asociación entre dos variables cuantitativas necesita normalmente la uti-
• P: valor de la proporción que se supone existe en la población. lización del coeficiente de correlación r de Pearson.

Te conviene recordar...

4 En estadística se conoce como muestreo la técnica para la selección de una muestra a partir de una población.

1181
Bioestadística:maquetaEIR.qxp 22/07/09 12:58 Página 1182

Manual DAE de enfermería. EIR. Oposiciones ••

Te conviene recordar... (continuación)

4 Al elegir una muestra se espera que sus propiedades sean extrapolables a la población. Este proceso permite ahorrar recursos.
4 En el muestreo, si el tamaño de la muestra es más pequeño que el tamaño de la población, se pueden extraer dos o más mues-
tras de la misma población. Al conjunto de muestras que se pueden obtener de la población se le denomina espacio muestral.
4 Existen dos métodos para seleccionar muestras de poblaciones: el muestreo no aleatorio o de juicio y el muestreo aleatorio o
de probabilidad. En este último todos los elementos de la población tienen la oportunidad de ser escogidos en la muestra.
Una muestra seleccionada por muestreo de juicio se basa en la experiencia de alguien con la población.
4 En estadística el tamaño de la muestra es el número de sujetos que componen la muestra extraída de una población, necesa-
rios para que los datos obtenidos sean representativos de la población.

BIBLIOGRAFÍA
• Almenara Barrios J, García Ortega C, Lagares Franco C. Manual de bioestadística: teoría y prácticas. Cádiz: Quorum Editores; 2005.
• Álvarez Leiva JA. Estadística descriptiva. [En línea] [fecha de acceso: 24 de junio de 2009]. URL disponible en: http://thales.cica.es/rd/Recursos/rd97/UnidadesDidac-
ticas/53-1-u-indice.html#HEAD
• Armitage P, Berry G. Estadística para la investigación biomédica. Barcelona: Doyma; 1992.
• Barón López FJ, Téllez Montiel F (ed.). Manual básico de bioestadística. Málaga: Téllez Montiel; 2005.
• Barón López FJ. Claves en bioestadística. Barcelona: Nexus Médica; 2007.
• Calot G. Curso de estadística descriptiva. 5ª ed. Madrid: Paraninfo; 1988.
• Campos Aranda M. Más de 777 preguntas de bioestadística y sus respuestas. Murcia: Diego Marín Librero Editor; 2008.
• Campos Aranda M. Problemas de bioestadística resueltos paso a paso. Murcia: Diego Marín Librero Editor; 2008.
• García Granero M, Calasanz Abinzano MJ. Bioestadística aplicada. Navarra: Newbook Ediciones; 2001.
• García Nogales A. Bioestadística básica. 2ª ed. Badajoz: Abecedario; 2007.
• Gondar Nores JE. Epidemiología y bioestadística. Madrid: Data Mining Institute; 2005.
• Hospital Universitario Ramón y Cajal. Material docente de la Unidad de Bioestadística Clínica. [En línea] [fecha de acceso: 24 de junio de 2009]. URL disponible en:
http://www.hrc.es/bioest/M_docente.html#tema2
• Martín Andrés A, Luna del Castillo JD. Bioestadística para las ciencias de la salud. Madrid: Capitel Ediciones; 2004.
• Peña Sánchez de Rivera D. Estadística: modelos y métodos, 1. Madrid: Alianza Universidad; 1994.
• Prieto Valiente L, Herranz Tejedor I. Bioestadística: diseño de experimentos y análisis de datos en investigación médica. Madrid: Compañía Española de Reprografía y Ser-
vicios; 2008.
• Remington RD, Schork MA. Estadística biométrica y sanitaria. Madrid: Prentice Hall International; 1979.
• Ríus Díaz F, Barón López FJ. Bioestadística. Madrid: Paraninfo; 2007.
• Rivas Moya T, Mateo MA, Ríus Díaz F, Ruiz M. Estadística aplicada a las ciencias sociales: teoría y ejercicios (EAC). Málaga: Secretariado de Publicaciones de la Universi-
dad de Málaga; 1991.
• Rubio Calvo E, Martínez Terrer T. Bioestadística. Colección Monografías Didácticas. Zaragoza: Universidad de Zaragoza; 1992.
• Ruiz-Maya L. Métodos estadísticos de investigación en las ciencias sociales. Técnicas no paramétricas. Madrid: Alfa Centauro; 2000.
• Sokal Robert R, Rohlf FJ. Introducción a la bioestadística. Barcelona: Editorial Reverté; 2008.

1182

También podría gustarte