Está en la página 1de 49

LICENCIATURA

EN NUTRICIÓN
GESTIONADO CON MODALIDAD A DISTANCIA

Asignatura Bioestadística

4. Cálculo y análisis de variables cuali y


Unidad didáctica
cuantitativas

Tema 1. Distribución de probabilidades y


distribuciones muestrales

Autoras Sandra Cavallaro y Karina Cavallaro


Índice
Introducción 3
Objetivos 3
Mapa conceptual 4
1. Distribuciones muestrales 5
1.1. Media 7
1.2. Varianza 8
1.3. Desviación estándar 8
2. Distribuciones de probabilidad 9
2.1. Distribución binomial 10
2.2. Distribución de Poisson 16
2.3. Distribución normal o de Gauss 21
Solucionario 39
Introducción

En general, a lo largo de su desarrollo, la ciencia ha intentado vincular y medir variables


de distinto tipo con el objetivo de construir modelos que representen distintas situacio-
nes. En este sentido, la estadística ha elaborado instrumentos para calcular distribucio-
nes de probabilidad que pudieran representar el comportamiento teórico de diferentes
fenómenos aleatorios que aparecían en el mundo real. A través de esas construcciones
teóricas, los modelos, es posible inferir ciertos resultados y así predecir, con un grado
de error controlado, variables que afecten la realidad. Existen algunas distribuciones de
probabilidad teóricas, como por ejemplo la distribución binomial o la de Poisson para
variables discretas o normal para variables continuas, que sirven de modelo para repre-
sentar las distribuciones empíricas más frecuentes.

Las distribuciones muestrales hacen referencia a la distribución de muestras que se


obtienen por lo general de una o más poblaciones, calculando y registrando un esta-
dístico (la media por ejemplo) en muestras pequeñas, reiteradas veces, y ordenándolas
hasta armar una distribución que arroja el valor del estadístico elegido en la muestra.

Objetivos

Al finalizar el trabajo con este tema serás capaz de:

• Distinguir los distintos tipos de distribuciones de probabilidad y sus usos.

• Internalizar el uso de tablas y gráficos.


Mapa conceptual

DISTRIBUCIONES

Distribuciones Distribuciones de
muestrales probabilidad

• Media • Binomial

• Varianza • Poisson

• Desviación • Normal
estándar
Licenciatura en Nutrición

1. Distribuciones muestrales

RECORDÁ:

Como sabemos, una muestra es una porción representativa de una población. Las
distribuciones muestrales son, en consecuencia, distribuciones de muestras esta-
dísticas que se obtienen de una población.

Las distribuciones muestrales hacen referencia a


la distribución de muestras que se obtienen, por lo En lugar de calcular el es-
general, de una o más poblaciones, calculando y tadístico en la muestra, se
registrando un estadístico (la media, por ejemplo), obtienen pequeñas mues-
en muestras pequeñas, reiteradas veces. Se orde- tras, se calcula la media
nan los resultados y así se obtiene una distribución en cada una de ellas y se
que arroja el valor del estadístico elegido aplicable registran para obtener una
a la muestra. distribución del estadístico.

Es decir: en lugar de calcular el estadístico en la


muestra (calcular la media de la muestra), se obtienen pequeñas muestras, se calcula la
media en cada una de estas pequeñas muestras y se registran para obtener una distribu-
ción del estadístico.

EJEMPLO:

Por ejemplo, si arrojamos una moneda 4 veces, la distribución de probabilidades


nos permitirá calcular la cantidad de caras y cecas que podemos obtener. Enton-
ces, imaginemos que lanzamos la moneda 4 veces al aire, asumiendo que solo
puede salir cara o ceca (nunca de costado…). Los resultados pueden ser:

• 1 vez cara.

• 2 veces cara.

• 3 veces cara.

• 4 veces cara.

Para este experimento, el espacio muestral estaría definido por:

E = 16 resultados posibles

Es decir, dos opciones (cara o seca) combinadas de a 4 (por los 4 lanzamientos).

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


5
Licenciatura en Nutrición

Se calcula como:

24 = 16

E = {cccc, cccs, ccsc, ccss, cscc, cscs, cssc, csss, sccc, sccs, scsc, scss, sscc, sscs,
sssc, ssss}

Ahora que definimos el espacio muestral, podemos ver cuál es la probabilidad de


obtener cada uno de los siguientes resultados:

• 0 caras: 1/16

E = {cccc, cccs, ccsc, ccss, cscc, cscs, cssc, csss, sccc, sccs, scsc, scss, sscc,
sscs, sssc, ssss}

• 1 cara: 4/16

E = {cccc, cccs, ccsc, ccss, cscc, cscs, cssc, csss, sccc, sccs, scsc, scss, sscc,
sscs, sssc, ssss}

• 2 caras: 6/16

E = {cccc, cccs, ccsc, ccss, cscc, cscs, cssc, csss, sccc, sccs, scsc, scss, sscc,
sscs, sssc, ssss}

• 3 caras: 4/16

E = {cccc, cccs, ccsc, ccss, cscc, cscs, cssc, csss, sccc, sccs, scsc, scss, sscc,
sscs, sssc, ssss}

• 4 caras: 1/16

E = {cccc, cccs, ccsc, ccss, cscc, cscs, cssc, csss, sccc, sccs, scsc, scss, sscc,
sscs, sssc, ssss}

Podemos sintetizar estos resultados en la siguiente tabla:

NÚMERO DE CARAS FRECUENCIA DISTRIBUCIÓN DE


PROBABILIDADES
0 1 1/16
1 4 4/16
2 6 6/16
3 4 4/16
4 1 1/16

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


6
Licenciatura en Nutrición

Con lo analizado, podemos inferir que:

• La probabilidad de cada resultado específico va desde 0 a 1 inclusive.

• La sumatoria de las probabilidades siempre da 1, lo cual queda expresado en la si-


guiente fórmula:

En el ejemplo, sería:

1/16 + 4/16 + 6/16 + 4/16 + 1/16 = 16/16 = 1

RECORDÁ:

Recordemos el concepto de variable. Las variables estadísticas son característi-


cas que pueden tener valores fluctuantes en un experimento. Esos valores fluc-
tuantes pueden ser medidos y observados. Asimismo, las variables pueden ser
discretas (cuando toman valores finitos entre dos valores) o continuas (cuando
pueden tomar un número infinito de valores entre dos números).

También se pueden realizar algunos cálculos de estadística descriptiva aplicada a la


distribución de probabilidades. Por ejemplo, es posible obtener la media, la varianza y la
desviación estándar de una distribución de probabilidades, como veremos a continuación.

1.1. Media

La media consiste en calcular el valor promedio de la variable aleatoria, al que también


llamamos “valor esperado”.

La media de una distribución de probabilidades es un promedio ponderado, dado que los


posibles valores se ponderan a través de sus probabilidades de ocurrencia.

Para su cálculo se utiliza la siguiente fórmula:

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


7
Licenciatura en Nutrición

1.2. Varianza

La varianza calcula el grado de dispersión en una distribución de probabilidades.

Para su cálculo se utiliza la siguiente fórmula:

1.3. Desviación estándar

La desviación estándar se calcula como la raíz cuadrada de la varianza.

Por lo tanto, se aplica la siguiente fórmula.

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


8
Licenciatura en Nutrición

2. Distribuciones de probabilidad

RECORDÁ:

La distribución de probabilidades muestra todos los resultados posibles en un


experimento y la probabilidad de que se produzca cada uno de ellos.

Es decir que una distribución de probabilidad muestra todo el abanico de resultados que
pueden aparecer en un experimento.

Podría decirse que la distribución de probabilidad es parecida a la distribución de fre-


cuencias relativas. La diferencia radica en que, en lugar de describir el pasado, describe la
probabilidad de que un evento suceda en el futuro. Es una herramienta fundamental que
permite diseñar un escenario de acontecimientos futuros considerando las tendencias ac-
tuales de diversos fenómenos.

EJEMPLO:

Podemos medir la estatura de los individuos y estimar la estatura media de nues-


tra población. ¿Cómo podemos realizar esto? Tomamos varias muestras de indi-
viduos, los medimos y luego realizamos el cálculo de la media de cada muestra
para, de esta forma, obtener la distribución de los valores medidos.

POBLACIÓN MUESTRA

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


9
Licenciatura en Nutrición

2.1. Distribución binomial

RECORDÁ:

La distribución binomial es una distribución de una variable aleatoria (X) que


toma solamente valores de 0 y 1 (o éxito y fracaso) cuando se realiza un solo ex-
perimento.

Está relacionada con la distribución de Bernoulli y tiene ciertos requerimientos o condi-


ciones:

• Cada experimento solo puede tener dos posibles resultados. Llamamos A al éxito y
A’ al fracaso. Asimismo, se llama p a la probabilidad de éxito y -p a la probabilidad de
fracaso.

• En cada experimento, los resultados posibles son mutuamente excluyentes.

• Los resultados de cada experimento son independientes entre sí.

• El experimento consta de un número N de pruebas.

• La probabilidad de que ocurra del suceso A es constante, es decir, la probabilidad de


cada resultado posible en un experimento es la misma que en otro.

• Las distribuciones binomiales se calculan con la siguiente fórmula:

Cuando hablamos de éxitos y de fracasos, podemos llegar a confundirnos y pensar que


existen solo dos resultados posibles. En realidad, tanto los posibles resultados de éxito
como de fracaso pueden ser más de uno.

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


10
Licenciatura en Nutrición

EJEMPLO:

Si consideramos la probabilidad de sacar cara al lanzar una moneda, la probabili-


dad de éxito (que salga cara) es 0,5 y la de fracaso (que salga ceca) es 0,5.

En cambio, si decidimos calcular la probabilidad de que salga el número 5 en un


dado, la probabilidad de éxito (que salga un 5) es 1/6 y la de fracaso (que salga un
1, 2, 3, 4 o 6) es 5/6. Como vemos en este caso, el fracaso puede ser un conjunto
de resultados.

También podemos calcular la media y la desviación estándar de una distribución binomial:

• La media de una distribución binomial se calcula con los parámetros n y p (número


de experimentos y probabilidad de éxito). La fórmula que se utiliza es:

• La desviación estándar de una distribución binomial se calcula como:

EJEMPLO:

Calculemos la distribución binomial de un examen tipo multiple choice que con-


siste en 3 preguntas con 4 opciones para cada una de ellas:

• Pregunta 1: opciones a, b, c o d.

• Pregunta 2: opciones a, b, c o d.

• Pregunta 3: opciones a, b, c o d.

Como podemos observar, cada pregunta tiene la misma probabilidad de éxito,


es decir, solo una de las cuatro opciones es válida (1/4). Asimismo, cada pregunta
posee una respuesta que es independiente de las demás; y, finalmente, el ca-
rácter binomial está verificado, ya que cada pregunta solo posee dos resultados
posibles: éxito (si está bien respondida) o fracaso (si está mal respondida).

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


11
Licenciatura en Nutrición

Reemplacemos los parámetros por sus valores:

• P = 1/4 o 0,25 (probabilidad de acierto).

• n = 3 (cantidad de experimentos; en este ejemplo, corresponde a la cantidad


de preguntas).

• 1 - p (o “q”) = 3/4 o 0,75 (probabilidad de fracaso).

• X representa el número de respuestas correctas en cada experimento, don-


de los valores posibles pueden ser 0, 1, 2 o 3. Como la fórmula pide la p(X)
(probabilidad de X), debemos realizar el cálculo para cada probabilidad. Re-
emplacemos en la fórmula dada:

- Para la probabilidad de cero respuestas correctas  p(0):

- Para la probabilidad de 1 respuesta correcta  p(1):

- Para la probabilidad de 2 respuestas correctas  p(2):

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


12
Licenciatura en Nutrición

- Para la probabilidad de 3 respuestas correctas  p(3):

Si comparamos los resultados obtenidos en el


ejemplo anterior, podemos ver que, cuanto más Para ver la tabla de distri-
exigente se es en cuanto al resultado, es decir, en bución binomial completa,
cuanto a la probabilidad de éxito (en el ejemplo, 3 podés consultar “Recur-
preguntas correctas), más baja es la probabilidad. sos” de esta unidad.

El cálculo de probabilidad para una distribución bi-


nomial también puede realizarse buscando valores en la tabla de distribución binomial.
En esta se pueden hallar diferentes valores de probabilidad para parámetros n o k (o x).

EJEMPLO:

Calculemos los valores en dicha tabla para el ejemplo anterior. Para ello, transcribi-
remos la parte de la tabla que precisamos.

Como los valores de tabla son acumulados –esto es, cada valor suma el valor ante-
rior–, para calcular el valor de un caso en particular, como por ejemplo p(2) (o K = 2,
según figura en la tabla), debemos mirar el valor acumulado para K = 2 y restarle el
anterior (en este ejemplo, K = 1).

p 0,01 0,05 0,1 0,15 0,2 0,25 0,3 0,35


n k
2 0 0,9801 0,9025 0,8100 0,7225 0,6400 0,5625 0,4900 0,4225
1 0,9999 0,9975 0,9900 0,9775 0,9600 0,9375 0,9100 0,8775
2 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
3 0 0,9703 0,8574 0,7290 0,6141 0,5120 0,4219 0,3430 0,2746
1 0,9997 0,9928 0,9720 0,9393 0,8960 0,8438 0,7840 0,7183
2 1,0000 0,9999 0,9990 0,9966 0,9920 0,9844 0,9730 0,9571
3 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


13
Licenciatura en Nutrición

Entonces, para p(2) tenemos que realizar la siguiente resta, tal como lo habíamos
calculado anteriormente:

0,984 - 0,843 = 0,141

Como habíamos visto, también es posible calcular la media y la desviación estándar, para
lo cual deberemos aplicar las fórmulas correspondientes.

EJEMPLO:

Para calcular la media, aplicaremos la fórmula correspondiente con los siguientes


valores:

• n=3

• p = 1/4

µ = np  µ = 3 × 0,25 = 0,75

Para calcular la desviación estándar, aplicaremos la fórmula correspondiente con


los siguientes valores:

• n=3

• p = 1/4

• q = 0,75

σ = √ npq  σ = √ 3 × 0,25 × 0,75 = √0,562 = 0,75

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


14
Licenciatura en Nutrición

Verificá tu aprendizaje

Actividad 1
Resolvé los siguientes problemas de distribución binomial.

1. La probabilidad de éxito de una nueva vacuna es de 0,81. En caso de que sea admi-
nistrada a 20 pacientes, calculá la probabilidad de que…

a. Ninguno se enferme.

b. Todos se enfermen.

____________________________________________________________________________

____________________________________________________________________________

2. Una fábrica que produce jeringas sabe que 7 de cada mil jeringas son defectuosas.
Calculá:

a. La probabilidad de que, al analizar 50 piezas, solo 1 sea defectuosa.

b. La probabilidad de que, al analizar 80 piezas, solo 2 sean defectuosas.

____________________________________________________________________________

____________________________________________________________________________

3. Calculá la probabilidad de que al arrojar un dado al aire 5 veces…

a. Salga una vez el número 3.

b. Salga al menos 3 veces el número 1.

c. Nunca salga el 4.

____________________________________________________________________________

____________________________________________________________________________

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


15
Licenciatura en Nutrición

2.2. Distribución de Poisson

RECORDÁ:

Desarrollada por Siméon Poisson, la distribución de Poisson analiza la distribu-


ción de variables aleatorias discretas.

Como sabemos, las variables aleatorias discretas refieren a números enteros.

EJEMPLO:

Algunos ejemplos pueden ser:

• Cantidad de enfermos que acceden a la sala de emergencias.

• Cantidad de autos que pasan por una cabina de peaje en una autopista.

• Cantidad de llamadas que recibe una persona en un conmutador.

Como vemos, todos estos ejemplos refieren a números con valores enteros (1, 2, 3, 4…).

Usaremos x para designar el valor específico que puede asumir la variable.

La distribución de Poisson nos permite calcular la probabilidad de x ocurrencias, aplicando


la siguiente fórmula:

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


16
Licenciatura en Nutrición

En la distribución de Poisson también podemos calcular la media y la varianza.

• La fórmula para calcular la media de una distribución de Poisson es la siguiente:

µ = E(x) = λ

• La fórmula para calcular la varianza de una distribución de Poisson es la siguiente:

λ = σ2

A continuación analizaremos la distribución de Poisson a través de algunos ejemplos.

EJEMPLO:

Se sabe que el 2% de los guantes utilizados en las consultas médicas poseen un


error de fabricación que los hace muy frágiles y se rompen al ponérselos. Calcu-
lemos la probabilidad de que 5 de 400 guantes en una caja posean ese defecto.

Utilizando las definiciones vistas, podemos calcular lambda:

Entonces:

λ = 400 × 0,02 = 8

Reemplazando en la fórmula de Poisson, tenemos:

P(X, λ) = 85 2,718-8 / 5! = 0,092

Entonces, la probabilidad de que 5 de 400 guantes en una caja posean fragilidad


es de 0,092.

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


17
Licenciatura en Nutrición

EJEMPLO:

En una fábrica de botellas de plástico se verifica que por minuto se producen 0,2
botellas defectuosas que deben ser descartadas. Calculemos la probabilidad de:

a. Encontrar 1 botella defectuosa en 3 minutos.

b. Encontrar al menos 2 botellas defectuosas en 5 minutos.

c. Encontrar a lo sumo 1 botella defectuosa en 15 minutos.

a. Encontrar una botella defectuosa en 3 minutos.

En principio debemos analizar los datos. El enunciado indica que se encuentran


0,2 botellas defectuosas por minuto; entonces, la probabilidad de encontrar una
botella defectuosa en un minuto es de 0,2.

P(x) = 0,2

Sabemos que x es un número entero (1, 2, 3, etc.).

Asimismo, podemos calcular lambda. La consigna nos pide encontrar 1 botella


defectuosa en 3 minutos, donde n = 3 y p = 0,2.

λ = 0,2 × 3 = 0,6

Ahora apliquemos la fórmula, sabiendo que el valor x = 1, pues debemos encontrar


1 botella defectuosa en 3 minutos:

La respuesta es 0,33, lo que implica que tenemos una probabilidad de 0,33 de


hallar una botella defectuosa en 3 minutos.

b. Encontrar al menos 2 botellas defectuosas en 5 minutos.

Como la consigna pide “al menos 2”, se nos está indicando que las botellas de-
fectuosas pueden ser 2, 3, 4… etc. Quedan por fuera del resultado los números 0 y
1. (Si nos hubieran pedido “a lo sumo 3 imperfecciones”, se nos estaría indicando
que puede haber 0, 1, 2 o 3 botellas defectuosas, pero no más).

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


18
Licenciatura en Nutrición

Como sabemos que la suma de todas las probabilidades siempre va a dar 1,


tenemos que decidir qué nos conviene más: si sumar cada probabilidad pedida
o restarle a 1 los resultados no pedidos. Resolvamos paso a paso.

x = 1, 2, 3… etc. cada 5 minutos.

Calculemos lambda:

λ = 0,2 × 5 = 1

Podemos calcular “al menos 2 botellas defectuosas” como….

1 - p(x, λ)

… siendo 1 la probabilidad total, a la cual le restaremos p (probabilidades no pe-


didas, que son 0 y 1).

La respuesta es 0,26, que indica la probabilidad de encontrar al menos 2 botellas


defectuosas en 5 minutos.

c. Encontrar a lo sumo 1 botella defectuosa en 15 minutos.

Recordemos que “a lo sumo” nos da un máximo, que en este ejemplo es 1; por lo


tanto, debemos calcular la probabilidad de encontrar 0 y 1 botellas defectuosas
en 15 minutos.

Calculemos lambda:

λ = 0,2 × 15 = 3

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


19
Licenciatura en Nutrición

Y ahora:

La respuesta es 0,2, que indica la probabilidad de hallar a lo sumo una botella


defectuosa en 15 minutos.

Como vimos, un enunciado puede pedir que calculemos la probabilidad de que un suce-
so determinado ocurra una vez, que no ocurra nunca o que ocurra siempre. Pero también
podemos calcular que un suceso ocurra “al menos” cierta cantidad de veces o “a lo sumo”
otra cantidad de veces. Es importante entender y no confundir estos conceptos:

• “Al menos”, “como mínimo”, “por lo menos”. Por ejemplo, si damos un examen, de-
seamos “como mínimo” obtener un 4. Pensando en un examen cuya nota máxima es
10, los resultados posibles para esta situación serían 4, 5, 6, 7, 8, 9 y 10. Es decir que
debemos obtener un mínimo de 4 para aprobar, pero el resto de los resultados serían
favorables también.

• “A lo sumo”, “como mucho”. Por ejemplo, si planeamos nuestras vacaciones y sabe-


mos que podemos tomarnos a lo sumo 8 días para viajar. De un total de 14 días de
vacaciones, solo podemos viajar, como mucho, 8 días: podemos viajar 1, 2, 3, 4, 5, 6, 7
u 8 días, pero no más que eso.

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


20
Licenciatura en Nutrición

Verificá tu aprendizaje

Actividad 2
Resolvé los siguientes problemas de distribución de Poisson.

1. Si se descubrió que 15 de cada 100 loros entrenados pueden hablar el idioma caste-
llano con cierta facilidad, ¿qué probabilidad existe de que, si tomamos 20 loros al azar,
3 de ellos puedan hablar castellano?

____________________________________________________________________________

____________________________________________________________________________

2. Si el 3% de las lámparas eléctricas producidas por una compañía son defectuosas,


calculá la probabilidad de que en una muestra de 100 lámparas…

a. No se encuentre ninguna lámpara defectuosa.

b. Se encuentren 2 lámparas defectuosas.

c. Se encuentren 5 lámparas defectuosas.

____________________________________________________________________________

____________________________________________________________________________

2.3. Distribución normal o de Gauss

Luego de años de recopilación y análisis de datos, la ciencia llegó a la conclusión de que


la mayor parte de las variables estudiadas en la naturaleza responden a una distribución
normal.

RECORDÁ:

La distribución normal de los datos, que corresponden a una variable continua,


se representa a través del gráfico de “campana” de Gauss, que tiene forma de
campana.

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


21
Licenciatura en Nutrición

Este gráfico lleva el nombre de Carl Friedrich Gauss, quien representaba sus descubri-
mientos en astronomía a través de él.

EJEMPLO:

Las siguientes variables de uso común responden a una distribución normal:

• Caracteres morfológicos de individuos (personas, animales, plantas…) de


una especie. Por ejemplo: tallas; pesos; envergaduras; diámetros; perímetros.

• Caracteres fisiológicos, como el efecto de una misma dosis de un fármaco o


de una misma cantidad de abono.

• Caracteres sociológicos. Por ejemplo: consumo de cierto producto por un


mismo grupo de individuos; puntuaciones en cierto examen.

• Caracteres psicológicos, como el cociente intelectual o el grado de adapta-


ción a un medio.

• Errores cometidos al medir ciertas magnitudes.

• Valores estadísticos muestrales. Por ejemplo: la media.

• La distribución binomial y de Poisson son aproximadas a la normal.

De hecho, y debido a la cantidad de distribuciones


de datos que se corresponden con la distribución Debido a la cantidad de
normal, muchos procedimientos estadísticos “asu- distribuciones de datos
men” la “normalidad” de los datos, esto es, su dis- que se corresponden con
tribución normal. Cuando no ocurre esto, los datos la distribución normal,
pueden ser transformados a la normal, o pueden muchos procedimientos
emplearse métodos estadísticos “no paramétricos” estadísticos “asumen” su
para su análisis. distribución normal.

Veamos ahora cómo es una campana de Gauss.


En ella se realiza la representación gráfica de una serie de datos correspondientes a una
variable específica. La distribución de datos sigue la curva normal, como se ve en la si-
guiente figura:

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


22
Licenciatura en Nutrición

Como vemos, existe un valor central (µ) o media, donde se encuentran la mayor parte de
los datos; y, a medida que nos alejamos de este valor medio, la cantidad de datos disminuye.

RECORDÁ:

En otras palabras, los datos se acumulan en la media, con una proporción del
68,2%. Luego se observa una reducción gradual en la cantidad de datos.

Esta reducción no es lineal, sino que es mayor al principio y luego disminuye al alejarse
de la media y acercarse al eje de las x. Vemos que en la figura se calculan los valores de
porcentaje en función de la media para 1, 2 o 3 desviaciones estándar (σ).

Se puede observar también que, cuanto más se dispersen los datos –es decir, cuanto ma-
yor sea el valor de la desviación estándar–, más dispersión se hallará en el eje x. Como ve-
remos en algún ejemplo más adelante, la curva normal más utilizada es la que tiene media
0 y desviación estándar 1, que reúne el 64,28% de los datos posibles en un experimento.

Finalmente, si el experimento presenta una distribución que abarca la campana de Gauss


completa –esto es, µ + - 3 σ–, tenemos que probabilidad alcanza el 99,74%, valor muy uti-
lizado (y buscado) en el campo de la bioquímica y la confección de medicamentos, por
ejemplo.

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


23
Licenciatura en Nutrición

RECORDÁ:

El área total que define la curva es igual a 1 (o al 100%) y, dado que es una curva
simétrica desde la media (igual dispersión hacia derecha e izquierda), el área des-
de la media hacia la derecha es 0,5 y hacia la izquierda también.

La fórmula que se aplica para los cálculos es:

* Donde x  N(µ, σ), que indica que la variable aleatoria x tiene una distribución de pro-
babilidad normal con parámetros µ y σ.

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


24
Licenciatura en Nutrición

Veamos algunas propiedades del modelo normal:

• Es simétrico con respecto a un valor central (media). En esta distribución coinciden


la media (o valor esperado), la mediana (que divide la curva en dos zonas de igual
área hacia la derecha y hacia la izquierda) y la moda (que es el punto de la curva con
máximo valor de ordenada).

• Es asintótica con respecto al eje de las abscisas, lo que significa que nunca tocará
el eje x cuando la curva tiende al infinito.

• Presenta puntos de inflexión (cuando la curva pasa de cóncava a convexa) en cada


sitio donde la media suma o resta un desvío estándar (µ + -σ).

• Hay toda una familia de curvas normales dependiendo de los valores de µ y σ, que
definen la forma de la campana de Gauss. La media indica la posición de la campana,
de modo que para diferentes valores de µ la gráfica es desplazada a lo largo del eje
horizontal.

La expresión que define la función de probabilidad para la distribución normal estándar es:

Veamos qué significa z. El valor z se encuentra estandarizado y se utiliza para obtener, de


una forma simple, la probabilidad de observar un dato en una distribución de datos. Se
aplica a variables que siguen una distribución normal y se calcula como:

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


25
Licenciatura en Nutrición

La tabla asociada a la distribución normal estándar


se puede obtener en la tabla de distribución nor- Para ver la tabla de distri-
mal estándar. bución normal estándar,
podés consultar “Recur-
El uso de estas tablas se basa en la aplicación de lo
sos” de esta unidad.
que se conoce como teorema de tipificación. Según
este teorema, la función de distribución asociada a
un valor de una variable aleatoria X, con distribución normal, es la misma que la función de
distribución de la tipificada de ese valor en la normal estándar. Es decir que la probabilidad
de los valores menores que uno dado (o área izquierda de ese valor) en una distribución
normal es la misma que para el valor tipificado en la normal estándar. Por eso las tablas se
han construido solo para la distribución estándar.

Veamos cómo se utiliza la tabla con su valor z.

En la primera columna podemos ver el número entero y el primer decimal a buscar. En las
columnas siguientes se observan valores correspondientes al segundo decimal. El valor
que figura en la celda será nuestro resultado.

EJEMPLO:

Si buscamos el área correspondiente al valor -0,43, buscamos en la primera co-


lumna la fila correspondiente a -0,4, luego buscamos el segundo decimal (nú-
mero 3). El valor que figura en la celda será nuestro resultado. En este ejemplo es
el 0,3336. (Si miran otras tablas con mayor cantidad de decimales, encontrarán
números no redondeados, como por ejemplo 0,333598).

Entonces: buscamos en la tabla de valores negativos, seleccionamos el valor -0,4


y luego en la columna que da el valor del segundo decimal (0,43 sería 0,4 con el
primer decimal y luego buscamos en la columna del 0,03).

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


26
Licenciatura en Nutrición

Como vimos, las tablas facilitan en gran medida los cálculos.

Una de las deducciones que podemos realizar es que la forma de la campana depende
de los parámetros µ y σ. La media indica la posición de la campana; por lo tanto, este valor
puede hacer que la campana se desplace en el eje x.

Por otra parte, el valor de σ determina el grado de apuntamiento de la curva. Cuanto mayor
sea este valor, más plana será la curva.

Mayor varianza

Repasemos algunos conceptos analizados:

• El área bajo la curva normal siempre es 1. Las colas de la curva se extienden hacia
el infinito negativo y el infinito positivo y nunca tocan al eje X, pero se acercan infinita-
mente, por eso se calcula que el área total bajo la curva es 1.

• Nunca podría dar un resultado negativo. Es imposible encontrar un área negativa.

• El área a la izquierda de µ es 0,5 y el área a la derecha de µ es 0,5 (la suma de las


dos mitades es el área total, que es igual a 1).

• La curva va sumando los valores de izquierda a derecha.

• Existen muchos tipos de tablas: de valores acumulados, de valores negativos y posi-


tivos. A medida que se van resolviendo los ejercicios, se adquiere destreza en el uso
de tablas.

EJEMPLO:

Tenemos una variable x que se distribuye como N(50,8), es decir, que el valor de la
media es 50 y el valor de la desviación estándar es 8. Encontremos:

a. El valor acumulado de 56.

b. Un valor como mínimo igual a 52,8.

c. Un valor comprendido entre 40,8 y 48,3.

a. El valor acumulado de 56.

El procedimiento para hallar el valor de Z (indicado en la página 25 ) se llama “tipifi-


car”. Significa convertir una distribución en una distribución normal estándar N(0,1);
de esta forma podremos consultar los valores en las tablas.

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


27
Licenciatura en Nutrición

Sabemos que “valor acumulado” indica todos los valores desde -∞ hasta el valor 56.

Ahora debemos buscar el valor z en la tabla, que da 0,7734. Por lo tanto, el resultado
es un área equivalente a 0,7735, aproximadamente un 77% del total del área bajo la
curva, tal como podemos observar en la tabla correspondiente:

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


28
Licenciatura en Nutrición

b. Un valor como mínimo igual a 52,8.

Primero calculamos Z:

Ahora buscamos el valor z en la tabla, que es 0,6368.

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


29
Licenciatura en Nutrición

El siguiente gráfico muestra el área bajo la curva:

Ahora, necesitamos un valor a la derecha de la curva –ya que la consigna dice


“como mínimo”–, es decir, de 52,8 hasta +∞.

Cuando necesitamos calcular el área a la derecha de un punto determinado, debe-


mos restarle a la probabilidad total (1) la probabilidad hasta dicho punto. Esa diferen-
cia nos da el resultado del área a la derecha de la curva (no olvidemos que la curva
acumula los valores de izquierda a derecha).

Debemos recordar que el área total es 1; por lo tanto, el área pedida es 1 - Z, lo que
resulta en:

1 - Z = 1 - 0,6368 = 0,3632

El gráfico muestra el área bajo la curva.

c. Un valor comprendido entre 40,8 y 48,3.

En este caso debemos calcular el área acotada entre los valores 40,8 y 48,3. Para
encontrarla necesitamos averiguar la diferencia entre la probabilidad acumulada
del mayor valor y la probabilidad del menor valor. El cálculo es el siguiente:

P (40,8 < X ≤ 48,3)

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


30
Licenciatura en Nutrición

Calculemos los valores de Z:

Para calcular el segmento pedido, recordando que el área de la curva avanza de


izquierda a derecha, veamos el siguiente esquema:

Lo podemos razonar de la siguiente forma: resolviendo los cálculos, obtenemos la


P de dos números negativos: -1,15 y -0,21. Esto nos asegura que el área que busca-
mos se encuentra en el sector izquierdo del gráfico, es decir, a la izquierda del eje
de ordenadas (el eje Y).

¿Cuál de las cifras estará más alejada de la intersección del eje de ordenadas con
el eje de abscisas (eje X)? Evidentemente, el -1,15 está más alejado y, por consi-
guiente, el -0,21 estará más cerca. Si observamos el gráfico y tenemos en cuenta
que la tabla nos va dando siempre los valores de izquierda a derecha, si tomamos
la porción de la curva que abarca desde -∞ a 0,21, obtendremos toda el área hasta
ese punto. Si a ello le restamos el área que nos arroja la curva desde -∞ hasta -1,21,
por diferencia solo quedará el segmento que estamos buscando.

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


31
Licenciatura en Nutrición

Hay una prueba que se puede hacer, un tanto intuitiva, pero que puede orientar a la hora
de ver si estamos manejando bien las tablas. El resultado de la distribución normal es un
área. Por lo tanto, siempre será un número positivo. Si dibujamos –aunque sea de forma
aproximada– el gráfico, podremos deducir si el área que nos arroja la tabla es coherente
(teniendo en cuenta que el área total bajo la curva es igual a 1). Si el dibujo que hacemos
nos da un área muy chiquita, un cuarto de la curva total, y el cálculo arroja por ejemplo
un resultado de 0,92, algo está mal: o la representación gráfica o el cálculo. El resultado
debería ser cercano a 0,25 o 0,30 para ser coherente con el gráfico dibujado (es decir, una
cuarta parte de 1, que es el área total bajo la curva).

P = (-0,21) - P (-1,15) = 0,4168 - 0,1251 = 0,2917

Tipos de curva con distribución normal


La distribución de datos y de probabilidad puede:

• Estar sesgada hacia la derecha o hacia la izquierda.

• Tener un valor máximo (como la campana de Gauss que analizamos, también llama-
da unimodal) o tener dos picos (en cuyo caso se denomina bimodal).

• Ser simétrica o asimétrica.

Asimismo, la distribución de los datos desde la media hacia los extremos derecho e iz-
quierdo se denomina curtosis (del griego kurtos, que significa ‘arqueado/a’) y puede tener
tres categorías:

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


32
Licenciatura en Nutrición

• Leptocúrtica: los datos están concentrados en la media (curtosis > 0).

• Mesocúrtica: los datos están dispersos (curtosis = 0).

• Platicúrtica: los datos están desplazados hacia los lados (curtosis < 0).

RECORDÁ:

Gráficamente, la curtosis –que indica cuán empinada o achatada es la curva– es


una medida de forma que indica la cantidad de datos cercanos a la media, de
manera que, a mayor grado de curtosis, la curva será más empinada y, a menor
grado de curtosis, será más achatada.

Esto se puede visualizar al observarse el gráfico e inferir cuán cercanos a la media son la
mayoría de los valores, pero también existen cálculos para determinar el grado de curto-
sis de la curva. La curtosis se mide promediando la cuarta potencia de la diferencia entre
cada elemento del conjunto y la media, dividido entre el producto de la cantidad total de
datos y la desviación típica elevada a la cuarta potencia. Si el conjunto X = (x1, x2…, xN), en-
tonces el coeficiente de curtosis será:

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


33
Licenciatura en Nutrición

Cuando los datos están agrupados o agrupados en intervalos, la fórmula del coeficiente
de curtosis se convierte en:

Como vemos, la fórmula es la misma, pero obviamente se multiplica por la frecuencia de


cada intervalo para tomar la totalidad de los datos.

EJEMPLO:

Analicemos el nivel de curtosis con el siguiente ejemplo.

Tenemos la siguiente tabla de frecuencias (ya están calculadas las marcas de cla-
se, señalizadas como X, para agilizar los cálculos).

X F
30,5 1
39,5 4
48,5 5
57,5 14
66,5 14
75,5 5
84,5 2

Si observamos la fórmula de curtosis de datos agrupados, necesitamos calcular la


media de la distribución y el desvío estándar.

X F Xi × F X - Xm (X - Xm)2 (X - Xm)2 × F
30,5 1 30,50 -29,80 888,04 888,04
39,5 4 158,00 -20,80 432,64 1730,56
48,5 5 242,50 -11,80 139,24 696,20
57,5 14 805,00 -2,80 7,84 109,76
66,5 14 931,00 6,20 38,44 538,16
75,5 5 377,50 15,20 231,04 1155,20
84,5 2 169,00 24,20 585,64 1171,28
45 2714 6289,20

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


34
Licenciatura en Nutrición

Media: 60,30

Varianza: 139,76

Desvío: 11,82

Hasta este punto son cálculos que ya estamos habituados a realizar. La fórmula
nos pide calcular también la potencia cuarta de la resta de X menos la media. Y la
potencia cuarta del desvío estándar:

X F Xi × F X - Xm (X - Xm)2 (X - Xm)2 × F (X - Xm)4 × F


30,5 1 30,50 -29,80 888,04 888,04 788.615,04
39,5 4 158,00 -20,80 432,64 1730,56 748.709,48
48,5 5 242,50 -11,80 139,24 696,20 96.938,89
57,5 14 805,00 -2,80 7,84 109,76 860,52
66,5 14 931,00 6,20 38,44 538,16 20.686,87
75,5 5 377,50 15,20 231,04 1155,20 266.897,41
84,5 2 169,00 24,20 585,64 1171,28 685.948,42
45 2714 6289,20 2.608.656,62

Media: 60,30

Varianza: 139,76

Desvío: 11,82 desvío4: 19.532,86

Estamos en condiciones, entonces, de calcular y analizar el nivel de curtosis de la


distribución:

Como el resultado es menor a cero, aunque muy cercano a cero, la curva es leve-
mente platicúrtica, es decir, está levemente achatada, aunque es muy cercana a
una curva normal estándar.

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


35
Licenciatura en Nutrición

Verificá tu aprendizaje

Actividad 3
Resolvé los siguientes problemas de distribución normal.

1. La media de los pesos de 500 estudiantes de un colegio es 70 kg y la desviación


típica, 3 kg. Suponiendo que los pesos se distribuyen normalmente, calculá cuántos
estudiantes pesan:

a. Más de 90 kg.

b. Menos de 64 kg.

____________________________________________________________________________

____________________________________________________________________________

2. En una ciudad se estima que la temperatura máxima en el mes de junio sigue una
distribución normal, con media 23° y desviación típica 5°. Calculá el número de días
del mes en los que se espera alcanzar máximas entre 21° y 27°.

_____________________________________________________________________________

_____________________________________________________________________________

3. Una maestra decide que, para que un alumno se saque una A, debe estar entre el 10%
de promedios más altos. Según su experiencia, la media será 72 y el desvío estándar
será 13. ¿Cuál es la calificación mínima que necesitará un estudiante para obtener una
A?

_____________________________________________________________________________

_____________________________________________________________________________

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


36
Licenciatura en Nutrición

4. Los ingresos de los ejecutivos junior en una empresa están distribuidos normalmente
con un desvío estándar de 1200. Se piensa hacer un recorte de gastos, por lo que los
ejecutivos que ganen menos de $28.000 serán despedidos. Si el despido representa
el 10% de los ejecutivos, ¿cuál es el sueldo medio de los ejecutivos junior de esta
empresa?

_____________________________________________________________________________

_____________________________________________________________________________

5. La vida media de los habitantes de un país es de 68 años, con una varianza de 25. Si
se hace un estudio en una pequeña ciudad de 10.000 habitantes…

a. ¿Cuántas personas superarán previsiblemente los 75 años?

b. ¿Cuántos vivirán estimativamente menos de 60 años?

_____________________________________________________________________________

_____________________________________________________________________________

6. El consumo medio anual de cerveza de los habitantes de un país es de 59 litros, con


una varianza de 36. Se supone que se distribuye según una distribución normal.¿-
Cuántos litros de cerveza tendría que beber una persona al año para pertenecer al 5%
de la población que más bebe?

_____________________________________________________________________________

_____________________________________________________________________________

7. A un examen se presentaron 2000 aspirantes. La nota media fue 5,5, con una varianza
de 1,1. Hay solamente 100 lugares. Si uno de los aspirantes obtuvo un 7,7, ¿sería opor-
tuno ir organizando una fiesta para celebrar su éxito?

_____________________________________________________________________________

_____________________________________________________________________________

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


37
Licenciatura en Nutrición

8. Varios test de inteligencia dieron una puntuación que sigue una ley normal con media
100 y desviación típica 15.

a. Determiná el porcentaje de población que obtendría un coeficiente entre 95 y 110.

b. En una población de 2500 individuos, ¿cuántos individuos se espera que tengan un


coeficiente superior a 125?

_____________________________________________________________________________

_____________________________________________________________________________

9. La renta media de los habitantes de un país es de 4 millones de pesos al año, con una
varianza de 1,5. Se supone que se distribuye según una distribución normal. Calculá:

a. El porcentaje de la población con una renta inferior a 3 millones de pesos.

b. La renta a partir de la cual se sitúa el 10% de la población con mayores ingresos.

_____________________________________________________________________________

_____________________________________________________________________________

Actividad 4

Calculá:

1. P (Z ≤ 1,47)

2. P (Z > 1,47)

3. P (0,45 < Z ≤ 1,47)

_____________________________________________________________________________

_____________________________________________________________________________

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


38
Licenciatura en Nutrición

Solucionario
Actividad 1

1. Considerando que la idea de éxito de la vacuna es que ningún paciente vacuna-


do sufra la enfermedad…

a. Para calcular la probabilidad de que ninguno se enferme debemos calcular la


probabilidad para x = 20:

b. Para calcular la probabilidad de que todos se enfermen, debemos calcular la


probabilidad para x = 0:

* Como en el resultado (0,000000000000000375) existen 15 ceros luego de la


coma, se elige esta forma de expresarlo (3,75 × 10-15).

2. Para resolver este problema debemos considerar los siguientes conceptos:

• 7 de cada mil jeringas son defectuosas, es decir que la probabilidad de que


una pieza sea defectuosa es de 7 cada mil (es decir, 0,007).

• La suma de todas las probabilidades de que ocurra un suceso (defectuoso /


no defectuoso) es igual a 1 (p + q = 1); por lo tanto, para obtener la probabilidad
de que una jeringa no salga defectuosa necesitamos calcular la diferencia: 1 -
0,007 = 0,993.

• X representa la variable aleatoria, que en este caso es la cantidad de jeringas


defectuosas.

Usaremos la siguiente fórmula:

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


39
Licenciatura en Nutrición

a. Para calcular la probabilidad de que, al analizar 50 piezas, solo 1 sea defectuo-


sa, consideremos lo siguiente: P(X) es la probabilidad que vamos a calcular; n
es el número de experimentos, es decir, el tamaño de la muestra (en este caso,
n = 50); p es la probabilidad de éxito (en este caso, se refiere a las jeringas de-
fectuosas: p = 0,007); 1 - p es la probabilidad de fracaso (en este ejemplo, las
jeringas no defectuosas: 1 - p = 0,993); X es el número de éxitos de la muestra
(en este caso, x = 1).

Reemplazamos en la fórmula y obtenemos:

(Recordá repasar el concepto de factorial para poder realizar los cálculos).

b. Para calcular la probabilidad de que, al analizar 80 piezas, solo encontremos 2


defectuosas, hacemos el siguiente cálculo:

3. Para resolver este problema, primero debemos hallar los valores para aplicar en
la fórmula.

• p es la probabilidad de éxito. En este caso, la probabilidad de encontrar un nú-


mero determinado al arrojar un dado al aire es 1/6.

• 1 - p es la probabilidad de fracaso, que en algunos textos es llamada “q”. En este


caso, será 5/6, es decir: 1 - 1/6 (1 es la probabilidad total y a esto le restamos la
probabilidad de que salga determinado número en un dado).

• P(X) es la probabilidad de X éxitos dados los parámetros n y p.

• n es el número de experimentos, es decir, el tamaño de la muestra. En este


caso sería 5, la cantidad de veces que arrojamos el dado al aire.

a. Para calcular la probabilidad de que salga una vez el 3, olvidemos que el número
es 3; lo importante es la frase “una vez”, es decir, X = 1 (podría ser una vez el 5 o
una vez el 6).

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


40
Licenciatura en Nutrición

Reemplazamos en la fórmula:

b. Para calcular la probabilidad de que salga al menos 3 veces el 1, recordemos


nuevamente que el número del dado no es importante; lo importante es la can-
tidad de veces. En este caso, esa cantidad no es exacta, sino que dice “al menos
3”, por lo que tenemos que calcular la probabilidad de que salga 3, 4 y 5 veces.

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


41
Licenciatura en Nutrición

c. Para calcular la probabilidad de que nunca salga el 4, consideremos que la pro-


babilidad de que nunca salga algo es X = 0.

Actividad 2

1. Primero calculamos la probabilidad. 15 de cada 100 loros entrenados pueden


hablar castellano con facilidad; por lo tanto, la probabilidad es 15/100 = 0,15. N
es el tamaño de la muestra de loros que tomamos; en este caso, n = 20. Luego
calculamos λ; lo hacemos multiplicando N × P.

P = 0,15

N = 20

λ = N × P = 20 × 0,15 = 3

e = 2,718 (base del logaritmo natural)

X=3

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


42
Licenciatura en Nutrición

La consigna pide calcular la probabilidad de que 3 loros hablen castellano. X es el


dato que queremos calcular (la cantidad de loros que queremos encontrar), por
lo que X = 3.

P(3) = 33 × 2,718-3 / 3!

P(3) = 27 × 0,04980 / 6

P(3) = 0,2241

2. Recordemos la fórmula:

 λ se calcula como n × p: en el ejemplo, sería λ = 100 × 0,03 = 3.

a. Probabilidad de no encontrar ninguna lámpara defectuosa = 0,04979.

b. Probabilidad de encontrar 2 lámparas defectuosas = 0,2241.

c. Probabilidad de encontrar 5 lámparas defectuosas = 0,1008.

Actividad 3

1.

a. Para calcular cuántos estudiantes pesan más de 90 kg, realizamos el siguiente


cálculo:

Recordá que la curva normal tiene un área total equivalente a 1 (es decir, se apro-
xima infinitamente a 1). En este caso, el valor arrojado por el cálculo de Z es 6,67,
es decir, en el extremo derecho de la curva. Por eso calculamos que el área acu-
mulada es la total, es decir, 1. Además, buscamos los valores a la derecha de Z,
por eso debemos restarle a 1 el valor hallado, que, como vimos, es 1.

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


43
Licenciatura en Nutrición

b. Para calcular cuántos estudiantes pesan menos de 64 kg, realizamos el si-


guiente cálculo:

2.

3. Recordemos que el 10% se representa con el número 0,10. Como hablamos del
0,10 más alto, podemos decir que dejamos por debajo al 0,90.

En este caso, en la tabla vamos a buscar al revés: tenemos el área, y el 90% de los
alumnos queda por debajo de esa nota. Tenemos que buscar en la zona del área
de la curva cuál es el valor de Z que arroja una superficie de aproximadamente
0,90 (o 90%).

Entonces, buscamos el valor en la tabla: Z = 1,28

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08


1,0 - - - - - - - - -
1,1 - - - - - - 0,8789 0,8809 0,8829
1,2 - - - - - - 0,8979 0,8997 0,9014
1,3 - - - - - - - - -

El valor 0,8997 es el que tiene la menor diferencia con 0,90.

Ahora reemplazamos en la fórmula de tipificación:

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


44
Licenciatura en Nutrición

A Z lo obtenemos consultando la tabla, y los otros dos datos nos los da el enun-
ciado:

Si bien la media de los promedios más altos, según la experiencia del docente, es
72, para poder quedar entre el 10% de las mejores puntuaciones se necesitarán al
menos 86,69 puntos.

4. En este caso, debemos buscar el 10% más bajo, es decir, a la izquierda de la curva,
debido a que por enunciado inferimos que se despedirán los ejecutivos con un
sueldo menor a la media. Como en el ejercicio anterior, buscamos qué valor de
Z arroja un área aproximada de 0,10. Luego reemplazamos y despejamos en la
fórmula la incógnita, que en este caso es la media.

5.

a. Tenemos que tener en cuenta que la fórmula pide el desvío estándar. Muchas
veces, los enunciados nos dan la información de la varianza, y hay que calcular
la raíz cuadrada para obtener el desvío estándar.

El 8,08% de la población (808 habitantes) vivirán más de 75 años.

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


45
Licenciatura en Nutrición

b. Para averiguar cuántos habitantes vivirán estimativamente menos de 60 años,


debemos calcular el valor de la normal tipificada equivalente a 60 años.

Buscamos el valor en la tabla y encontramos 0,0548. Por lo tanto, el 5,48% de la


población (548 habitantes) probablemente no llegarán a esa edad.

6. Buscamos en la tabla el valor de la variable tipificada cuya probabilidad acumula-


da es 0,95 (95%), por lo que por arriba estaría el 5% restante. Ese valor corresponde
a Z = 1,645 (aproximadamente). Ahora calculamos la variable normal X equivalente
a ese valor de la normal tipificada:

Por lo tanto, debería beber 67,87 litros.

7. Vamos a ver en qué nivel porcentual está situado ese 7,7. Para ello vamos a calcu-
lar primero el valor de la normal tipificada equivalente.

A ese valor de Z le corresponde en la tabla una probabilidad acumulada de 0,9820


(98,20%), lo que significa que por encima de este estudiante solo se encuentra un
1,8%. Si se han presentado 2000 aspirantes, ese 1,8% equivale a unos 36 aspiran-
tes. Por lo que, si hay 100 plazas disponibles, se puede organizar la fiesta.

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


46
Licenciatura en Nutrición

8.

a. Para determinar el porcentaje de población que obtendría un coeficiente entre


95 y 110, realizamos el siguiente cálculo:

b. Para calcular cuántos individuos se espera que tengan un coeficiente superior


a 125 en una población de 2500 individuos, realizamos el siguiente cálculo:

9.

a. Debemos calcular qué porcentaje de la población tiene una renta inferior a 3


millones de pesos.

Dados los siguientes datos:

• Varianza: 1,5

• Desvío estándar: 1,22

Calculamos:

Por lo tanto, el 20% cumple con este requisito.

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


47
Licenciatura en Nutrición

b. Para calcular la renta a partir de la cual se sitúa el 10% de la población con ma-
yores ingresos, buscamos primero en la tabla el valor de la variable tipificada
cuya probabilidad acumulada es el 0,9 (90%), lo que quiere decir que por enci-
ma se sitúa el 10% superior. Ese valor corresponde a X = 1,282 (aproximadamen-
te). Ahora calculamos la variable normal Z equivalente a ese valor de la normal
tipificada:

Por lo tanto, el 10% está formado por personas que ganan más de 5,57 millones.

Actividad 4

1. P (Z ≤ 1,47) = 0,9292

2. P (Z > 1,47) = 1 − P(Z ≤ 1,47) = 1 – 0,9292 = 0,0708

3. P(0,45 < Z ≤ 1,47) = P(Z ≤ 1,47) − P(Z ≤ 0,45) = = 0,9292 – 0,6736 = 0,2556

Bioestadística I Unidad didáctica: 4. Cálculo y análisis de variables cuali y cuantitativas


48
NUESTRAS SEDES

Buenos Aires La Rioja Santo Tomé


Ciudad Autónoma Provincia de La Rioja Provincia de Corrientes
de Buenos Aires
Av. Las Heras 1907 Benjamín Matienzo 3177 Rivadavia e Independencia
Tel./Fax: (011) 4800 0200 Tel./Fax: (0380) 4422090 Tel./Fax: (03756) 421622
(011) 1565193479 (0380) 154811437 (03756) 15401364
informesba@barcelo.edu.ar informeslr@barcelo.edu.ar informesst@barcelo.edu.ar

También podría gustarte