Está en la página 1de 103

Apresto Ejercicios Solemne 2

Ejercicio 1

Hay una población A= {2,3,6,8,9}; cuya µ= 5,6 y σ 2=7,44. Se realiza muestreo aleatorio
sin reemplazo de todas las muestras posibles de tamaño 2 de la población A,
produciendo una nueva población de medias de las muestras, la que llamaremos
población B. Los parámetros de la población de B son µ=5,6 y σ2=2,79.

a) ¿Cuántas muestras de tamaño 2, es posible obtener de la población A


b) Verifique las determinaciones de la media µ y varianza poblacional σ 2 en A.
c) Indique los elementos para el conjunto población B.
d) Verifique las determinaciones de la varianza y media de la población B.
e) Evidencie la relación entre los parámetros (µ y σ2) de la población A y de B. (Tabla I)
f) Determine e interprete el error estándar.

Ejercicio 2

A partir de la población F = {1,2,3}

a) Determine número total posible de muestras aleatorias con reemplazo y sin


reemplazo, para un tamaño muestral (n) de 2.
b) Determine la media µ y varianza poblacional σ2 en F.
c) Determine todas las muestras aleatorias de tamaño n=2, con reemplazo que se
puedan seleccionar de F, denominando a este conjunto como población K.
d) Haga las determinaciones de la varianza y media de la población K obtenido en la
pregunta c.
e) Evidencie la relación entre los parámetros (µ y σ2) de la población F y de la población
K (Tabla I).
f) Determine e interprete el error estándar.

1
Tabla I Relaciones entre parámetros población y parámetros muestrales.

Población finita Población infinita


𝜇𝑋̅ = 𝜇 𝜇𝑋 = 𝜇
𝜎2 𝜎2
𝜎𝑋2̅ = 𝑓(𝑁, 𝑚) 𝜎𝑋2̅ =
𝑛 𝑛

𝜎2 𝜎
𝜎𝑋̅ = √ 𝑓(𝑁, 𝑚) 𝜎𝑋̅ =
𝑛 √𝑛

𝑁−𝑛
Muestreo aleatorio con reemplazo:𝑓(𝑁, 𝑚) = 1 ; muestreo aleatorio sin reemplazo: 𝑓(𝑁, 𝑚) ( )
𝑁−1

Ejercicio 3

Los pesos de una población X infinita en que cada peso es considerado una variable
continua; evidencia una distribución uniforme (Figura1) con parámetros con media (µ) de
59 Kg y varianza (σ2) de σ2=800 Kg2. Se realiza un muestreo aleatorio sin reposición, en
que se toman infinitas muestras aleatorias de tamaño 50. En cada muestra se determina,
la media construyendo una nueva población de infinitas muestras, que llamaremos Y. La
población Y de medias muestrales es distribución simétrica con forma de campana
(Figura 2) cuyos parámetros son una media µ de 59 Kg y σ2=16 Kg2.

a) Evidencie la relación existente entre los parámetros (µ y σ2) de la población X e Y.


b) Explique porque un muestreo aleatorio sin reemplazo de una población infinita
produce una varianza de distribución muestral idéntica a un muestreo aleatorio con
remplazo.
c) Determine e interprete el error estándar.
d) La distribución de las medias muestrales muestra un comportamiento que es una
normal. Explique en forma conceptual, ¿Por qué razón la distribución de las medias
muestrales es normal? ¿Qué supuestos deben cumplirse para que la suma de
variables distribuya normal?
e) ¿Qué importancia da usted al hecho de que la media muestral distribuya normal y no
la variable en cuestión?
Figura 1 Histograma para pesos (kilogramos) con distribución uniforme lo que podemos
visualizar en el siguiente histograma de probabilidad en 10,000 sujetos. Los pesos se
mueven en rango de 10 a 109 kilogramos. µ=59 Kg, σ2=800 Kg2

0,8

Frecuencia (Porcentaje)
0,6

0,4

0,2

0
10 20 30 40 50 60 70 80 90 100 110
Pesos (Kilogramos)

Figura 2 Distribución de promedios de pesos para 2.000 muestras aleatorias de 50


sujetos cada uno los pesos se mueven en rango de 46,8 a 72,7 Kilogramos. µ=59 Kg;
σ2=16 Kg2.

10

8
Frecuencia (porcentaje)

0
46,8 52,5 59,5 72,7
media

Ejercicio 4

Usted toma una muestra aleatoria sin reemplazo de la edad de 100 sujetos en una
población de un consultorio cuya población inscrita es de 500.000 personas. El análisis
estadístico de la muestra evidencia una media muestral de 50 años y varianza muestral
(σ2) de 1,98 años2.

a) Determine la cuasivarianza muestral (S2), la desviación estándar muestral (S) y el


error estándar de la distribución muestral de medias.
b) Si tuviera que describir la variabilidad de la edad en la muestra como un representante
de la población ¿Cuál sería el estimador a utilizar? ¿Porqué?
Ejercicio 5

Se realiza un estudio para determinar la proporción de hipertensión arterial crónica en la


población del consultorio de una localidad X cuya población inscrita es de 100,000
sujetos. Para lo anterior se selecciona una muestra aleatoria sin reemplazo de un
número de 400 sujetos inscritos en consultorio, observando en 160 de ellos la presencia
de hipertensión arterial crónica.

a) Determine la proporción de hipertensión arterial crónica en estudio referido.


b) Determine el intervalo de confianza al 90%, para la proporción basado en el teorema
de límite central.
c) ¿Cuáles son los supuestos que sustentan la construcción intervalo de confianza de
la letra b)?
d) Señale los factores que pueden ser manipulados por el investigador para hacer más
preciso el intervalo de confianza.
e) Señale la interpretación de este intervalo de confianza. Discuta la validez del
parámetro poblacional estimado para la distribución muestral de proporciones.

Ejercicio 6

Supongamos que de una población compuesta por 100.000 sujetos con hipertensión
arterial crónica es escogemos en forma aleatoria sin reemplazo a 10 sujetos a lo que
medimos el colesterol observando una media muestral 225,8 mg/dl y una cuasivarianza
muestral de 469,6 mg/dl2. Se asume para este ejercicio que el colesterol distribuye
normal.

a) Determine, fundamente e interprete el cálculo de la desviación estándar o S.


b) Determine el intervalo de confianza al 95% usando la T de Student. Justifique el uso
de la T de Student.
c) Señale los factores que pueden ser manipulados por el investigador haciendo más
preciso el intervalo de confianza calculado.
d) Interprete y discuta la validez de la estimación de la media muestral e intervalo de
confianza para la media muestral determinado en d).
Ejercicio 7

Entre los adultos de Estados Unidos, la distribución de niveles de albúmina en el fluido


cerebroespinal es normal con una media µ de 30mg/100 ml y una desviación estándar σ
de 9 mg/100 ml. Suponga que usted selecciona en forma aleatoria las posibles muestras
de tamaño 100 sin reemplazo y calcula la media de cada muestra.

a) ¿Cuál será la media de las medias muestrales?


b) ¿Cuál será la desviación estándar de las medias muestrales?, ¿Cuál es otro nombre
que se da a esta desviación estándar de las medias muestrales?
c) ¿Cómo se compara la desviación estándar de las medias muestrales con la
desviación estándar de los niveles de albúmina mismos?
d) Si usted toma todas las diferentes medias muestrales y las utiliza para construir un
histograma, ¿cuál será la forma de su distribución?
e) ¿Qué proporción de las medias muestrales de son mayores de 31,152 mg/100 ml?
f) ¿Qué proporción de las medias muestrales son menores que 28,2 mg/100 ml?
g) ¿Qué proporción de las medias muestrales se localizan entre 29,1 y 30,9 mg/100
ml?

Ejercicio 8

En Noruega, la distribución de pesos al nacer de niños es aproximadamente normal, con


µ=3500 gramos y con una desviación estándar (σ) de 400 gramos.

a) ¿Cuál es la probabilidad de que su peso al nacer sea menor de 2500 gramos?


b) ¿Qué valor de peso separa el 5% inferior de la distribución de pesos al nacer?
c) Describa la distribución de todas las medias posibles de tamaño 4 sin reemplazo
tomadas de esta población.
d) ¿Qué valor separa el 5% inferior de la distribución muestral de tamaño 4 enunciada
en pregunta c)?
e) Dada la distribución muestral de medias de pregunta c) ¿Cuál es la probabilidad de
que su peso medio al nacer sea menor que 2500 gramos?
Ejercicio 9

Para una población de 1.000 mujeres entre 3 y 74 años, la distribución de los niveles de
hemoglobina distribuye normal con una media (µ) de 14 g/dl y una desviación estándar
(σ) de 8 g/dl2.

a) Si se eligen todas las posibles muestras con reemplazo de tamaño 16 de esta


población, ¿Qué proporción de muestras tendrá un nivel medio de hemoglobina entre
13,5 y 14,5 g/dl?
b) Si las todas las posibles muestras con reemplazo son de tamaño 64. ¿Qué proporción
tendrá una media entre 12,9 y 15 g/dl?
c) Determine un intervalo de confianza al 95% de la media muestral, asumiendo que la
media poblacional es la media muestral y con tamaño de muestra de 64 según lo
referido para muestreo asumido en pregunta b).
d) Determine para población total entre que límites que está contenido el 95% de las
observaciones
e) ¿Cuál es la diferencia entre la metodología de la determinación entre c y d

Ejercicio 10

En los países bajos, los hombres saludables entre 65 y 79 años tienen una distribución
de ácido úrico en la sangre normal, con una media de 5,4 mg/dl y una desviación
estándar de 2 mg/dl.

a) ¿Qué proporción de los varones tiene un nivel de ácido úrico en la sangre de entre
4,5 a 7,1 mg/dl?
b) ¿Qué proporción de muestras de tamaño 16 sin reemplazo tienen un nivel de ácido
úrico en la sangre entre 4,5 a 7,1 mg/dl?
c) ¿Qué proporción de muestras de tamaño 4 sin reemplazo tienen un nivel de ácido
úrico en la sangre entre 4,5 a 7,1 mg/dl?
d) Construya un intervalo de confianza que incluya el 95% de las medias muestrales de
tamaño 4 asumiendo un muestreo sin reemplazo población infinita.
Ejercicio 11

Para la población de hombres adultos de Estados Unidos, la distribución de pesos es


normal, con µ=78 kg y una σ de 125 kg.

a) Describa la distribución de todas las posibles medias muestrales de tamaño 25


seleccionadas aleatoriamente desde un muestreo sin reemplazo de esta población.
b) ¿Cuál es el límite superior de 95% de los pesos medios para muestras de tamaño 25
asumiendo que la media muestral es igual a la media poblacional y el muestreo
efectuado en a)?
c) ¿Cuál es el límite inferior del 99% de los pesos medios para muestras de tamaño 25
asumiendo que la media muestral es igual a la media poblacional y el muestreo
efectuado en a?
d) Suponga que elige una sola muestra aleatoria de tamaño 25 y encuentra que el peso
medio de los hombres de la muestra es exactamente de 86 kg. ¿Cuán probable es
este resultado?, ¿Qué concluiría usted?
e) Los resultados en b) y c) son conocidos como intervalos de confianza unilaterales.
Haga una interpretación de los resultados en b) y c)

Ejercicio 12

Se desea conocer el porcentaje de la población X de un millón de escolares de 10 a 14


años, que presentan defectos visuales. Con este propósito, se toma una muestra
aleatoria de 650 niños de esa edad y se encuentra a 52 con defectos visuales.

a) ¿Cuál es la estimación puntual del porcentaje de niños de 10 a 14 años con defectos


visuales en la población y que valor práctico tiene esta estimación?
b) Estime el porcentaje poblacional de escolares con defectos visuales de 10-14 años,
mediante intervalos de confianza de 95% y 99%.
c) ¿Qué sucede con la precisión de la estimación al aumentar el nivel de confianza,
manteniendo el tamaño de la muestra?
d) Se decide ampliar la muestra a 1.200 niños (dejando constante las otras condiciones
del problema) y se construye un intervalo de confianza de 95%. Comparando este
intervalo con el de la muestra de 650 niños, indique si varia (aumenta o disminuye)
o se mantiene el valor del estimador, del error estándar del estimador, de la precisión
y de los límites de dicho intervalo.
e) En la población estudiada, hay 4500 escolares de 10 a 14 años. De acuerdo con los
resultados obtenidos en b). ¿Cuántos niños tendrían defectos visuales?

Ejercicio 13

Un investigador interesado en obtener una estimación del nivel promedio de la enzima


“E” toma una muestra aleatoria de 10 individuos de una población R, determina un nivel
enzimático promedio (𝑥̅ ) de 22, con desviación estándar muestral de 10. Estudios
previos, han evidenciado que los niveles de dicha enzima distribuyen normal

a) Determine el intervalo de confianza al 99% para la media muestral del nivel de


enzima.
b) Indique las condiciones que justifican la construcción intervalo confianza usando la
T de Student en letra a); y su opinión de la situación planteada.

Ejercicio 14

La lluvia ácida causada por la reacción de ciertos contaminantes del aire con el agua de
la lluvia es un problema creciente en algunas áreas, debido a que esta lluvia ácida afecta
la tierra de los cultivos y causa corrosión en los metales expuestos. La lluvia pura que
cae a través del aire limpio registra un valor pH = 5,7 y distribuye normal. Se analiza el
pH de 41 muestras de agua lluvia de muestras tomadas en una localidad Z en que se
piensa que pudiera haber mayor contaminación. En las muestras de aguas lluvias de Z,
se encuentra un promedio muestral (𝑋̅) de 3,7 y desviación estándar determinada a partir
de cuasivarianza muestral (S) de 5. Encuentre un intervalo de confianza de 99% para el
pH medio e interprételo, en virtud de la problemática planteada.
Ejercicio 15

Se desea estimar la media poblacional de concentración de ácido ascórbico en la saliva


de hombres, se reconoce que la concentración de ácido ascórbico distribuye normal.
Con este propósito, se toma una muestra aleatoria de 31 individuos normales de la
población “M” y se obtienen los siguientes resultados: promedio 𝑥̅ = 0,12 mg y desviación
estándar determinada a partir de cuasivarianza muestral (S) de 0,09 mg.

a) Calcule los límites de intervalos de confianza para la media poblacional de 95% y 99%
b) Si se aumenta la muestra a 121 individuos, manteniendo los mismos valores para la
media y desviación estándar. ¿Cuáles son los límites de confianza de 95% y 99%?
c) Interprete los valores observados en intervalos de confianza determinado en b) al
99% ¿Qué credibilidad da a sus hallazgos en b?

Ejercicio 16

Según un estudio sobre los niños que padecen dolor de pecho, realizado por Selbst,
Ruddy y Clark (Clinical Pediatrics, 1990), se ha hallado que de 125 niños que tenían
dolor de pecho, 100 daban radiografías de tórax normales.

a) Obtener un intervalo de confianza del 95% para la proporción muestral ( 𝑝̂ ) de niños


con dolor de pecho que dieron radiografías normales.
b) Haga una interpretación de los hallazgos determinados en su intervalo de confianza
c) Haga un comentario acerca del cumplimiento supuestos para construcción intervalo
confianza

Ejercicio 17

En una muestra aleatoria de 10 tabletas de aspirina, de las cuales observamos su peso


expresado en gramos, obtenemos: 1,19; 1,23; 1,18; 1,21;1,27; 1,17;1,15;1,14; 1,19; 1,2.
Se sabe que el peso de las tabletas de medicamentos como la aspirina distribuye normal.
a) Determinar la media y desviación estándar(S) a partir de la cuasivarianza (S 2)
b) Determinar e interpretar el intervalo confianza de la media al 95%.
c) Justifique el cálculo del intervalo de confianza.
d) Determine la mediana de la muestra de 10 tabletas de aspirina.
e) Si la mediana fuera discordante con la media ¿Qué validez tendría la estimación
puntual del promedio muestral y por ende del intervalo de confianza?

Ejercicio 18

En el reporte del conteo de neutrófilos, un laboratorio clínico utiliza como rango de


normalidad los límites entre 50 a 75 neutrófilos en un total de 100 leucocitos. Se reconoce
que la probabilidad de que cualquier leucocito sea un neutrófilo es de 0,6. Se aplica el
examen una población “L” compuesta por 100.000 sujetos.

a) Utilizando la distribución binomial exacta, determine el porcentaje de sujetos en que


es considerado normal dicho conteo de neutrófilos. (utilice para esto el programa
Calculadora 2019 binomial)
b) Utilizando la aproximación de la distribución binomial a la normal, determine el
porcentaje de sujetos en que será considerado normal dicho conteo de neutrófilos.
c) Aplique los valores determinados en b) para una población “L” compuesta por 100.000
sujetos donde se aplicará el examen.
d) Discuta la pertinencia de tales determinaciones.
e) El recuento de neutrófilos es definido alto si el número de neutrófilos es mayor o igual
a 76 y anormalmente bajo si dicho recuento es menor o igual 49. Determine la
proporción de la población en que el recuento de neutrófilos es anormalmente alto o
bajo, utilizando la binomial exacta (utilice para esto el programa Calculadora 2019
binomial) y la distribución binomial aproximada a la normal.
Ejercicio 19

El número de muertes de un tipo particular de leucemia sometido a un tratamiento


quimioterápico “Q” es de 50%. Usted aplica este tratamiento Q en base a drogas en que
el fabricante asegura que hay estudios que demuestran que dichas drogas podrían
incluso reducir las muertes. Se aplica Q a 10 enfermos de este tipo particular de
leucemia.

a) Utilizando la distribución binomial exacta, determine los valores limites (de a lo más;
y a lo menos) en que hay contenida una probabilidad central aproximada de 0,99 de
observar un resultado de muerte para la aplicación tratamiento Q a 10 enfermos.
(utilice para esto el programa Calculadora 2019 )
b) Utilice la función grafica de la Binomial y evidencie el histograma de función cuantía
de probabilidad de a)
c) Utilizando la aproximación de la binomial a la normal; determine el número de muertes
(valor variable aleatoria) que contiene el 99% de todas las muertes. Verifique el
cumplimiento de supuestos para tal aproximación.
d) Utilizando la distribución normal; determine los límites en que están contenidas el 99%
de todas las muertes, para un parámetro de proporción poblacional p=50% y n=10.
Verifique el cumplimiento de supuesto para dicho intervalo.
e) Compare la pertinencia de tales comparaciones y su interpretación.

Ejercicio 20

Supongamos que, como parte de un programa para aconsejar a pacientes para factores
de riesgo para la enfermedad cardíaca, 100 fumadores son identificados. En este grupo,
se observa que 10 dejan de fumar durante al menos 1 mes. Después de 1 año de
seguimiento, 6 de los 10 pacientes han vuelto a fumar. Los sujetos que fueron fumadores
y que empiezan a fumar de nuevo muestran reincidencia de tabaquismo.
a) Determine la proporción de reincidencia
b) Indique si es posible determinar un intervalo de confianza al 95% para la proporción
de reincidencia y en caso de que ello no sea posible indique una opción razonable
que usted pueda ejecutar.

Ejercicio 21

Consideremos la distribución del número de bacterias en una placa de Petri sobre un


área de un centímetro cuadrado. Asumiendo que la probabilidad de observar bacterias
en placa de Petri distribuye Poisson de parámetro λ= 10 bacterias / cm2. Supongamos el
evento G, que se observan a lo menos 20 bacterias/cm 2 en esta placa de Petri.

a) Grafique un histograma para la variable aleatoria número bacterias observan en


placa de Petri por cm2 acuerdo con Y: número bacterias observan en placa de Petri
por cm2 𝑌~𝑃(𝜆 = 10) para un n desde cero a 20.
b) Indique la probabilidad del evento” G” usando la distribución de Poisson exacta
c) indique la probabilidad del evento “G” usando la distribución de Poisson aproximada
por la normal
d) Discuta la pertinencia de las determinaciones en a) y b).
e) en caso de no cumplirse los supuestos para aproximar una Poisson a una normal,
que debiera ser usado.

Ejercicio 22

Una variable aleatoria sigue una distribución t de Student, con 11 grados de libertad.
Determinar

a) Percentil 50
b) el percentil 99
c) el percentil 95
d) percentil 1
e) La esperanza
f) La varianza
Ejercicio 23

Una variable aleatoria sigue una distribución Ji-cuadrado. Determinar

a) El valor Ji cuadrado con 7 grados de libertad, tal que la probabilidad de obtener un


valor mayor es 0,025
b) el percentil 95 de la distribución para una ji cuadrado con 3 grados de libertad
c) la esperanza de una ji cuadrado con 4 grados de libertad
d) la varianza de una ji cuadrado con 20 grados de libertad

Ejercicio 24

En una población de 20.000 mujeres se realiza una selección aleatoria sin reemplazo de
25 mujeres registrando su colesterol. La media muestral de colesterol fue de 220 mg/dl,
con una varianza de 25 mg/dl2. Te informan además que hay evidencia que la
determinación de colesterol distribuye normal.

a) Indicar la mejor medida de variabilidad o dispersión del colesterol en mg/dl. Indique


la razón para ello.
b) Indique y discuta las opciones que posee para determinar un intervalo de confianza
para la media de colesterol, así como el propósito de tal determinación.
c) Determine e interprete un intervalo de confianza al 95% para la media de colesterol
d) Indique los factores que hacen variar un intervalo de confianza usando la T de
Student y la distribución normal estándar. Indique cuales de ellos pueden ser
manipulados por el investigador. Diferencie entre precisión y longitud intervalo
e) ¿Cómo puedo saber si la población distribuye normal a partir de la lectura del
artículo?
Ejercicio 25

Los pesos de una población 10 recién nacidos es aproximadamente normal, con μ=3000
gramos y con una desviación estándar (σ) de 400 gramos.

a) Indique la probabilidad de observar un peso al nacer de a lo menos 3000 gramos


b) Determine el valor de peso en gramos que corresponde el percentil 5 y 10
c) Se realiza un muestreo aleatorio sin reemplazo seleccionado las muestras de tamaño
5. Indique el número de muestras que es posible obtener. Determine la media y la
desviación estándar de la distribución de medias muestrales producto del muestreo.
d) Se realiza un muestreo aleatorio con reemplazo seleccionado las muestras de
tamaño 5. Indique el número de muestras que es posible obtener. Determine la media
y la desviación estándar de la distribución de medias muestrales producto del
muestreo.
e) Interprete el error estándar determinado en las preguntas c y d. Indique cual es la
diferencia entre error estándar y desviación estándar.
f) Construya un intervalo de confianza al 95% para la pregunta d.
g) Supongamos ahora que la población fueran 10.000 sujetos; y se realizara un
muestreo aleatorio sin reemplazo seleccionado las muestras de tamaño 5. Indique el
número de muestras que es posible obtener. Determine la media y la desviación
estándar de la distribución de medias muestrales producto del muestreo.
h) Respecto a la pregunta g, a que llamamos en estadística una población infinita. Haga
una discusión respecto a la frase “El muestreo con reemplazo produce el mismo error
estándar que en un muestreo aleatorio sin reemplazo en una población infinita”

Ejercicio 26

Se realiza un muestreo aleatorio sin reemplazo en una población de 5000 médicos


seleccionando a 100 sujetos en que se consulta por su opinión acerca del uso terapéutico
de la marihuana. 10 sujetos responden que consideran el uso terapéutico de la marihuana
como una opción razonable.
a) Indique y discuta las opciones que posee para determinar un intervalo de confianza
para la proporción de sujetos que consideran la marihuana una opción terapéutica
razonable, así como el propósito de tal determinación.
b) Determine e interprete un intervalo de confianza al 99% (basado en la distribución
normal) para la proporción de sujetos que consideran la marihuana una opción
terapéutica razonable
c) Indique los factores que hacen variar la precisión de un intervalo de confianza para
las proporciones usando la normal estándar. Indique cuales de ellos pueden ser
manipulados por el investigador. Diferencie entre precisión y longitud intervalo.
d) Para el intervalo de confianza al 99%. Hay que indicar que es y cómo se interpreta el
99% y 1%.
e) Determine e interprete el error estándar usado para hacer las determinaciones del
intervalo de confianza en la pregunta b.
f) Para el intervalo determinado en la pregunta b determine la diferencia absoluta entre
la proporción estimada en un límite del intervalo y la proporción poblacional.
g) Determine la varianza de la variable original Bernoulli (no la distribución muestral)
considerada en la construcción del intervalo de la pregunta b.

Ejercicio 27

Se reconoce que la hemoglobina en sangre (g/dl) distribuye normal. Se realiza un


muestreo aleatorio sin reemplazo en una población saludable determinando los
siguientes valores de hemoglobina 11,12 y 13.

a) Determine la cuasivarianza muestral


b) Determine e interprete un intervalo confianza al 95% para la media
Ejercicio 28

El número de consultas médicas atendidas en un Servicio es una variable aleatoria de


Poisson. Se atiende un promedio de 3000 consultas en 30 días.

a) Usando la distribución normal estándar, determine e interprete un intervalo cuyos


límites contengan el 95% central (Intervalo exacto, sin corrección por continuidad) de
las consultas a urgencia por día.
b) Usando la distribución normal determine el número de consultas por día que a lo más
ocurran con un 99% de probabilidad.
c) Usando la aproximación de la distribución normal para la distribución de Poisson, la
probabilidad de que ocurran a lo más 120 consultas en un día.

Ejercicio 29

Estudios evidencian que un tratamiento quimioterápico para un cáncer presenta una


mortalidad del 30%. Su servicio efectúa este tipo de tratamiento en 100 sujetos.

a) Determine la probabilidad (aproximada a 4 decimales, con distribución normal, sin


factor de corrección por continuidad) de observar que a lo más 40 sujetos mueran
producto de este tratamiento.
b) Determine la probabilidad (aproximada a 4 decimales, con distribución normal, sin
factor de corrección por continuidad) de observar que a lo menos 25 sujetos mueran
producto de este tratamiento
c) Basado en la distribución normal estándar determine el intervalo de confianza al 95%
para la proporción esperada de sujetos que mueran con este tratamiento
d) Determine los valores (con distribución normal sin factor de corrección por continuidad)
de los límites para el 95% central (0,95 de probabilidad central) de sujetos que mueren
producto del tratamiento quimioterápico.
e) Asumiendo como límite de probabilidad bajo el 5% como un suceso raro que pone en
duda la afirmación acerca de un parámetro en una distribución de probabilidad. Si se
observan a lo menos 38 muertes
Ejercicio 30

Defina los siguientes conceptos

1. Muestreo
2. Muestreo aleatorio
3. Muestra representativa
4. Muestreo aleatorio simple
5. Muestreo aleatorio con reemplazo
6. Muestreo aleatorio sin reemplazo
7. Población Finita
8. Población Infinita
9. Muestreo sin reemplazo en una población infinita
10. Estimador
11. Estimador insesgado
12. Estimador eficiente o estimador de mínima varianza

Ejercicio 31

Precise si verdadero o falso

1. La distribución ji-cuadrada se genera sumando variables aleatorias independientes


distribuidas uniformemente.
2. La esperanza de una distribución Ji cuadrada con 10 grados de libertad es 10
3. La varianza de una distribución Ji-cuadrada con 3 grados de libertad es 3.
4. El dominio de la función de densidad de una distribución ji-cuadrado son los reales
5. Los parámetros de la distribución ji-cuadrada son dos: el tamaño de la muestra, n, y
el número de grados de libertad.
6. El recorrido de la función de distribución Ji-cuadrada va desde el menos infinito al más
infinito.
7. El recorrido de la función de densidad de una distribución Ji-cuadrado puede tomar
valores menores a cero.
8. La suma de n variables aleatorias independientes distribuidas normalmente genera
una variable aleatoria con distribución ji cuadrada de parámetro igual a n.
9. Sea Z una variable aleatoria normal estándar y sea V una variable aleatoria que sigue
una distribución ji cuadrada con k grados de libertad. Si Z y V son independientes,
entonces la
distribución de la variable aleatoria T se conoce como la distribución T, con k grados
𝑍
de libertad, donde: 𝑇 =
√𝑉⁄𝑘

10. Una variable aleatoria con distribución T de Student se define como el cociente entre
una variable aleatoria normal estándar y la raíz cuadrada del cociente entre una
variable aleatoria con distribución ji cuadrada y su número de grados de libertad,
siendo las variables independientes.
11. Una distribución T de Student, difiere de la distribución de una variable normal
estándar Z, en que la varianza de la T depende de los grados de libertad y siempre es
menor que uno.
12. La esperanza o percentil 50 de una T de Student para cualquier grado de libertad es
cero.
13. Al aumentar los grados de libertad de una T de Student se hace más cercana a la
normal y cuando los grados de libertad que llamaremos k tiende al infinito (k → ∞) las
dos distribuciones coincidirán.
14. Si bien la distribución de T y la distribución de Z tiene forma de campana, la distribución
de T es más variable que la de Z.
15. Si graficamos dos variables aleatorias con distribución T de Student, donde k 1 es el
número de grados de libertad de la primera y k2 el de la segunda, y k1 < k2, entonces
la primera se extenderá más sobre el eje horizontal.
16. Al aumentar los grados de libertad de un T de Student se reduce la varianza
17. El uso de la distribución t de Student no presenta tiene restricciones respecto de la
distribución de la población muestreada.
18. La inferencia estadística consiste en aquellos métodos mediante los cuales se realizan
inferencias o generalizaciones acerca de una población, a partir de la información de
una muestra aleatoria extraída de dicha población.
19. En el método de estimación de un parámetro de la población, las inferencias se basan
de manera estricta, en la experiencia personal y subjetiva que una persona tiene sobre
la población que se estudia.
20. Generalmente el valor numérico de una estimación puntual en una muestra coincide
exactamente con el valor numérico del parámetro a estimar.
21. En general, se espera que las estimaciones del parámetro poblacional obtenidas
mediante un estimador insesgado, estén muy alejadas del valor real del parámetro.
22. Nunca debe utilizarse la mediana de la muestra de una población con distribución
sesgada para estimar el valor de la media de dicha población.
23. El estimador “Varianza” determinado en una muestra, siempre producirá estimaciones
puntuales más cercanas a la media de la población de la cual proviene la muestra,
que las estimaciones puntuales del estimador “Media muestral”.
24. Una de las propiedades deseables que debe reunir un estimador, es que sea sesgado.
25. Se dice que un estimador es insesgado cuando proviene de una población cuya
función de densidad de probabilidad es simétrica.
26. La varianza determinada en la muestra de una variable X, es un estimador insesgado
de la varianza poblacional de la variable X.
27. La cuasivarianza determinada en la muestra de una variable X es un estimador
sesgado de la varianza poblacional de la variable X.
28. Todos los estadígrafos son estimadores insesgados del parámetro poblacional.
29. Se puede demostrar que, para un muestreo aleatorio sin reemplazo de una población
infinita, se cumple que E(S²) = σ².
30. ∑𝑛 ̅ 2
𝑖=1(𝑋𝑖 − 𝑋 ) lo dividimos por (n – 1) en lugar de n cuando se estima la varianza de

una población, porque en esta condición la cuasivarianza muestral es un estimador


insesgado del parámetro estimado.
31. De los todos los posibles estimadores de algún parámetro poblacional θ, se denomina
estimador más eficiente de θ, al de menor varianza.
32. Las estimaciones puntuales que se obtienen con un estimador insesgado resultan
iguales y coinciden exactamente con el valor numérico del parámetro estimado.
33. Cuando se estima un parámetro poblacional con el estimador insesgado más eficiente,
se espera que la estimación puntual coincida exactamente con el valor del parámetro
a estimar.
34. En poblaciones normales, la media muestral de una variable X es un estimador
insesgado de la media o µ de la población de la variable X.
35. Dado que no es posible hacer que un estimador insesgado más eficiente estime al
parámetro poblacional con exactitud, es preferible determinar un intervalo y esperar,
con una confianza dada, que contenga al verdadero valor del parámetro.
36. Al construir un intervalo de confianza para estimar la media de una población con un
tamaño muestral pequeño (menor a 30) y basado en la T de Student, se debe tener
en cuenta la distribución de la población (si es normal, no normal o desconocida).
37. Al estimar la media poblacional mediante un intervalo de confianza basado en la T de
Student, sólo algunas veces esta estimación depende del tamaño de la muestra
seleccionada.
38. Al construir un intervalo con un nivel de confianza del 95% para la media basado en
la T de Student, por ejemplo, es posible conseguir mayor precisión en la estimación,
aumentando el tamaño de la muestra seleccionada.
39. Si el nivel de confianza elegido es del 99%, podemos estar absolutamente seguros de
que el intervalo que construyamos a partir de la muestra contendrá al verdadero valor
del parámetro poblacional estimado.
40. Al estimar un parámetro como la proporción poblacional mediante un intervalo de
confianza, basado en la distribución normal estándar, a mayor precisión, menor será
la amplitud del intervalo.
41. Al construir un intervalo de confianza para la media muestral basado en la T de
Student, asumimos que la media de la muestra es la media de la población.
42. El tamaño de la muestra seleccionada para estimar la media de una población rara
vez influye en la estimación realizada.
43. Al estimar la media de una población, siempre se dará que, para un nivel de confianza
dado, muestras diferentes de igual error estándar seleccionadas aleatoriamente de
una misma población, producirán intervalos de igual amplitud.
44. Para un nivel de confianza elegido y un tamaño de muestra dado, todos los intervalos
que se construyan para la media de una población de varianza conocida σ², a partir
de muestras diferentes, tendrán la misma amplitud.
45. Al estimar la media de una población por intervalos de confianza mediante la T de
Student, la estimación puntual ocupa el punto medio de la amplitud del intervalo.
46. El tamaño de la muestra seleccionado para estimar la media de una población
mediante un intervalo de confianza basado en la normal estándar, determina del error
estándar de dicho intervalo.
47. Al hacer estimaciones mediante intervalos de confianza para la media de una
población, se debe hacer una distinción entre los casos de desviación estándar de la
población conocida y desconocida.
48. Para estimar el intervalo de confianza de la media de una variable aleatoria que
distribuye normal con desviación estándar desconocida, podemos hacer uso de la
distribución T de Student.
49. El parámetro de la distribución T de Student, utilizada para estimar la media de una
población mediante un intervalo de confianza, está relacionado con el tamaño de la
muestra seleccionada.
50. En Estadística, se dice que trabajamos con muestras grandes cuando el tamaño de
estas es general igual o mayor a 30.
51. Cuando se trabaja con muestras grandes, la varianza determinada en la muestra es
un buen estimador de la media de la población de donde proviene la muestra.
52. Cuando se desconoce la varianza de una variable que distribuye normal y se desea
efectuar una estimación por intervalos de la media a partir de una muestra pequeña
de tamaño n, se debe utilizar la distribución T de Student, con (n – 1) grados de
libertad.
53. A la desviación estándar de un estimador, se la conoce con el nombre de error
estándar del estimador. Por ejemplo, el error estándar de la media muestral viene dado
𝜎
por el cociente .
√𝑛

54. Un estimador puntual de la proporción p en un experimento binomial está dado por el

estadígrafo 𝑝̂ = 𝑋⁄𝑛, donde X representa el número de éxitos en n pruebas.


55. Cuando el tamaño n de la muestra es pequeño y la proporción desconocida p es
cercana al valor cero o al valor uno, el procedimiento de cálculo que permite la
construcción del intervalo de confianza usando la distribución normal, no es confiable
y por lo tanto no se debe utilizar.
56. En la práctica, si se cumple que np ≥ 5 o nq ≥ 5, la aproximación normal para evaluar
probabilidades binomiales será aceptable.
57. La distribución binomial se aproxima bien por la normal cuando el tamaño de la
muestra es suficientemente grande.
58. Toda vez que la función de cuantía de la binomial adquiere forma de campana
simétrica, la distribución normal es una buena aproximación de la binomial.
59. Para hacer inferencia estadística correcta basta tomar cualquier muestra dentro de la
población de estudio.
60. Un estimador insesgado es siempre mejor que un estimador sesgado.
61. En un intervalo de confianza para la media µ de una distribución normal, si aumento
el nivel de confianza, entonces aumenta el largo del intervalo.
62. En una encuesta a nivel nacional sobre una muestra de 1.200 personas, el 65%
consideró que la cumbre APEC fue beneficiosa para el país. Con un nivel de confianza
del 95% estos resultados permiten concluir que la diferencia absoluta entre la
proporción estimada en uno de los límites del intervalo y la proporción poblacional es
menor al 3%.
63. En la estimación puntual se toma un valor muestral concreto como estimación del
parámetro, mientras que en la estimación por intervalos se establece un rango de
valores dentro del cual estaría el valor del parámetro.
64. Un estimador es una función calculada para una muestra.
65. Manteniendo constantes todos los factores excepto el nivel de confianza, una
estimación al 99% confianza es más precisa que una estimación al 95% de confianza.
66. En un muestreo aleatorio sin reemplazo para población infinita la varianza de la
distribución muestral de medias es equivalente a un muestreo con reemplazo de una
población infinita
67. En un muestreo aleatorio sin reemplazo, la esperanza o media de la distribución
muestral de medias de la variable X, es la media de la población X.
68. Sea cual sea la forma de la distribución de la variable, la distribución muestral de la
media es normal, cuando el tamaño de la muestra es suficientemente grande.
69. A mayor tamaño muestral menor precisión del intervalo de confianza basado en la T
de Student.
70. Un intervalo de confianza basado en la distribución normal estándar para la Media
Muestral, que contiene la media muestral ± 1,96 veces el error estándar se dice que
tiene una confianza de 95%, incluyendo 95 de 100 muestras.
71. Un intervalo de confianza de la Media Muestral ± 2 veces el error estándar de la media
comprende un 99% de las veces la media poblacional; asumiendo que esta última es
la media muestral.
72. En un muestreo aleatorio con reemplazo de una población finita, el error estándar es
la raíz cuadrada de la varianza de la población dividida por el tamaño de muestra.
73. La determinación del error estándar de la distribución muestral de medias en un
muestreo aleatorio sin reemplazo de una población finita es igual a un muestreo de
una población infinita.
74. Un muestreo aleatorio asegura 100% la representatividad de una muestra.
75. El error estándar es error que hay en cualquier investigación.
Respuestas

Ejercicio 1

Letra a

Muestreo aleatorio sin reemplazo

En un muestreo aleatorio sin reposición o muestreo aleatorio sin reemplazo, las unidades
se extraen una a una de la población, y la unidad seleccionada en cualquier extracción
no se devuelve a la población antes de seleccionar una unidad en la siguiente extracción.

El número de muestras posibles totales en un muestreo sin reemplazo usa la


combinatoria de la siguiente forma:
𝑁
( )
𝑛

Aquí N es el número total de elementos del conjunto a muestrear y n es el tamaño de


muestra. En el ejercicio N=5 y n=2 y obtienen 10 muestras posibles

5 5!
( )= = 10
2 2! (5 − 2)!

Letra b
Población A
Media

2 + 3 + 6 + 8 + 9 28
𝜇𝐴 = = = 5,6
5 5
Varianza

(2 − 5,6)2 + (3 − 5,6)2 + (6 − 5,6)2 + (8 − 5,6)2 + (9 − 5,6)2 37,2


𝜎𝐴2 = = = 7,44
5 5
Letra c
Población B

La población B está compuesta por todas las posibles muestras de tamaño 2 extraídas
desde la población A. Estas posibles muestras son 10, y cada muestra (par) da origen a
un promedio. En la tabla 1 de a continuación, se muestra para cada para su respectivo
promedio

Tabla 1 10 muestras de tamaño dos que son posibles de obtener desde la población A=
{2,3,6,8,9} con sus respectivas colecciones de promedios muestrales que
conforman B.

Promedios
Número Número Promedio
Muestra muestrales Muestra
muestra muestra muestrales 𝑋̅
𝑋̅

2+3
1 2,3 = 2,5 6 3,8 3+8
2 = 5,5
2

2+6
2 2,6 =4 7 3,9 3+9
2 =6
2

3 2,8 2+8 8 6,8 6+8


=5 =7
2 2

4 2,9 2+9 9 6,9 6+9


= 5,5 = 7,5
2 2

3+6 8+9
5 3,6 = 4,5 10 8,9 = 8,5
2 2

B está conformado por los siguientes 10 elementos que son: 2,5; 4; 5; 5,5; 4,5; 5,5; 6; 7;
7,5; 8,5.
Letra d

Media muestral de B

2,5 + 4 + 5 + 5,5 + 4,5 + 5,5 + 6 + 7 + 7,5 + 8,5 56


𝑋̅𝐵 = = = 5,6
10 10

Varianza de medias muestrales de B

(2,5 − 5,6)2 + (4 − 5,6)2 + (5 − 5,6)2 + (5,5 − 5,6)2 + (4,5 − 5,6)2 + (5,5 − 5,6)2 + (6 − 5,6)2 + (7 − 5,6)2 + (7,5 − 5,6)2 + (8,5 − 5,6)2
𝜎𝐵2 =
10

27,9
𝜎𝐵2 = = 2,79
10

La media y varianza de la población A y B del encabezado del ejercicio están bien


calculados.

Letra e
Si A es una población finita y B resulta de un muestreo aleatorio sin reemplazo que
incluye todas las muestras posibles de A, entonces se cumple que:

𝜇𝐵 = 𝜇𝐴 = 5,6

𝜎𝐴2 𝑁 − 𝑛 7,44 5 − 2
𝜎𝐵2 = ( ) = 2,79 = ( )
𝑛 𝑁−1 2 5−1

Letra f
El error estándar es la desviación estándar de la distribución de medias, por tanto, indica
la dispersión media de las muestras en torno a la media muestral. Su expresión
matemática es la raíz cuadrada de la varianza de medias muestrales de la población B.

𝜎𝐴2 𝑁 − 𝑛 7,44 5 − 2
𝜎𝐵 = √𝜎𝐵2 = √ ( ) = √2,79 = √ ( ) ≈ 1,67
𝑛 𝑁−1 2 5−1

En la población B (todas las medias muestrales de tamaño 2 obtenidas desde A) hay una
dispersión promedio de 1,67 en torno a la media muestral de 5,6.
Ejercicio 2

Letra a

Número de muestras posibles en muestreo aleatorio con reemplazo

Un muestreo aleatorio con reemplazo es aquel en que un elemento puede ser


seleccionado más de una vez en la muestra para ello se extrae un elemento de la
población se observa y se devuelve a la población, por lo que de esta forma se pueden
hacer infinitas extracciones de la población aun siendo esta finita. Este tipo de muestreo
es considerado un muestreo aleatorio simple, pues todos los elementos tienen la misma
probabilidad de ser seleccionados

El número de muestras posibles totales en un muestreo con reemplazo usa la siguiente


expresión Nn, donde N número total de elementos del conjunto a muestrear y n el tamaño
de muestra. En este ejercicio N=3 y n=2; entonces se obtienen 32 o 9 muestras posibles

Número de muestras posibles en muestreo sin reemplazo

El número de muestras posibles totales en un muestreo sin reemplazo usa la


combinatoria de la siguiente forma:
𝑁
( )
𝑛

Aquí N es el número total de elementos del conjunto a muestrear y n es el tamaño de


muestra. En el ejercicio N=3 y n=2 y obtienen 6 muestras posibles

3 3!
( )= =3
2 2! (3 − 2)!

Letra b
Media µ y varianza poblacional σ2 en F
1+2+3 6
𝜇𝐹 = = =2
3 3

(1 − 2)2 + (2 − 2)2 + (3 − 2)2 2


𝜎𝐹2 = =
3 3

Letra c

Llamaremos población K al conjunto muestral de medias muestrales de tamaño 2, que


se obtiene al realizar un muestreo aleatorio con reemplazo de la población F (Tabla 2).

Tabla 2 9 muestras de tamaño dos que son posibles de obtener desde la población F=
{1,2,3} con sus respectivas colecciones de promedios muestrales que
conforman K.

Muestra Promedios muestrales 𝑋̅ que conforman K


1+1
1,1 =1
2

1+2
1,2 = 1,5
2

1,3 1+3
=2
2

2,1 2+1
= 1,5
2

2+2
2,2 =2
2

2,3 2+3
= 2,5
2

3,1 3+1
=2
2

3,2 3+2
= 2,5
2

3,3 3+3
=3
2

Población K de medias muestrales de tamaño 2 extraído desde F; está compuesto por


los siguientes elementos
𝐾 = {1; 1,5; 2; 1,5; 2; 2,5; 2; 2,5; 3]
Letra d
Media µ poblacional σ2 de K:

1 + 1,5 + 2 + 1,5 + 2 + 2,5 + 2 + 2,5 + 3 18


𝜇𝐾 = = =2
9 9

Varianza poblacional o σ2 de K:

(1 − 2)2 + (1,5 − 2)2 + (2 − 2)2 + (1,5 − 2)2 + (2 − 2)2 + (2,5 − 2)2 + (2 − 2)2 + (2,5 − 2)2 + (3 − 2)2
𝜎𝐾2 =
9

3 1
𝜎𝐾2 = =
9 3

Letra e

Si F es una población finita y K resulta de un muestreo aleatorio con reemplazo que


incluye todas las muestras posibles de F, entonces se cumple que:
𝜇𝐹 = 𝜇𝐾 = 2

𝜎𝐹2 1 2⁄3
𝜎𝐾2 = = =
𝑛 3 2

Letra f

El error estándar es la desviación estándar de la distribución de medias, por tanto, indica


la dispersión media de las muestras en torno a la media muestral. Su expresión
matemática es la raíz cuadrada de la varianza de medias muestrales de la población K.

𝜎𝐹2 1 √2⁄3
𝜎𝐵 = √𝜎𝐾2 =√ = √ = ≈ 0,33
𝑛 3 2

En la población K (Son todas las medias muestrales de tamaño 2 obtenidas con


reemplazo desde F) hay una dispersión promedio de 0,33 en torno a la media muestral
de 2.
Ejercicio 3
Letra a

Si X es una población infinita e Y resulta de un muestreo sin reemplazo (si peso es una
variable continua ningún peso va a ser igual a otro) de las infinitas muestras posibles de
X, entonces se cumple que:

𝜇𝑌 = 𝜇𝑋 = 59
𝜎𝑋2 800
𝜎𝑌2 = = 16 =
𝑛 50
Letra b
En un muestreo sin reemplazo de una población finita X, se cumple la siguiente relación
entre la varianza de la población muestras que llamaremos 𝜎𝑌2 y la varianza de la
población original de las muestras que llamaremos 𝜎𝑋2

𝜎𝑋2 𝑁 − 𝑛
𝜎𝑌2 = ( )
𝑛 𝑁−1

N igual infinito menos 1 es infinito; y N infinito menos un tamaño finito también es infinito;
y así infinito dividido en infinito es 1.

𝑁−𝑛
Si N es infinito, es indiscutible que la expresión (𝑁−1) se vuelve igual a 1; por tanto, si la

población X se vuelve infinita y obtenemos todas las infinitas muestras de la población


vamos a tener que:

𝜎𝑋2 𝑁 − 𝑛 𝜎𝑋2 𝜎𝑋2


𝜎𝑌2 = ( )= 2
∗ 1 ⟹ 𝜎𝑌 =
𝑛 𝑁−1 𝑛 𝑛
Letra c
El error estándar es la desviación estándar de la distribución de medias muestrales, por
tanto, indica la dispersión media de las muestras en torno a la media muestral. Su
expresión matemática es la raíz cuadrada de la varianza muestral. En este caso dado
que la varianza de la población X es 800 y el tamaño muestral es 50 resulta que:

𝜎𝑋2 800
𝜎𝑌 = √𝜎𝑌2 = √ =√ = √16 = 4
𝑛 50

En la población Y (de las infinitas medias de muestras de tamaño 50 obtenidas desde X)


hay una dispersión promedio de 4, en torno a la media muestral de 59Kg.

Letra d
Razones para aparición distribución normal

El teorema del límite central establece que la suma al infinito, de variables aleatorias
idénticas (tienen igual distribución), independientes, media finita y varianza finita mayor
cero, sigue siempre una distribución normal. Lo antes dicho es posible demostrarlo
matemáticamente; cuestión que acá no realizaremos, dado que ello requiere calculo lo
que está fuera de los límites de este curso. La aparición de la distribución normal al sumar
infinitas variables aleatorias ocurre por razones de índole matemática, pues tratamos con
la operación suma de variables.

Dijimos que el teorema de límite central se cumple siempre y cuando la suma de


variables es al infinito. En estadística consideramos al infinito cuando la suma de
variables es lo suficientemente grande. Ahora, bien a que llamamos grande, esto va a
depender del problema del cual tratemos; aquí manda la regla del tacto, tino y criterio.
Como regla general se ha establecido grande, un tamaño de muestra mayor a 30, no
obstante, esto no siempre tiene que ser así. De hecho, si la variable original está muy
asimétrica y alejada de la normalidad la suma de variables para conseguir la normalidad
va a ser posiblemente mucho mayor que 30.
Supuestos deben cumplirse para que la suma de variables distribuya normal

Los supuestos que deben cumplirse para que el teorema de límite central se cumpla son:

a) Se suman variables que son idénticas o sea provienen de la misma distribución de


probabilidad.
b) Se suman variables que son independientes unas de otras.
c) La media, así como la varianza de las variables que se suman debe ser finita.
d) La varianza de las variables que se suman siempre debe ser mayor a cero.
e) La suma debe ser lo suficientemente grande (ya comentado) para que la distribución
de la suma de estas variables sea aproximadamente normal.
En el fondo la suma de variables genera una nueva variable aleatoria que distribuye
normal. Los promedios en este ejercicio distribuyen normal, pues el promedio en si es
una suma ponderada de una variable aleatoria.

Letra e

Este hecho reviste la mayor importancia, pues no hay que esperar que el comportamiento
de la variable sea normal, para ocupar el teorema de límite central. En otras palabras,
hay que observar el comportamiento de la suma de variables; en este caso particular la
suma variable que siguen distribución uniforme muestra un comportamiento de
normalidad.

Bajo las condiciones ya enunciadas para el teorema de límite central, la distribución


normal del estadígrafo “media muestral” de una población de medias muestrales, nos
permite predecir lo que pasa con un promedio muestral para dicha población. Y
ocupamos el hecho de que, si la muestra es representativa, la media muestral es una
representación de la media poblacional y ello permite hacer toda la inferencia estadística
desde la muestra a la población de interés para una variable que pueda ser representada
por un promedio

La distribución de probabilidad normal, del promedio muestral, ha permitido el desarrollo


según veremos más delante de dos cuestiones súper importantes en medicina los
intervalos de confianza y contraste de hipótesis, que nos han llevado a poder avanzar
en nuestro conocimiento médico.
Ejercicio 4
Letra a

En este curso, la varianza se representará siempre por σ2 y la cuasivarianza por S2 y sus


expresiones para la determinación en una muestra con n elementos, son las que a
continuación se señalan:

∑𝑁
𝑖=1(𝑋𝑖 − 𝜇)
2
𝜎2 =
𝑛

∑𝑁
𝑖=1(𝑋𝑖 − 𝜇)
2
𝑆2 =
𝑛−1

La diferencia entre la varianza y la cuasivarianza de una muestra están en el


denominador; en el caso de la varianza es “n” el tamaño de total de la muestra; y en el
caso de la cuasivarianza “n-1” el tamaño de la muestra menos 1. Debe también quedar
claro, que la raíz cuadrada de la varianza da lugar σ. Y Finalmente la raíz cuadrada de
la cuasivarianza da lugar a S.

∑𝑁
𝑖=1(𝑋𝑖 − 𝜇)
2
𝜎=√
𝑛

∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)2
𝑆=√
𝑛−1

Cuasivarianza muestral S2

El enunciado del problema nos entrega la varianza que es 1,98 así como el tamaño
muestra n=100. Si asumimos que esta varianza σ2 usando el promedio muestra y tamaño
total de la muestra “n”, luego tenemos que:

100
∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)2 ∑100
𝑖=1(𝑋𝑖 − 𝜇)
2
2
𝜎 = = 1,98 = ⟹ ∑(𝑋𝑖 − 𝑋̅)2 = 198
𝑛 100
𝑖=1
La expresión ∑100 ̅ 2
𝑖=1 (𝑋𝑖 − 𝑋 ) corresponde a la suma de las diferencias al cuadrado en

torno al promedio muestral y este valor corresponde a 198; por tanto, basta el reemplazo
de este valor en la siguiente ecuación y bajo n-1=99; podremos determinar la
cuasivarianza muestral:

∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)2 198


𝑆2 = = =2
𝑛−1 99

Desviación estándar a partir cuasivarianza muestral o S2

∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)2 198


𝑆 = √𝑆 2 = √ =√ = √2 ≈ 141
𝑛−1 99

Dado que la cuasivarianza muestral es un estimador insesgado de la varianza


poblacional (ver apunte teórico), podemos inferir que 1,41 es la dispersión promedio
esperada en torno a la edad media de 50 años, asumiendo que el promedio muestral es
la media poblacional de edad; ello basado en que la muestra es representativa. Ojo
inferimos que la media de edad poblacional es 50 años y que la desviación estándar de
la población es 1,41 años; basados en la muestra.

Error estándar muestral

Acá tenemos una población grande de 500.000 sujetos la que fue muestreada sin
reemplazo y si 𝑆𝐴2 es la varianza de la población original de edades luego la varianza de
las muestras de tamaño 50 es igual a 𝑆𝐵2
𝑆𝐴2 𝑁 − 𝑛 2 500000 − 50 2
𝑆𝐵2 = ( ) = 2,79 = ( )= ∗ 1 ≈ 0,04
𝑛 𝑁−1 50 500000 − 1 50

Acá usamos para el cálculo de la varianza de la población de medias la cuasivarianza


de las muestras S2 y no la varianza σ2; ello pues la cuasivarianza muestral es un
estimador insesgado de la varianza poblacional, toda vez que el muestreo es aleatorio
simple (incluye muestreo aleatorio población infinita y muestreo aleatorio con reemplazo
población finita). Leer apunte teórico.

En este caso el factor de corrección que puede ser considerado en la práctica como 1;
pue la población total es grande y ello lleva a que esta expresión en virtud de tamaño
muestra 50 va a dar un valor casi de 1. En síntesis, si el muestreo se hace sin reemplazo
y el tamaño de la población es mayor a 20 veces el tamaño de la muestran o sea la
𝑁−𝑛
relación N/n>20 luego la expresión (𝑁−1) debe ser considerada como 1 y el muestreo

sin reemplazo de una población infinita es equivalente al muestreo con reemplazo de


una población finita o como dijimos en ejercicio 3 letra c) al muestreo de una población
infinita.

Ahora bien, le sacamos la raíz cuadrada a la varianza de las muestras y obtenemos el


error estándar requerido

𝑆 2 500000 − 50 2
𝐸𝐸 = √ ( )=√ = √0,02 ≈ 0,14
𝑛 500000 − 1 100

Este error se interpreta que la variación media esperada de todas las posibles
muestras de tamaño 100 en torno a la media de 50 años es de 0,14 años.

Letra b

El error estándar es un representante de la variabilidad de la distribución muestral de


medias de edad; y su valor cambia según el tamaño de muestra. A mayor tamaño
muestral, menor error estándar.

La pregunta establece que lo que se quiere es un estimador de la variabilidad de la edad


por tanto la desviación estándar (S) que es generada a partir de la cuasivarianza muestral
es el mejor representante de la variabilidad. No sirve la desviación estándar o σ
generada por la varianza de la muestra (σ2), pues ya dijimos el estimador la varianza
generada como σ2 es un estimador sesgado de la varianza poblacional.
Ejercicio 5

Letra a

𝑝̂ es la proporción de hipertensión arterial

160
𝑝̂ = = 0,4 ó 40%
400

Letra b

𝑝̂ 𝑞̂ 0,4 ∗ 0,6
𝑝 = 𝑝̂ ± 𝑍𝛼⁄2 √ ⁄𝑛 = 0,4 ± 1,645 ∗ √
400

El intervalo de confianza al 90% presenta un límite inferior de 0,3597 y un límite


superior de 0,4403

Letra c

La construcción de este intervalo de confianza requiere:


1.- Un muestreo aleatorio simple de la población. El enunciado dice muestreo aleatorio
sin reposición en población infinita, N/n mayor a 20.
2.-que “𝑛𝑝̂ ” y/o “𝑛𝑞̂” muestrales sean mayores o iguales a 5. En este caso 𝑛𝑝̂ = 100 ∗
0,4 = 160 y 𝑛𝑞̂ = 400 ∗ 0,6 = 240; luego se cumplen los supuestos. Recordar 𝑞̂ = 1 − 𝑝̂ .
Esto es pues, la base de este Intervalo de confianza es el teorema de límite central.
3.- Se requiere también el n o tamaño muestral y la proporción muestral estimada,
cuestiones que da el problema.

Letra d

Factores que pueden ser manipulados por el investigador:


a) El nivel de confianza que es 𝑍𝛼⁄2 :El nivel de confianza establece el porcentaje de

muestras que van a estar contenidas en el intervalo de confianza. Si aumento el nivel de


confianza el intervalo se hace más amplio y por ende menos preciso.
b) El tamaño de muestra: Si aumento el tamaño de muestra el intervalo se hace más
estrecho y por ende más preciso.
Letra e

La interpretación de este intervalo es que la proporción de hipertensión arterial crónica a


lo menos 0,3597 y a lo más 0,4403 se observa en una proporción del 95% de todas las
muestras de tamaño 400 seleccionadas por muestreo aleatorio simple desde la población
consultorio localidad X. también podemos informar que 90 de 100 (confianza) muestras
aleatorias simples de tamaño 400 desde población consultorio localidad X, la proporción
poblacional (estimada en 0,4 según la muestra) de presencia hipertensión arterial crónica
va a estar comprendida entre 0,3597 a 0,4403. El muestrear a 400 sujetos para saber el
parámetro (proporción poblacional) en una población de 100.000 sujetos, podría poner
ser puesto en duda desde la metodología utilizada para obtener la información. En el
fondo lo importante para su validez es que la muestra sea representativa de la población
y ello se fundamenta teóricamente en el muestreo aleatorio simple.

Ejercicio 6

Letra a

Calculo de S: En el cálculo de la desviación estándar se usa la raíz cuadrada de la


cuasivarianza muestral lo que da valor se

𝑆 = √𝑆 2 = √469,6 ≈ 21,67

Fundamento de S: El fundamento para usar la cuasivarianza de la muestra es que S 2 es


un estimador insesgado de la varianza poblacional o σ2 bajo un muestreo aleatorio
simple.

Interpretación de S: Se interpreta haciendo la inferencia que los valores de colesterol


varían o muestran una dispersión en promedio de 21,67 mg/dl respecto a un hipotético
colesterol medio 225,8 mg/dl de la población original de donde se extrajo a la muestra
mediante un muestreo aleatorio simple. Aquí asumimos que la muestra es representativa
y que la media de colesterol observada en la muestra de 225,8 mg/dl, es la media
poblacional de colesterol y que la desviación estándar de la población es 21,6 mg/dl. Ojo
decimos que la muestra es representativa dado que de base se usó un muestreo
aleatorio simple en la selección muestra.
Letra b

Justificación del uso de la T:

El uso correcto de la t de Student debe cumplir las siguientes condiciones:

a) Los promedios muestrales se producen como resultado de un muestreo aleatorio


simple.
b) La distribución de la variable que da origen a la media de la muestra debe tener
siempre una distribución normal. Aquí se dice que el colesterol, distribuye normal.
c) debemos contar con: a) n o tamaño de la muestra, b) media muestral c) desviación
estándar (S) de la muestra determinada a partir de la cuasivarianza muestral o S 2;
cuestiones que nos da el planteamiento del problema. Si hubiésemos conocido la
varianza de donde se obtuvo el muestreo, se podría haber usado la distribución Z
estándar.

Intervalo confianza usando la T de Student: En los apuntes teóricos está la inferencia de


donde se obtiene la fórmula para el intervalo de confianza de la T que se muestra a
continuación:

𝑆
𝜇 = 𝑋̅ ± 𝑇𝛼⁄2
√𝑛

La distribución T de Student (9 grados de libertad) de acuerdo con tabla para tamaño


muestral n=10, para probabilidad de 0,025 y 0,975, da un valor absoluto de 2,2622. Esto
puede ser corroborado ya sea en la tabla T de Student de Cola Superior que muestra en
la figura 1. No obstante, lo anterior existe una tabla T de Dos Colas, en que también se
puede buscar este valor según figura 2.
Figura 1 Calculo T de Student con Distribución de Cola Superior, se busca alfa de 0,025;
pues un intervalo de confianza al 95%, deja a cada lado un área de probabilidad
de 0,025. La observación de valor T (9 grados de libertad) de a lo menos 2,2622
tiene una probabilidad de 0,025 (rojo).

Figura 2 Calculo T de Student con Distribución de Dos colas, se busca alfa de 0,05; pues
un intervalo de confianza al 95%, deja a cada lado un área de probabilidad de
0,025, las que al sumarse dan 0,05. La observación de un valor T (9 grados de
libertad) de a lo más -2,2622 y a los menos 2,2622 tiene una probabilidad de
0,05 (en rojo). En una T con 9 grados de libertad, al lado izquierdo de T -2,2622
hay área de 0,025; y al lado derecho de T 2,2622 hay probabilidad de 0,025; de
esta manera T=-2,2622 a T+2,2622 separan un área central de probabilidad de
0,95

Así tenemos los insumos para el cálculo del intervalo de confianza usando la distribución
T de Student, lo que son: a) puntaje T=2,2622; b) tamaño muestra o n=10, c) media
observada en muestra, que es 𝑋̅= 225,8 mg/dl y desviación estándar observada en
muestra o S que es igual 21,67 mg/dl.

𝑆 21,67
𝜇 = 𝑋̅ ± 𝑇𝛼⁄2 = 225,8 ± 2,2622
√𝑛 √10

El intervalo de confianza al 95% presenta un límite inferior de 210,30 mg/ dl y un límite


superior de 241,30 mg/dl
Letra c

Los factores que pueden ser manipulados por el investigados son:


a) El nivel de confianza que es 𝑇𝛼⁄2 El nivel de confianza establece el porcentaje de

muestras que van a estar contenidas en el intervalo de confianza. Si aumento el nivel de


confianza, se amplía el tamaño del intervalo de confianza haciéndose menos preciso.
b) El tamaño de muestra. Si aumento el tamaño de muestra se reduce el tamaño del
intervalo de confianza haciéndose más preciso.

Letra d

El intervalo de confianza al 95% usando la T de Student, nos indica que en 95 de 100


muestras aleatorias simples que tomemos de tamaño 10 desde la población de
hipertensos (asumiendo una media de colesterol de 225,8 mg/dl), los promedios de
colesterol se encontrarán en un rango de 210,3 a 241,3 mg/dl. También podemos
informar que la observación de un colesterol de a lo menos 210,3 mg/dl y a lo más 241,3
mg/dl se observa en una proporción de 90% de todas las medias muestrales de tamaño
10 seleccionadas por muestreo aleatorio simple desde la población H.

Al igual que lo que sucede con los intervalos de la proporción asumimos la media de la
muestra como valor poblacional de la distribución muestral de medias y ello pudiera no
ser así. Debemos confiar que si el muestreo fue aleatorio la muestra de colesterol de 10
sujetos es representativa del nivel de colesterol de una población de 100.000 sujetos;
pero no hay manera de confirmar esta aseveración. La inferencia estadística funciona
aquí con la cuasivarianza determinada en la muestra bajo el supuesto que media
poblacional de colesterol es la media de la muestra. En la construcción de este intervalo
no se asume que la cuasivarianza determinada en la muestra como un estimador
de la varianza muestral, pues en este caso no es necesaria la varianza poblacional.
No obstante, la cuasivarianza muestral, es un estimador insesgado de la varianza
poblacional. La cifra obtenida podría estar muy lejos del verdadero valor poblacional,
pero es válida al menos como una aproximación a este valor del parámetro poblacional.

Esto es lo mismo que sucede cuando tomamos el hematocrito en un paciente, es una


muestra de 10 ml, sobre la que determinamos el porcentaje total de glóbulos rojos en 5
litros de sangre.
Ejercicio 7

Letra a

La media de las medias muestrales o la llamada media de la distribución muestral de


medias es un nivel de albumina 30 mg/100ml

Letra b
La desviación estándar de las medias muestrales o desviación estándar de la distribución
muestral de medias se llama error estándar. Al hablar de distribución muestral de
medias, estamos considerando, todas las muestras posibles.
Este error estándar se determina de la siguiente manera:

𝜎2 𝑁 − 𝑛 𝜎2 𝜎 9
𝐸𝐸 = √ ( )=√ ∗1= = = 0,9
𝑛 𝑁−1 𝑛 √𝑛 √100

Dado que la población de adultos de estados unidos son cientos de millones de personas
y n=100, luego tenemos N/n>>20; por tanto, se cumple que:

𝑁−𝑛
( )=1
𝑁−1

En este caso el muestreo sin reemplazo es de una población infinita, pues N/n>>20; por
tanto, el factor de corrección de un muestreo sin reemplazo es igual a uno. Ojo en este
caso el muestreo sin reemplazo población infinita es un muestreo aleatorio simple. (ver
apunte teórico).

Letra c

Si llamamos σMM= desviación estándar medias muestrales que es el error estándar; σa


desviación estándar niveles albumina, tenemos que un muestreo sin reemplazo se
cumple:

𝜎𝐴2 𝑁 − 𝑛 𝜎2 𝜎𝐴
𝜎𝑀𝑀 = √ ( )=√ 𝐴 ∗1= = 𝐸𝐸
𝑛 𝑁−1 𝑛 √𝑛
Dado que la población de adultos de estados unidos son cientos de millones de personas
y n=100, luego tenemos N/n>>20; por tanto, se cumple que:

𝑁−𝑛
( )=1
𝑁−1

En este caso el muestreo sin reemplazo es de una población infinita, pues N/n>>20; por
tanto, el factor de corrección de un muestreo sin reemplazo es igual a uno.

Letra d

En consideración al enunciado los niveles de albumina en el fluido cerebroespinal


distribuyen normal; por ende, las medias de las muestras de tamaño 100 también van a
distribuir normal. pues la variable original distribuye normal. Se puede demostrar
matemáticamente que en aquellos casos en los que la población de origen es normal, la
distribución de muestreo de la media de la muestra también es normal.
Asumiendo que M es una variable aleatoria que representa a todas las posibles medias
muestrales de tamaño 100, podemos decir que:

9
𝑀~𝑁 ((𝜇 = 30 ; 𝜎 = = 0,9)
√100

En este caso la media, así como la desviación estándar, poblacionales están en unidades
de mg/100 ml. A partir de este argumento responderemos e), f) y g). Ojo: acá es un
muestreo sin reemplazo población infinita, por tanto, es muestreo aleatorio simple.

Letra e

31,152 − 30
𝑃(𝑀 > 31,152) = 1 − 𝑃 (𝑍 < ) = 1 − 𝐹(𝑍 = 1,28) = 1 − 0,89973 = 0,10027 ó 10,027%
0,9

Respuesta: Un valor de albumina cerebroespinal de a lo menos 31,152mg/100ml se


observará en una proporción de 10,027% de medias muestrales seleccionadas por
muestreo aleatorio simple desde la población adultos de Estados Unidos.
Letra f
28,2 − 30
𝑃(𝑀 < 28,2) = 𝑃 (𝑍 < ) = 𝐹(𝑍 = −2) = 0,02275 ó 2,275%
0,9

Respuesta: Un valor de albumina cerebroespinal de a lo más 28,2 mg/100ml se


observará en una proporción de 2,275% de medias muestrales seleccionadas por
muestreo aleatorio simple desde la población adultos de Estados Unidos.

Letra g

30,9 − 30 29,1 − 30
𝑃(29,1 < 𝑀 < 30,9 ) = 𝑃 (𝑍 < ) − 𝑃 (𝑍 =< )
0,9 0,9

𝑃(29,1 < 𝑀 < 30,9 ) = 𝐹(𝑍 = 1) − 𝐹(𝑍 = −1) = 0,84134 − 0,15866 = 0,68268 ó 68,268%

Respuesta: Un valor de albumina cerebroespinal de a lo más 30,9 mg/100ml y a lo


menos 29,1 mg/100ml, se observará en una proporción de 68,268% de medias
muestrales seleccionadas por muestreo aleatorio simple desde la población adultos de
Estados Unidos.

Ejercicio 8

Aquí la variable aleatoria P, es el peso al nacer asumimos según enunciado que esta
variable distribuye normal con media de 3500 gramos y desviación estándar de 400
gramos, lo que podemos decir como:
𝑃~𝑁 ((𝜇 = 3500; 𝜎 = 400 )

A partir de lo anterior vamos a responder de la a) a la b)

Letra a

2500 − 3500
𝑃(𝑃 < 2500) = 𝑃 (𝑍 < ) = 𝐹(𝑍 = −2,5) = 0,00621
400

Respuesta: La probabilidad de un peso al nacer de a lo más 2500 gramos es de 0,00621


Letra b

El 5% inferior de la distribución de pesos o percentil 5, corresponde a Z=-1,645; este Z


separa el 5% inferior respecto al 95% superior. Si llamamos PI al peso que buscamos
podemos decir que:
𝑃𝐼 − 3500
𝑃(𝑃 < 𝑃𝐼 ) = 0,05 = 𝐹(𝑍 = −1,645) = 𝐹 (𝑍 = = −1,645) ⟹ 𝑃𝐼 = 2842
400

Respuesta: Un peso de a lo más 2842 gramos se observa con una probabilidad de 0,05.

Letra c

Se puede demostrar matemáticamente que en aquellos casos en los que la población de


origen es normal, la distribución de muestreo de la media de la muestra también es
normal. A partir de lo anterior y considerando que el problema establece que la
distribución de pesos al nacer en la población noruega es normal, podemos decir que la
distribución de los promedios muestrales de pesos de tamaño 4 también distribuye
normal.

Asumiendo que X, es una variable aleatoria que representa a todas las medias de los
pesos de muestras de tamaño 4 tomadas de la población de recién nacidos de
Noruega, podemos decir que:

400
𝑋~𝑁 ((𝜇 = 3500 ; 𝜎 = = 200)
√4

La variable aleatoria X, se origina en la distribución muestral de medias de los pesos de


nacimientos de los recién nacidos noruegos, por tanto, la media es el promedio de los
pesos de nacimiento; y su desviación estándar es el error estándar.
Si consideramos: a) N tamaño población total 58890 (en el año 2016 hubo en noruega
58.890 nacimientos) b) tamaño muestral n=4, c) desviación estándar poblacional de 400,
El error estándar en muestreo sin reemplazo de población infinita se determina de la
siguiente manera:
𝜎2 𝑁 − 𝑛 𝜎 𝑁−𝑛 400 58890 − 4 400
𝐸𝐸 = √ ( )= √( )= √( )= ∗ 1 = 200
𝑛 𝑁−1 √𝑛 𝑁 − 1 √4 58890 − 1 √4

Asumimos que el muestreo corresponde a población infinita, pues N/n>>20; por tanto,
tenemos que:

𝑁−𝑛
( )=1
𝑁−1

A partir de esta información contestamos la d) y e). Ojo: acá es un muestreo sin


reemplazo población infinita, por tanto, es muestreo aleatorio simple.

Letra d

El 5% inferior de la distribución muestral de medias de pesos o percentil 5, corresponde


a Z=-1,645; este Z separa el 5% inferior respecto al 95% superior. Si llamamos XI al
promedio muestral de peso que buscamos podemos decir que:

𝑋𝐼 − 3500
𝑃(𝑋 < 𝑋𝐼 ) = 0,05 = 𝐹(𝑍 = −1,645) = 𝐹 (𝑍 = = −1,645) ⟹ 𝑋𝐼 = 3171
400⁄
√4

Respuesta: Una media muestral de peso (seleccionadas por muestreo aleatorio simple
en la población de los niños nacidos en Noruega) de a lo más 3171 gramos se observa
con una probabilidad de 0,05.

Letra e

2500 − 3500
𝑃(𝑋 < 2500) = 𝑃 (𝑍 < ) = 𝐹(𝑍 = −5) = 0,00000028665 ≈ 0
400⁄
√4

Respuesta: Un promedio de peso de a lo menos 2500 gramos se observa con una


probabilidad muy cercana a cero.
Ejercicio 9

Letra a

Asumimos que, Y es una variable aleatoria y corresponde a un valor de una media


muestral de una distribución muestral de medias muestrales de tamaño 16, tomadas con
reemplazo desde una población de 1000 mujeres de 3 a 74 años. Ojo acá sin hay
muestreo con reemplazo el muestreo es aleatorio simple.

Se puede demostrar matemáticamente que en aquellos casos en los que la población de


origen es normal, la distribución de muestreo de la media de la muestra también es
normal. El problema enuncia que la distribución de niveles de hemoglobina es normal,
por ende, los promedios muestrales de tamaño 16 también van a distribuir normal. Ojo:
acá es un muestreo es con reemplazo población finita, por tanto, es muestreo aleatorio
simple.

De este modo Y distribuye normal como se muestra a continuación:

8
𝑌~𝑁 ((𝜇 = 14 ; 𝜎 = = 2)
√16
Si consideramos el tamaño muestral n=16 y desviación estándar poblacional de 8; y que
el muestreo fue efectuado con reemplazo, entonces si la población es finita (ver pregunta
2 y tabla I) se cumple que el error estándar o EE se determina como:

𝜎2 𝜎 8
𝐸𝐸 = √ = = =2
𝑛 √𝑛 √16

A partir de esta información contestamos la pregunta.

14,5 − 14 13,5 − 14
𝑃(13,5 < 𝑌 < 14,5 ) = 𝑃 (𝑍 < ) − 𝑃 (𝑍 < ) = 0,02275 ó 2,275%
8⁄ 8⁄
√16 √16

𝑃(13,5 < 𝑌 < 14,5 ) = 𝐹(𝑍 = 0,25) − 𝐹(𝑍 = −0,25) = 0,59871 − 0,40129 = 0,19742 ó 19,742%
Respuesta: Una hemoglobina de a lo menos 13,5 g/dl y a lo más 14,5 g/dl se observa
en una proporción de 19,742% de todas las medias muestrales de tamaño 16
seleccionadas por muestreo aleatorio simple de la población de 1000 mujeres entre 3 a
74 años.

Letra b

Se puede demostrar matemáticamente que en aquellos casos en los que la población de


origen es normal, la distribución de muestreo de la media de la muestra también es
normal. El problema enuncia que la distribución de niveles de hemoglobina es normal,
por ende, los promedios muestrales de tamaño 64 también van a distribuir normal.
Asumimos que L es una variable aleatoria y corresponde a un valor de una media
muestral de hemoglobina de una distribución muestral de medias muestrales de tamaño
64, seleccionadas aleatoriamente desde una población de 1000 mujeres entre 3 y 74
años. Ojo: acá es un muestreo es con reemplazo población finita, por tanto, es muestreo
aleatorio simple. Así podemos decir:

8
𝐿~𝑁 ((𝜇 = 14 ; 𝜎 = = 1)
√64

Si consideramos el tamaño muestral n=64 y desviación estándar poblacional de 8; y que


el muestreo fue efectuado con reemplazo, entonces si la población es finita (ver pregunta
2 y tabla I) se cumple que el error estándar o EE se determina como:

𝜎2 𝜎 8
𝐸𝐸 = √ = = =1
𝑛 √𝑛 √64

A partir de esta información contestamos la pregunta

15 − 14 12,9 − 14
𝑃(12,9 < 𝐿 < 15 ) = 𝑃 (𝑍 < ) − 𝑃 (𝑍 < )
8⁄ 8⁄
√64 √64

𝑃(12,9 < 𝐿 < 15 ) = 𝐹(𝑍 = 1) − 𝐹(𝑍 = −1,1) = 0,84134 − 0,13567 = 0,70567 ó 70,567%
Respuesta: Una hemoglobina de a lo menos 12,9 g/dl y a lo más 15 g/dl se observa en
una proporción de 70,567% de todas las medias muestrales de tamaño 64 seleccionadas
por muestreo aleatorio simple de la población de 1000 mujeres entre 3 a 74 años.

Letra c

Valores Z normal para intervalo 95%


Un intervalo del 95% significa que al centro están distribuidas el 95% de las medias; y el
5% restante se distribuye en los dos extremos. De este modo un valor de probabilidad
de 0,025 o 2,5% se corresponde con un Z de a lo más -1,96; y del mismo modo un valor
Z de a lo menos +,196 tiene una probabilidad de 0,025. La probabilidad entre valores Z
de -1,96 a +,196 es de 0,95 o 95%. (Ver figura 3 siguiente)

Figura 3 Áreas de probabilidad de la distribución Z normal estándar. un valor Z de a lo


más -1,96 tiene una probabilidad de 0,025; un Z de a lo más +1,96 tiene una
probabilidad de 0,975. La probabilidad entre valores Z de -1,96 a +,196 es de
0,95.

Aquí asumimos lo que dijimos acerca de la variable aleatoria L en la letra b).


En consideración que conocemos la varianza(σ2) y por ende la desviación estándar (σ)
poblacional y además sabemos que la distribución muestral de medias distribuye normal
se puede usar Z directamente de la siguiente forma para calcular el intervalo requerido:

𝜎𝑋 8
𝑋̅𝑖 = 𝜇𝑋 ± 𝑍𝛼⁄2 = 14 ± 1,96
√𝑛 √64
El intervalo de confianza al 95% para la hemoglobina presenta un límite inferior de 12,04
g/dl kg y un límite superior de 15,96 g7dl.
Respuesta: Una hemoglobina de a lo menos 12,04 g/dl y a lo más 15,96 g/dl se observa
en una proporción de 95% de todas las medias muestrales de tamaño 64 seleccionadas
por muestreo aleatorio simple desde la población de 1000 mujeres entre 3 a 74 años.

Letra d

Aquí asumimos que la variable Hb es la concentración de hemoglobina y esta variable


distribuye normal, pues el enunciado del problema lo dictamina así. De esta manera
tenemos que:
𝐻𝑏~𝑁 ((𝜇 = 14 ; 𝜎 = 8)

El requerimiento es buscar los límites para el 95% o 0,95 de las observaciones de


hemoglobina. Si definimos estos límites como el valor hemoglobina A y B; podemos decir
que el “0,95 central” indica que cada límite A y B se van a situar a una probabilidad 0,475
equidistante a cada lado de la media (ver figura abajo). Si la media es la probabilidad de
0,5, luego el límite A va a ubicarse a 0,025 (0,5-0,475); y el límite B va a estar a 0,975
(0,5+0,475). (Figura 4).

Figura 4 Los valores de probabilidad para un área de 0,95; son un extremo de 0,025 y
otro extremo de 0,975.
Entonces para resolver el problema, hay que determinar a qué puntaje Z corresponde el
0,025 y 0,975.

Los puntajes en la tabla normal estándar (sección algunos puntajes importantes) que
corresponden con probabilidad 0,025 y 0,975 son respectivamente los puntajes Z=-1,96
y Z=1,96.

Una vez obtenidos estos puntajes ellos pueden ser transformados a valores de colesterol
al conocerla media y desviación estándar de la distribución normal de X.

𝐴 − 𝜇𝑥 𝐴 − 14
𝑍𝐴 = = −1,96 = ⟹ 𝐴 = 1,68
𝜎𝑥 8

𝐵 − 𝜇𝑥 𝐵 − 14
𝑍𝐵 = = 1,96 = ⟹ 𝐵 = 29,68
𝜎𝑥 8

Respuesta: Una hemoglobina de a lo menos 1,68 g/dl y a lo más 29,68 g/dl se observa
con una probabilidad de 0,95 en la población de 1000 mujeres entre 3 a 74 años.

Letra e

La diferencia está que en c) se determina un intervalo de confianza para distribución


muestral de medias de hemoglobina de tamaño 64; y en e) se determina los valores de
hemoglobina que se ubican en 0,95 central de probabilidad.

Para el intervalo en c) interpretamos que 95 de 100 muestras aleatorias de tamaño 64


seleccionadas por muestreo aleatorio simple desde una población de 100 mujeres entre
3 a74 años, los niveles de hemoglobina van a estar entre 12,04 a 15,96.
En el caso del intervalo en d) podemos decir que el 95% central de observaciones de
hemoglobina en la población de 1000 mujeres de 3 a 74 años van a estar comprendidas
entre los límites de 1,68 g/dl a 29,68 g/dl. Esto es lo mismo que decir que para la
población de 100 mujeres entre 3 a 74 años; la probabilidad de observar a lo menos una
hemoglobina de 1,68 g/dl y a lo más de 29,68 g/dl es de 0,95.
Indiscutiblemente el intervalo de la variable original siempre a va a ser más amplio y por
ende menos preciso respecto del de la media de la variable, pues en su cálculo sólo
interviene la desviación estándar poblacional. En cambio, en intervalo confianza de
distribución muestral de medias interviene el error estándar donde considera la
desviación estándar más el tamaño muestral

Ejercicio 10

Letra a
En base a enunciado problema, aquí asumimos hay una variable U que es el nivel de
ácido úrico en sangre (uricemia) que presenta la siguiente característica:
𝑈~𝑁 ((𝜇 = 5,4 ; 𝜎 = 2)

7,1 − 5,4 4,5 − 5,4


𝑃(4,5 < 𝑈 < 7,1) = 𝑃 (𝑍 < ) − 𝑃 (𝑍 < ) = 𝐹(𝑍 = 0,85) − 𝑓(𝑍 = −0,45)
2 2

𝑃(4,5 < 𝑈 < 7,1) = 0,80234 − 0,32636 = 0,47598

Respuesta: Un nivel de uricemia de a lo menos 4,75 mg/dl y a lo más 5,4 mg/dl se


observa con una probabilidad de 0,47598 en la población de hombres saludables entre
65 y 79 años de los países bajos.

Letra b

Se puede demostrar matemáticamente que en aquellos casos en los que la población de


origen es normal, la distribución de muestreo de la media de la muestra también es
normal. El problema enuncia que la distribución de niveles de uricemia es normal, por
ende, los promedios muestrales de tamaño 16 también van a distribuir normal.
Asumimos que Q es una variable aleatoria y corresponde a un valor uricemia media
muestral de una distribución muestral de medias muestrales de tamaño 16, seleccionada
aleatoriamente desde una población de hombres saludables entre 65 y 79 años de los
países bajos. Así podemos decir:
2
𝑄~𝑁 ((𝜇 = 5,4 ; 𝜎 = )
√16
Dado que el muestreo fue efectuado sin reemplazo sobre una población muy grande
(varios millones de personas), entonces si N/n>>20 (ver pregunta 2 y tabla I) tenemos
que

𝑁−𝑛
( )=1
𝑁−1
Entonces debemos considerar el muestreo como efectuado sobre población infinita
y que el tamaño muestral es n=16 y la desviación estándar poblacional de 2; así se
cumple que:

𝜎2 𝑁 − 𝑛 𝜎2 𝜎 2
𝐸𝐸 = √ ( )= √ ∗1= = = 0,5
𝑛 𝑁−1 𝑛 √𝑛 √16

De lo anterior podemos repetir que la variable Q presenta la siguiente característica:


2
𝑄~𝑁 ((𝜇 = 5,4 ; 𝜎 = = 0,5)
√16
Ojo: acá es un muestreo es sin reemplazo de población infinita, por tanto, es muestreo
aleatorio simple.
Ahora contestamos la pregunta:

7,1 − 5,4 4,5 − 5,4


𝑃(4,5 < 𝑄 < 7,1) = 𝑃 (𝑍 < ) − 𝑃 (𝑍 < ) = 𝐹(𝑍 = 3,4) − 𝐹(𝑍 = −1,8)
2⁄ 2⁄
√16 √16

𝑃(4,5 < 𝑄 < 7,1) = 0,99966 − 0,03593 = 0,96373 ó 96,373%

Respuesta: Un nivel de uricemia de a lo menos 4,5 mg/dl y a lo más 7,1mg/dl se observa


en una proporción de 96,373% de todas las medias muestrales de tamaño 16
seleccionadas por muestreo aleatorio simple desde la población de hombres saludables
entre 65 y 79 años de los países bajos.
Letra c

Se puede demostrar matemáticamente que en aquellos casos en los que la población de


origen es normal, la distribución de muestreo de la media de la muestra también es
normal. El problema enuncia que la distribución de niveles de uricemia es normal, por
ende, los promedios muestrales de tamaño 4 también van a distribuir normal.

Asumimos que B es una variable aleatoria y corresponde a un valor uricemia media


muestral de una distribución muestral de medias muestrales de tamaño 4 de la población
de hombres saludables entre 65 y 79 años de los países bajos. Así podemos decir:
2
𝐵~𝑁 ((𝜇 = 5,4 ; 𝜎 = = 1)
√4
Dado que el muestreo fue efectuado sin reemplazo sobre una población muy grande
(varios millones de personas), entonces si N/n>>20 (ver pregunta 2 y tabla I) tenemos
que

𝑁−𝑛
( )=1
𝑁−1
Entonces debemos considerar el muestreo como efectuado sobre población infinita y que
el tamaño muestral es n=4 y la desviación estándar poblacional de 2; así se cumple que:

𝜎2 𝑁 − 𝑛 𝜎2 𝜎 2
𝐸𝐸 = √ ( )=√ ∗1= = =1
𝑛 𝑁−1 𝑛 √𝑛 √4

Ojo: acá es un muestreo es sin reemplazo de población infinita, por tanto, es muestreo
aleatorio simple.
De lo anterior podemos repetir que la variable B presenta la siguiente característica:
2
𝐵~𝑁 ((𝜇 = 5,4 ; 𝜎 = = 1)
√4
Ahora contestamos la pregunta:

7,1 − 5,4 4,5 − 5,4


𝑃(4,5 < 𝐵 < 7,1) = 𝑃 (𝑍 < ) − 𝑃 (𝑍 < ) = 𝐹(𝑍 = 1,7) − 𝐹(𝑍 = −0,9)
2⁄ 2⁄
√4 √4
𝑃(4,5 < 𝐵 < 7,1) = 0,95543 − 0,18406 = 0,77137 ó 77,137%

Respuesta: Un nivel de uricemia de a lo menos 4,5 mg/dl y a lo más 7,1mg/dl se observa


en una proporción de 77,137% de todas las medias muestrales de tamaño 4
seleccionadas por muestreo aleatorio simple desde la población de hombres saludables
entre 65 y 79 años de los países bajos.

Letra d

Uso Z normal
Un intervalo del 95% significa que al centro están distribuidas el 95% de las medias; y el
5% restante se distribuye en los dos extremos. Los puntajes Z que contienen dichos
valores son Z0-1,96 y Z=+1,96 (ver figura 4 pregunta 9 letra c)

Aquí asumimos lo que dijimos acerca de la variable aleatoria B en la letra c).

2
𝐵~𝑁 ((𝜇 = 5,4 ; 𝜎 = = 1)
√4
Ojo: acá es un muestreo es sin reemplazo de población infinita, por tanto, es muestreo
aleatorio simple.
En consideración que conocemos la varianza(σ2) y por ende la desviación estándar (σ)
poblacional y además sabemos que la distribución muestral de medias distribuye normal
se puede usar Z directamente de la siguiente forma para calcular el intervalo requerido:

𝜎𝑋 2
𝑋̅𝑖 = 𝜇𝑋 ± 𝑍𝛼⁄2 = 5,4 ± 1,96
√𝑛 √4

El intervalo de confianza al 95% presenta para uricemia un límite inferior de 3,54 mg/dl
y un límite superior de 7,46 mg/dl

Respuesta: Un nivel de uricemia de a lo menos 3,54 mg/dl y a lo más 7,46 mg/dl se


observa en una proporción de 95% de todas las medias muestrales de tamaño 4
seleccionadas por muestreo aleatorio simple desde la población de hombres saludables
entre 65 y 79 años de los países bajos. Otra interpretación sería en 95 de 100 muestras
aleatorias simples de tamaño 4 de la población de hombres saludables entre 65 y 79
años de los países bajos, la uricemia se va a encontrar entre los límites de 3,54 a 7,46
mg/dl.

Ejercicio 11

Letra a

Distribución normal, pues la población originaria es normal y variables aleatorias


normales dan origen a normales. Se puede demostrar matemáticamente que en
aquellos casos en los que la población de origen es normal, la distribución de muestreo
de la media de la muestra también es normal.
Dado que el muestreo fue efectuado sin reemplazo sobre una población muy grande
(varios millones de personas componen la población de hombre en Estados Unidos),
entonces si N/n>>20 (ver pregunta 2 y tabla I) tenemos que

𝑁−𝑛
( )=1
𝑁−1
Entonces debemos considerar el muestreo como efectuado sobre población infinita y que
el tamaño muestral es n=25 y la desviación estándar poblacional de 125; así se cumple
que:

𝜎2 𝑁 − 𝑛 𝜎2 𝜎 125
𝐸𝐸 = √ ( )=√ ∗1= = = 25
𝑛 𝑁−1 𝑛 √𝑛 √25

Ojo: acá es un muestreo es sin reemplazo de población infinita, por tanto, es muestreo
aleatorio simple.

De lo anterior podemos repetir que la variable C: peso medio de una distribución


muestral de medias muestrales de peso de tamaño 64, seleccionadas por muestreo
aleatorio simple desde una población de hombres de Estados Unidos, presenta la
siguiente característica:
125
𝐶~𝑁 ((𝜇 = 78; 𝐸𝐸 = = 25)
√25
Letra b

Asumiendo la distribución de C en el punto a) tenemos:

El 95% superior de la distribución de la media de pesos es el percentil 95; y en la


distribución Z normal estándar corresponde a un Z=+1,645; este Z separa el 95%
inferior respecto al 5% superior. Si llamamos CI al peso que buscamos podemos decir
que:

𝐶𝐼 − 78
𝑃(𝐶 < 𝐶𝐼 ) = 0,95 = 𝐹(𝑍 = 1,645) = 𝐹 (𝑍 = = 1,645) ⟹ 𝐶𝐼 = 119,125
125⁄
√25

Respuesta: Un peso de a lo más 119,125 kg se observará en una proporción de 95%


de medias muestrales seleccionadas por muestreo aleatorio simple desde la población
de hombres adultos de Estados Unidos.

Letra c

Asumiendo la distribución de C en el punto a) tenemos:

El 99% superior de la distribución de pesos es el percentil 99; y en la distribución Z


normal estándar corresponde a Z=+2,326; este Z separa el 99% inferior respecto al 1%
superior. Si llamamos CI al peso que buscamos podemos decir que:

𝐶𝐼 − 78
𝑃(𝐶 < 𝐶𝐼 ) = 0,95 = 𝐹(𝑍 = 2,326) = 𝐹 (𝑍 = = 2,326) ⟹ 𝐶𝐼 = 136,15
125⁄
√25

Respuesta: Un peso de a lo más 136,15 kg se observará en una proporción de 99% de


medias muestrales seleccionadas por muestreo aleatorio simple desde la población de
hombres adultos de Estados Unidos.
Letra d

El resultado puntual de 86 Kg tiene probabilidad cero. No podemos concluir nada.

Letra e

En b) estamos diciendo que el 95% de las muestras de tamaño 25 seleccionadas por


muestreo aleatorio simple desde una población de hombres adultos de Estados Unidos
tiene un promedio menor de 119,125Kg, y un 5% un valor con promedio de peso mayor
a 119,125 kg.

En c) estamos diciendo el 99% de las muestras de tamaño 25 seleccionadas por


muestreo aleatorio simple de desde una población de hombres adultos de Estados
Unidos, tiene un promedio menor de 136,15 Kg, y un 1% un valor con promedio de peso
mayor a 136,15 kg.

Ejercicio 12

Letra a
𝑝̂ es la proporción de hipertensión arterial

52
𝑝̂ = = 0,08 ó 8%
650

8% esta estimación puntual, nos da una orientación acerca del valor de parámetro
poblacional
Letra b

La construcción de los siguientes intervalos de confianza requiere:

1.- Un muestreo aleatorio simple de la población. Acá asumimos un muestreo sin


reemplazo de una población infinita dado origen a un muestreo aleatorio simple. Aquí
nos da la impresión de una población grande con tamaño muestra de 52 (N/n>20).
2.-que “𝑛𝑝̂ ” y/o “𝑛𝑞̂” muestrales sean mayores o iguales a 5. En este caso 𝑛𝑝̂ = 650 ∗
0,08 = 52 y 𝑛𝑞̂ = 650 ∗ 0,92 = 598; luego se cumplen los supuestos. Recordar 𝑞̂ = 1 −
𝑝̂ . Esto es pues, la base de este Intervalo de confianza es el teorema de límite central.

3.- Se requiere también el n o tamaño muestral y la proporción muestral estimada que


están dadas en los planteamientos problema.

Intervalo confianza 95%

𝑝̂ 𝑞̂⁄ 0,08 ∗ 0,92


𝑝 = 𝑝̂ ± 𝑍𝛼⁄2 √ 𝑛 = 0,08 ± 1,96 ∗ √ 650

El intervalo de confianza al 95% presenta para la proporción de defectos visuales un


límite inferior de 0,0591 y un límite superior de 0,1009

Interpretación: En 95 de 100 muestras de tamaño 650 seleccionada por muestreo


aleatorio simple desde la población X de escolares de 10 a 14 años, la proporción de
defectos visuales (estimada en 0,08 según la muestra) será de a lo menos 0,0591 y a lo
mas 0,1009.
Intervalo de confianza 99%

𝑝̂ 𝑞̂⁄ 0,08 ∗ 0,92


𝑝 = 𝑝̂ ± 𝑍𝛼⁄2 √ 𝑛 = 0,08 ± 2,576 ∗ √ 650

El intervalo de confianza al 95% presenta para la proporción de defectos visuales un


límite inferior de 0,0526 y un límite superior de 0,1074.

Interpretación: En 99 de 100 muestras de tamaño 650 seleccionada por muestreo


aleatorio simple desde la población X de escolares de 10 a 14 años, la proporción de
defectos visuales (estimada en 0,08 según la muestra) será de a lo menos 0,0526 y a lo
más 0,1074.
Letra c
La precisión de un intervalo de confianza es la longitud de dicho intervalo. Al 99% o 0,99
tiene una precisión de 0,0548 (0,1074-0); en cambio al 95% o 0,95 la precisión es de
0,0418 (0,1009-0,0591). Al aumentar el nivel de confianza el intervalo se hace más
amplio y por ende menos preciso.
Letra d

Intervalo confianza con muestra 1200 niños

𝑝̂ 𝑞̂⁄ 0,08 ∗ 0,92


𝑝 = 𝑝̂ ± 𝑍𝛼⁄2 √ 𝑛 = 0,08 ± 1,96 ∗ √ 1200

El intervalo de confianza al 95% presenta para la proporción de defectos visuales un


límite inferior de 0,0647 y un límite superior de 0,0953

Interpretación: En 95 de 100 muestras de tamaño 1200 seleccionadas por muestreo


aleatorio simple desde la población X de escolares de 10 a 14 años, la proporción de
defectos visuales (estimada en 0,08 según la muestra) será de a lo menos 0,0647 y a lo
más 0,0953.
Al aumentar el tamaño de muestra, ocurre lo siguiente:
1.-el estimador o proporción poblacional de niños preescolares con defectos visión se
mantiene en 0,08.
2.-El error estándar se reduce desde valores aproximados de 0,0106 hasta 0,00783
3.- El intervalo se acorta o se hace más preciso cambiando desde 0,0418 a 0,0306
4.-Los limites se hacen más estrechos inicialmente en 0,0591 a 0,1009 pasa a 0,0647 a
0,0953
Letra e

Uso Intervalo confianza 95% de 0,0591 a 0,1009

Si usamos el intervalo de confianza del 95% estos valores varían desde cifras
aproximadas de 266 (0,0591*4500) a 454 (0,1009*4500) niños.
Uso Intervalo confianza 99% de 0,0526 a 0,1074

Si usamos el intervalo de confianza del 99% varía desde 237 (0,0526*4500) hasta 483
(0,1074 *4500).

Ejercicio 13
Letra a

Intervalo confianza usando la T de Student

En los apuntes teóricos está la inferencia de donde se obtiene la fórmula para el intervalo
de confianza de la T que se muestra a continuación:

𝑆
𝜇 = 𝑋̅ ± 𝑇𝛼⁄2
√𝑛

La distribución T de Student (9 grados de libertad) de acuerdo con tabla para tamaño


muestral n=10, para probabilidad de 0,005 y 0,995, da un valor absoluto de 3,2498. Esto
puede ser corroborado ya sea en la tabla T de Student de Cola Superior que muestra en
la figura 5. No obstante, lo anterior existe una tabla T de Dos Colas, en que también se
puede buscar este valor según figura 6.

Figura 5 Calculo T de Student con Distribución de Cola Superior, se busca alfa de 0,005;
pues un intervalo de confianza al 99%, deja a cada lado un área de probabilidad
de 0,005. La observación de valor T (9 grados de libertad) de a lo menos 3,2498
tiene una probabilidad de 0,005 (verde).
Figura 6 Calculo T de Student con Distribución de Dos colas, se busca alfa de 0,01; pues
un intervalo de confianza al 99%, deja a cada lado un área de probabilidad de
0,005, las que al sumarse dan 0,01. La observación de un valor T (9 grados de
libertad) de a lo más -3,2498 y a los menos 3,2498 tiene una probabilidad de
0,01 (en verde). En una T con 9 grados de libertad, al lado izquierdo de T -3,2498
hay área de 0,005; y al lado derecho de T 3,2498 hay probabilidad de 0,005; de
esta manera T=-2,2622 a T+2,2622 separan un área central de probabilidad de
0,99

Se usa una t de Student con 9 grados de libertad (n-1; n=tamaño muestra), que para una
confianza al 1% dos colas dan 3,2498.

𝑆 10
𝜇 = 𝑋̅ ± 𝑇𝛼⁄2 = 22 ± 3,2498
√𝑛 √10

El intervalo de confianza al 95% para el nivel enzimático E, presenta un límite inferior


de 10,28 y un límite superior de 32,8

Interpretación: El intervalo de confianza al 99% usando la T de Student, nos indica que


en 99 de 100 muestras aleatorias simples que tomemos de tamaño 10 desde la población
R, los promedios de la enzima “E” se encontrarán en un rango de 10,28 a 32,28 mg/dl.
También podemos decir que 99 de 100 muestras aleatorias simples de tamaño 10
tomadas desde la población X, los niveles de enzima “E” serán de a lo menos 10,28 y a
lo más 32,28.

Letra b

Justificación del uso de la T

El uso correcto de la t de Student debe cumplir las siguientes condiciones:


a) Los promedios muestrales se producen como resultado de un muestreo aleatorio
simple. Debemos asumir que hay muestreo sin reemplazo en población infinita, lo que
da origen a un muestreo aleatorio simple.
b) La distribución de la variable que da origen a la media de la muestra debe tener
siempre una distribución normal. La distribución de la variable original niveles de enzima
“E” es normal
c) Desde el enunciado contamos con: a) n o tamaño de la muestra, b) media muestral c)
desviación estándar (S) de la muestra determinada a partir de la cuasivarianza muestral
o S2.

Si hubiésemos conocido la varianza de donde se obtuvo el muestreo, se hubiese podido


usar la distribución Z estándar.

Opinión situación planteada.

Esto es lo que se usa habitualmente para calcular los intervalos de confianza; pues en
la práctica siempre desconocemos la varianza poblacional, y generalmente tenemos
tamaño muestral reducido; en que existen indicios que la variable distribuye normal a
nivel poblacional. Cabe también remarcar que asumimos que el tamaño de la población
que niveles enzima E es infinita o grande que enfrentada a tamaño muestral de 10; da
cumplimiento a N/n mayor a 20 y por ende se considera un muestreo aleatorio simple.

Ejercicio 14
Letra a

Intervalo confianza usando la T de Student

En los apuntes teóricos está la inferencia de donde se obtiene la fórmula para el intervalo
de confianza de la T que se muestra a continuación:
𝑆
𝜇 = 𝑋̅ ± 𝑇𝛼⁄2
√𝑛

La distribución T de Student (40 grados de libertad) de acuerdo con tabla para tamaño
muestral n=41, para probabilidad de 0,005 y 0,995, da un valor absoluto de 2,7045. Esto
puede ser corroborado ya sea en la tabla T de Student de Cola Superior que muestra en
la figura 7. No obstante, lo anterior existe una tabla T de Dos Colas, en que también se
puede buscar este valor según figura 8.

Figura 7 Calculo T de Student con Distribución de Cola Superior, se busca alfa de 0,005;
pues un intervalo de confianza al 99%, deja a cada lado un área de probabilidad
de 0,005. La observación de valor T (40 grados de libertad) de a lo menos
2,7045 tiene una probabilidad de 0,005 (azul).

Determinación Intervalo confianza 99%

Se usa una t de Student con 40 grados de libertad (n-1; n=tamaño muestra), que para
una confianza al 1% a dos colas da 2,7045.

𝑆 5
𝜇 = 𝑋̅ ± 𝑇𝛼⁄2 = 3,5 ± 2,7045
√𝑛 √41

El intervalo de confianza al 95% presenta para el pH de lluvia de la localidad Z muestra


un límite inferior de 1,388 kg y un límite superior de 5,612.

Interpretación: El intervalo de confianza al 99% usando la T de Student, nos indica que


en 99 de 100 muestras aleatorias simples que tomemos de tamaño 41 desde la localidad
Z, los promedios de pH de agua lluvia se encontrarán en un rango de 1,388 a 5,612.
También podemos decir que 99 de 100 muestras aleatorias simples de tamaño 41
tomadas desde la población X, los niveles de pH de agua lluvia serán de a lo menos
1,388 y a lo más 5,612. Estos valores de pH de agua lluvia del intervalo están alejados
de un pH de 5,7 propio de agua pura; por tanto, tenemos evidencia fuerte en favor de la
contaminación en la localidad Z.
Figura 8 Calculo T de Student con Distribución de Dos colas, se busca alfa de 0,01; pues
un intervalo de confianza al 99%, deja a cada lado un área de probabilidad de
0,005, las que al sumarse dan 0,01. La observación de un valor T (40 grados de
libertad) de a lo más -2,7045 y a los menos 2,7045 tiene una probabilidad de
0,01 (en verde). En una T con 9 grados de libertad, al lado izquierdo de T -2,7045
hay área de 0,005; y al lado derecho de T 2,7045 hay probabilidad de 0,005; de
esta manera T=-2,7045 a T+2,7045 separan un área central de probabilidad de
0,99.

Justificación del uso de la T El uso correcto de la t de Student debe cumplir las siguientes
condiciones:
a) Los promedios muestrales se producen como resultado de un muestreo aleatorio
simple. Asumiendo un muestreo sin reemplazo sobre población infinita. Recordemos que
la población de pH agua lluvia es infinita y se seleccionó sólo 41 muestras.
b) La distribución de la variable que da origen a la media de la muestra debe tener
siempre una distribución normal. La distribución de la variable original niveles de pH agua
lluvia distribuyen normal
c) Desde el enunciado se sabe que: a) n o tamaño de la muestra, b) media muestral c)
desviación estándar (S) de la muestra determinada a partir de la cuasivarianza muestral
o S2.
Si hubiésemos conocido la varianza de donde se obtuvo el muestreo, se hubiese podido
usar la distribución Z estándar.
Ejercicio 15

Letra a
Justificación del uso de la T

a) Hay un muestreo aleatorio simple. Asumiendo un muestreo sin reemplazo sobre


población infinita. Recordemos que la población de niveles de ácido ascórbico en la
saliva de hombre es infinita y se seleccionó a 31 sujetos.
b) La distribución de la variable original concentración de ácido ascórbico distribuye
normal, lo dice el enunciado problema.
c) Desde el enunciado se sabe que: a) n o tamaño de la muestra, b) media muestral c)
desviación estándar (S) de la muestra determinada a partir de la cuasivarianza muestral
o S2. Cabe destacar que se desconoce la varianza del pH de agua lluvia de la población
de donde se obtuvo el muestreo. Si hubiésemos conocido la varianza de donde se obtuvo
el muestreo, se hubiese podido usar la distribución Z estándar.
En este caso dado que trabajamos con tamaño muestra de 31, Los grados de libertad
de la T a usar son 30.

Intervalo confianza 95%

En este caso se puede consultar Tabla Distribución T de Student de Cola Superior e ir a


buscar un alfa de 0,025 con 30 grados de libertad lo que da un T 2,0423. La probabilidad
de a lo más un T de 2,0423 es de 0,975; y la probabilidad de a lo menos un T de 2,0423
es de 0,025. Este valor T de 2,0425 deja un alfa 0,025 que debiera estar distribuido a
ambos lados de la distribución de probabilidad, delimitando entre T-2,0425 y T+2,0425
un área de probabilidad de 0,95.

Visto lo anterior en la Tabla de Distribución T de Student de Dos colas, basta ubicar un


alfa de 0,05 y este da un valor T de 2,0425.

𝑆 0,09
𝜇 = 𝑋̅ ± 𝑇𝛼⁄2 = 0,12 ± 2,0423
√𝑛 √31
El intervalo de confianza al 95% para la concentración de ácido ascórbico, para un
tamaño de muestra de 31, presenta un límite inferior de 0,087 mg y un límite superior
de0,153 mg

Intervalo confianza 99%

En este caso se puede consultar Tabla Distribución T de Student de Cola Superior e ir a


buscar un alfa de 0,005 con 30 grados de libertad lo que da un T 2,75 La probabilidad de
a lo más un T de 2,75 es de 0,995; y la probabilidad de a lo menos un T de 2,75 es de
0,005. Este valor T de 2,75 deja un alfa 0,005 que debiera estar distribuido a ambos
lados de la distribución de probabilidad, delimitando entre T-2,75 y T+2,75 un área de
probabilidad de 0,99.

Visto lo anterior en la Tabla de Distribución T de Student de Dos colas, basta ubicar un


alfa de 0,01 y este da un T de 2,75.

𝑆 0,09
𝜇 = 𝑋̅ ± 𝑇𝛼⁄2 = 0,12 ± 2,75
√𝑛 √31

El intervalo de confianza al 99% para la concentración de ácido ascórbico para un


tamaño de muestra de 31, presenta un límite inferior de 0,0755 mg y un límite superior
de 0,1645 mg

Letra b

En caso de aumento tamaño muestra, la justificación del uso de la T se mantiene como


lo señalada en la letra a de esta pregunta. Ojos los grados de libertad de la T a usar
ahora son 120, pues el tamaño de muestra cambio a 121; y recordemos que los grados
de libertad de la T a usar cambian a 120.

Intervalo confianza 95%

En este caso se puede consultar Tabla Distribución T de Student de Cola Superior e ir a


buscar un alfa de 0,025 con 120 grados de libertad lo que da un T de 1,9799. La
probabilidad de a lo más un T de 1,9799 es de 0,975; y la probabilidad de a lo menos un
T de 1,9799 es de 0,025. Este valor T de 1,9799 deja un alfa 0,025 que debiera estar
distribuido a ambos lados de la distribución de probabilidad, delimitando entre T-1,9799
y T+1,9799 un área de probabilidad de 0,95.

Visto lo anterior en la Tabla de Distribución T de Student de Dos colas, basta ubicar un


alfa de 0,05 y este da un T de 1,9799.

𝑆 0,09
𝜇 = 𝑋̅ ± 𝑇𝛼⁄2 = 0,12 ± 1,9799
√𝑛 √121

El intervalo de confianza al 95% para la concentración de ácido ascórbico para un


tamaño de muestra de 121, presenta un límite inferior de 0,1038 mg y un límite superior
de 0,1362 mg

Intervalo confianza 99%

En este caso se puede consultar Tabla Distribución T de Student de Cola Superior e ir a


buscar un alfa de 0,005 con 120 grados de libertad lo que da un T de 2,6174 La
probabilidad de a lo más un T de 2,6174 es de 0,995; y la probabilidad de a lo menos un
T de 2,6174 es de 0,005. Este valor T de 2,6174 deja un alfa 0,005 que debiera estar
distribuido a ambos lados de la distribución de probabilidad, delimitando entre T-2,6174
y T+2,6174 un área de probabilidad de 0,99.
Visto lo anterior en la Tabla de Distribución T de Student de Dos colas, basta ubicar un
alfa de 0,01 y este da un T de 2,6174.

𝑆 0,09
𝜇 = 𝑋̅ ± 𝑇𝛼⁄2 = 0,12 ± 2,6174
√𝑛 √121

El intervalo de confianza al 95% para la concentración de ácido ascórbico para un


tamaño de muestra de 121, presenta un límite inferior de 0,0986 mg y un límite superior
de 0,1414 mg.
Al aumentar la significancia del intervalo, este se hace más amplio al 99% tiene una
longitud de 0,0428 (0,1362-0,1038), en cambio al 95% la longitud es de 0,0324
(0,1414-0,0986).
Letra c

Interpretación Intervalo confianza en 9 al 99%: 0,0986 a 0,1414

El intervalo de confianza al 99% usando la T de Student, nos indica que en 99 de 100


muestras aleatorias simples que tomemos de tamaño 121 de la población “M”, los
promedios de concentración de ácido ascórbico en la saliva se encontrarán en un rango
de 0,0986 mg a 0,1414 mg. También podemos decir que 99 de 100 muestras aleatorias
simples de tamaño 121 tomadas desde la población “M”, los promedios de concentración
de ácido ascórbico en la saliva serán de a lo menos 0,0986 mg y a lo más 0,1414 mg.
Esto tiene una credibilidad o confianza de 99% para ese tamaño muestral.

Ejercicio 16

Letra a

𝑝̂ 𝑞̂⁄ 0,2 ∗ 0,8


𝑝 = 𝑝̂ ± 𝑍𝛼⁄2 √ 𝑛 = 0,8 + 1,96 ∗ √ 125

El intervalo de confianza al 95%para la proporción de niños con radiografía de tórax


normal que padecen dolor al pecho presenta un límite inferior de 0,7299 y un límite
superior de 0,8701.

Letra b

Este intervalo se interpreta formalmente como para 95 de 100 muestras (confianza) que
se obtengan de muestras aleatorias simples de tamaño 125 desde la población de “niños
con dolor al pecho”, la proporción poblacional (estimada en 80% según la muestra) de
presencia de radiografías de tórax normales va a estar comprendida entre 72,99% a
87,01%. También podría decirse que en 95 de 100 muestras aleatorias simples de
tamaño 125 seleccionada aleatoriamente desde la población de “niños con dolor al
pecho”, la proporción de radiografías de tórax normales (estimada en 0,8 según la
muestra) será de a lo menos 0,7299 y a lo más 0,8701.

Letra c

La construcción de este intervalo de confianza debería cumplir los siguientes supuestos:

1.- Un muestreo aleatorio de la población, esto no lo dice el encabezado del problema y


podría ser puesto en discusión
2.-que “𝑛𝑝̂ ” y/o “𝑛𝑞̂” muestrales sean mayores o iguales a 5. En este caso 𝑛𝑝̂ = 100 ∗
0,8 = 80 y 𝑛𝑞̂ = 100 ∗ 0,2 = 20; luego se cumplen los supuestos. Recordar 𝑞̂ = 1 − 𝑝̂ .
Esto es pues, la base de este Intervalo de confianza es el teorema de límite central.
3.-Se requiere también el n o tamaño muestral y la proporción muestral estimada, que
están dados en el enunciado del problema.

Ejercicio 17
Letra a
Media

1,19 + 1,23 + 1,18 + 1,21 + 1,27 + 1,17 + 1,15 + 1,14 + 1,19 + 1,2 11,93
𝑋̅ = = = 1,193
3 10

Desviación estándar (S) a partir de la cuasivarianza (S2)

∑𝑛𝑋=1(𝑋𝑖 − 𝑋̅)2 0,01301


𝑆 = √𝑆 2 = √ =√ ≈ 0,0380
10 − 1 9
Letra b

En los apuntes teóricos está la inferencia de donde se obtiene la fórmula para el intervalo
de confianza de la T que se muestra a continuación:

𝑆
𝜇 = 𝑋̅ ± 𝑇𝛼⁄2
√𝑛

Los grados de libertad de la T a usar son 9, pues el tamaño de la muestra es 10; y los
grados de libertada a usar deben ser siempre el tamaño muestra menos 1 o sea 10-1=9.

La distribución T de Student (9 grados de libertad) de acuerdo con tabla para tamaño


muestral n=10, para probabilidad de 0,025 y 0,975, da un valor absoluto de 2,2622. Esto
puede ser corroborado ya sea en la tabla T de Student de Cola Superior que muestra en
la figura 1 de la pregunta 6 letra b). No obstante, lo anterior existe una tabla T de Dos
Colas, en que también se puede buscar este valor según figura 2 de la pregunta 6 letra
b).

Así tenemos los insumos para el cálculo del intervalo de confianza usando la distribución
T de Student, lo que son: a) puntaje T=2,2622; b) tamaño muestra o n=10, c) media
observada en muestra, que es 𝑋̅= 1,193 gramos yd) desviación estándar observada en
muestra o S que es igual 0,0380 gramos.

√0,01301
𝑆 9
𝜇 = 𝑋̅ ± 𝑇𝛼⁄2 = 1,193 ± 2,2622
√𝑛 √10

El intervalo de confianza al 95% para el peso de tabletas de aspirina presenta un límite


inferior de 1,1658 mg y un límite superior de 80,3 Kg.

Letra c

Justificación del uso de la T El uso correcto de la t de Student debe cumplir las siguientes
condiciones:
a) Los promedios muestrales se producen como resultado de un muestreo aleatorio
simple. En este caso, debemos asumir que es una muestra de 10 tabletas de aspirina
obtenida de una población gigantesca de tabletas de aspirina, de esta manera hay
muestreo sin reemplazo en población infinita dando lugar a muestreo aleatorio simple.
b) La distribución de la variable que da origen a la media de la muestra debe tener
siempre una distribución normal. Se sabe que el peso de las tabletas de medicamentos
como la aspirina distribuye normal.
c)Desde el enunciado contamos con: a) n o tamaño de la muestra, b) media muestral c)
desviación estándar (S) de la muestra determinada a partir de la cuasivarianza muestral
o S2,

Letra d
La mediana es 1,19

Letra e
Si la mediana es discordante con la media es evidencia de sesgo en la muestra; lo que
si fuera muy pronunciado indica que no podría usar la media como medida que
representa nuestra información muestral, por tanto, no tendría mucho sentido hacer una
estimación puntual de la media, así como de tampoco la determinación de un intervalo
de confianza, pues ellos la media representan a la muestra.
Además de los señalado, si hay discordancia entre la mediana y la media; nos indica que
hay un comportamiento anómalo de las muestras que vienen se supone de una variable
con distribución normal, hay que revisar nuestra información muestral por si hay un dato
extremo producto de algún error.
Ejercicio 18
Letra a
Xi P (X=Xi) F(X) Xi P (X=Xi) F(X) Xi P (X=Xi) F(X)
0.0216560
0 1.6069E-40 1.6069E-40 34 9.0587E-08 1.3547E-07 68 0.96015212
3
0.0150650
1 2.4104E-38 2.4265E-38 35 2.5623E-07 3.917E-07 69 0.97521718
6
2 1.7897E-36 1.814E-36 36 6.9396E-07 1.0857E-06 70 0.0100075 0.98522468
0.0063427
3 8.7697E-35 8.9511E-35 37 1.8006E-06 2.8862E-06 71 0.99156747
8
4 3.19E-33 3.2795E-33 38 4.4777E-06 7.3639E-06 72 0.0038321 0.99539957
0.0022047
5 9.1871E-32 9.515E-32 39 1.0678E-05 1.8041E-05 73 0.99760434
7
0.0012066
6 2.1819E-30 2.2771E-30 40 2.4425E-05 4.2466E-05 74 0.998811
6
0.0006274
7 4.395E-29 4.6228E-29 41 5.3616E-05 9.6082E-05 75 0.99943846
7
8 7.6639E-28 8.1261E-28 42 0.00011298 0.00020906 76 0.0003096 0.99974807
0.0001447
9 1.1751E-26 1.2564E-26 43 0.00022858 0.00043764 77 0.99989282
5
10 1.604E-25 1.7297E-25 44 0.00044417 0.00088181 78 6.4024E-05 0.99995684
11 1.9686E-24 2.1416E-24 45 0.00082912 0.00171093 79 2.6744E-05 0.99998359
12 2.1901E-23 2.4042E-23 46 0.00148701 0.00319793 80 1.0531E-05 0.99999412
13 2.2238E-22 2.4642E-22 47 0.00256271 0.00576065 81 3.9002E-06 0.99999802
14 2.0729E-21 2.3193E-21 48 0.0042445 0.01000514 82 1.3556E-06 0.99999937
15 1.7827E-20 2.0146E-20 49 0.00675654 0.01676169 83 4.4096E-07 0.99999982
16 1.4206E-19 1.622E-19 50 0.01033751 0.0270992 84 1.3386E-07 0.99999995
17 1.0529E-18 1.2151E-18 51 0.01520222 0.04230142 85 3.7797E-08 0.99999999
18 7.2825E-18 8.4975E-18 52 0.02148776 0.06378918 86 9.8887E-09 1
19 4.7144E-17 5.5642E-17 53 0.02919091 0.09298009 87 2.3869E-09 1
20 2.864E-16 3.4204E-16 54 0.03811036 0.13109045 88 5.2892E-10 1
21 1.6366E-15 1.9786E-15 55 0.04781118 0.17890163 89 1.0697E-10 1
22 8.8152E-15 1.0794E-14 56 0.05762955 0.23653118 90 1.9612E-11 1
23 4.4843E-14 5.5636E-14 57 0.06672895 0.30326013 91 3.2327E-12 1
24 2.1581E-13 2.7144E-13 58 0.07420719 0.37746732 92 4.7437E-13 1
25 9.8407E-13 1.2555E-12 59 0.07923819 0.45670551 93 6.1208E-14 1
26 4.258E-12 5.5135E-12 60 0.08121914 0.53792466 94 6.8371E-15 1
27 1.7505E-11 2.3019E-11 61 0.07988768 0.61781234 95 6.4773E-16 1
28 6.8458E-11 9.1476E-11 62 0.0753779 0.69319024 96 5.0604E-17 1
29 2.5495E-10 3.4642E-10 63 0.06819905 0.76138929 97 3.1301E-18 1
30 9.0506E-10 1.2515E-09 64 0.05914136 0.82053065 98 1.4373E-19 1
31 3.0655E-09 4.317E-09 65 0.04913282 0.86966347 99 4.3555E-21 1
32 9.915E-09 1.4232E-08 66 0.03908293 0.9087464 100 6.5332E-23 1
33 3.0646E-08 4.4878E-08 67 0.02974969 0.93849609

La suma de la función de cuantía de la binomial para X=50 hasta X=75 (en celeste) da
0,9827 o sea un 98,27% de los sujetos va a tener un conteo de a lo menos 50 y a lo
más 78 neutrófilos.
Letra b

𝑋~𝐵𝑖(𝑛 = 100, 𝑝 = 0,6), y dado que se cumple np y nq mayor o igual a 5, podemos decir
que X distribuye aproximadamente normal de parámetros µ=60 y 𝜎 = (√100 ∗ 0,6 ∗ 0,4).

Ojo acá decimos que µ=np=100*0,60=60 y σ=√𝑛𝑝𝑎 = √100 ∗ 0,6 ∗ 0,4

75 − 60 50 − 60
𝑃(50 ≤ 𝑋 ≤ 75) = 𝑃 (𝑍 < ) − 𝑃 (𝑍 < )
√100 ∗ 0,6 ∗ 0,4 √100 ∗ 0,6 ∗ 0,4

𝑃(50 ≤ 𝑋 ≤ 75) = 𝐹(𝑍 = 3,06) − 𝐹(𝑍 = −2,04) = 0,99889 − 0,02068 = 0,97821 ó 97,821%

El porcentaje de sujetos que será considerado normal para conteo neutrófilos entre 50
y 75 neutrófilos es de aproximadamente 97,821%

Letra c
De acuerdo con b), un 97,821% de 100.000 sujetos da un total de 97821 sujetos que
van a ser considerados normales en sus recuentos de neutrófilos para esta población.

Letra d
Usando la distribución exacta de la binomial hay un 0,9827 de probabilidad de tener un
recuento de neutrófilos de a lo más 75 y a lo menos 50. Usando la aproximación de la
distribución normal, hay 0,97821 de probabilidad de observar un recuento de neutrófilos
entre 50 y 75. Estas determinaciones son similares, hay una diferencia mínima
aproximada de 0,00449 o 0,449%, lo que se podría corregir usando en la normal la
corrección por continuidad.

Letra e
Aproximación con binomial exacta

Dijimos por la binomial exacta que hay una probabilidad de 0,9827 de encontrar un sujeto
con recuento neutrófilo dentro de los rangos normales; y por ende hay 1-0,9827 o 0,0173
de encontrar sujetos con neutrófilos menores a 50 y mayores a 75. Esta área se
encuentra achurada en anaranjado en la tabla de la respuesta a).
Aproximación binomial por normal
X es el conteo de neutrófilos, que distribuye binomial, de parámetros n=100 y p=0,6; y
dado que se cumple que np y nq es mayor o igual a 5; podemos decir que X distribuye
aproximadamente normal con µ=np (100*0,6) y σ=√𝑛𝑝𝑞 (√100 ∗ 0,6 ∗ 0,4)lo que significa
que:

𝑋 ∼ 𝑁 (𝜇 = 60; 𝜎 = √24)

𝑃(𝑋 ≥ 76) ∪ (𝑃𝑌 ≤ 49) = [1 − 𝑃(𝑌 ≤ 76)] + 𝑃(𝑌 ≤ 49)

76 − 60 49 − 60
𝑃(𝑋 ≥ 76) ∪ (𝑃𝑌 ≤ 49) = [1 − 𝑃 (𝑍 < )] + 𝑃 (𝑍 < )
√24 √24

𝑃(𝑋 ≥ 76) ∪ (𝑃𝑌 ≤ 49) = [1 − 𝐹(𝑍 ≈ 3,27)] − 𝐹(𝑍 ≈ −2,25)

𝑃(𝑋 ≥ 76) ∪ (𝑃𝑌 ≤ 49) = [1 − 0,99946] + 0,01222 = 0,01276

A esta metodología debería incluírsele un ajuste por continuidad; dado que la variable
aleatoria normal es continua y la variable binomial es discreta. No obstante, este ajuste
es mínimo así que no lo haremos.

Podemos decir entonces que en la probabilidad de observar a lo más 49 y a lo menos


76 de conteo de neutrófilos tiene una probabilidad aproximada por la normal de 0,01276
o 1,276% que es muy cercana al valor que se obtiene con la distribución binomial exacta
que dio un valor de 0,0173 o 1,73%.

Ejercicio 19

Letra a
xi P (X=Xi) P (X≤ xi) =F(Xi) P(X> xi) =1-F(Xi)
0 0.0010 0.0010 0.9990
1 0.0098 0.0107 0.9893
2 0.0439 0.0547 0.9453
3 0.1172 0.1719 0.8281
4 0.2051 0.3770 0.6230
5 0.2461 0.6230 0.3770
6 0.2051 0.8281 0.1719
7 0.1172 0.9453 0.0547
8 0.0439 0.9893 0.0107
9 0.0098 0.9990 0.0010
10 0.0010 1.0000 0.0000
La suma de los valores de la función de cuantía entre X=1 y X=9 (fondo celeste) dan
una probabilidad cercana al 99%. El valor exacto es de 0,998
Letra b

Letra c

Si X: número de muertes de enfermos con leucemia sometidos a tratamiento “Q”. El


tratamiento considera 10 enfermos cada uno un experimento de Bernoulli con
probabilidad de muerte de 0,5; por tanto:

𝑋 ∼ 𝐵𝑖(𝑛 = 10; 𝑝 = 0,5) dado que np (10*0,5) y nq (10*0,5) son mayores o iguales a 5;
luego podemos decir, que X distribuye aproximadamente normal con µ=np (10*0,5) y
σ=√𝑛𝑝𝑞 (√10 ∗ 0,5 ∗ 0,5)lo que significa que:

𝑋 ∼ 𝑁 (𝜇 = 5; 𝜎 = √2,5)

El requerimiento es buscar los límites para el 99% o 0,99 de las observaciones de muerte
para leucemia. Si definimos estos límites como el valor muertes A y B; podemos decir
que el “0,99 central” indica que cada límite A y B se van a situar a una probabilidad 0,495
equidistante a cada lado de la media (ver figura 9). Si la media es la probabilidad de 0,5,
luego el límite A va a ubicarse a 0,005 (0,5-0,495); y el límite B va a estar a 0,995
(0,5+0,495).
Figura 9 Distribución 0,99 de probabilidad, con una cola inferior de 0,005 y otra cola
superior de 0,005

Entonces para resolver el problema, hay que determinar a qué puntaje Z corresponde
el 0,005 y 0,995. Los puntajes en la tabla normal estándar (sección algunos puntajes
importantes) que corresponden con probabilidad 0,005 y 0,995 son respectivamente los
puntajes Z=-2,576 y Z=2,576. Una vez obtenidos estos puntajes ellos pueden ser
transformados a valores de número de muertos, sabiendo que:

𝑋~𝑁 (𝜇 = 5; 𝜎 = √2,5)

𝐴 − 𝜇𝑥 𝐴−5
𝑍𝐴 = = −2,576 = ⟹𝐴≈1
𝜎𝑥 √2,5

𝐵 − 𝜇𝑥 𝐵−5
𝑍𝐵 = = 2,576 = ⟹9
𝜎𝑥 √2,5

Letra d

𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ )
𝐶𝐼99%: 𝑃 (𝑝̂ − 𝑍𝛼⁄2 √ ≥ 𝑃 ≥ 𝑝̂ + 𝑍𝛼⁄2 √ )
𝑛 𝑛

0,5 ∗ 0,5 0,5 ∗ 0,5


𝐶𝐼99%: 𝑃 (0,5 − 2,576√ ≥ 𝑃 ≥ 0,5 + 2,576√ )
10 10

CI99%: 0,0927 a 0,9073 o 9,27% a 90,73%. Hay cumplimiento de supuestos pues np


(10*0,5) y nq (10*0,5) son mayores o iguales a 5
Letra e

El intervalo de confianza de d) aplicado sobre un numero de 10 enfermos, indica que se


espera una proporción de muertes entre 0,0927 a 0,9073; si aplicamos estas
proporciones a un total de 10 enfermos que se someterán al tratamiento “Q” podemos
decir que 0,0927 es cercano a 1 y que 0,9073 es cercano a 9; por tanto, esperamos con
el cálculo de este intervalo entre 1 a 9 muertes.

En este caso el intervalo de confianza al 99% de d) indica que en 99 de 100 muestras


de tamaño 10, la proporción muertes (parámetro) va a estar comprendida entre 0,0927
a 0,9073. Lo anterior visto usando la distribución binomial exacta, es equivalente a decir
que para un total de 10 enfermos en que se administra “Q”, la probabilidad de observar
a lo menos una muerte (proporción de 0,0927 de 10 enfermos) y a los más nueve
(proporción 0,9027 de 10 enfermos) va a ser aproximadamente de 0,99.

De este modo podemos generalizar que bajo el cumplimiento del supuesto de normalidad
las proporciones de los límites de intervalo del intervalo para un determinado porcentaje
de confianza de una proporción pueden ser llevados a resultados (resultados limites)
aplicando la proporción al n muestra observada. De este modo la confianza del intervalo
pasa a ser la probabilidad de que el número de resultados este comprendido entre dos
valores límites del intervalo

Ejercicio 20

Letra a

6
𝑝̂ = 10 = 0,6

Letra b

Dado que np (10*0,6) ≥ 5 pero nq (10*0,4) <5; luego no se puede hacer intervalo
confianza proporción, como tampoco hacer aproximación de Binomial por normal.
Se ofrece la opción de hacerlo usando la función de cuantía de la binomial

xi P (X=Xi) P (X≤ xi) =F(Xi) P(X> xi) =1-F(Xi)


0 0,0001 0,0001 0,9999
1 0,0016 0,0017 0,9983
2 0,0106 0,0123 0,9877
3 0,0425 0,0548 0,9452
4 0,1115 0,1662 0,8338
5 0,2007 0,3669 0,6331
6 0,2508 0,6177 0,3823
7 0,2150 0,8327 0,1673
8 0,1209 0,9536 0,0464
9 0,0403 0,9940 0,0060
10 0,0060 1,0000 0,0000

Las sumas de la probabilidad de observar entre dos y ocho recaídas dan un área de
probabilidad central de 0,952. En otras palabras, observar el resultado entre 2 y 8
recaídas tiene una probabilidad cercana a 0,95. Esto se llama intervalo de recidiva. El
intervalo para la proporción de recidiva se calcula determinado la proporción de sujetos
que recidivan con 95% de probabilidad central, en este caso es 0,2 (2 casos de 10) a 0,8
(8 casos de 10).

Ejercicio 21

Letra a
Letra b
Y: número bacterias observan en placa de agar

𝑌~𝑃(𝜆 = 10)

10
𝑒 −10 10𝑘
1 − 𝐹(19) = 1 − (∑ ) ≈ 1 − 0,998412 = 0,003454
𝑘!
𝑘=0

Letra c

Si 𝑌~𝑃(𝜆 = 10), y dado que λ≥10; luego Y distribuye aproximadamente normal de


parámetros µ=λ=10 y σ2=λ=10; así tenemos:

19 − 10
𝑃(𝑌 ≥ 20) = 1 − 𝑃 (𝑍 < ) = 1 − 𝐹(2,85) = 1 − 0,99781 = 0,00219
√10
En este caso es importante recordar que en la distribución de Poisson la esperanza y la
varianza son iguales a lambda, por ende, la desviación estándar es raíz de lambda.

Letra d

Dado que λ≥10 podemos asumir que la variable distribuye normal de µ=λ y σ2=λ, esto se
comprueba al menos visualmente al mirar figura histograma para función cuantía
probabilidad para λ=10 de la letra a).

Las determinaciones en b) y c) difieren en valor de 0,001264, esto indica que habría que
hacer ajuste de continuidad que en este caso no se hizo. No obstante, las dos
determinaciones son muy cercanas, y es posible usarlas.

Letra e
Una opción es la distribución exacta, de probabilidad de la Poisson como el caso b).
Ejercicio 22

Se usa la tabla y se evalúa 𝐿~𝑇𝑠𝑡𝑢𝑑𝑒𝑛𝑡(𝑛 = 11). En verde la figura 10 siguiente


muestra el uso tabla con valor de 1,7959; y en rojo el valor de +27181.

Determinación Respuesta

Es valor Cero. La esperanza de una T de Student para cualquier grado de


Percentil 50
libertad es cero.

Percentil 99 Es valor de +2,7181 (rojo figura abajo)

Percentil 95 Valor de1,7959 (verde figura abajo)

Percentil 1 Valor de -2,7181*

Esperanza Para cualquier grado libertad es cero.

𝑛 11
Varianza Si n son los grados de libertada se determina:𝑉𝑎𝑟(𝑊) = = =≈ 1,22
𝑛−2 11−2

*Ojo el percentil 1 no aparece en la tabla, pero como la T de Student es simétrica como


la distribución normal, es equivalente al percentil 99, pero negativo. El percentil 1 deja
un 0,01 de probabilidad a la izquierda y el 99 deja también un 0,01 a la derecha, de este
modo el percentil 1 y 99 contiene un 0,98 de probabilidad (Ver figura 11)

Figura 10 Uso Tabla Distribución T de Student de Cola Superior, en verde indica que la
probabilidad de observar a lo menos un valor T (11 grados libertad) de 1,7959
es 0,05. En rojo indica que la probabilidad de observar lo menos un valor T (11
grados libertad) de 2,7181 es de 0,01.
Figura 11 Muestra el percentil 1 y 99 equivalentes en T de Student de 11 grados de
libertad equivalen a -2,7181 y +2.7181

Ejercicio 23

𝐽~𝐽𝑖(𝑛) mirar la tabla.

Letra a

El valor Ji cuadrado con 7 grados de libertad, tal que la probabilidad de obtener un


valor mayor es 0,025.

Respuesta: 16,013; ver figura 12

Figura 12 En rojo indica que la probabilidad de observar a lo menos un valor Ji-cuadrado


(7 grados libertad) de 16,013 es 0,025. El alfa indica la probabilidad de a lo
menos.
Letra b

El percentil 95 de la distribución para una ji cuadrado con 3 grados de libertad


Respuesta: 0,7815; ver figura 13

Figura 13 En rojo indica que la probabilidad de observar a lo menos un valor Ji-cuadrado


(3 grados libertad) de 7,815 es 0,05, lo que equivale a decir que observar más
un valor Ji-cuadrado (3 grados libertad) tiene una probabilidad de 0,95. El alfa
indica la probabilidad de a lo menos.

Letra c

La esperanza de una ji cuadrado con 4 grados de libertad. La esperanza de una ji


cuadrado son siempre sus grados de libertad.
Respuesta: si 4 son sus grados de libertad luego esto es 4.

Letra d

La varianza de una ji cuadrado con 20 grados de libertad. la varianza de una ji-


cuadrados son siempre dos veces sus grados de libertad.
Respuesta si 20 son sus grados de libertad luego la varianza es dos veces sus grados
de libertad lo que da 40.
Ejercicio 24

Letra a

25∗25
𝑆=√ = 5,1
24

S2 es la cuasivarianza muestral un estimador insesgado de la varianza del colesterol;


por ende, s que es la raíz cuadrada de S2 es mejor estimador desviación estándar del
colesterol.

Letra b

Existen las opciones de la normal estándar y la T de Student. La T de Student es la más


correcta, pues hay: a) muestreo aleatorio simple, b) la variable distribuye normal c) se
conoce el tamaño muestral, la cuasivarianza o S2 y la desviación estándar o S.
La normal estándar requiere el conocimiento de la varianza poblacional.

Letra c

25 ∗ 25⁄
220 ± 2,0639√ 24
25
Los límites del intervalo al 95%; son217,9 a 222,1.
Un nivel de colesterol de a lo menos 217,9 mg/dl y a lo más 222,1 mg/dl se observa en
una proporción de 95% de todas las medias muestrales de tamaño 25 seleccionadas por
muestreo aleatorio simple en la población de 20.000 mujeres. Otra interpretación sería
en 95 de 100 muestras aleatorias simples de tamaño 25 de la población 20.000 mujeres,
el nivel de colesterol se va a encontrar entre los límites de 217,9 a 222,1 mg/dl.

Letra d

Los factores que hacen variar el tamaño de muestra son el nivel de confianza, el tamaño
de muestra y la desviación estándar muestral o S. Son manipulados por el investigador
el tamaño de muestra y la confianza.
La precisión es inversa a la longitud del intervalo. Un intervalo preciso es más estrecho y
viceversa.

Letra e

Para valorar la distribución normal de una variable en la lectura de un artículo de


investigación científica pueden usarse algunos criterios como:

1. La variable original que da lugar a la media muestral tiene que evidenciar simetría.
En otras palabras, la mediana o percentil 50 debe ser igual o parecido a la media;
o bien el autor debe referir que la variable distribuye en forma simétrica,
2. Hay evidencias de publicaciones anteriores en que se muestra que la variable
original tiene una distribución normal de probabilidad.
3. El autor del artículo explicita que aplica un contraste de hipótesis sobre la variable
original, evidenciado ausencia de un comportamiento de distribución no normal.
Esto suele referirse como un valor p mayor a 0,15 ya sea en Prueba de Shapiro-
Wilk, o Prueba de sesgo y curtosis para normalidad (SK test) o bien Prueba de
Shapiro-Francia.

Ejercicio 25

Letra a
3000 − 3000
𝑃(𝑋 ≥ 3000) = 1 − 𝐹 (𝑍 = ) = 1 − 𝐹(𝑍 = 0) = 0,5
400

Letra b
Percentil 5
𝑋𝑖 − 3000
−1,645 = ⟹ 𝑋𝑖 = 2342
400
Percentil 10

𝑋𝑖 − 3000
−1,282 = ⟹ 𝑋𝑖 = 2487,2
400
Letra c
Muestras que se pueden tomar
(10
5
) = 252.
La media es la media poblacional o sea 3000 gramos
La desviación estándar es el error estándar y se calcula como:

4002 10 − 5
𝐸𝐸 = √ ( ) ≈ 133,33
5 10 − 1

Letra d
Muestras que se pueden tomar 105 = 100.000.
La media es la media poblacional o sea 3000 gramos
La desviación estándar es el error muestral o error estándar y se calcula como:

4002
𝐸𝐸 = √ = 178,9
5

Letra e

Caso pregunta c La dispersión promedio de las medias muestrales de tamaño 5 producto


del muestreo aleatorio sin reemplazo, es de 133,33 gramos de peso respecto de la media
poblacional de 3000 gramos. Ojo este no es un muestreo aleatorio simple.

Caso pregunta d La dispersión promedio de las medias muestrales de tamaño 5 producto


del muestreo aleatorio con reemplazo, es de 178,9 gramos de peso respecto de la media
poblacional de 3000 gramos. Ojo este es un muestreo aleatorio simple.

El error estándar es la desviación estándar de la distribución de medias muestrales. La


desviación estándar es la dispersión media de los valores de la variable original en
torno a la media.
Letra f

4002
3000 ± 1,96√
5

Los límites del intervalo son 2649,4 a 3350,6

Letra g
El número de muestras es impresionante lo consideramos infinito y es
10000
( )
5
La media es la media poblacional o sea 3000 gramos

La desviación estándar es el error muestral o error estándar y se calcula como:

4002
𝐸𝐸 = √ = 80
25

𝑁−𝑛 10000−5
Ojo cuando N/n> 20, la expresión ( 𝑁−1) ≈ 1; en este caso es (10000−1) ≈ 1

Letra h

Población infinita es una muestra grande; esto ocurre cuando N/n es mayor a 20 el
muestreo sin reemplazo produce el mismo error estándar que un muestreo con
reemplazo. A estos dos casos los llamamos Muestreo Aleatorio Simple.

Ejercicio 26

Letra a
Hay muchas opciones, la que nosotros mostramos en el curso es usar el teorema de
límite central y determinar el intervalo de confianza para una proporción basado en el
normal estándar esta es sólo válida para tamaño de muestra grande o sea np y nq mayor
a 5. La otra opción es la que vimos en apresto que es usar la binomial exacta; que
determina los límites de valores entre los que está comprendida una particular
probabilidad.
Letra b

0,1 ∗ 0,9
0,10 ± 2,576√
100

Los límites del intervalo son 0,02 a 0,18.


En 99 de 100 muestras de tamaño 10 seleccionada con muestreo al aleatorio simple
desde la población de médicos, la proporción de sujetos que consideran razonable el uso
terapéutico de la marihuana (estimada en 0,1 según la muestra) será de a lo menos 0,02
y a lo más 0,18.

Letra c
Los factores que hacen variar el tamaño de la muestra son el nivel de confianza, el
tamaño de muestra y la desviación estándar muestral o pq. Son manipulados por el
investigador el tamaño de muestra y la confianza.
La precisión es inversa a la longitud del intervalo. Un intervalo preciso es más estrecho y
viceversa.

Letra d
El 99% indica que 99 de 100 muestras, bajo las condiciones muestreo, contiene la
proporción muestra de 0,02 a 0,18.
El 1%, indica que un 1% bajo las condiciones muestreo, no contiene la proporción
poblacional entre 0,02 a 0,18.

Letra e
El error estándar es la desviación estándar de la distribución muestral de proporciones.
El valor del error estándar es

0,1 ∗ 0,9
𝐸𝐸 = √ = 0,03
100

0,03 es la proporción de dispersión promedio de las muestras de tamaño 100 en torno a


la proporción poblacional de las muestras de 0,1. Este debe ser considerado un muestreo
con reemplazo de población infinita o sea un muestreo aleatorio simple.
Letra f

0,1 ∗ 0,9
2,576√ = 0,07728 ≈ 0,08
100

La diferencia entre la proporción media 0,10 y cada uno de los límites del intervalo es
0,08.

Letra g
La varianza de la población original de donde se obtiene la distribución de muestreo es
pq pues esta variable original es Bernoulli. En este caso está varianza se estima partir
de la proporción estimada en la muestra que es 0,1. La varianza es 0,1 por 0,9 lo que da
0,09

Ejercicio 27

Letra a
Cuasivarianza muestral

(11 − 12)2 + (12 − 12)2 + (13 − 12)2


𝑆2 = =1
3−1

Letra b
1
12 ± 4,3027
√3

Los límites del intervalo al 95%; son 9,5 a 14,5. Una hemoglobina de a lo menos 9,5 g/dl
y a lo más 14,5 g/dl se observa en una proporción de 95% de todas las medias muestrales
de tamaño 3 seleccionadas por muestreo aleatorio simple en la población saludable. Otra
interpretación sería en 95 de 100 muestras aleatorias simples de tamaño 3 de la
población saludable, el nivel de colesterol se va a encontrar entre los límites de 9,5 a 14,5
g/dl.
Ojo acá se considera un muestreo sin reemplazo en población infinita es por tanto
equivalente a muestreo aleatorio simple.
Ejercicio 28

Letra a

X: número de consultas médicas al día.


𝑋~𝑃(𝜆 = 100)
Dado que λ mayor a 10 luego podemos decir que:
𝑋~𝑁(𝜇 = 100; 𝜎 = √100 ∗ 100)
𝐴 − 100
−1,96 = ⟹ 𝐴 = 80
√100

𝐵 − 100
1,96 = ⟹ 𝐵 = 120
√100

Letra b

𝑋~𝑁(𝜇 = 100; 𝜎 = √100 ∗ 100)

𝐴 − 100
+2,326 = ⟹ 𝐴 = 123
√100

Letra c

𝑋~𝑁(𝜇 = 100; 𝜎 = √100 ∗ 100)

120 − 100
𝑃(𝑋 ≤ 120) = 𝐹 (𝑍 = ) = 𝐹(𝑍 = 2) = 0,97725
√100
Ejercicio 29

Letra a
M: número de muertos después de tratamiento quimioterápico.

𝑀~𝑏𝑖𝑛( 𝜇 = 30; 𝜎 = √100 ∗ 0,3 ∗ 0,7

Dado que 100*0,3 y 100*0,7 son mayores o iguales a 5 podemos decir que:

𝑀~𝑁( 𝜇 = 30; 𝜎 = √100 ∗ 0,3 ∗ 0,7)

40 − 30
𝑃(𝑋 ≤ 40) = 𝐹 (𝑍 = ) = 𝐹(𝑍 ≈ 2,18) = 0,98537
√100 ∗ 0,3 ∗ 0,7

Letra b
𝑀~𝑁( 𝜇 = 30; 𝜎 = √100 ∗ 0,3 ∗ 0,7

25 − 30
𝑃(𝑋 ≥ 25) = 1 − 𝐹 (𝑍 = ) = 1 − 𝐹(𝑍 ≈ −1,09) = 0,86214
√100 ∗ 0,3 ∗ 0,7

Letra c

0,3 ∗ 0,7
0,30 ± 1,96√
100

Los límites del intervalo son 0,21 a 0,39.

Letra d

𝑀~𝑁( 𝜇 = 30; 𝜎 = √100 ∗ 0,3 ∗ 0,7)

𝐴 − 30
−1,96 = ⟹ 𝐴 = 21
√100 ∗ 0,3 ∗ 0,7
𝐵 − 30
1,96 = ⟹ 𝐵 = 39
√100 ∗ 0,3 ∗ 0,7

Letra e
𝑀~𝑁( 𝜇 = 30; 𝜎 = √100 ∗ 0,3 ∗ 0,7

38 − 30
𝑃(𝑋 ≥ 38) = 1 − 𝐹 (𝑍 = ) = 1 − 𝐹(𝑍 ≈ 1,75) = 0,04006
√100 ∗ 0,3 ∗ 0,7

Es un evento extraño pone en duda el parámetro de muerte observada.

Ejercicio 30

1. Muestreo: proceso para seleccionar un subconjunto de unidades de observación de


la población.

2. Muestreo aleatorio: se define como el proceso de selección muestral en que todas


las unidades de observación candidatas tienen una probabilidad conocida, distinta de
cero, de ser incluidos en la muestra. Esto no es sinónimo de muestreo aleatorio
simple.

3. Muestra representativa: Una muestra representativa es aquella que exhibe el


mismo grado de diversidad interna que la población de donde se seleccionó”. La
noción de representatividad sólo tiene un alcance intuitivo. En efecto, no existe una
forma que permita establecer el grado de representatividad de una muestra o declarar
si ella es o no representativa de la población de la que se obtuvo.
4. Muestreo aleatorio simple: es un muestreo aleatorio de frecuente uso, en el que
cada unidad de observación tiene la misma probabilidad de ser seleccionado.

5. Muestreo con Reemplazo: en este muestreo después de que una unidad de


observación ha sido seleccionada, se devuelve a la población que da origen a la
muestra; siendo elegible para ser vuelto a seleccionar como parte de la muestra.

6. Muestreo sin Reemplazo en este muestreo después de que una unidad de


observación ha sido seleccionada, no es elegible para ser vuelta a seleccionar como
parte de la muestra.

7. Población Finita es aquella formada por conjunto limitado de elementos definido por
un número de elementos “N” que dan cuenta del tamaño de la población.

8. Población Infinita es aquella que está formada por un conjunto ilimitado de


elementos. Desde el punto de vista estadístico una población grande es considerada
infinita.

9. Estimador: es un valor que se determina a partir de los datos muestrales


proporcionando información sobre su valor en toda la población (parámetro). Por
ejemplo, la media muestral colesterol es un estimador de la media poblacional de
colesterol.

10. Estimador insesgado: es aquel estimador en que su valor esperado de la


distribución del estimador es igual a la del parámetro de la población que da origen a
la distribución de dicho estimador.

11. Estimador Eficiente: es un estimador que tiene una varianza reducida. Aquí
estamos diciendo que los estimadores con menor variabilidad serán considerados
eficientes
Ejercicio 31

1 F 26 F 51 F
2 V 27 F 52 V
3 F 28 F 53 V
4 F 29 V 54 V
5 F 30 V 55 V
6 F 31 V 56 V
7 F 32 F 57 V
8 F 33 F 58 V
9 V 34 V 59 F
10 V 35 V 60 V
11 F 36 V 61 V
12 V 37 F 62 V
13 V 38 V 63 V
14 V 39 F 64 V
15 V 40 V 65 F
16 V 41 V 66 V
17 F 42 F 67 V
18 V 43 V 68 V
19 F 44 V 69 F
20 F 45 V 70 V
21 F 46 V 71 F
22 V 47 V 72 V
23 F 48 V 73 F
24 F 49 V 74 F
25 F 50 V 75 F
Tabla de distribución normal estándar
Normal 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490
0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230 0,78524
0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891
1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147
1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91308 0,91466 0,91621 0,91774
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574
2,2 0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899
2,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158
2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361
2,5 0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477 0,99492 0,99506 0,99520
2,6 0,99534 0,99547 0,99560 0,99573 0,99585 0,99598 0,99609 0,99621 0,99632 0,99643
2,7 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,99720 0,99728 0,99736
2,8 0,99744 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,99807
2,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861
3,0 0,99865 0,99869 0,99874 0,99878 0,99882 0,99886 0,99889 0,99893 0,99896 0,99900
3,1 0,99903 0,99906 0,99910 0,99913 0,99916 0,99918 0,99921 0,99924 0,99926 0,99929
3,2 0,99931 0,99934 0,99936 0,99938 0,99940 0,99942 0,99944 0,99946 0,99948 0,99950
3,3 0,99952 0,99953 0,99955 0,99957 0,99958 0,99960 0,99961 0,99962 0,99964 0,99965
3,4 0,99966 0,99968 0,99969 0,99970 0,99971 0,99972 0,99973 0,99974 0,99975 0,99976
3,5 0,99977 0,99978 0,99978 0,99979 0,99980 0,99981 0,99981 0,99982 0,99983 0,99983
3,6 0,99984 0,99985 0,99985 0,99986 0,99986 0,99987 0,99987 0,99988 0,99988 0,99989
3,7 0,99989 0,99990 0,99990 0,99990 0,99991 0,99991 0,99992 0,99992 0,99992 0,99992
3,8 0,99993 0,99993 0,99993 0,99994 0,99994 0,99994 0,99994 0,99995 0,99995 0,99995
3,9 0,99995 0,99995 0,99996 0,99996 0,99996 0,99996 0,99996 0,99996 0,99997 0,99997
4,0 0,99997 0,99997 0,99997 0,99997 0,99997 0,99997 0,99998 0,99998 0,99998 0,99998
Tabla de distribución normal estándar

Normal 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
-4,0 0,00003 0,00003 0,00003 0,00003 0,00003 0,00003 0,00002 0,00002 0,00002 0,00002
-3,9 0,00005 0,00005 0,00004 0,00004 0,00004 0,00004 0,00004 0,00004 0,00003 0,00003
-3,8 0,00007 0,00007 0,00007 0,00006 0,00006 0,00006 0,00006 0,00005 0,00005 0,00005
-3,7 0,00011 0,00010 0,00010 0,00010 0,00009 0,00009 0,00008 0,00008 0,00008 0,00008
-3,6 0,00016 0,00015 0,00015 0,00014 0,00014 0,00013 0,00013 0,00012 0,00012 0,00011
-3,5 0,00023 0,00022 0,00022 0,00021 0,00020 0,00019 0,00019 0,00018 0,00017 0,00017
-3,4 0,00034 0,00032 0,00031 0,00030 0,00029 0,00028 0,00027 0,00026 0,00025 0,00024
-3,3 0,00048 0,00047 0,00045 0,00043 0,00042 0,00040 0,00039 0,00038 0,00036 0,00035
-3,2 0,00069 0,00066 0,00064 0,00062 0,00060 0,00058 0,00056 0,00054 0,00052 0,00050
-3,1 0,00097 0,00094 0,00090 0,00087 0,00084 0,00082 0,00079 0,00076 0,00074 0,00071
-3,0 0,00135 0,00131 0,00126 0,00122 0,00118 0,00114 0,00111 0,00107 0,00104 0,00100
-2,9 0,00187 0,00181 0,00175 0,00169 0,00164 0,00159 0,00154 0,00149 0,00144 0,00139
-2,8 0,00256 0,00248 0,00240 0,00233 0,00226 0,00219 0,00212 0,00205 0,00199 0,00193
-2,7 0,00347 0,00336 0,00326 0,00317 0,00307 0,00298 0,00289 0,00280 0,00272 0,00264
-2,6 0,00466 0,00453 0,00440 0,00427 0,00415 0,00402 0,00391 0,00379 0,00368 0,00357
-2,5 0,00621 0,00604 0,00587 0,00570 0,00554 0,00539 0,00523 0,00508 0,00494 0,00480
-2,4 0,00820 0,00798 0,00776 0,00755 0,00734 0,00714 0,00695 0,00676 0,00657 0,00639
-2,3 0,01072 0,01044 0,01017 0,00990 0,00964 0,00939 0,00914 0,00889 0,00866 0,00842
-2,2 0,01390 0,01355 0,01321 0,01287 0,01255 0,01222 0,01191 0,01160 0,01130 0,01101
-2,1 0,01786 0,01743 0,01700 0,01659 0,01618 0,01578 0,01539 0,01500 0,01463 0,01426
-2,0 0,02275 0,02222 0,02169 0,02118 0,02068 0,02018 0,01970 0,01923 0,01876 0,01831
-1,9 0,02872 0,02807 0,02743 0,02680 0,02619 0,02559 0,02500 0,02442 0,02385 0,02330
-1,8 0,03593 0,03515 0,03438 0,03362 0,03288 0,03216 0,03144 0,03074 0,03005 0,02938
-1,7 0,04457 0,04363 0,04272 0,04182 0,04093 0,04006 0,03920 0,03836 0,03754 0,03673
-1,6 0,05480 0,05370 0,05262 0,05155 0,05050 0,04947 0,04846 0,04746 0,04648 0,04551
-1,5 0,06681 0,06552 0,06426 0,06301 0,06178 0,06057 0,05938 0,05821 0,05705 0,05592
-1,4 0,08076 0,07927 0,07780 0,07636 0,07493 0,07353 0,07215 0,07078 0,06944 0,06811
-1,3 0,09680 0,09510 0,09342 0,09176 0,09012 0,08851 0,08692 0,08534 0,08379 0,08226
-1,2 0,11507 0,11314 0,11123 0,10935 0,10749 0,10565 0,10383 0,10204 0,10027 0,09853
-1,1 0,13567 0,13350 0,13136 0,12924 0,12714 0,12507 0,12302 0,12100 0,11900 0,11702
-1,0 0,15866 0,15625 0,15386 0,15151 0,14917 0,14686 0,14457 0,14231 0,14007 0,13786
-0,9 0,18406 0,18141 0,17879 0,17619 0,17361 0,17106 0,16853 0,16602 0,16354 0,16109
-0,8 0,21186 0,20897 0,20611 0,20327 0,20045 0,19766 0,19489 0,19215 0,18943 0,18673
-0,7 0,24196 0,23885 0,23576 0,23270 0,22965 0,22663 0,22363 0,22065 0,21770 0,21476
-0,6 0,27425 0,27093 0,26763 0,26435 0,26109 0,25785 0,25463 0,25143 0,24825 0,24510
-0,5 0,30854 0,30503 0,30153 0,29806 0,29460 0,29116 0,28774 0,28434 0,28096 0,27760
-0,4 0,34458 0,34090 0,33724 0,33360 0,32997 0,32636 0,32276 0,31918 0,31561 0,31207
-0,3 0,38209 0,37828 0,37448 0,37070 0,36693 0,36317 0,35942 0,35569 0,35197 0,34827
-0,2 0,42074 0,41683 0,41294 0,40905 0,40517 0,40129 0,39743 0,39358 0,38974 0,38591
-0,1 0,46017 0,45620 0,45224 0,44828 0,44433 0,44038 0,43644 0,43251 0,42858 0,42465
0 0,50000 0,49601 0,49202 0,48803 0,48405 0,48006 0,47608 0,47210 0,46812 0,46414
Algunos puntajes Z Importantes

Puntaje Z Probabilidad Puntaje Z Probabilidad

-2,576 0,005 2,576 0,995

-2,326 0,010 2,326 0,990

-1,960 0,025 1,960 0,975

-1,645 0,050 1,645 0,950

-1,282 0,100 1,282 0,900

-1,036 0,150 1,036 0,850

-0,842 0,200 0,842 0,800

-0,674 0,250 0,674 0,7500

-0,524 0,300 0,524 0,700

-0,385 0,350 0,385 0,650

-0,253 0,400 0,253 0,600

-0,126 0,450 0,126 0,550

0,000 0,500 0,000 0,500


Tabla distribución ji-cuadrada 𝑷(𝝌𝟐 > 𝝌𝟐𝒊 ) = 𝟏 − 𝑭(𝝌𝟐𝒊 ) = 𝜶

GL/α 0,001 0,005 0,010 0,020 0,025 0,030 0,040 0,050 0,100 0,150 0,200 0,250 0,300 0,350 0,400
1 10,828 7,879 6,635 5,412 5,024 4,709 4,218 3,841 2,706 2,072 1,642 1,323 1,074 0,873 0,708
2 13,816 10,597 9,210 7,824 7,378 7,013 6,438 5,991 4,605 3,794 3,219 2,773 2,408 2,100 1,833
3 16,266 12,838 11,345 9,837 9,348 8,947 8,311 7,815 6,251 5,317 4,642 4,108 3,665 3,283 2,946
4 18,467 14,860 13,277 11,668 11,143 10,712 10,026 9,488 7,779 6,745 5,989 5,385 4,878 4,438 4,045
5 20,515 16,750 15,086 13,388 12,833 12,375 11,644 11,070 9,236 8,115 7,289 6,626 6,064 5,573 5,132
6 22,458 18,548 16,812 15,033 14,449 13,968 13,198 12,592 10,645 9,446 8,558 7,841 7,231 6,695 6,211
7 24,322 20,278 18,475 16,622 16,013 15,509 14,703 14,067 12,017 10,748 9,803 9,037 8,383 7,806 7,283
8 26,124 21,955 20,090 18,168 17,535 17,010 16,171 15,507 13,362 12,027 11,030 10,219 9,524 8,909 8,351
9 27,877 23,589 21,666 19,679 19,023 18,480 17,608 16,919 14,684 13,288 12,242 11,389 10,656 10,006 9,414
10 29,588 25,188 23,209 21,161 20,483 19,922 19,021 18,307 15,987 14,534 13,442 12,549 11,781 11,097 10,473
11 31,264 26,757 24,725 22,618 21,920 21,342 20,412 19,675 17,275 15,767 14,631 13,701 12,899 12,184 11,530
12 32,909 28,300 26,217 24,054 23,337 22,742 21,785 21,026 18,549 16,989 15,812 14,845 14,011 13,266 12,584
13 34,528 29,819 27,688 25,472 24,736 24,125 23,142 22,362 19,812 18,202 16,985 15,984 15,119 14,345 13,636
14 36,123 31,319 29,141 26,873 26,119 25,493 24,485 23,685 21,064 19,406 18,151 17,117 16,222 15,421 14,685
15 37,697 32,801 30,578 28,259 27,488 26,848 25,816 24,996 22,307 20,603 19,311 18,245 17,322 16,494 15,733
16 39,252 34,267 32,000 29,633 28,845 28,191 27,136 26,296 23,542 21,793 20,465 19,369 18,418 17,565 16,780
17 40,790 35,718 33,409 30,995 30,191 29,523 28,445 27,587 24,769 22,977 21,615 20,489 19,511 18,633 17,824
18 42,312 37,156 34,805 32,346 31,526 30,845 29,745 28,869 25,989 24,155 22,760 21,605 20,601 19,699 18,868
19 43,820 38,582 36,191 33,687 32,852 32,158 31,037 30,144 27,204 25,329 23,900 22,718 21,689 20,764 19,910
20 45,315 39,997 37,566 35,020 34,170 33,462 32,321 31,410 28,412 26,498 25,038 23,828 22,775 21,826 20,951
21 46,797 41,401 38,932 36,343 35,479 34,759 33,597 32,671 29,615 27,662 26,171 24,935 23,858 22,888 21,991
22 48,268 42,796 40,289 37,659 36,781 36,049 34,867 33,924 30,813 28,822 27,301 26,039 24,939 23,947 23,031
23 49,728 44,181 41,638 38,968 38,076 37,332 36,131 35,172 32,007 29,979 28,429 27,141 26,018 25,006 24,069
24 51,179 45,559 42,980 40,270 39,364 38,609 37,389 36,415 33,196 31,132 29,553 28,241 27,096 26,063 25,106
25 52,620 46,928 44,314 41,566 40,646 39,880 38,642 37,652 34,382 32,282 30,675 29,339 28,172 27,118 26,143
26 54,052 48,290 45,642 42,856 41,923 41,146 39,889 38,885 35,563 33,429 31,795 30,435 29,246 28,173 27,179
27 55,476 49,645 46,963 44,140 43,195 42,407 41,132 40,113 36,741 34,574 32,912 31,528 30,319 29,227 28,214
28 56,892 50,993 48,278 45,419 44,461 43,662 42,370 41,337 37,916 35,715 34,027 32,620 31,391 30,279 29,249
29 58,301 52,336 49,588 46,693 45,722 44,913 43,604 42,557 39,087 36,854 35,139 33,711 32,461 31,331 30,283
30 59,703 53,672 50,892 47,962 46,979 46,160 44,834 43,773 40,256 37,990 36,250 34,800 33,530 32,382 31,316
31 61,098 55,003 52,191 49,226 48,232 47,402 46,059 44,985 41,422 39,124 37,359 35,887 34,598 33,431 32,349
32 62,487 56,328 53,486 50,487 49,480 48,641 47,282 46,194 42,585 40,256 38,466 36,973 35,665 34,480 33,381
33 63,870 57,648 54,776 51,743 50,725 49,876 48,500 47,400 43,745 41,386 39,572 38,058 36,731 35,529 34,413
34 65,247 58,964 56,061 52,995 51,966 51,107 49,716 48,602 44,903 42,514 40,676 39,141 37,795 36,576 35,444
35 66,619 60,275 57,342 54,244 53,203 52,335 50,928 49,802 46,059 43,640 41,778 40,223 38,859 37,623 36,475
40 73,402 66,766 63,691 60,436 59,342 58,428 56,946 55,758 51,805 49,244 47,269 45,616 44,165 42,848 41,622
60 99,607 91,952 88,379 84,580 83,298 82,225 80,482 79,082 74,397 71,341 68,972 66,981 65,227 63,628 62,135
80 124,839 116,321 112,329 108,069 106,629 105,422 103,459 101,879 96,578 93,106 90,405 88,130 86,120 84,284 82,566
90 137,208 128,299 124,116 119,648 118,136 116,869 114,806 113,145 107,565 103,904 101,054 98,650 96,524 94,581 92,761
100 149,449 140,169 135,807 131,142 129,561 128,237 126,079 124,342 118,498 114,659 111,667 109,141 106,906 104,862 102,946
120 173,617 163,648 158,950 153,918 152,211 150,780 148,447 146,567 140,233 136,062 132,806 130,055 127,616 125,383 123,289
140 197,451 186,847 181,840 176,471 174,648 173,118 170,624 168,613 161,827 157,352 153,854 150,894 148,269 145,863 143,604

Contiene los valores Χ2 tales que la 𝑃(𝜒 2 > 𝜒𝑖2 ), donde GL son los grados de libertad 97
Tabla distribución ji-cuadrada 𝑷(𝝌𝟐 > 𝝌𝟐𝒊 ) = 𝟏 − 𝑭(𝝌𝟐𝒊 ) = 𝜶

GL/α 0,450 0,500 0,550 0,600 0,650 0,700 0,750 0,800 0,850 0,900 0,950 0,975 0,980 0,990 0,995
1 0,571 0,455 0,357 0,275 0,206 0,148 0,102 0,064 0,036 0,016 0,004 0,001 0,001 0,000 0,000
2 1,597 1,386 1,196 1,022 0,862 0,713 0,575 0,446 0,325 0,211 0,103 0,051 0,040 0,020 0,010
3 2,643 2,366 2,109 1,869 1,642 1,424 1,213 1,005 0,798 0,584 0,352 0,216 0,185 0,115 0,072
4 3,687 3,357 3,047 2,753 2,470 2,195 1,923 1,649 1,366 1,064 0,711 0,484 0,429 0,297 0,207
5 4,728 4,351 3,996 3,655 3,325 3,000 2,675 2,343 1,994 1,610 1,145 0,831 0,752 0,554 0,412
6 5,765 5,348 4,952 4,570 4,197 3,828 3,455 3,070 2,661 2,204 1,635 1,237 1,134 0,872 0,676
7 6,800 6,346 5,913 5,493 5,082 4,671 4,255 3,822 3,358 2,833 2,167 1,690 1,564 1,239 0,989
8 7,833 7,344 6,877 6,423 5,975 5,527 5,071 4,594 4,078 3,490 2,733 2,180 2,032 1,646 1,344
9 8,863 8,343 7,843 7,357 6,876 6,393 5,899 5,380 4,817 4,168 3,325 2,700 2,532 2,088 1,735
10 9,892 9,342 8,812 8,295 7,783 7,267 6,737 6,179 5,570 4,865 3,940 3,247 3,059 2,558 2,156
11 10,920 10,341 9,783 9,237 8,695 8,148 7,584 6,989 6,336 5,578 4,575 3,816 3,609 3,053 2,603
12 11,946 11,340 10,755 10,182 9,612 9,034 8,438 7,807 7,114 6,304 5,226 4,404 4,178 3,571 3,074
13 12,972 12,340 11,729 11,129 10,532 9,926 9,299 8,634 7,901 7,042 5,892 5,009 4,765 4,107 3,565
14 13,996 13,339 12,703 12,078 11,455 10,821 10,165 9,467 8,696 7,790 6,571 5,629 5,368 4,660 4,075
15 15,020 14,339 13,679 13,030 12,381 11,721 11,037 10,307 9,499 8,547 7,261 6,262 5,985 5,229 4,601
16 16,042 15,338 14,655 13,983 13,310 12,624 11,912 11,152 10,309 9,312 7,962 6,908 6,614 5,812 5,142
17 17,065 16,338 15,633 14,937 14,241 13,531 12,792 12,002 11,125 10,085 8,672 7,564 7,255 6,408 5,697
18 18,086 17,338 16,611 15,893 15,174 14,440 13,675 12,857 11,946 10,865 9,390 8,231 7,906 7,015 6,265
19 19,107 18,338 17,589 16,850 16,109 15,352 14,562 13,716 12,773 11,651 10,117 8,907 8,567 7,633 6,844
20 20,127 19,337 18,569 17,809 17,046 16,266 15,452 14,578 13,604 12,443 10,851 9,591 9,237 8,260 7,434
21 21,147 20,337 19,548 18,768 17,984 17,182 16,344 15,445 14,439 13,240 11,591 10,283 9,915 8,897 8,034
22 22,166 21,337 20,529 19,729 18,924 18,101 17,240 16,314 15,279 14,041 12,338 10,982 10,600 9,542 8,643
23 23,185 22,337 21,510 20,690 19,866 19,021 18,137 17,187 16,122 14,848 13,091 11,689 11,293 10,196 9,260
24 24,204 23,337 22,491 21,652 20,808 19,943 19,037 18,062 16,969 15,659 13,848 12,401 11,992 10,856 9,886
25 25,222 24,337 23,472 22,616 21,752 20,867 19,939 18,940 17,818 16,473 14,611 13,120 12,697 11,524 10,520
26 26,240 25,336 24,454 23,579 22,697 21,792 20,843 19,820 18,671 17,292 15,379 13,844 13,409 12,198 11,160
27 27,257 26,336 25,437 24,544 23,644 22,719 21,749 20,703 19,527 18,114 16,151 14,573 14,125 12,879 11,808
28 28,274 27,336 26,419 25,509 24,591 23,647 22,657 21,588 20,386 18,939 16,928 15,308 14,847 13,565 12,461
29 29,291 28,336 27,402 26,475 25,539 24,577 23,567 22,475 21,247 19,768 17,708 16,047 15,574 14,256 13,121
30 30,307 29,336 28,386 27,442 26,488 25,508 24,478 23,364 22,110 20,599 18,493 16,791 16,306 14,953 13,787
31 31,323 30,336 29,369 28,409 27,438 26,440 25,390 24,255 22,976 21,434 19,281 17,539 17,042 15,655 14,458
32 32,339 31,336 30,353 29,376 28,389 27,373 26,304 25,148 23,844 22,271 20,072 18,291 17,783 16,362 15,134
33 33,355 32,336 31,337 30,344 29,340 28,307 27,219 26,042 24,714 23,110 20,867 19,047 18,527 17,074 15,815
34 34,371 33,336 32,322 31,313 30,293 29,242 28,136 26,938 25,586 23,952 21,664 19,806 19,275 17,789 16,501
35 35,386 34,336 33,306 32,282 31,246 30,178 29,054 27,836 26,460 24,797 22,465 20,569 20,027 18,509 17,192
40 40,459 39,335 38,233 37,134 36,021 34,872 33,660 32,345 30,856 29,051 26,509 24,433 23,838 22,164 20,707
60 60,713 59,335 57,978 56,620 55,239 53,809 52,294 50,641 48,759 46,459 43,188 40,482 39,699 37,485 35,534
80 80,927 79,334 77,763 76,188 74,583 72,915 71,145 69,207 66,994 64,278 60,391 57,153 56,213 53,540 51,172
90 91,023 89,334 87,666 85,993 84,285 82,511 80,625 78,558 76,195 73,291 69,126 65,647 64,635 61,754 59,196
100 101,115 99,334 97,574 95,808 94,005 92,129 90,133 87,945 85,441 82,358 77,929 74,222 73,142 70,065 67,328
120 121,285 119,334 117,404 115,465 113,483 111,419 109,220 106,806 104,037 100,624 95,705 91,573 90,367 86,923 83,852
140 141,441 139,334 137,248 135,149 133,003 130,766 128,380 125,758 122,748 119,029 113,659 109,137 107,815 104,034 100,655

Contiene los valores Χ2 tales que la 𝑃(𝜒 2 > 𝜒𝑖2 ), donde GL son los grados de libertad 98
Tabla distribución T de Student
𝑷(𝑻 > 𝒕𝒊 ) = 𝟏 − 𝑭(𝒕𝒊 ) = 𝜶

α
K
0,3000 0,2500 0,2000 0,1000 0,0500 0,0250 0,0100 0,0050 0,0025 0,0010 0,0005
1 0,7265 1,0000 1,3764 3,0777 6,3138 12,7062 31,8205 63,6567 127,3213 318,3088 636,6192
2 0,6172 0,8165 1,0607 1,8856 2,9200 4,3027 6,9646 9,9248 14,0890 22,3271 31,5991
3 0,5844 0,7649 0,9785 1,6377 2,3534 3,1824 4,5407 5,8409 7,4533 10,2145 12,9240
4 0,5686 0,7407 0,9410 1,5332 2,1318 2,7764 3,7469 4,6041 5,5976 7,1732 8,6103
5 0,5594 0,7267 0,9195 1,4759 2,0150 2,5706 3,3649 4,0321 4,7733 5,8934 6,8688
6 0,5534 0,7176 0,9057 1,4398 1,9432 2,4469 3,1427 3,7074 4,3168 5,2076 5,9588
7 0,5491 0,7111 0,8960 1,4149 1,8946 2,3646 2,9980 3,4995 4,0293 4,7853 5,4079
8 0,5459 0,7064 0,8889 1,3968 1,8595 2,3060 2,8965 3,3554 3,8325 4,5008 5,0413
9 0,5435 0,7027 0,8834 1,3830 1,8331 2,2622 2,8214 3,2498 3,6897 4,2968 4,7809
10 0,5415 0,6998 0,8791 1,3722 1,8125 2,2281 2,7638 3,1693 3,5814 4,1437 4,5869
11 0,5399 0,6974 0,8755 1,3634 1,7959 2,2010 2,7181 3,1058 3,4966 4,0247 4,4370
12 0,5386 0,6955 0,8726 1,3562 1,7823 2,1788 2,6810 3,0545 3,4284 3,9296 4,3178
13 0,5375 0,6938 0,8702 1,3502 1,7709 2,1604 2,6503 3,0123 3,3725 3,8520 4,2208
14 0,5366 0,6924 0,8681 1,3450 1,7613 2,1448 2,6245 2,9768 3,3257 3,7874 4,1405
15 0,5357 0,6912 0,8662 1,3406 1,7531 2,1314 2,6025 2,9467 3,2860 3,7328 4,0728
16 0,5350 0,6901 0,8647 1,3368 1,7459 2,1199 2,5835 2,9208 3,2520 3,6862 4,0150
17 0,5344 0,6892 0,8633 1,3334 1,7396 2,1098 2,5669 2,8982 3,2224 3,6458 3,9651
18 0,5338 0,6884 0,8620 1,3304 1,7341 2,1009 2,5524 2,8784 3,1966 3,6105 3,9216
19 0,5333 0,6876 0,8610 1,3277 1,7291 2,0930 2,5395 2,8609 3,1737 3,5794 3,8834
20 0,5329 0,6870 0,8600 1,3253 1,7247 2,0860 2,5280 2,8453 3,1534 3,5518 3,8495
21 0,5325 0,6864 0,8591 1,3232 1,7207 2,0796 2,5176 2,8314 3,1352 3,5272 3,8193
22 0,5321 0,6858 0,8583 1,3212 1,7171 2,0739 2,5083 2,8188 3,1188 3,5050 3,7921
23 0,5317 0,6853 0,8575 1,3195 1,7139 2,0687 2,4999 2,8073 3,1040 3,4850 3,7676
24 0,5314 0,6848 0,8569 1,3178 1,7109 2,0639 2,4922 2,7969 3,0905 3,4668 3,7454
25 0,5312 0,6844 0,8562 1,3163 1,7081 2,0595 2,4851 2,7874 3,0782 3,4502 3,7251
26 0,5309 0,6840 0,8557 1,3150 1,7056 2,0555 2,4786 2,7787 3,0669 3,4350 3,7066
27 0,5306 0,6837 0,8551 1,3137 1,7033 2,0518 2,4727 2,7707 3,0565 3,4210 3,6896
28 0,5304 0,6834 0,8546 1,3125 1,7011 2,0484 2,4671 2,7633 3,0469 3,4082 3,6739
29 0,5302 0,6830 0,8542 1,3114 1,6991 2,0452 2,4620 2,7564 3,0380 3,3962 3,6594
30 0,5300 0,6828 0,8538 1,3104 1,6973 2,0423 2,4573 2,7500 3,0298 3,3852 3,6460
40 0,5286 0,6807 0,8507 1,3031 1,6839 2,0211 2,4233 2,7045 2,9712 3,3069 3,5510
80 0,5265 0,6776 0,8461 1,2922 1,6641 1,9901 2,3739 2,6387 2,8870 3,1953 3,4163
120 0,5258 0,6765 0,8446 1,2886 1,6577 1,9799 2,3578 2,6174 2,8599 3,1595 3,3735
∞ 0,5244 0,6745 0,8416 1,2816 1,6449 1,9600 2,3263 2,5758 2,8070 3,0902 3,2905

99
Contiene los valores t tales que la P(T>ti) = α, donde K son los grados de libertad.
Tabla distribución T de Student
𝑷(−𝒕𝒊 < 𝑻) + 𝑷(𝒕𝒊 > 𝑻) = 𝑭(−𝒕𝒊 ) + 𝟏 − 𝑭(𝒕𝒊 )+= 𝜶⁄𝟐 + 𝜶⁄𝟐 = 𝜶

α
n
0,9000 0,8000 0,7000 0,5000 0,3000 0,2000 0,1000 0,0500 0,0200 0,0100 0,0010
1 0,1584 0,3249 0,5095 1,0000 1,9626 3,0777 6,3138 12,7062 31,8205 63,6567 636,6192
2 0,1421 0,2887 0,4447 0,8165 1,3862 1,8856 2,9200 4,3027 6,9646 9,9248 31,5991
3 0,1366 0,2767 0,4242 0,7649 1,2498 1,6377 2,3534 3,1824 4,5407 5,8409 12,9240
4 0,1338 0,2707 0,4142 0,7407 1,1896 1,5332 2,1318 2,7764 3,7469 4,6041 8,6103
5 0,1322 0,2672 0,4082 0,7267 1,1558 1,4759 2,0150 2,5706 3,3649 4,0321 6,8688
6 0,1311 0,2648 0,4043 0,7176 1,1342 1,4398 1,9432 2,4469 3,1427 3,7074 5,9588
7 0,1303 0,2632 0,4015 0,7111 1,1192 1,4149 1,8946 2,3646 2,9980 3,4995 5,4079
8 0,1297 0,2619 0,3995 0,7064 1,1081 1,3968 1,8595 2,3060 2,8965 3,3554 5,0413
9 0,1293 0,2610 0,3979 0,7027 1,0997 1,3830 1,8331 2,2622 2,8214 3,2498 4,7809
10 0,1289 0,2602 0,3966 0,6998 1,0931 1,3722 1,8125 2,2281 2,7638 3,1693 4,5869
11 0,1286 0,2596 0,3956 0,6974 1,0877 1,3634 1,7959 2,2010 2,7181 3,1058 4,4370
12 0,1283 0,2590 0,3947 0,6955 1,0832 1,3562 1,7823 2,1788 2,6810 3,0545 4,3178
13 0,1281 0,2586 0,3940 0,6938 1,0795 1,3502 1,7709 2,1604 2,6503 3,0123 4,2208
14 0,1280 0,2582 0,3933 0,6924 1,0763 1,3450 1,7613 2,1448 2,6245 2,9768 4,1405
15 0,1278 0,2579 0,3928 0,6912 1,0735 1,3406 1,7531 2,1314 2,6025 2,9467 4,0728
16 0,1277 0,2576 0,3923 0,6901 1,0711 1,3368 1,7459 2,1199 2,5835 2,9208 4,0150
17 0,1276 0,2573 0,3919 0,6892 1,0690 1,3334 1,7396 2,1098 2,5669 2,8982 3,9651
18 0,1274 0,2571 0,3915 0,6884 1,0672 1,3304 1,7341 2,1009 2,5524 2,8784 3,9216
19 0,1274 0,2569 0,3912 0,6876 1,0655 1,3277 1,7291 2,0930 2,5395 2,8609 3,8834
20 0,1273 0,2567 0,3909 0,6870 1,0640 1,3253 1,7247 2,0860 2,5280 2,8453 3,8495
21 0,1272 0,2566 0,3906 0,6864 1,0627 1,3232 1,7207 2,0796 2,5176 2,8314 3,8193
22 0,1271 0,2564 0,3904 0,6858 1,0614 1,3212 1,7171 2,0739 2,5083 2,8188 3,7921
23 0,1271 0,2563 0,3902 0,6853 1,0603 1,3195 1,7139 2,0687 2,4999 2,8073 3,7676
24 0,1270 0,2562 0,3900 0,6848 1,0593 1,3178 1,7109 2,0639 2,4922 2,7969 3,7454
25 0,1269 0,2561 0,3898 0,6844 1,0584 1,3163 1,7081 2,0595 2,4851 2,7874 3,7251
26 0,1269 0,2560 0,3896 0,6840 1,0575 1,3150 1,7056 2,0555 2,4786 2,7787 3,7066
27 0,1268 0,2559 0,3894 0,6837 1,0567 1,3137 1,7033 2,0518 2,4727 2,7707 3,6896
28 0,1268 0,2558 0,3893 0,6834 1,0560 1,3125 1,7011 2,0484 2,4671 2,7633 3,6739
29 0,1268 0,2557 0,3892 0,6830 1,0553 1,3114 1,6991 2,0452 2,4620 2,7564 3,6594
30 0,1267 0,2556 0,3890 0,6828 1,0547 1,3104 1,6973 2,0423 2,4573 2,7500 3,6460
40 0,1265 0,2550 0,3881 0,6807 1,0500 1,3031 1,6839 2,0211 2,4233 2,7045 3,5510
80 0,1261 0,2542 0,3867 0,6776 1,0432 1,2922 1,6641 1,9901 2,3739 2,6387 3,4163
120 0,1259 0,2539 0,3862 0,6765 1,0409 1,2886 1,6577 1,9799 2,3578 2,6174 3,3735
∞ 0,1257 0,2533 0,3853 0,6745 1,0364 1,2816 1,6449 1,9600 2,3263 2,5758 3,2905

100

Contiene los valores t tales que la 1- P(-ti<T<ti) = α/2, donde n son los grados de libertad.
Algunas fórmulas importantes

1.- Bernoulli

𝑋 ∼ 𝐵𝑒(𝑝)

𝑃(𝑋 = 𝑋𝑖 ) = 𝑝 𝑋𝑖 (1 − 𝑝)(1−𝑋𝑖 ) ∀ X = 0 ∨ X = 1

2.- Binomial

𝑋 ∼ 𝐵𝑖𝑛(𝑛; 𝑝)

𝑛
𝑃(𝑋 = 𝑘) = ( ) 𝑝𝑘 (1 − 𝑝)(𝑛−𝑘)
𝑘

𝑘𝑖 𝑘𝑖
𝑛
𝑃(𝑋 ≤ 𝑘𝑖 ) = 𝐹(𝑘𝑖 ) = ∑ 𝑃(𝑘𝑖 ) = ∑ ( ) 𝑝𝑘𝑖 𝑞 (𝑛−𝑘𝑖 )
𝑘𝑖
𝑘=0 𝑘=0

3.- Poisson

𝑋~𝑃(𝜆)

𝑒 −𝜆 𝜆𝑘
𝑃(𝑋 = 𝑘) =
𝑘!

𝑘𝑖 𝑘𝑖
𝑒 −𝜆 𝜆𝑘𝑖
𝑃(𝑋 ≤ 𝑘𝑖 ) = 𝐹(𝑘𝑖 ) = ∑ 𝑃(𝑘𝑖 ) = ∑
𝑘𝑖 !
𝑘=𝑜 𝑘=0

4.-Distribución normal

𝑋~𝑁(𝜇𝑥 , 𝜎𝑥 )

1 1 𝑥−𝜇 2
𝑒 −2( )
𝑋 ∼ 𝑁(𝑥; 𝜇; 𝜎) ⟹ 𝑓(𝑥) = 𝜎 ; −∞ < 𝑥 < +∞ ∕ 𝑥 ∈ ℛ
𝜎√2𝜋

+∞ 1 𝑥−𝜇 2
1
𝑒 2 𝜎 )
− (
𝑋 ∼ 𝑁(𝑥; 𝜇; 𝜎) ⟹ 𝐹(𝑥) = ∫ = 1 ; −∞ < 𝑥 < +∞ ∕ 𝑥 ∈ ℛ
−∞ 𝜎√2𝜋
101
5.-Conversión a distribución normal estándar

𝑍~𝑁(𝜇𝑥 = 0, 𝜎𝑥 = 1)

𝑋𝑖 − 𝜇𝑋
𝑍𝑖 =
𝜎𝑋

6.-Combinatoria

𝑛 𝑛!
( )=
𝑘 (𝑛 − 𝑘)! 𝑘!

Donde se verifica que

a. n y k son enteros naturales


b. n! =n*(n-1) *(n-2) *…*3*2*1
c. 0! =1! =1

7.-Función distribución de probabilidades para variable aleatoria tiempo (T)

𝐹(𝑡) = 𝑃(𝑇 < 𝑡)

8.-Función distribución de supervivencia para variable aleatoria tiempo (T)

𝑆(𝑡) = 𝑃(𝑇 > 𝑡) = 1 − 𝐹(𝑡)


Bibliografía

1. Rosner B. Fundamentals of Biostatistics. Eighth edition. Boston, Cengaje


Learning, 2016. 927p.

2. Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística amigable. Tercera


edición. España, Elsevier,2014.596p.

3. Dawson B y Trapp. Bioestadística Médica. Cuarta edición. Ciudad de México,


Editorial Manual Moderno,2005.392p.

4. Ruiz A y Morillo L. Epidemiología Clínica. Investigación clínica aplicada. Bogotá,


Editorial Panamericana, 2009.576p.

5. Argimon J, Jiménez J. Métodos de Investigación Clínica y Epidemiológica. Cuarta


edición. Barcelona, Elsevier España, 2013.402p.

6. Fletcher R, Fletcher S. Epidemiología Clínica. Cuarta edición. Barcelona, Wolters


Kluwer Health España S.A., Lippincott Williams & Wilkins, 2008.269p.

7. Triola M. Estadística. Décima edición. Ciudad de México, Pearson, 2010.866p.

8. Canavos G. Probabilidad y estadística aplicaciones y métodos. México, McGraw-


Hill interamericana de México S.A., 1988.651p.

9. Meyer P. probabilidad y aplicaciones estadísticas. Segunda edición. México.


Fondo Educativo Interamericano, 1973.372p.

10. Mode E. Elementos de Probabilidad y estadística. Barcelona, Reverte, 2014.367p.

También podría gustarte