Está en la página 1de 82

ESTIMACIONE

S. CASO DE
UNA
MUESTRA
ELISA MENDOZA G.
2020
CONCEPTOS PREVIOS
• En este punto se tiene conocimiento de los siguientes
conceptos:
• - Población
• - Diferencia entre los tipos de muestreo
• - Unidades de análisis
• - Propósitos del muestreo
• - Estadísticas descriptivas
ELISA MENDOZA G.

• - Distribuciones de probabilidad
DISTRIBUCIÓN DE PROBABILIDAD (CASO DE
V.A.C)
• De todas las distribuciones de probabilidad que se analizan, la distribución normal es la más importante,
dada su característica en forma de campana y la forma como se relaciona con la regla empírica.

• Muchas de las observaciones de la vida real se pueden modelar usando la distribución Normal. Si las
condiciones del asunto tratado satisfacen las condiciones de este importante modelo, se pueden encontrar
respuestas valiosas.

fi

X
PROF. ELISA MENDOZA
VEAMOS UN EJEMPLO
• Supóngase que se mide el peso (en libra) a 250 personas, seleccionadas de forma aleatoria y se elabora una tabla de
frecuencias para determinar su distribución. Además, se calcula la media y la desviación estándar.

• Los resultados son los siguientes.

Se observa que los


datos tienden a una
forma acampanada
y que la media se
ubica en el centro
de la distribución.

ELISA MENDOZA G. 9/6/2022


MEDIA
ESTADÍSTICAS Y
ERROR
REGULARMENTE SE SELECCIONA UNA SOLA MUESTRA DE MUCHAS
OPCIONES DE UNA POBLACIÓN DE ESTUDIO.
CON LOS RESULTADOS DE DICHA MUESTRA SE OBTIENEN LAS
ESTADÍSTICAS DESCRIPTIVAS, QUE SE USARÁN PARA HACER LAS
ESTIMACIONES.
EN CADA ESTIMACIÓN HAY UN ERROR DEBIDO AL MUESTREO.
ESTO ES UNA DIFERENCIA ENTRE LA ESTADÍSTICA DE LA MUESTRA
Y EL PARÁMETRO.
Estadística muestral – Parámetro = Error muestral

ELISA MENDOZA G.
Esta foto de Autor desconocido está bajo licencia CC
Esta generalización
ocurre si la Muestra
es Probabilística.
Los estimadores
obtenidos de la muestra
se generalizan a la
población.
Muestra
Población n: Cantidad de
datos en la
N: Cantidad de datos en
muestra
la Población
Técnica:
Técnica: Censo Muestreo

Ejemplos: μ y σ
Estadísticas que se obtienen: Estimaciones

Estadísticas que se obtienen: Parámetros

ESTADÍSTICA INFERENCIAL
PARÁMETROS Y ESTIMADORES
Parámetro (Estadística Estimador y Estimación
Estadístico Censal) (Estadística Muestral)

Media μ
Varianza σ2 s2
Desviación estándar σ s
Proporción P ρ
Total τ

El Estimador es la función matemática y la Estimación el resultado o valor.


PROF. ELISA MENDOZA
POBLACIÓN Y MUESTRAS
• En una población de 4 individuos (A, B, C, D), con edades de 21, 25, 30 y 41 respectivamente, de
esta, se selecciona una muestra aleatoria simple de 2 teniendo como posibles muestras las siguientes.

Muestra Edad Media Varianza El verdadero valor de la media en la población (Parámetro)


s Muestra muestral es: μ=29.25 y la Varianza poblacional: σ2=56.2
l
(A,B) 21, 25 23.0 8.0 En la vida real, solo se elige una sola muestra. Suponiendo
que se escogió la muestra (A,C), cuyas edades son: 21 y 30;
(A,C) 21, 30 25.5 40.5 entonces la media muestral es: 25.5 y la varianza es 40.5.
(A,D) 21, 41 31.0 200.0
(B,C) 25, 30 27.5 12.5 El Error de muestreo es: 25.5 – 29.25, esto es: -3.75

(B,D) 25, 41 33.0 128.0 De todas las muestras la media que más se acerca a la
(C,D) 30, 41 35.5 60.5 verdadera es la muestra (B, C). Donde la media de las
edades es 27.5.
ELISA MENDOZA G.
DISTRIBUCIONES MUESTRALES

ELISA MENDOZA G.
INTRODUCCIÓN
• En una POBLACIÓN, los datos son: 120, 135, 140, 145 y 150,
correspondientes a los pesos en libra de 5 individuos, se selecciona una
muestra de tamaño 2. ¿Cuántas muestras posibles pueden resultar, si N=5, y
n=2?
• El resultado es 10 muestras posibles, de las cuales en la práctica solo elegimos
una muestra y con ella se toman decisiones, se elaboran los intervalos de
confianza y se realizan pruebas de hipótesis sobre el parámetro de estudio.
• Veamos la relación de las estimaciones y el parámetro cuando se realiza
muestreo aleatorio.
ELISA MENDOZA G.
ESTIMADOR DE LA MEDIA Y LA VARIANZA
DE LA MEDIA

ELISA MENDOZA G.
RESULTADOS POSIBLES.
μ = 138

8 de las 10
muestras
estiman la
media
poblacional.

2 muestras no estiman la
media poblacional

Si la media poblacional es 138, y con las medias de las 10 muestras posibles se elaboran los
intervalos de confianza, algo así como en la imagen podría resultar. De las 10 muestras 8
incluyen en el intervalo la media verdadera, mientras que dos muestras no la incluyen.
ELISA MENDOZA G.
ESTIMACIÓN PUNTUAL Y ESTIMACIÓN POR
INTERVALO
Un solo valor o estadística Dos valores, un mínimo y un máximo

Así que, una estimación


Las estimaciones por intervalo, es un
Cuando se determinan
puntuales, son las que se INTERVALO DE
dos valores para esa
generan en Estadística CONFIANZA,
estimación puntual, se
descriptiva, y que se determinado por dos
habla de intervalo, y
usan para estimar el valores dentro de los
cuando se asocia a una
parámetro. cuales se afirma o se
probabilidad de que este
tiene la confianza o
Cumplen propiedades intervalo contenga el
certeza, de que incluye el
como: Insesgado, PARÁMETRO se le
verdadero parámetro con
Consistente y Eficiente. apellida “de confianza”.
un nivel o grado de
probabilidad.

ELISA MENDOZA G.
CRITERIOS DE
CALIDAD DE UN
ESTIMADOR

Consistent
Insesgado Eficiente
e

Insesgado, “sin sesgo”, estimación


aproximadamente igual al parámetro.
Eficiente: se asocia con “precisión”, mínima
varianza.
Consistencia: las repeticiones producen los
mismos resultados cercanos al parámetro a
medida que crece el tamaño de muestra.

ELISA MENDOZA G.
EJEMPLO
Estimación puntual: Media muestral: 1.75 m
1.75
1.80 • La estatura promedio de un grupo
1.90 de estudiantes seleccionados Estimación por intervalo: [1.62, 1.88]
1.75 Este intervalo se refiere a la media de la muestra, a
aleatoriamente, es de: 1.75 m, con una desviación estándar.
1.80
1.90
una desviación estándar de: 0.13
1.75 m
1.60
1.51 Estimación por Intervalo de CONFIANZA,
Con un 95% (de probabilidad), es:
[1.67, 1.83]
Este intervalo es una estimación de la media
ELISA MENDOZA G. poblacional al 95% de confianza
ESTIMACIONES POR INTERVALOS O
INTERVALOS DE CONFIANZA
• Para elaborar los intervalos de confianza, se requieren:
• La estadística o estimación, puede ser la media, una proporción o porcentaje, o
cualquier otro estadístico.
• El error de estimación
• El nivel de confianza (o nivel de significación) con que se quiere determinar el
intervalo de confianza (IC%)
Los dos primeros se calculan a partir de la muestra. El último dato, lo determina
el investigador o analista (o usted).
ELISA MENDOZA G.
ESTIMADORES DE LA MEDIA Y DEL
ERROR

El error estándar se estima de la siguiente manera:


Si la muestra se seleccionada con reposición o cuando el tamaño de la muestra es
menor que el 5% del tamaño poblacional (n/N < 5%) se usa la siguiente fórmula:

Si la muestra es seleccionada sin reemplazo o (n/N ≥ 5%):

Calculando el error de muestreo con los datos del ejemplo,


sabiendo que la varianza poblacional es de 106, por lo tanto
la desviación estándar es de σ = 10.3:

ELISA MENDOZA G.
REGLA EMPÍRICA

Tomado de: Guía práctica del Curso de Bioestadística Aplicada a las Ciencias de la Salud.

PROF. ELISA MENDOZA


NIVEL DE CONFIANZA
SE ESTIMA UN PARÁMETRO CON BASE A LA PROBABILIDAD DE QUE EL INTERVALO DEL
ESTIMADOR INCLUYA EL VERDADERO VALOR POBLACIONAL.

PROBABILIDAD DE 95%, SI LA DISTRIBUCIÓN DE PROBABILIDAD ES NORMAL: Z = 1.96

¿CUÁNTO SERÁ EL VALOR DE Z, SI LA PROBABILIDAD DE CONFIANZA ES DE 90%?

ELISA MENDOZA G.
ESTIMACIONES POR INTERVALO PARA LA MEDIA,
CON Σ CONOCIDA

ELISA MENDOZA G.
ESTIMACIONES POR INTERVALO PARA LA
MEDIA
Ejemplo. Usando los datos de la muestra 5, con media: 137.5 y desviación estándar de 3.5, calcular
el Intervalo de confianza para un 95% de acertar en la estimación de la media.

Fórmula del IC%:


Los valores de los coeficientes de la
Normal para estimar intervalos,
comúnmente son, para un 95%,
Z=1.96; para un 90%, Z=1.65 y para Reemplazando los datos:
el 99% de confianza, Z = 2.58.

95%
1-α Se tiene un 95% de certeza que la
media poblacional se encuentra entre
ELISA MENDOZA G.
133.3 y 141.7
ESTIMACIONES POR INTERVALO PARA LA
MEDIA CON Σ DESCONOCIDA

Cuando no se conoce la varianza poblacional se reemplaza la desviación estándar poblacional –sigma


por la desviación estándar de la muestra, S y se emplea la distribución t-student para el cálculo del IC.
Considerar el factor de ajuste si la fracción de muestreo es mayor que 5%. gl: grados de libertad = n-1
t, coeficiente de la distribución t-student para un nivel de confianza y grados de libertad determinados.

ELISA MENDOZA G.
INTERVALO DE
CONFIANZA PARA
PROPORCIÓN
Fórmula para el Intervalo de Confianza para p’

Donde p’= a/n y q’ = 1 – p’ y


p’ es la estimación puntual de p.
Si n/N es mayor que 5%, incluir el factor de ajuste al error estándar.

ELISA MENDOZA G.
EJEMPLOS

• Ver los ejercicios resueltos en:


• E Libro
• Matus, R. (2010). Estadística. Instituto Politécnico Nacional.
https://elibro.net/es/ereader/udelistmo/76119?page=43

ELISA MENDOZA G.
DESARROLLE UN ESQUEMA QUE RESUMA
LOS TIPOS DE ESTIMACIONES
• Tome en cuenta:
• - Estimación puntual y por Intervalo de confianza
• - Estimación por Intervalo de confianza para la media, con varianza conocida
• - Estimación por Intervalo de confianza para la media, con varianza desconocida.
• - Estimación por Intervalo de confianza para la proporción.
• - Incluya el Error Estándar cuando la población es infinita y cuando es Finita (factor de
corrección).
ELISA MENDOZA G.
PRÁCTICA
Con los datos poblacionales del ejemplo anterior: 120, 135, 140, 145 y 150, correspondientes a los
pesos en libra de 5 individuos, ahora seleccione muestras de tamaño 3. Con los datos muestrales calcule
las medias de cada muestra.
a). Calcule la media para cada muestra
b). Calcule la Media de todas las medias muestrales
c). Escoja una muestra de las 10 muestras posibles aleatoriamente,
puede usar el método de SORTEO o TÓMBOLA, enumere del 1 al 10 y
escoja solo una muestra.
d). Para la muestra elegida, calcule la media, la desviación estándar
muestral, y el IC95%.
e). Explique los resultados y compare con los parámetros poblacionales.

ELISA MENDOZA G.
“PRUEBA DE
HIPÓTESIS”.
ELISA MENDOZA
27
PRUEBAS DE HIPÓTESIS.
CONTENIDO.
1. Conceptos Generales.
Hipótesis.
2. Pruebas de Hipótesis para una Hipótesis Nula.
sola población. Hipótesis Alternativa.

1. Medias. Prueba de Hipótesis


Estadística.
2. Proporciones. Nivel de significancia
α.
3. Pruebas de Hipótesis para dos
poblaciones independientes. Estadística de prueba.
Regla de decisión.
1. Diferencias de dos medias.
2. Diferencias de dos proporciones.
3. Diferencias de dos varianzas.
4. Pruebas de Hipótesis para dos 28

poblaciones dependientes.
Bioestadística. Elisa Mendoza G.
CONCEPTOS GENERALES
• Las hipótesis son respuestas TENTATIVAS a la o las preguntas de investigación.
• Por lo general, implican parámetros estadísticos como: promedios, proporción,
varianzas, relación de variables, etc.
• Están estrechamente relacionadas con los objetivos y preguntas de investigación.
• Se plantea, fundamentado en teorías, estudios previos o con base a opiniones de
expertos.
• Se recomienda sean redactados en forma afirmativa.
• Se expresa en términos de la unidad de análisis, variables y expresión lógica
(igual, mayor que, menor que).

29

Bioestadística. Elisa Mendoza G.


HIPÓTESIS ESTADÍSTICA.

• Las hipótesis estadísticas plantean dos tipos de hipótesis:


• Hipótesis nula (Ho), la que señala la ausencia de diferencias o igualdad
del parámetro a un valor específico o que los parámetros de dos o más
muestras son idénticos (dependiendo del número de muestras
consideradas en la prueba).
• Hipótesis alternativa (Ha), plantea tres posibles resultados contrarios a la
hipótesis nula, estos son: Diferencias (dos colas), “mayor que” (una
cola-derecha) y “menor que” (cola izquierda).

30

Bioestadística. Elisa Mendoza G.


HIPÓTESIS ESTADÍSTICAS PARAMÉTRICAS
PARA MEDIAS Y PROPORCIONES. CASO DE
UNA Y DOS MUESTRAS INDEPENDIENTES.
Parámetro Hipótesis Pruebas estadísticas
Poblacional paramétricas
Prueba de dos Colas Prueba de una Cola

Una Media H0: μ = valor específico H0: μ = valor específico Prueba t ó z para media
H1: μ ≠ valor específico H1: μ > valor específico en una población
ó
H1: μ < valor específico

Dos Medias H0: μ1 = μ2 H0: μ1 = μ2 Prueba t ó z para medias


H1: μ1 ≠ μ2 H1: μ1 > μ2 en dos poblaciones
ó independientes
H1: μ1 < μ2
Una Proporción H0: p = valor específico H0: p = valor específico Prueba z, para
H1: p ≠ valor específico H1: p > valor específico proporción en una
ó población.
H1: p < valor específico

Dos Proporciones H0: p1 = p2 H0: p1 = p2 Prueba z, para


H1: p1 ≠ p2 H1: p1 > p2 proporción en dos
ó poblaciones
H1: p1 < p2 independientes. 31

Bioestadística. Elisa Mendoza G.


DECISIÓN: ERROR TIPO I Y TIPO
II.

El riesgo, es una probabilidad de la ocurrencia de un evento desfavorable.

Hipótesis nula
Decisión
Verdadera Falsa

No rechazar Ho Decisión correcta tipo A: 1-α Error de tipo II: β

Rechazar Ho Error tipo I: α Decisión correcta de tipo B: 1-β

32

Bioestadística. Elisa Mendoza G.


ESTADÍSTICA DE PRUEBA.
Es la variable aleatoria cuyo valor se calcula a partir de los datos muestrales y
que se utiliza para tomar la decisión de “no rechazar Ho” o “rechazar Ho”

El valor de la estadística de prueba es calculado, según la distribución del


parámetro a probar, por ejemplo, “z” o “t” calculado y se utiliza junto con una
regla de decisión para determinar si “se rechaza la hipótesis nula: Ho” o “no se
rechaza Ho”.

33

Bioestadística. Elisa Mendoza G.


REGLA DE
REGIÓN DECISIÓN.
Una cola (“Menor que”)
• Se rechaza Ho, si:
• El valor del Estadístico de prueba calculado es menor que Valor crítico.
• Se rechaza Ho, si:
• Valor de p es menor que valor de significancia α (alfa)

Dos colas (“Diferente”)


• Se rechaza Ho, si:
• El valor del Estadístico de prueba calculado es menor que Valor crítico; o si El
valor del Estadístico de prueba calculado es mayor que el valor crítico.
• Se rechaza Ho, si:
• Valor de p es menor que valor de significancia α (alfa).

Una cola (“Mayor que”)


• Se rechaza Ho, si:
• El valor del Estadístico de prueba calculado es mayor que Valor crítico.
• Se rechaza Ho, si:
• Valor de p es menor que valor de significancia α (alfa). 34

Bioestadística. Elisa Mendoza G.


REGLA DE DECISIÓN. PRUEBAS
DE HIPÓTESIS DE DOS COLAS.
Específicamente, se utiliza cuando la hipótesis del investigador, considera la relación
“diferente” ó “≠ ”.

Recordemos que la distribución del parámetro media o proporción, siguen distribuciones


en forma de campana simétricas.

Región de rechazo de
Caso donde las
Región de rechazo de
Ho Ho Hipótesis son:
■Ho: μ = μ o.
Cola 1. Cola 2. ■Ha: μ ≠ μ o.

-c c
c representa el valor crítico del estadístico de prueba y se obtiene a partir del
nivel de significancia α, establecido. Tiene dos regiones de rechazo de Ho,
(cola 1 y cola 2). 35

Bioestadística. Elisa Mendoza G.


REGLA DE DECISIÓN. PRUEBAS
DE HIPÓTESIS DE UNA COLA.
Específicamente, se utiliza cuando la hipótesis del investigador, considera
la relación “menor que”.

Caso donde las


Hipótesis son: El valor crítico, es uno solo
■Ho: μ = μ o. y la región de rechazo de
■Ha: μ < μ o. Ho, se ubica del lado
izquierdo de la curva (cola
1).

Cola 1.

Región de rechazo de -c
Ho
36

Bioestadística. Elisa Mendoza G.


REGLA DE DECISIÓN. PRUEBAS
DE HIPÓTESIS DE UNA COLA.
Relación “mayor que”
Caso donde las
Hipótesis son:
■Ho: μ = μ o.
■Ha: μ > μ o.

Cola 2.
Región de rechazo de
c Ho

Recordemos, que el valor crítico depende del estadístico de prueba a utilizar


y del nivel de significancia. Estos valores se encuentran en las tablas de
distribuciones de probabilidad t-student, Z-Normal estándar, según sea el
caso.

37

Bioestadística. Elisa Mendoza G.


PROCEDIMIENTO DE CINCO PASOS.
PRUEBA DE HIPÓTESIS CLÁSICA.
1. Describir el parámetro de la población de interés.
2. Establecer la hipótesis nula (Ho) y alternativa Ha).
3. Especificar los criterios de prueba.
a. Comprobar los supuestos.
b. Identificar la estadística de prueba a utilizar.
c. Determinar el nivel de significancia, α.
d. Determinar la(s) región (regiones) crítica(s) y el (los) valores
crítico(s).
4. Recolectar y presentar los hechos muestrales.
a. Recolectar la información muestral.
b. Calcular el valor de la estadística de prueba.
5. Determinar los resultados
a. Determinar si el valor de la estadística de prueba está o no en la región
crítica.
b. Tomar una decisión sobre Ho. 38
c. Escribir una conclusión sobre Ha.
Bioestadística. Elisa Mendoza G.
PRUEBAS DE HIPÓTESIS. UNA
POBLACIÓN.

1. Pruebas de Hipótesis de la media μ (σ conocida):


Enfoque clásico.
Supuesto para pruebas de hipótesis sobre la media μ usando una σ conocida:
la distribución muestral de la media muestral, está contenida en la distribución
muestral de medias muestrales y en el Teorema de Límite Central.

39

Bioestadística. Elisa Mendoza G.


EJEMPLO
Se desea contrastar con un nivel del 98% de confianza, la hipótesis de que los panameños de 18
años y más tienen una estatura en promedio de 167 cm. Suponiendo que las tallas se distribuyen
normalmente, con una desviación estándar de 4 cms, verifique con los datos de una muestra de
n=25 dicha afirmación.

155 160 163 165 167 170 173 182 190 174
180 185 195 143 151 164 162 178 181 179
185 179 190 180 176
Datos:
• El parámetro de población en cuestión es: “el número medio o estatura media”.
• μo = 167 cm, es el valor específico de interés o de comparación del parámetro.
• La relación propuesta es μ = 167 cm. (Hipótesis de dos colas).
• Nivel de confianza: 1-α = 0.98, por lo tanto, α = 0.02

Bioestadística. Elisa Mendoza G.


EJEMPLO
Datos (continuación):
• Las Hipótesis, planteadas son:
•Ho: La estatura promedio de los panameños de 18 años y más es igual a 167 cm.
•Ha: La estatura promedio de los panameños de 18 años y más es distinto de 167 cm.
• Estadísticamente,
•Ho: μ = 167 y Ha: μ ≠ 167

El estadístico de prueba en este caso, se define como,


“zeta estrella” ó Z.

Bajo el supuesto de que los las medias muestrales siguen una distribución normal y
cumpliendo con el Teorema de Límite Central, además considerando la varianza
poblacional ( σ ) conocida.

Bioestadística. Elisa Mendoza G.


EJEMPLO: SOLUCIÓN.
Datos: n= 25, μo= 167 cm., α =0.02 y σ = 4 cm.

Paso 1. El parámetro de interés: μ, la estatura promedio de


todas las estudiantes de una universidad.
Estadísticamente, las
Paso 2. Establecimiento de la las hipótesis nula y alternativa son:
hipótesis son expresadas
•Ho: La estatura promedio de los panameños de 18 años y
más es igual a 167 cm. como:
•Ha: La estatura promedio de los panameños de 18 años y Ho. μ = 167 cm.
más es distinto de 167 cm.
Ha. μ ≠ 167 cm.
Los criterios de prueba son:
Paso 3.
a. Las estaturas de las personas de 18 años y más, siguen una
distribución aproximadamente normal, debido a que la muestra
es suficientemente grande (n=25).
b. La estadística de prueba, por tanto, a utilizar es z*

Bioestadística. Elisa Mendoza G.


EJEMPLO: SOLUCIÓN.
Paso 3. Los criterios de prueba son:
c. El nivel de significancia planteado es: α = 0.02 (dado en el problema).
d. Las regiones críticas (valores críticos), se determinan, para dos colas,
son: -2.3263 y 2.3263.
e. Si el estadístico z*, se encuentra entre –2.3263 y 2.3263 no se puede
rechazar la Ho.

98%
α/2=0.01 α/2=0.01
Región de rechazo de -c c Región de rechazo de
Ho Ho

Bioestadística. Elisa Mendoza G.


EJEMPLO: SOLUCIÓN.
a. La información muestral es: media muestral “equis
Paso 4. barra” es 167 y n=25.
b. El cálculo del estadístico de prueba, al aplicar la
fórmula es:

CONCLUSIÓN: Dado que el valor de Z calculado es mayor que el valor crítico 2.3263 se rechaza la
Ho, por lo tanto, la estatura promedio es diferente de 167 cm,

Bioestadística. Elisa Mendoza G.


2. PRUEBAS DE HIPÓTESIS DE LA MEDIA Μ
(Σ DESCONOCIDA):
El estadístico de prueba, a utilizar es:
GRADOS DE
LIBERTAD: G.L. =
n-1

Cuando la varianza poblacional no es conocida, se utiliza el estadístico t-student o cuando el tamaño


de muestra es pequeña. Recordemos, que usualmente, la varianza poblacional es desconocida y que
se utiliza la varianza estimada S. El estadístico t, sigue una distribución t-student con n-1 grados de
libertad.

45

Bioestadística. Elisa Mendoza G.


3. PRUEBAS DE HIPÓTESIS PARA
PROPORCIONES.
Para hipótesis:
Ho: p = po
Ha: p ≠po, ó Ha: p> po , ó Ha: p< po

El estadístico de prueba, para el caso de proporciones en una sola muestra, bajo


el supuesto de normalidad de p es:

p, es el número de éxitos en la muestra entre el tamaño de la muestra: x/n.


po, es el valor específico de la hipótesis a comprobar.
46

Bioestadística. Elisa Mendoza G.


PRUEBA DE HIPÓTESIS PARA VARIANZA
DE UNA POBLACIÓN

El Estadístico de prueba es:

Donde: , es el valor específico planteado en la hipótesis a comprobar.


S2, es la varianza calculada en la muestra.
n, es el tamaño de la muestra.

47

Bioestadística. Elisa Mendoza G.


EJEMPLO:

Tomado de: http://es.slideshare.net/eira1779/contraste-de-hipotesis1-tema-de-clase. 48

Bioestadística. Elisa Mendoza G.


PRUEBA DE HIPÓTESIS PARA
COMPARAR DOS
PROPORCIONES
Para hipótesis:
Ho: p1 = p2 y con Ha: p1 ≠p2, ó Ha: p1 > p2 ó Ha: p1 < p2

El Estadístico de Pruebas es el siguiente:

Donde:
x1, es el total de unidades con la característica de interés, en la muestra 1.
x2, es el total de unidades con la característica de interés, en la muestra 2.
n1, es el tamaño de la muestra 1.
n2, es el tamaño de la muestra 2.
, y 49

Bioestadística. Elisa Mendoza G.


PRUEBA DE HIPÓTESIS PARA VARIANZAS
DE DOS POBLACIONES.

El Estadístico de prueba, sigue una distribución F, de Fisher con n1-1 y n2-1,


es:

Donde: y

Son las varianzas respectivas de las muestras 1 y 2.


50

Bioestadística. Elisa Mendoza G.


PRUEBA DE HIPÓTESIS PARA
VARIANZAS

Valores críticos para nivel de significancia del 5%, prueba bilateral, y grados de libertad: 11 y 9, son:
0.2787 y 3.9121

Tomado de: http://es.slideshare.net/eira1779/contraste-de-hipotesis1-tema-de-clase.


51

Bioestadística. Elisa Mendoza G.


COMPARACIÓN DE MEDIAS
• COMPARACIÓN DE DOS MEDIAS PARA POBLACIONES
INDEPENDIENTES.
• Para esto deberá comprobar además de la normalidad de la distribución de los datos de cada
uno de los grupos, si las varianzas respectivas son iguales (grupos homogéneos) o si son
diferentes(grupos heterogéneos). Donde: n y m son los tamaños de las muestras de ambos
grupos respectivamente.
Para Varianzas iguales Para Varianzas diferentes
Conocido
también como
test de Welch

Grados de libertad: n+m-2 Grados de libertad:

52

Bioestadística. Elisa Mendoza G.


COMPARACIÓN DE DOS
MEDIAS
• COMPARACIÓN DE DOS MEDIAS EN POBLACIONES DEPENDIENTES.

• Para esto deberá comprobar la normalidad de la distribución de la diferencia de los dos


grupos (di = xi - yi). Donde, n es el tamaño de la muestra. Luego de obtener las diferencias
de cada par (x,y) se calculan tanto el promedio como la varianza de las diferencias.

• En esta prueba las mediciones corresponde a una misma población.

Grados de Libertad: n-1


Consultar: https://www.fisterra.com/mbe/investiga/t_student/t_student.asp#Tabla%202
53

Bioestadística. Elisa Mendoza G.


TABLA DE
DISTRIBUCIÓN
T-STUDENT

54
TABLA DE DISTRIBUCIÓN NORMAL ESTÁNDAR -Z

55
UNIVERSIDAD DE PANAMÁ
Facultad de Ciencias Naturales,
Exactas y Tecnología

ESCUELA DE ESTADÍSTICA

DISTRIBUCION NORMAL.

Presentado por:

Elisa Mendoza G.
Pueden ser para:
Distribuciones
• Variables aleatorias discretas (v.a.d)
de probabilidad
• Variables aleatorias continuas (v.a.c.)

9/8/2020 Elisa Mendoza G.


Esta foto Cinta de medir

¿Cuándo utilizar esta


distribución?

Cuando la Variable es CUANTITATIVA


CONTINUA, o por aproximación en
variables cuantitativas discretas.

Esta foto Medición de Peso y Estatura de Personas


CC BY-NC

9/8/2020 Elisa Mendoza G.


Distribución de probabilidad (caso de v.a.c)

De todas las distribuciones de probabilidad que se analizan, la distribución normal es la más importante,
dada su característica en forma de campana y la forma como se relaciona con la regla empírica.

Muchas de las observaciones de la vida real se pueden modelar usando la distribución Normal. Si las
condiciones del asunto tratado satisfacen las condiciones de este importante modelo, se pueden
encontrar respuestas valiosas.

fi

X
Prof. Elisa Mendoza
Veamos un Ejemplo
Supóngase que se mide el peso (en libra) a 250 personas, seleccionadas de forma aleatoria y se elabora una tabla de frecuencias para
determinar su distribución. Además, se calcula la media y la desviación estándar.

Los resultados son los siguientes.

Se observa que
los datos tienden
a una forma
acampanada y
que la media se
ubica en el centro
de la distribución.

MEDIA
9/8/2020 Elisa Mendoza G.
Distribución de Probabilidad
Normal
Abrahan De Moivre (1733) fue el primero en obtener la
ecuación matemática de la curva normal. Kart Friedrich Gauss y
Márquez De Laplace (principios del siglo diecinueve)
desarrollaron más ampliamente los conceptos de la curva. La
curva normal también es llamada curva de error, curva de
campana, curva de Gauss, distribución gaussiana o curva de De
Moivre. Su altura máxima se encuentra en la media aritmética,
es decir su ordenada máxima corresponde a una abscisa igual a
la media aritmética. La asimetría de la curva normal es nula y
por su grado de apuntamiento o curtosis se clasifica en
mesocúrtica.

Prof. Elisa Mendoza


La función de distribución

Puede existir un número infinito de distribuciones


normales posibles, cada una con su propia media y
su desviación estándar. Ya que obviamente no se
puede analizar un número tan grande de
posibilidades es necesario convertir todas estas
distribuciones normales a una forma estándar
(Estandarizar la variable X). Generando la
distribución normal estándar.

El uso de esta distribución es útil cuando se desea,


además, eliminar la unidad de medida.

Prof. Elisa Mendoza


Ejemplo
Para los siguientes conjuntos de datos elabore el HISTOGRAMA. Use el Excel para graficar. Observe la distribución
de los datos en cuanto a la media y la variabilidad.
Edad_1 Edad_2 Edad_3 Edad_1 Edad_2 Edad_3
18 7 26
MEDIA 42.3 42.9 42.8
45 6 60
46 41 4 DESV. EST 20.5 18.6 23.2
52 58 45 MÍNIMO 6.0 6.0 4.0
41 9 5 MÁXIMO 86.0 80.0 81.0
37 74 50
39 80 20
57 50 16 Edad_1 Edad_2 Edad_3
30 62 34
35 41 29
31 43 32 Media 42.6 42.9 42.8
34 54 76 Error típico 4.2 3.8 4.7
69 40 41 Mediana 41.5 41.5 39
50 50 50 Moda #N/D 41 50
60 42 50
Desviación estándar 20.40 18.55 23.20
16 41 81
42 40 31 Varianza de la muestra 416.07 344.25 538.14
79 56 77 Curtosis 0.00 0.40 -0.93
65 40 61 Coeficiente de asimetría 0.19 -0.34 0.19
43 33 76 Rango 80 74 77
7 32 21
Mínimo 6 6 4
28 25 37
6 55 30 Máximo 86 80 81
86 51 76 Suma 1023 1030 1028
Cuenta 24 24 24

9/8/2020 Elisa Mendoza G.


Función de distribución Normal y NORMAL estándar
La Función de Densidad de la distribución DISTRIBUCIÓN NORMAL ESTANDAR:
normal, para <x< 
La función de Densidad de la Distribución
VARIABLE: X N (,  ) Normal Estándar, Z. VARIABLE: Z  N(0,1)

1 1 −z2 / 2
f ( x) = e − ( x −  ) 2 / 2 2
f ( z) = e
2 2
Parámetros:  (media) y  (desviación estándar)
La estandarización de la variable X, se realiza mediante la fórmula:
(𝑋 − 𝜇)
𝑍=
𝜎

Prof. Elisa Mendoza


REGLA EMPÍRICA

Tomado de: Guía práctica del Curso de Bioestadística Aplicada a las Ciencias de la Salud.

Prof. Elisa Mendoza


Cálculo de probabilidades con la distribución
normal estándar
Ejemplo de la Estandarización de la variable X

X −
Z=
Se llama estandarización a la
transformación de la variable X a Z. Se
eliminan las unidades de medidas.

Ejemplo:
 3.3 − 2.2 
Sea = 2.2 y =0.8, calcule la probabilidad de, X>3.3 P( X  3.3) = P Z  
 0.8 
= P( Z  1.38)
= 0.0838

Prof. Elisa Mendoza


Ejemplo

Tomando como ejemplo los datos de Edad 1, con media de 42.3 y


desviación estándar de 20.5 años, ¿cuál es la probabilidad de seleccionar
a una persona con menos de 35 años?; ¿cuál es la probabilidad de
seleccionar una persona aleatoriamente entre 30 a 50 años?, y ¿cuál es la
probabilidad de seleccionar aleatoriamente a una persona al azar de más
de 55 años?

9/8/2020 Elisa Mendoza G.


Ejemplo

9/8/2020 Elisa Mendoza G.


Otras
Distribución t-student y Chi-
distribuciones de cuadrado
probabilidad

9/8/2020 Elisa Mendoza G.


Distribución t-student

Prof. Elisa Mendoza


Tomado de: http://slideplayer.es/slide/2514/
Prof. Elisa Mendoza
Cálculo de probabilidad
Normal

◦Usando Excel

9/8/2020 Elisa Mendoza G.


Problema: El salario por hora
para los trabajadores de una
oficina estatal sigue una
distribución normal con una
media de $9.10 y una desviación
estándar de $0.90.
Determine la probabilidad de
que el salario por hora de un
trabajador exceda $10.00.

Prof. Elisa Mendoza. Universidad de Panamá


Con Excel, se pueden usar las funciones Es importante recorder siempre colocar el signo
de distribuciones de probabilidad.
de igual cuando se va a realizer un cálculo.
En este caso, se usa: DISTR.NORM.N

Prof. Elisa Mendoza. Universidad de Panamá


Así la probabilidad P(X > 10), es igual al complemento, es decir: 1
Dado que la probabilidad que se quiere obtener – P(X<10). Excel, calcula P(X<10), luego se le restará de 1.
es del área superior “mayor que”, y Excel
Se reemplazan los datos de la función: Valor de X; media; desv.
devuelve áreas inferiores al valor “menor que”, se
Estándar; acum. Tal como se ve en la imagen.
debe calcular el complemente, en este caso.

Prof. Elisa Mendoza. Universidad de Panamá


El resultado es como se ve en la imagen.

Después de calcular la P(X<10), se Cuando la probabilidad que se desea es el área izquierda


calcula el complemento: 1- P(X<10). “menor que”. NO HAY QUE CALCULAR COMPLEMENTO,
sino que es el resultado directo de Excel.

Prof. Elisa Mendoza. Universidad de Panamá


En la parte b, se observa que se quiere
calcular la probabilidad del área “menor
que”: P(X<8)

Se escoge la distribución Normal:


DISTR.NORM.N

Se completan los datos solicitados, donde


x=8, Media=9.1; desviación estándar = 0.9 y
en acumulado se coloca 1.

El resultado es el que proporciona Excel.

Prof. Elisa Mendoza. Universidad de Panamá


ESTE ES EL RESULTADO. ES DIRECTO

Prof. Elisa Mendoza. Universidad de Panamá


ESTE ES UN
EJEMPLO PARA
CALCULAR
PROBABILIDADES
ENTRE DOS
VALORES

Prof. Elisa Mendoza. Universidad de Panamá


SI INTERESA CONOCER EL VALOR DE X A
PARTIR DE LA PROBABILIDAD, SE REALIZA
LO SIGUIENTE.
EJEMPLO, ¿CUÁNTO GANARÁ EL 85% DE
LOS TRABAJADORES?. OBSÉRVESE QUE Se calcula el inverso de la probabilidad.
85% ES LA PROPORCIÓN, AHORA SE
QUIERE SABER EL VALOR DE X (CUÁNTO
GANAN).

Prof. Elisa Mendoza. Universidad de Panamá


En el caso de
Geogebra
◦ Para calcular probabilidades de Z, deben
usar los parámetros 0 y 1, como se ve en la
imagen.
◦ Luego completar el valor de la probabilidad
que desean calcular.

◦ Los procedimientos que se usaron en Excel


valen para cualquier distribución de
probabilidad.

Esta foto de Autor desconocido está bajo licencia CC BY-SA-NC

Prof. Elisa Mendoza. Universidad de Panamá


Referencias consultadas

• Bibliografía:
• Pagano, M.; Gauvreau, K.; (2001). Fundamentos de Bioestadística.
Thomson Learning editores. México.
• Blair, C. y Otros (2008). Bioestadística. Edit. Pearson. México.
• Bioestadística. Hospital Ramón Cajal.
http://www.hrc.es/bioest/M_docente.html
• Díaz Narváez, V. P. y Díaz Narváez, V. P. (2009). Metodología de la
investigación científica y bioestadística: para médicos, odontólogos y
estudiantes de ciencias de la salud. Chile: RIL editores. Recuperado de
https://elibro.net/es/ereader/upanama/85233?page=243.
• Apuntes y videos de bioestadística.
https://www.bioestadistica.uma.es/baron/apuntes/

9/8/2020 Elisa Mendoza G.

También podría gustarte