Está en la página 1de 37

Test de Hipótesis

Descriptivo
Pruebas Paramétricas y Pruebas
No Paramétricas
t de Student para una muestra y Chi cuadrado de Bondad
de Ajuste

Describir Estimar Comparar

Dr. José Luis Soto Velásquez


ESTADÍSTICA
Niveles de Investigación
Describe fenómenos sociales o clínicos en una circunstancia temporal y
geográfica determinada. Su finalidad es describir y/o estimar parámetros.

Se describen frecuencias y/o promedios; y se estiman parámetros con


intervalos de confianza. Ejm. los estudios de frecuencia de la enfermedad:
Incidencia y Prevalencia.

02 Descriptivo
Univariado

Propósito investigativo: Incidencia, Prevalencia, Frecuencia,


Estimación, Descripción, Elaboración.
http://appswl.elsevier.es/watermark/ctl_servlet?_f=10&pident_articulo=13059109&pident_usuario=0&pcontactid=&pident_revista=25&ty=10&accion=L&origen=cardio&web=www.re
vespcardiol.org&lan=es&fichero=25v57n04a13059109pdf001.pdf&anuncioPdf=ERROR_publi_pdf
http://appswl.elsevier.es/watermark/ctl_servlet?_f=10&pident_articulo=13096585&pident_usuario=0&pcontactid=&pident_revista=25&ty=37&accion=L&origen=cardio&web=www.revesp
cardiol.org&lan=es&fichero=25v59n12a13096585pdf001.pdf&anuncioPdf=ERROR_publi_pdf
http://scielo.sld.cu/pdf/san/v16n4/san09412.pdf
Nivel de investigación
DESCRIPTIVO

05
Variables Categóricas Variables Numéricas

d.- Chi-Cuadrado de Bondad de Ajuste


04
d.- T Student para una muestra
c.- Intervalos de Confianza para prevalencia c.- Intervalos de Confianza para la Media
b.- Gráficos de barras y diagramas de sectores b.- Gráficos de Histogramas
03
a.- Frecuencias absolutas y relativas a.- Medidas de Tendencia Central y de dispersión

02

01
01 Descriptivo
Univariado
a. Tabla de Frecuencia y b. Diagrama de sectores Variables CATEGÓRICAS

Tabla N° 1.- Distribución según Sexo (Población, lugar y tiempo)


Porcentaje
Sexo Frecuencia (n) (%)
Masculino 110 55

Variables Categóricas Femenino


Total
90
200
45
100
Fuente.- Elaboración propia, 2018.

d.- Chi-Cuadrado de Bondad de Ajuste Grafico N° 1.- Distribución según Sexo (Población, lugar y tiempo)
c.- Intervalos de Confianza para prevalencia
b.- Gráficos de barras y diagramas de sectores
a.- Frecuencias absolutas y relativas
Femenino Masculino
45% 55%

Según la tabla n° 1, El 55% de la población de estudio corresponde al sexo masculino y el


45% al sexo femenino.
a. Tabla de Frecuencia y b. Gráfico de Barras Variables CATEGÓRICAS

Tabla N° 2.- Distribución del Estado Nutricional (Población, lugar y tiempo)


Estado Frecuencia Porcentaje
Nutricional (n) (%)
Desnutrición 16 7
Normal (Eutrófico) 126 57
Variables Categóricas Sobrepeso 65 29
Obesidad 12 5
Obesidad mórbida 4 2
Total 223 100
Fuente.- Elaboración propia, 2018.
d.- Chi-Cuadrado de Bondad de Ajuste
c.- Intervalos de Confianza para prevalencia Grafico N° 2.- Distribución del Estado Nutricional (Población, lugar y tiempo)

b.- Gráficos de barras y diagramas de sectores Estado Nutricional


60% 57%
a.- Frecuencias absolutas y relativas
50%

Porcentaje (%)
40%
29%
30%

20%

10% 7% 5%
2%
0%
Desnutrición Normal Sobrepeso Obesidad Obesidad
(Eutrófico) mórbida

Según la tabla n° 2, se pudo evidenciar que el 29% de la población de estudio presenta Sobrepeso,
mientras que el 7% tiene Obesidad y desnutrición.
c. Intervalos de Confianza para Prevalencia Variables CATEGÓRICAS

1.- Calculo de los Intervalos de confianza para la PREVALENCIA (95%) con n=100

Muestra Prevalencia 1-Prevalencia Error Estándar Intervalos de confianza 95%

Estadístico n p q Límite inferior Límite superior


Variables Categóricas
Diabetes 100 0,18 0,82 0,038 0,106 0,254

Hipertensión 100 0,39 0,61 0,049 0,294 0,486

d.- Chi-Cuadrado de Bondad de Ajuste Triglicéridos 100 0,52 0,51 0,050 0,422 0,618

100 0,47 0,050 0,372 0,568


c.- Intervalos de Confianza para prevalencia HDL disminuido 0,47

b.- Gráficos de barras y diagramas de sectores Fuente.- Elaboración propia, 2018.

a.- Frecuencias absolutas y relativas

IC  Pr evalencia 1,96 * EE
Intervalos de confianza para la media 95%:
Prueba de
Bondad de Ajuste de Chi cuadrado

Variables Categóricas

d.- Chi-Cuadrado de Bondad de Ajuste


c.- Intervalos de Confianza para prevalencia Aplicativo
b.- Gráficos de barras y diagramas de sectores
Predictivo
a.- Frecuencias absolutas y relativas c.- Verificar
Explicativo
Estimación puntual e
b.- Estimar
Relacional Intervalos de confianza

Univariado Descriptivo a.- Describir Frecuencias y gráficos

Exploratorio
Prueba de
Bondad de Ajuste de Chi cuadrado

Variables Categóricas
La bondad de ajuste de un modelo estadístico describe lo bien que
se ajusta un conjunto de observaciones. Las medidas de bondad en
d.- Chi-Cuadrado de Bondad de Ajuste general resumen la discrepancia entre los valores observados y los
c.- Intervalos de Confianza para prevalencia que valores esperados en el modelo de estudio.
b.- Gráficos de barras y diagramas de sectores
a.- Frecuencias absolutas y relativas
Tales medidas se pueden emplear en el contraste de hipótesis, e.g.
el test de normalidad de los residuos, comprobar si dos muestras se
obtienen a partir de dos distribuciones idénticas ( test de
Kolmogorov-Smirnov), o si las frecuencias siguen una distribución
específica (Chi cuadrado).
Prueba de
Bondad de Ajuste de Chi cuadrado

Variables Categóricas

d.- Chi-Cuadrado de Bondad de Ajuste


c.- Intervalos de Confianza para prevalencia 3,989
b.- Gráficos de barras y diagramas de sectores
a.- Frecuencias absolutas y relativas
95,00%
Si X2 = 3,84
Entonces p = 0,05
5,00%

3,84
Prueba de
Bondad de Ajuste de Chi cuadrado

Variables Categóricas

d.- Chi-Cuadrado de Bondad de Ajuste


c.- Intervalos de Confianza para prevalencia 3,989
b.- Gráficos de barras y diagramas de sectores
a.- Frecuencias absolutas y relativas
95,43%

P-valor= 0,0457
4,57%
Prueba de
Bondad de Ajuste de Chi cuadrado

Variables Categóricas

Regla de decisiones para la prueba de hipótesis


d.- Chi-Cuadrado de Bondad de Ajuste
c.- Intervalos de Confianza para prevalencia p-valor p-valor
b.- Gráficos de barras y diagramas de sectores
H1 Ho
a.- Frecuencias absolutas y relativas

P-valor= 0,0457

0 0,01 0,02 0,03 0,04 0,05

Nivel de significancia (alfa)


Prueba de
Bondad de Ajuste de Chi cuadrado
PLANTEAMIENTO: La prevalencia de diabetes en la población general es del 8%. En una
muestra de 385 personas mayores a 40 años se encontró 51 casos de diabetes. ¿La prevalencia
de diabetes en mayores de 40 años es distinta al de la población general?
Variables Categóricas
Plantear Hipótesis
1
Ho: La prevalencia de diabetes en mayores de 40 años NO es DISTINTA al de la población general

d.- Chi-Cuadrado de Bondad de Ajuste H1: La prevalencia de diabetes en mayores de 40 años es DISTINTA al de la población general

c.- Intervalos de Confianza para prevalencia Establecer un nivel de significancia


2
b.- Gráficos de barras y diagramas de sectores Nivel de Significancia (alfa) α = ___5% = 0,05____________

a.- Frecuencias absolutas y relativas 3 Seleccionar estadístico de prueba (Resaltarla con amarillo)
a)Chi Cuadrado de Bondad de ajuste

Valor de P=____ 0,000148 = 0,0148% ____________


4 Lectura del p-valor
Con una probabilidad de error 0,0148% la prevalencia de diabetes en mayores de 40 años es DISTINTA al
de la población.

5 Toma de decisiones (dar como respuesta una de las Hipótesis)


La prevalencia de diabetes en mayores de 40 años es DISTINTA al de la población
Prueba de
Bondad de Ajuste de Chi cuadrado
PLANTEAMIENTO: La prevalencia de diabetes en la población general es del 8%. En una
muestra de 385 personas mayores a 40 años se encontró 51 casos de diabetes. ¿La prevalencia
de diabetes en mayores de 40 años es distinta al de la población general?
Variables Categóricas
Porcentaje
Diabetes Cantidad
(%)
Si 51 13%
d.- Chi-Cuadrado de Bondad de Ajuste No 334 87%
c.- Intervalos de Confianza para prevalencia Total 385 100%

b.- Gráficos de barras y diagramas de sectores


X2: 14,400 P: 0,000148
a.- Frecuencias absolutas y relativas
La Interpretación:
En el presente año la prevalencia de diabetes en mayores de 40 años está por encima (P: 0,000) al de la
población general.
Prueba de
Bondad de Ajuste de Chi cuadrado
PLANTEAMIENTO: La prevalencia de Helicobacter pylori en la población de Santa Cruz es del
73%. En una muestra de 64 personas se encontró 37 casos positivos. ¿La prevalencia de
Helicobacter pylori en la población de estudio será menor al parámetro departamental?
Variables Categóricas
Plantear Hipótesis

1 H1: La prevalencia de Helicobacter pylori en la población de estudio ES MENOR al parámetro departamental


Ho: La prevalencia de Helicobacter pylori en la población de estudio ES MAYOR al parámetro departamental
d.- Chi-Cuadrado de Bondad de Ajuste
Establecer un nivel de significancia
c.- Intervalos de Confianza para prevalencia 2 Nivel de Significancia (alfa) α = ___5% = 0,05____________
b.- Gráficos de barras y diagramas de sectores Seleccionar estadístico de prueba
a.- Frecuencias absolutas y relativas 3 a) Chi Cuadrado de Bondad de ajuste

Valor de P=____ 0,0062/2 = 0,0031 = 0,31% ____________


Lectura del p-valor
4
Con una probabilidad de error 0,31% La prevalencia de Helicobacter pylori en la población de estudio es menor al
parámetro departamental.
Toma de decisiones (dar como respuesta una de las Hipótesis)
5
La prevalencia de Helicobacter pylori en la población de estudio es menor al parámetro departamental.
Prueba de
Bondad de Ajuste de Chi cuadrado
PLANTEAMIENTO: La prevalencia de Helicobacter pylori en la población de Santa Cruz es del
73%. En una muestra de 64 personas se encontró 37 casos positivos. ¿La prevalencia de
Helicobacter pylori en la población de estudio será menor al parámetro departamental?
Variables Categóricas Prueba de Frecuencia Porcentaje
Helicobacter
pylori (n) (%)
Positivo 37 57,8
d.- Chi-Cuadrado de Bondad de Ajuste Negativo 27 42,2
c.- Intervalos de Confianza para prevalencia Total 64 100,0
b.- Gráficos de barras y diagramas de sectores
X2: 7,490 P: 0,0062
a.- Frecuencias absolutas y relativas
La Interpretación:
La seroprevalencia fue del 57,8% de la población de estudio que dio positivo a la prueba de Helicobacter
pylori, mientras que el 42,2% dio negativo.
En la comprobación de hipótesis se aceptó la hipótesis alternativa (H1) que dice que la seroprevalencia
(57,8%) de la población de estudio es menor (P: 0,0031) al parámetro departamental (73%) .
CASO PRACTICO N° 13

Prueba de bondad de ajuste


de Chi-cuadrado para
frecuencias
Nivel de investigación
DESCRIPTIVO

05
Variables Numéricas

04
d.- T Student para una muestra
c.- Intervalos de Confianza para la Media
b.- Gráficos de Histogramas
03
a.- Medidas de Tendencia Central y de dispersión

02

01
01 Descriptivo
Univariado
a. Medidas de tendencia Central y de Dispersión Variables Numéricas

Tabla N° 1.- Medidas de tendencia central (Edad)


Estadístico
Media = 43,420
Mediana = 43
Variables Numéricas
Moda = 42
Fuente.- Elaboración propia, 2018.
d.- T Student para una muestra
Tabla N° 2.- Medidas de dispersión (Peso) c.- Intervalos de Confianza para la Media
b.- Gráficos de Histogramas
Estadístico
a.- Medidas de Tendencia Central y de dispersión
Desviación Estándar = 9,176
La varianza = 84,199
Error estándar = 1,297
Fuente.- Elaboración propia, 2018.
b. Gráfica de Histograma Variables Numéricas

Grafico N° 1.- Histograma (Hemoglobina en g/dl) (Población, lugar y tiempo)

Variables Numéricas

d.- T Student para una muestra


c.- Intervalos de Confianza para la Media
b.- Gráficos de Histogramas
a.- Medidas de Tendencia Central y de dispersión
c. Intervalos de Confianza para la Media Variables Numéricas

Tabla N° 1.- Intervalos de confianza para la MEDIA (95%)

Intervalos de confianza Variables Numéricas


Estadístico Media Error estándar Límite inferior Límite superior
Edad = 43,420 1,215 41,038 45,802
Peso = 74,380 1,298 71,837 76,923 d.- T Student para una muestra
Talla = 1,681 0,008 1,665 1,697 c.- Intervalos de Confianza para la Media

IMC = 26,289 0,395 25,515 27,062 b.- Gráficos de Histogramas


Fuente.- Elaboración propia, 2018 a.- Medidas de Tendencia Central y de dispersión

IC  x  1,96 * EE
Intervalos de confianza para la media 95%:
Prueba de t de Student
para una muestra

Variables Numéricas

d.- T Student para una muestra

Aplicativo c.- Intervalos de Confianza para la Media


b.- Gráficos de Histogramas
Predictivo
c.- Verificar a.- Medidas de Tendencia Central y de dispersión
Explicativo
Estimación puntual e
b.- Estimar
Intervalos de confianza Relacional

a.- Describir Medidas de tendencia Descriptivo Univariado


central y dispersión
Exploratorio
Prueba de t de Student
para una muestra

Permite comprobar si es posible aceptar que la media de la población es Variables Numéricas


un valor determinado. Se toma una muestra y el Test permite evaluar si
es razonable mantener la Hipótesis nula de que la media es tal valor.
d.- T Student para una muestra
c.- Intervalos de Confianza para la Media
Se trata de un Test paramétrico; o sea, parte de la suposición de que la b.- Gráficos de Histogramas
variable analizada en el conjunto de la población sigue una variabilidad, a.- Medidas de Tendencia Central y de dispersión

una distribución como la de la campana de Gauss. Por lo tanto, podemos


pensar que la distribución normal es un buen modelo de esa población.
Prueba de t de Student
para una muestra

Distribución normal
Variables Numéricas
- Simétrica
- Mesocúrtica
95% d.- T Student para una muestra
c.- Intervalos de Confianza para la Media
b.- Gráficos de Histogramas
2,5% 2,5%
a.- Medidas de Tendencia Central y de dispersión
Contraste de hipótesis para la distribución

Propósito: Analizar la distribución de la variable aleatoria.

Ho: La distribución de la variable aleatoria no es distinta a la distribución normal


H1: La distribución de la variable aleatoria es distinta a la distribución normal

La prueba de hipótesis se realiza con el estadístico: Kolmogorov-Smirnov


Prueba de t de Student
para una muestra

Variables Numéricas

Contraste de hipótesis para la media


d.- T Student para una muestra
c.- Intervalos de Confianza para la Media
b.- Gráficos de Histogramas
Propósito: Comparar el promedio del grupo con el parámetro de la población.
a.- Medidas de Tendencia Central y de dispersión

Ho: El promedio del grupo no es distinto al promedio de la población.


H1: El promedio del grupo es distinto al promedio de la población.

La prueba de hipótesis se realiza con el estadístico: t de Student para una muestra.


Prueba de t de Student
para una muestra

Variables Numéricas
Planteamiento de hipótesis para la media
d.- T Student para una muestra
c.- Intervalos de Confianza para la Media
A dos colas b.- Gráficos de Histogramas
Hipótesis bilateral a.- Medidas de Tendencia Central y de dispersión

Ho: El peso promedio de los recién nacidos de madres adolescentes no es diferente (es igual) al de la población
H1: El peso promedio de los recién nacidos de madres adolescentes es diferente al de la población
Prueba de t de Student
para una muestra

Variables Numéricas
Planteamiento de hipótesis para la media
d.- T Student para una muestra
c.- Intervalos de Confianza para la Media
A una cola b.- Gráficos de Histogramas
Hipótesis unilateral a.- Medidas de Tendencia Central y de dispersión

H1: Los niveles de glucosa en ayunas en los diabéticos son mayores que los niveles de glucosa en ayunas en los no diabéticos
Ho: Los niveles de glucosa en ayunas en los diabéticos son menores que los niveles de glucosa en ayunas en los no diabéticos
Prueba de t de Student
para una muestra

Variables Numéricas
Planteamiento de hipótesis para la media
d.- T Student para una muestra
c.- Intervalos de Confianza para la Media
A una cola b.- Gráficos de Histogramas
Hipótesis unilateral a.- Medidas de Tendencia Central y de dispersión

Ho: Los niveles de la hemoglobina antes de la terapia son mayores que los niveles de la hemoglobina después de la terapia
H1: Los niveles de la hemoglobina antes de la terapia son menores que los niveles de la hemoglobina después de la terapia
Prueba de t de Student
para una muestra

Planteamiento: El peso promedio de los recién nacidos en una población es de Variables Numéricas
3350 gramos. ¿El peso un conjunto de recién nacidos de madres adolescentes es
menor que el de la población?
d.- T Student para una muestra
Plantear Hipótesis
1 c.- Intervalos de Confianza para la Media
H1: El peso promedio de los recién nacidos de madres adolescentes es menor al de la población
Ho: El peso promedio de los recién nacidos de madres adolescentes no es menor al de la población b.- Gráficos de Histogramas
a.- Medidas de Tendencia Central y de dispersión
2 Establecer un nivel de significancia
Nivel de Significancia (alfa) α = ___5% = 0,05________

Seleccionar estadístico de prueba (Resaltarla con amarillo)


a) t de Student para una muestra
3
b) t para grupos independientes
c) t para medidas repetidas
d) Análisis de la varianza
Prueba de t de Student
para una muestra

Planteamiento: El peso promedio de los recién nacidos en una población es de Variables Numéricas
3350 gramos. ¿El peso un conjunto de recién nacidos de madres adolescentes es
menor que el de la población?
d.- T Student para una muestra
Valor de P=_______0,0446395= 4,46%________________________________
4 Lectura del p-valor c.- Intervalos de Confianza para la Media
Con una probabilidad de error del 4,46% el peso promedio de los recién nacidos de madres b.- Gráficos de Histogramas
adolescentes es menor al de la población.
a.- Medidas de Tendencia Central y de dispersión
5 Toma de decisiones (dar como respuesta una de las Hipótesis)
El peso promedio de los recién nacidos de madres adolescentes es menor al de la población

Interpretación: El peso promedio de los recién nacidos de madres adolescentes es menor (P: 0,0446) al
peso de los RN de la población en general.
Prueba de t de Student
para una muestra

Planteamiento: La Hemoglobina promedio en las mujeres embarazadas del Variables Numéricas


primer trimestre en el departamento de Santa Cruz es de 11,0 g/dl. ¿La
Hemoglobina de las mujeres embarazadas guaraníes será menor que la
hemoglobina promedio? d.- T Student para una muestra
c.- Intervalos de Confianza para la Media
Plantear Hipótesis b.- Gráficos de Histogramas
1
H1: _______________________________________________________________________
Ho: _______________________________________________________________________ a.- Medidas de Tendencia Central y de dispersión

2 Establecer un nivel de significancia


Nivel de Significancia (alfa) α = ___5% = 0,05________

Seleccionar estadístico de prueba (Resaltarla con amarillo)


a) t de Student para una muestra
3
b) t para grupos independientes
c) t para medidas repetidas
d) Análisis de la varianza
Prueba de t de Student
para una muestra

Planteamiento: La Hemoglobina promedio en las mujeres embarazadas del Variables Numéricas


primer trimestre en el departamento de Santa Cruz es de 11,0 g/dl. ¿La
Hemoglobina de las mujeres embarazadas guaraníes será menor que la
hemoglobina promedio? d.- T Student para una muestra
c.- Intervalos de Confianza para la Media
Valor de P=_______0,000________________________________ b.- Gráficos de Histogramas
4 Lectura del p-valor
_______________________________________________________________________________ a.- Medidas de Tendencia Central y de dispersión
_______________________________________________________________________________

5 Toma de decisiones (dar como respuesta una de las Hipótesis)


_______________________________________________________________________________

Interpretación:
____________________________________________________________________________________
____________________________________________________________________________________.
Prueba de t de Student
para una muestra

Planteamiento: El Colesterol promedio en la población de la ciudad de Variables Numéricas


Santa Cruz de la Sierra es de 200 mg/dl. ¿El colesterol de una
población de estudio será mayor al colesterol promedio?
d.- T Student para una muestra
c.- Intervalos de Confianza para la Media
Plantear Hipótesis b.- Gráficos de Histogramas
1
Ho:
H1: El colesterol de una población de estudio es mayor al colesterol promedio a.- Medidas de Tendencia Central y de dispersión

2 Establecer un nivel de significancia


Nivel de Significancia (alfa) α = ___5% = 0,05________

Seleccionar estadístico de prueba (Resaltarla con amarillo)


a) t de Student para una muestra
3
b) t para grupos independientes
c) t para medidas repetidas
d) Análisis de la varianza
Prueba de t de Student
para una muestra

Planteamiento: El Colesterol promedio en la población de la ciudad de Variables Numéricas


Santa Cruz de la Sierra es de 200 mg/dl. ¿El colesterol de una
población de estudio será mayor al colesterol promedio?
d.- T Student para una muestra
c.- Intervalos de Confianza para la Media
Valor de P=_______0,000________________________________ b.- Gráficos de Histogramas
4 Lectura del p-valor
_______________________________________________________________________________ a.- Medidas de Tendencia Central y de dispersión
_______________________________________________________________________________

5 Toma de decisiones (dar como respuesta una de las Hipótesis)


_______________________________________________________________________________

Interpretación:
____________________________________________________________________________________
____________________________________________________________________________________.
CASO PRACTICO N° 19

Prueba de hipótesis para


promedios
“t de Student para una
muestra”

También podría gustarte