Está en la página 1de 66

ASIGNATURA : PROYECTO DE TESIS II

CICLO : XII
SEMESTRE ACADEMICO : 2023-I
UNIVERSIDAD PRIVADA SAN JUAN BAUTISTA
FACULTAD DE CIENCIAS DE LA SALUD
ESCUELA PROFESIONAL DE MEDICINA HUMANA
“Dr. Wilfredo E. Gardini Tuesta”

Resultados:
Interpretación y análisis de datos recolectados mediante aplicación
de pruebas estadísticas
PROYECTO DE TESIS II

DOCENTE: Mg Cesar Burga


Investigador RENACYT-CONCYTEC
ESTADISTICA INFERENCIAL

INTERVALOS DE CONFIANZA

Rango de valores derivado de los


estadísticos de la muestra, que
posiblemente incluya el valor de un
parámetro de población desconocido.

Cesar Burga
40%
Valor poblacional

Cesar Burga
CONTRASTES DE HIPOTESIS

• Demuestra asociaciones o relaciones


entre las características observadas.

• Intenta controlar el error aleatorio.

Cesar Burga
Variables cuantitativas
No pareado T Student independ
VAR DEPEND
Distribución Normal

Pareado T Student Pareado


VAR INDEP
Cuant. Continua

No pareado U - MannWhitney
2 GRUPOS Distrib. No Normal
Cualitativa dicotómica
Rango signado
Pareado
Wilcoxon

No pareado U de Mann-Whitney

Cuant. Discreta
Rango signado
Pareado
Cesar Burga Wilcoxon
Variables cuantitativas
VAR DEPEND
Distribución Normal ANOVA
VAR INDEP
Cuant. Continua

Distribución No Normal Kruskall Wallis

+ 2 GRUPOS
Cualitativa politómica

Cuant. Discreta Kruskall Wallis

Cesar Burga
Variables cualitativas

VAR INDEP VAR DEPEND


Chi cuadrado o
Muestra independien prueba exacta de
Fisher
VARIABLE VARIABLE
CATEGORICA CATEGORICA
Muestra Pareada Kappa y McNemar

Cesar Burga
EJEMPLOS

Se desea saber si la presencia de parásitos en niños influye en la ganancia de peso.

• Var Dependiente: Peso (Kg) – Cuantitativa continua

• Var independiente: Parasitosis – Cualitativa nominal (+/-)

 Sigues la distribución normal: T student

 No Sigue la distribución normal: U de Man-Whitney

Cesar Burga
Variables cuantitativas
No pareado T Student independ
VAR DEPEND
Distribución Normal

Pareado T Student Pareado


VAR INDEP
Cuant. Continua

No pareado U - MannWhitney
2 GRUPOS Distrib. No Normal
Cualitativa dicotómica
Rango signado
Pareado
Wilcoxon

No pareado U de Mann-Whitney

Cuant. Discreta
Rango signado
Pareado
Cesar Burga Wilcoxon
Se desea evaluar cuál es el peso (kg) de personas con obesidad tratadas
con 3 diferentes dietas (Dieta 1 / Dieta 2/ Dieta 3)

• Var Dependiente: Peso (kg) – Cuantitativa continua

• Var independiente: Tipo dieta – Cualitativa ordinal– Politómica

 Sigue la distribución normal: ANOVA

 No Sigue la distribución normal: Kruskall Wallis

Cesar Burga
Variables cuantitativas
VAR DEPEND
Distribución Normal ANOVA
VAR INDEP
Cuant. Continua

Distribución No Normal Kruskall Wallis

+ 2 GRUPOS
Cualitativa politómica

Cuant. Discreta Kruskall Wallis

Cesar Burga
Se desea evaluar si existe asociación entre el sexo y la muerte por COVID:

• Var Dependiente: Muerte por COVID – Cualitativa nominal – Dicotómica


(vive o muere)
• Var independiente: Actividad Sexo – Cualitativa nominal – Dicotómica
(Hombre/mujer)
Prueba estadística: Chi – cuadrado / Prueba exacta Fisher

Cesar Burga
Se desea conocer la eficacia de un antiparasitario, para ello se evalúa la
presencia de huevos antes y 30 días después del tratamiento.
• Var Dependiente: Eficacia – Cualitativa nominal – Dicotómica (Presencia o
ausencia de huevos de parásito)
• Var independiente: Tratamiento - Cualitativa nominal – Dicotómica (Sin
tratamiento/ con tratamiento)
*En este caso, según el diseño, se evaluará al mismo individuo antes y después
de la aplicación del tto, es decir sería una muestra pareada.
PDTA: Prueba de Shapiro Wilk e Histograma nos dice que la muestra no sigue
una distribución normal. Cesar Burga
Prueba estadística: Rangos signados de Wilcoxon
RECORDANDO….
• Hay dos tipos de análisis estadísticos que pueden realizarse
para probar hipótesis:

ANÁLISIS ANÁLISIS NO
PARAMÉTRICO PARAMÉTRICO

LA ELECCIÓN DE QUÉ CLASE DE ANÁLISIS EFECTUAR DEPENDE DE LOS SUPUESTOS


ANÁLISIS
PARAMÉTRICO

Coeficiente de correlación de Pearson

Prueba T

Prueba de regresión lineal

Análisis de varianza factorial (ANOVA).


ANÁLISIS NO
PARAMÉTRICO

Chi cuadrado

WILCOXON

KRUSKAL WALLIS

U DE MANN WHITNEY PARA DOS GRUPOS


Interpretación de análisis de datos
recolectados con T-TEST PARA
MUESTRAS RELACIONADAS
ANALIZANDO RESULTADOS…
Pasos para probar una hipótesis estadística
• Paso 1.- Planteamiento de hipótesis.
• H0 : d = 0 (Las medias de muestras relacionales son similares).
• H1 : d ≠ 0 (Las medias de muestras relacionales no son similares).
• Paso 2.- Niveles de significación. (teórico) “” Se obtiene el valor de
significación practico
• Paso 3.- Estadístico de prueba. «P- valor» mediante el
• «T» de student de muestras relacionales grados de libertad (n-1).
SPSS.

P - VALOR
• Paso 4.- Formular la regla de decisión P>0.05 No significativo
• Si el p-valor <  Se rechaza H0 P<0.05 Significativo

• Si el p-valor ≥  No se rechaza H0
• Paso 5.- Conclusión:
• En este caso se especifica la hipótesis estadística que no ha sido rechazada
indicando el nivel de significancia teórico considerado (α)
EJEMPLO: Determinar la efectividad del programa dieta
ejercicios en la disminución del los niveles de colesterol.
• A continuación se tienen los niveles de colesterol total de una
muestra de ocho pacientes antes y después de participar en un
programa dieta ejercicio.
• PASO 01: PLANTEAMIENTO DE HIPÓTESIS
• H0 : El programa no es efectivo. (Después del programa los valores de
colesterol total no disminuirán).
• H1 : El programa es efectivo. (Después del programa los valores de colesterol
total disminuirán).
• PASO 2: Niveles de significación. (teórico) ””
• Se asume un nivel de significancia de 0.05
• PASO 3: Estadístico de prueba. «T» de student con su respectivos
grados de libertad.
• Empezamos por comprobar la normalidad de la diferencia de los
datos para muestras relacionadas.
• Ruta en SPSS: Analizar / Estadísticos descriptivos / Explorar,
dentro del menú. Explorar en la opción Gráficos marcar Gráficos
con prueba de normalidad

Los tests de normalidad dan un valor de p no significativo (p>0,05) en ambas muestras relacionadas (en
este caso, por el tamaño muestral que tenemos correcto utilizar el test de Shapiro-Wilks). No hay
evidencias para rechazar la hipótesis nula de normalidad de la variable
reducción del colesterol.
• Paso 4: Formular la regla de decisión
• Como p-valor = 0,032 < 0,05 se rechaza H0
• Paso 5: Conclusión:
• Se concluye que hay evidencia para indicar que el programa dieta –
ejercicio es efectiva; es decir, que después del programa dieta -
ejercicios los niveles de colesterol fueron significativamente menores
que los obtenidos antes, a un nivel de significancia de 0,05.
Interpretación de análisis de datos
recolectados con ANÁLISIS
DE VARIANZA ANOVA
ANÁLISIS DE VARIANZA ANOVA
• Su nombre está basado en el método que se utiliza y puede
desorientar, pero el ANOVA no compara varianzas, sino medias y es
el test indicado cuando se desean comparar las medias de tres o
más grupos independientes.
• La situación que vamos a tratar es similar a la del t-test para
muestras independientes:
• La variable a contrastar (dependiente) es cuantitativa.
• La variable de agrupación es cualitativa con más de dos categorías.
• El ANOVA es un método paramétrico y exige el cumplimiento de
unos supuestos, de manera que cuando no se cumplan las
condiciones de aplicación se dispone de una técnica no paramétrica
que es el test de Kruskal-Wallis.
ANALIZANDO RESULTADOS:

• Paso 1: Planteamiento de hipótesis.


• H0: El pertenecer a un grupo u otro no influye en el cambio del
colesterol
• H1: Al menos dos grupos difieren
• Paso 2: Niveles de significación. (teórico) ””
• Se asume un nivel de significancia de 0.05
• Paso 3: Estadístico de prueba. «F» de Fisher de Snedecor.

• CUMPLE CON LOS SUPUESTOS POR LO QUE SE APLICA EL ANOVA


• Aplicamos la prueba «F» de Fisher mediante el SPSS cuya ruta es: Analizar /
Comparar medias / ANOVA DE UN FACTOR.

Siendo la prueba F= 5,225 su


respectiva significancia
p-valor =0,025.
INTERPRETANDO…
• Paso 4: Formular la regla de decisión
• Como p-valor = 0,025 < 0,05 se rechaza H0
• Paso 5: Conclusión:
• Se concluye que hay evidencia para indicar que al menos dos tipos de dietas
difieren; es decir, que las intervenciones sobre dietas es efectiva con un nivel
de significancia de 0.05.
Interpretación de análisis de datos
recolectados con CHI CUADRADO
PRUEBA CHI CUADRADO DE HOMOGENEIDAD.
• Prueba estadística para evaluar hipótesis acerca de la relación entre dos
variables categóricas.
• Procedimiento: se calcula por medio de una tabla de contingencia o
tabulación cruzada, que es un cuadro de dos dimensiones y cada dimensión
contiene una variable. A su vez, cada variable se subdivide en dos o más
categorías.
• OJO!
• Se necesita que más del 20 % de los valores esperados estén por encima de 5 y que
ninguna celda tenga valor esperado menor a 1.
• Si la tabla es de 2x2, todas las celdas deben tener valores esperados por encima de 5.
• En el caso de la tabla de 2x2 si existe una sola celda con valor esperado menor que 5,
esto representaría un 25 % de las celdas con esa condición, por lo que se utilizaría la
Prueba de las Probabilidades exactas de Fisher en lugar de la Prueba χ2 , ya que en
éste caso no es posible agrupar categorías.
ANALIZANDO RESULTADOS…
• EJEMPLO: Determinar si existe homogeneidad entre los
enfermos y no enfermos de cáncer del pulmón respecto a
fumar o no fumar.
• Se seleccionan 2 muestras aleatorias, una de pacientes con esta
enfermedad y la otra de personas sin esta condición.
• Paso 1: Planteamiento de
hipótesis.
• H0: Hay homogeneidad entre los
enfermos y no enfermos de cáncer del
pulmón respecto a fumar o no fumar (la
proporción de fumadores es similar en
enfermos y no enfermos)
• H1: No hay homogeneidad (la
proporción de fumadores difiere en
enfermos y no enfermos)
• Paso 2: Niveles de significación.
(teórico) ””
• Se asume un nivel de significancia
de 0.05
• Paso 3: Estadístico de prueba
«Prueba CHI CUADRADO DE
HOMOGENEIDAD
• RESULTADOS:

Siendo la prueba chi


cuadrado = 6,792 con
1 grados de libertad y
su respectiva
significancia p-valor
=0,009.

• Paso 4: Formular la regla de decisión


• Como p-valor =0,009 < 0,05 se rechaza H0
• Paso 5: Conclusión
• Se concluye que hay evidencia para indicar que no hay homogeneidad (la proporción de
fumadores difiere en enfermos y no enfermos), con un nivel de significación de 0.05.
• Es decir, existen diferencias estadísticas significativas entre enfermos de cáncer del pulmón y
libres de la enfermedad en relación a la distribución de fumadores y no fumadores.
Interpretación de análisis de datos
recolectados con WILCOXON
Prueba de WILCOXON.
• OBJETIVO: Comparar dos mediciones de rangos
(medianas) y determinar que la diferencia no se deba al
azar (que la diferencia sea estadísticamente significativa).
• La prueba es posible utilizarla en lugar de la prueba
paramétrica t de Student para una muestra en la cual se
necesita probar una hipótesis en relación con un parámetro que
refleja una tendencia central.
ANALIZANDO RESULTADOS…
• EJEMPLO: Probar si hay diferencias en el nivel de estrés laboral de
los trabajadores de una empresa antes y después de la
implementación de un programa de mejoramiento del ambiente
laboral.
• El nivel de estrés se midió en una escala de nada, bajo, medio, alto y muy
alto.

Decisiones para seleccionar la prueba de Wilcoxon


Es un problema de Comparación
VI: programa de mejoramiento del ambiente laboral
2 grupos relacionados (estrés antes y después del
programa)
VD: nivel de estrés laboral
• PASO 01: Planteamiento de hipótesis.
• H0: No hay diferencias en el nivel de estrés laboral de los trabajadores antes
y después de implementar el programa de mejoramiento del ambiente laboral
(Md1 = Md2 ).
• H1: Hay diferencias en el nivel de estrés laboral de los trabajadores antes y
después de implementar el programa de mejoramiento del ambiente laboral
(Md1 ≠ Md2 ).
• Paso 02: Niveles de significación. (teórico) “”
• Se asume un nivel de significancia de 0.05
• PASO 3: Estadístico de prueba. «Prueba de WILCOXON»
• Siendo la prueba Z = -0.541 su respectiva significancia p-valor =0,589.

• PASO 4: Formular la regla de decisión


• Como p-valor =0,589 > 0,05 no se rechaza H0
• PASO 5: Conclusión:
• Se concluye que hay evidencia para indicar que no hay diferencias en el nivel
de estrés laboral de los trabajadores antes y después de implementar el
programa de mejoramiento del ambiente laboral, con un nivel de significación
de 0.05.
Interpretación de análisis de datos
recolectados con KRUSKAL
WALLIS
PRUEBAS NO PARAMETRICAS. Prueba KRUSKAL
WALLIS.
• OBJETIVO: Comparar mas de dos mediciones de rangos
(medianas) y determinar que la diferencia no se deba al azar
(que la diferencia sea estadísticamente significativa).
• Es una prueba no paramétrica que compara más de dos
muestras independientes. Se debe cumplir las siguientes
características:
• Es libre de curva, no necesita una distribución específica
• Nivel ordinal de la variable dependiente
• Es una alternativa de la prueba “F” de ANOVA de un factor.
ANALIZANDO RESULTADOS…
• EJEMPLO: Determinar si las cifras que excretan en orina de
sodio y potasio 4 tipos de ratas difieren entre sí.

• PASO 1: Planteamiento de hipótesis.


• H0: Med1= Med2=Med3=Med4
• H1: Medi ≠ Medj al menos para un par (i,j)
• PASO 2: Niveles de significación. (teórico) “”
Se asume un nivel de significancia de 0.05
• PASO 3: analizar el RESULTADOS

• Siendo la prueba Z chi cuadrado = 13,699 con 3


grados de libertad y su respectiva significancia p-valor
=0,003.
• PASO 4: Formular la regla de decisión
• Como p-valor =0,003 < 0,05 se rechaza H0
• PASO 5: Conclusión
• Se concluye que hay evidencia para indica que el nivel de excreción
urinaria de sodio/potasio difiere entre los cuatro tipos de ratas, con un
nivel de significación de 0.05.
Interpretación de análisis de datos
recolectados con U DE MANN
WHITNEY PARA DOS GRUPOS
Prueba U De Mann Whitney Para Dos Grupos
Independientes.

• OBJETIVO: Comparar dos grupos de rangos (medianas)


• Es una prueba no paramétrica de comparación de dos
muestras independientes, debe cumplir las siguientes
características:
• Es libre de curva, no necesita una distribución específica.
• Nivel ordinal de la variable dependiente
ANALIZANDO RESULTADOS…
• PASO 1: Planteamiento de
hipótesis.
• H0: No existe diferencias en el nivel de
estrés entre enfermeras de terapia
intensiva y las del servicio de urgencias
en un hospital (Med1 = Med2 )
• H1: Existe diferencias en el nivel de
estrés entre enfermeras de terapia
intensiva y las del servicio de urgencias
en un hospital (Med1 ≠ Med2 )
• PASO 2: Niveles de significación.
(teórico) ”  = 0.05”
• PASO 3: Estadístico de prueba:
Prueba U MANN WHITNEY.
• RESULTADOS:

Siendo la prueba U MANN WHITNEY = 11 su respectiva significancia p-valor =0,135


• PASO 4: Formular la regla de decisión
Como p-valor > 0.05, no se rechaza H0
• PASO 5: Conclusión Se concluye que hay evidencia para indicar que el nivel de estrés es
igual entre los 2 grupos de enfermeras, con un nivel de significación de 0.05.
Interpretación de análisis de datos
recolectados con PEARSON Y
SPEARMAN
COEFICIENTE DE
CORRELACION DE PEARSON
• Podemos definir el coeficiente de correlación de Pearson como
un índice que puede utilizarse para medir el grado de relación
de dos variables siempre y cuando ambas sean cuantitativas.
• El coeficiente de correlación de Pearson se calcula a partir de
las puntuaciones obtenidas en una muestra en dos variables.
• Se relacionan las puntuaciones recolectadas de una variable
con las puntuaciones obtenidos de la otra.
VENTAJAS Y DESVENTAJAS DEL COEFICIENTE DE PEARSON

VENTAJAS DESVENTAJAS
• El valor de coeficiente de • Requiere supuestos acerca de
correlación es independiente la naturaleza o formas de las
de cualquier unidad usada para poblaciones afectadas.
medir variables. • Requiere que las dos variables
• Mientras mas grande es la hayan ido medidas hasta un
muestra mas exacta será la nivel cuantitativo continuo y
estimación. que la distribución de ambas
sea semejante a la de la curva
normal.
USOS
• Permite predecir el valor de una variable dado un valor determinado
de la otra variable.
• Se trata de valorar la asociación entre dos variables cuantitativas
estudiando el método conocido como correlación.
• Dicho cálculo es el primer paso para determinar la relación entre las
variables.
• Consiste en la posibilidad de calcular su distribución muestral y así
poder determinar su error típico de estimación.
• Reporta un valor de correlación cercano a 0 como un indicador de
que no hay relación lineal entre 2 variables.
• Reporta un valor de correlación cercano a 1 como un indicador de
que existe una relación lineal positiva entre las 2 variables. Un valor
mayor a cero que se acerque a 1 da como resultado una mayor
correlación positiva entre la información.
COEFICIENTE DE
CORRELACION DE SPEARMAN
• La interpretación de coeficiente de Spearman es igual que la
del coeficiente de correlación de Pearson. Oscila entre -1 y +1,
indicándonos asociaciones negativas o positivas
respectivamente, 0 cero, significa no correlación pero no
independencia.
• Correlación de Pearson para el conjunto de rangos apareados.
La correlación de Spearman puede ser calculada con la
fórmula de Pearson, si antes hemos transformado las
puntuaciones en rangos.
VENTAJAS DESVENTAJAS
• No esta afectada por los • Es recomendable usarlo
cambios en las unidades de cuando los datos presentan
medida. valores extremos, ya que en
• Al ser una técnica no dichos valores afectan mucho
paramétrica, es libre de el coeficiente de correlación
distribución probabilística. de Pearson o ante distribución
no normales.
• R no debe ser utilizado para
decir algo sobre la relación
entre causa y efecto.
ANALIZANDO RESULTADOS…
Ejemplo: veremos a 100 mujeres a quien se le evaluó la
hemoglobina durante la gestación y también se evaluó el
peso de su recién nacido con la finalidad de conocer si el
valor de la hemoglobina de la madre esta relacionada con el
peso del recién nacido.

• 1° Ingresamos los datos


al SPSS y elegimos el
calculo del estadístico.
• 2° Colocamos las variables al lado
derecho y elegimos la opción
(Coeficiente de correlación de
Pearson).

o Al ver los reportes observamos que la correlación


de Pearson tiene un valor de 0,293 y la Sig.
(Bilateral) tiene un valor de 0,003 estando por
debajo de 0,01 por lo tanto rechazamos la Ho
(Nula).
o Para este ejemplo se trabajo con un nivel de
confianza de 99% por lo tanto el nivel de
significancia es de 0,01
Interpretación de análisis
de datos recolectados con
REGRESION LINEAL
REGRESION LINEAL SIMPLE
• En el análisis de regresión lineal es simple cuando intervienen sólo
dos variables:

VARIABLE X VARIABLE Y
(variable independiente ) (variable dependiente)

Los valores de la variable dependiente son los que


deseamos predecir, usando para ello la información
aportada por la variable independiente ( X )
En el caso de una relación lineal, el objetivo es obtener la
ECUACIÓN DE LA RECTA que mejor se ajuste a los datos (que mejor
represente la relación entre las variables).
ANALIZANDO RESULTADOS…
• PASO 01: Construir la ecuación de recta de regresión lineal
simple.
• PASO 02: Observar los valores mostrados en el cuadro de
COEFICIENTES:

• CONSTANTE DE REGRESIÓN
• COEFICIENTE DE REGRESIÓN
COEFICIENTE DE CONSTANTE DE
REGRESIÓN REGRESIÓN
• B>0  relación lineal es positiva • Indica el valor correspondiente a la
(B representa el número de unidades que tiende a variable dependiente cuando la
aumentar la variable Y por cada unidad que aumenta variable independiente asume un
la variable X)
valor igual a cero.
• B<0  relación lineal es negativa
(B representa el número de unidades que tiende a
• Cuidado al interpretar la constante de
disminuir la variable Y por cada unidad que aumenta regresión de la ecuación pues en
la variable X) ocasiones ésta no tiene sentido.
• B=0  la ecuación de regresión lineal no
es el modelo más adecuado para
describir la relación entre las variables
involucradas
• PASO 03: Evaluar la SIGNIFICANCIA (se evalúa a través del p
valor y de los intervalos de confianza que deben acompañar los
resultados)
• P < 0,05 “significativo”  los valores de la variable X tiene
INFLUENCIA sobre los valores de la variable Y
• P > 0,05 “no significativo”  los valores de la variable X no tiene
relación con la variable Y
Muchas gracias

También podría gustarte