Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Maestría en:
SEGURIDAD Y SALUD
OCUPACIONAL
100% online
Grupo 6:
ARGUDO PELÁEZ, RUTH
CEDEÑO PÉREZ FREDDY
RODRÍGUEZ RODRÍGUEZ, VERÓNICA
MAESTRIA DE SEGURIDAD Y SALUD
OCUPACIONAL
Análisis Estadístico de Datos y Técnicas de Muestreo
Instrucciones
A partir de la base de datos adjunta a esta actividad y usando el software Epi Info
realice los siguientes cálculos:
Contenido
INTRODUCCIÓN.........................................................................................................................................2
OBJETIVOS..................................................................................................................................................5
TABLA DE DATOS E INTERPRETACIÓN DE RESULTADOS.............................................................5
Bibliografía....................................................................................................................................................9
CAPTURAS DE PANTALLA....................................................................................................................10
MAESTRIA DE SEGURIDAD Y SALUD
OCUPACIONAL
Análisis Estadístico de Datos y Técnicas de Muestreo
INTRODUCCIÓN
Dentro de la estadística una variable es una característica que puede fluctuar y cuya variación
es susceptible a adoptar diferentes valores, los cuales pueden medirse u observarse. Las
variables adquieren valor cuando se relacionan con otras variables, es decir, si forman parte de
una hipótesis o de una teoría. En este caso se las denomina constructos o construcciones
hipotéticas. A partir de este concepto se puede mencionar que una variable es la que permite
relacionarla con algún problema o fenómeno, el cual vamos a investigar y buscar posible
soluciones (Wikipedia, 2021).
Dentro de este contexto existes una división de las variables, para esta tarea se considerarán
las variables cuantitativas que varios autores las definen de diferentes formas, para mayor
facilidad se puede definir como variables cuantitativas a las variables con argumento numérico
y/o matemático y que están divididas en:
Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores
que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los
distintos valores específicos que la variable pueda asumir. Ejemplo: El número de hijos (1, 2, 3, 4, 5)
(Wikipedia, 2021).
Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo
especificado de valores. Por ejemplo la masa (2,3kg, 2,4kg, 2,5kg,...) o la altura (1,64m, 1,65m,
1,66m,...), o el salario. Solamente se está limitado por la precisión del aparato medidor, en teoría
permiten que exista indefinidos valores entre dos variables (Wikipedia, 2021).
Otra definición técnica es que las variables cuantitativas son diferentes a las cualitativas
porque pueden expresarte en cifras, que pueden ser medibles, pueden ordenarse de mayor a
menor o viceversa y realizar operaciones matemáticas y esto puede ser aplicado para análisis
con métodos estadísticos.
Para el presente análisis se utilizará de igual forma el programa Epi Info que es de fácil acceso y
aplicación, que a pesar de que es un programa estadístico más utilizado por los epidemiólogos puede ser
aplicado en varios campos como es el presente caso.
Se dice que un proceso es binomial cuando sólo tiene dos posibles resultados:
"éxito" y "fracaso", siendo la probabilidad de cada uno de ellos constante en una
serie de repeticiones. A la variable número de éxitos en n repeticiones se le
denomina variable binomial. A la variable resultado de un sólo ensayo y, por tanto,
con sólo dos valores: 0 para fracaso y 1 para éxito, se le denomina binomial
puntual.
Los modelos de regresión logística son modelos de regresión que permiten estudiar
si una variable binomial depende, o no, de otra u otras variables (no
necesariamente binomiales): Si una variable binomial de parámetro p es
independiente de otra variable X, se cumple p=p|X, por consiguiente, un modelo de
regresión es una función de p en X que a través del coeficiente de X permite
investigar la relación anterior.
tratamiento. A tratamiento. B
(X=1) (X=0)
curación 18 13
no 2 7
Total 20 20
Ejemplo 2: Para refrescar los conceptos de odds ratio y riesgo relativo. Sean dos
juegos, en uno (X=0) se apuesta sobre la salida de una cierta cara en una tirada de
un dado, y en otro (X=1) sobre la salida de una cara en la tirada de una moneda.
Evidentemente, la probabilidad de ganar es para el dado p|(X=0)=1/6 y para la
moneda p|(X=1)=1/2 El riesgo relativo es:
MAESTRIA DE SEGURIDAD Y SALUD
OCUPACIONAL
Análisis Estadístico de Datos y Técnicas de Muestreo
que, como es distinto de 1, quiere decir que la probabilidad de ganar está asociada
al tipo de juego, y que es 3 veces más probable ganar con la moneda que con el
dado. El odds ratio para este ejemplo es:
el odds para la moneda es 5 veces el odds del dado, es decir, a la larga la razón de
partidas ganadas/perdidas es 5 veces mayor para la moneda que para el dado. Para
decidir a que juego interesa jugar hay que comparar este odds ratio con la razón de
los cocientes entre lo que se puede ganar y perder en cada jugada en ambos
juegos. El OR está siempre más alejado de 1 que el RR, aunque cuando las
probabilidades son muy pequeñas la diferencia (entre el OR y el RR) es pequeña.
que, como era de esperar, debido a los pequeños valores de p|X=1 y p|X=0 es
prácticamente igual que el riesgo relativo (recordar cuando la prevalencia es baja,
el OR estima el RR).
OBJETIVOS
A continuación, se presenta la tabla con los resultados obtenidos de cada una de las variables:
MAESTRIA DE SEGURIDAD Y SALUD
OCUPACIONAL
Análisis Estadístico de Datos y Técnicas de Muestreo
Hipótesis nula. ¿
Análisis: los valores de las medias de las variables no son iguales, por lo que se procede a
observar el valor de T test de varianzas desiguales, mismo que es de 0,8536 y el P- Value de
0,8528, por lo tanto, tienen valores mayores a 0,05, indicando que la edad influye con el uso de
analgésicos durante los últimos 3 meses
B si es menor a 0.05 es una variable independiente y explica a la variable dependiente en este caso las
únicas son ausencia del trabajo y uso de medicamentos
Ex(B), indica el grado de relación, cuanto más alejada de uno esta más fuerte, en este caso lesión,
ausencia y uso de medicamentos
En cuanto a la bondad del modelo este se explica entre 0.98 y 0.39 en el primer caso y en el segundo
entre 0.538 y 0.536
El modelo debe ser el que más explique los datos y que además sea técnicamente robusto e
interpretable.
Para ajustar el modelo de regresión logística se debe incluir el estudio de la devianza, este se define
como el doble logaritmo de verosimilitud
=(2*(0.537)-2*(0.3958))
MAESTRIA DE SEGURIDAD Y SALUD
OCUPACIONAL
Análisis Estadístico de Datos y Técnicas de Muestreo
Mi valor de la varianza debería disminuir sensiblemente entre las dos instancias, en mejor de los
casos tender a cero cuando el modelo predice bien.
=(2*(0.537)-2(0.3958))
“ En el ajuste del modelo deben incluirse todas aquellas variables que se consideren técnicamente
importantes para el modelo, no debería dejarse de incluir toda variable que en un análisis univariado
previo demostrara una relación “suficiente” con la variable dependiente”.
Escoger las variables que se van a escoger en mi caso yo escogí todas así que en tarea ya no pueden
colocar las mismas
Análisis: los valores de las medias de las variables no son iguales, por lo que se procede a
observar el valor de T test, mismo que es de 0,7464 y el P- Value de 0,7469, por lo tanto,
tienen valores mayores a 0,05, indicando que existe dependencia de la edad y genero de los
trabajadores.
Análisis: el porcentaje de los valores esperados en la prueba chi cuadrado no son inferiores al
5%, por ende, es un método robusto,
Análisis:
Bibliografía:
Bibliografía
CAPTURAS DE PANTALLA