Está en la página 1de 10

Taller:

“Análisis de Datos Cuantitativos”

Integrantes
Jabiera Belen Carrasco Ballesteros.
Javiera Ignacia Quediman Villarroel.
Maitte Fernanda Velasquez Sanchez.
Investigación en Salud II
Departamento de Ciencias de la Salud.
Docentes
Daniel Conei Valencia / Astrid Garrido Campos.
Miércoles 19 de Julio del 2023.
Taller Análisis de Datos Cuantitativos

1. Para el desarrollo del siguiente trabajo se utilizará el archivo “Base de Datos Taller” y
el programa GraphPad Prism 9, Atlas.ti y las cápsulas disponibles en la plataforma de
Ucampus de la Universidad de Aysén. A continuación se presenta el desarrollo del
taller.

A. Pregunta de investigación e hipótesis.

Pregunta de Investigación:

¿Cuál es la relación entre las variables puntaje APGAR y peso de nacimiento en


Recién Nacidos (RN) del Hospital de Puerto Montt (HPM) en el año 2016?

Hipótesis:

Hi: Existe una correlación positiva entre el puntaje Apgar y el peso de nacimiento en
recién nacidos del hospital de Puerto Montt en el año 2016, lo que implica que a
medida que aumenta el puntaje Apgar, es más probable que los recién nacidos tengan
un mayor peso al nacer.

Se plantea una hipótesis de tipo correlacional, teniendo en cuenta que en este caso, la
hipótesis simplemente sugiere que existe una relación estadística entre el puntaje
Apgar y el peso al nacer, pero no podemos decir que uno cause directamente al otro.

Para probar esta hipótesis, se extraerán los datos de los grupos de bebés entregados
(base de datos taller) con su respectivos puntajes Apgar al minuto, a los 5 minuto y
algunos a los 10 minutos y su peso al nacer. Luego, se analizará la relación entre estas
dos variables utilizando el análisis estadístico del programa GraphPad Prism 9.

B. Clasificación de la variables según: Definición conceptual, operacional, tipo de


variable, unidad de medida e índice.

Variable Definición Definición Unidad de Índice


Conceptual Operacional Medida

Variable Un método, Puntuación de Promedio, Promedio,


Cualitativa desarrollado por la acuerdo a la desviación desviación
Continua: Dra. Virginia valoración de: estándar estándar
Apgar, para evaluar frecuencia dividido por dividido por
Puntaje de la adaptación de un cardíaca, esfuerzo minuto minuto
APGAR. RN a la vida respiratorio, tono (DE/minuto). (DE/minuto).
extrauterina (1). muscular,
irritabilidad refleja
y color. Se evalúa
al RN a los 60
segundos (1
minuto) después
del nacimiento,
luego a los 5 y a
los 10 minutos.
(1).

Variable La masa o cantidad Para el cálculo del PEG (<10). Número,


Cualitativa de pesadez de un peso, el RN debe AEG (entre porcentaje
Ordinal: individuo al ser colocado los (%).
nacimiento. Se desnudo y sin percentiles
Peso de expresa en unidades pañal sobre la 10 y 90).
Nacimiento. de libras o báscula, cuidando GEG (>90).
kilogramos (kg) (2). que todo su
cuerpo
permanezca
dentro de esta y
sea distribuido de
manera uniforme
sobre el centro de
ella (3).

C. Depuración de la base de datos según herramientas de Excel.

La depuración de la base de datos, corresponde a un proceso que consiste en eliminar,


corregir o actualizar los datos inexactos, inconsistentes, duplicados o no válidos
dentro de una base de datos. El objetivo principal de la depuración es asegurar la
calidad y la integridad de los datos almacenados en la base de datos, para poder
realizar un análisis estadístico en floema rápida y precisa.

Durante la depuración de la base de datos, se realizan diferentes actividades para


garantizar la limpieza de los datos. Algunas de estas actividades incluyeron:

1. Corrección de errores de datos: Se tomó por ejemplo la variable puntaje apgar


y se fue ordenando de manera que queden los puntajes por minutos de vida (1
minuto, 5 minutos y respectivamente 10 minutos) Esto ayuda a asegurar que
los datos sean coherentes y precisos.
2. Validación y eliminación de datos no válidos: Para esto contemplamos la
contabilización de las casillas nulas o en blanco.

En resumen, la depuración de la base de datos es una etapa crítica en la gestión de


datos, ya que asegura la limpieza y la calidad de los datos almacenados. A
continuación, se muestran imágenes ilustrativas de los explicado con anterioridad:
Ilustración N° 1: Utilización de filtros para depuración de datos.

Ilustración N° 2: Depuración de datos en la variable “puntuación APGAR”.

En relación a la depuración de la variable peso de nacimiento, se establece que se


medirán en rangos de peso máximo y peso mínimo de la muestra, ya que, si
contabilizamos estos números son diferentes entre sí, por lo cual se hubiesen obtenido
los mismos 69 datos ya presentados. Al realizarlo de manera ordenada y filtrando las
casillas en blanco o nulo, quedaría detallado de la siguiente manera:

Ilustración N° 3: Depuración de datos variable “peso de Nacimiento”.


D. Análisis de la distribución de las frecuencias de las variables.

La distribución de frecuencia de la variable APGAR muestra los resultados finales de


cada puntaje, que van desde 1 punto como el mínimo hasta 10 como el máximo. Los
puntajes más frecuentes se encuentran en APGAR el primer minuto de vida con un
puntaje de 9, en el APGAR a los 5' con un puntaje de 9, y en APGAR a los 10' con un
puntaje de 8. Sin embargo, también se consideran los valores de desviación estándar
en los gráficos, que son los mínimos. Estos valores son importantes, ya que nos
ayudan a entender por qué algunos recién nacidos deben ser evaluados por tercera vez
a los 10 minutos de vida.

Ilustración N° 4: Gráfico de distribución de frecuencias de “puntaje APGAR”.

La variable Peso de Nacimiento, se analizó en un gráfico en donde los datos se


distribuyeron en un conjunto de variables. Este tipo de gráfico nos ayuda a visualizar
la dispersión y concentración de los datos, así como identificar valores atípicos o
anomalías en los datos. En la siguiente ilustración se refleja una tendencia hacia la
media, donde se observa una concentración máxima aproximadamente entre los 2200
gramos hasta los 3400 gramos, de igual manera hay sujetos que se alejan de la media
con pesos inferiores a los 2000 gramos y pesos máximos cercanos a los 4500 gramos.

Ilustración N° 5: Gráfico de distribución de frecuencias de “Peso de nacimiento”.


E. Análisis descriptivo de las variables.

Se analizaron 69 datos en total con respecto a la variable puntuación APGAR, 66 de


estos datos correspondientes a un APGAR evaluado al minuto de vida y a los 5
minutos, los otros 3 sujetos de estudio permitieron analizar además un valor de
APGAR a los 10 minutos. Los valores más destacables fueron; puntuación mínima 1,
2 y 8 en APGAR a 1x’, 5x’ y 10x’ respectivamente siguiendo esta lógica,
encontramos la puntuación máxima 10, 10 y 9.

Al analizar los percentiles se obtiene que el percentil 10% al APGAR 1 x’ es de 5.0, a


los 5x’ y a los 10x’ respectivamente es de 8.0. En consideración al percentil 90% se
obtiene 9.0; 10.0; y 9.0. Los valores de desviación estándar son 1.769, 1.102 y 0.5774,
lo cual nos indica la presencia de sujetos de estudios alejados de la media, con
especial énfasis en la puntuación de APGAR 1x’. Demostrado en la siguiente
ilustración:

Ilustración N° 6: Análisis descriptivo de los datos de APGAR con su desviación


estándar.

En consideración a la variable peso de nacimiento se realiza el mismo análisis,


identificando un peso de nacimiento mínimo de 700 gramos, un peso máximo de
4.300 kilogramos y un rango de 3.600 Kg. Una desviación estándar de 854.0, que se
puede observar cómo puntos aislados fuera de los valores centrales (en gris) expuesto
en la siguiente imagen.

Ilustración N° 7: Análisis descriptivo de los datos de Peso de Nacimiento el RN con


su desviación estándar.
F. Análisis de la simetría, curtosis y distribución gaussiana.

La distribución es asimétrica con cola larga hacia a la derecha con valores más altos
por lo cual se obtiene un sesgo positivo, asimismo si analizamos la curtosis (colas de
la distribución de datos) en relación con su coincidencia con la distribución gaussiana,
se obtiene que están directamente relacionadas. Dependiendo de estas colas se
clasifican en leptokurtic (thin), mesokurtic y platykurtic (flat) según lo analizado y
visualizado en las cápsulas.

La distribución gaussiana, se caracteriza por tener una forma de campana simétrica


alrededor de su media. Hay dos parámetros clave que definen una distribución
gaussiana: la media y la desviación estándar. Para representar la distribución
gaussiana en un gráfico, se utiliza un eje horizontal para representar los valores
posibles de la variable aleatoria, y un eje vertical para representar la densidad de
probabilidad. El gráfico de una distribución gaussiana muestra una curva suave que
alcanza su punto máximo en la media y disminuye a medida que se aleja de la media
en ambas direcciones. La forma y la altura de la curva están determinadas por la
desviación estándar. Una desviación estándar más pequeña da como resultado una
curva más estrecha y alta, mientras que una desviación estándar más grande produce
una curva más ancha y más baja.

En este caso cabe mencionar que no se realizó la relación con los resultados de la
variable de APGAR en 10 minutos ya que tenía 3 resultados, lo cual no era
representativo en el análisis.

Ilustración N° 8: Análisis de asimetría, curtosis y distribución gaussiana.

G. Análisis de normalidad.

Al examinar los gráficos y el tamaño muestral más las variables, evaluaremos la


normalidad de estos datos. Esto en base a realizar pruebas estadísticas, algunas de las
pruebas más comunes son la prueba de Shapiro-Wilk o la prueba de
Kolmogorov-Smirnov.
La prueba de Shapiro-Wilk evalúa si los datos se ajustan a una distribución normal
o no. Si el valor p es mayor que un nivel de significancia predefinido (ej. 0.05),
podemos asumir que la muestra sigue una distribución normal. La prueba de
Kolmogorov-Smirnov compara la distribución acumulativa empírica de los datos con
la distribución teórica (normal en este caso). Si el valor p es mayor que el nivel de
significancia establecido, podemos considerar que los datos siguen una distribución
normal.

Al tener un tamaño muestral alto de más de 60 RN se opta por la prueba de


Kolmogorov-Smirnov (se recomienda su uso en un tamaño muestral mayor a 50
sujetos).

Ilustración N°9: Análisis de Normalidad por la prueba de Kolmogorov-Smirnov.

En el caso específico del valor de p de 0.0002 y 0,0003, se utilizó un umbral de


significancia de 0.05, por lo cual esto se consideraría que el resultado es altamente
significativo, ya que la probabilidad de obtener un resultado tan extremo o más
extremo por pura casualidad es muy baja. Esto sugiere que hay evidencia sólida para
rechazar la hipótesis nula y respaldar la existencia de una relación o diferencia
significativa entre las variables.

Ilustración N° 10: : Gráfico de distribución de normalidad en variable APGAR 1’ y


5’

Por otro lado, la variable “Peso de nacimiento” demostró un valor de p de 0.0599


indicando que la probabilidad de obtener un resultado igual o más extremo que el
observado, asumiendo que la hipótesis nula es verdadera, es relativamente baja. En
otras palabras, indica que existe una posibilidad moderadamente alta de que la
diferencia o relación entre las variables que se están comparando sea significativa.

Ilustración N° 11: Análisis de Normalidad por la prueba de Kolmogorov-Smirnov.

Ilustración N° 12: Gráfico de distribución de normalidad en variable peso de


nacimiento.

H. Aplicación de pruebas estadísticas.

Para el análisis de las variables peso de nacimiento y puntaje APGAR, se escogió el


coeficiente de correlación de Pearson, también conocido como R de Pearson, es una
medida de la correlación lineal entre dos variables continuas que siguen una
distribución normal. Es uno de los coeficientes de correlación más utilizados y se
utiliza para evaluar la fuerza y la dirección de la relación lineal entre dos variables.
Al momento de realizar la prueba estadística, se puede observar que a medida que la
variable X (peso al nacer) va creciendo, la variable Y, (APGAR en 1-5 minutos)
también irá creciendo, obteniendo así mayor puntaje, es decir, que las variables se
encuentran directamente proporcionales. Por otra parte, queda en evidencia que la
hipótesis planteada anteriormente es correcta, ya que a mayor peso de nacimiento
mayor es el puntaje de APGAR obtenido, visualizado en los gráficos a continuación:

Ilustración N° 13: Gráfico de prueba estadística R de Pearson. Correlación entre las


variables “APGAR” y “Peso al nacimiento”.
I. Referencias bibliográficas:

1. Apgar score - MeSH - NCBI [Internet]. Nih.gov. [citado el 6 de julio de 2023].


Disponible en: https://www.ncbi.nlm.nih.gov/mesh/?term=APGAR
2. Birth weight - MeSH - NCBI [Internet]. Nih.gov. [citado el 6 de julio de 2023].
Disponible en: https://www.ncbi.nlm.nih.gov/mesh/68001724
3. Cárdenas-López C, Haua-Navarro K, Suverza-Fernández A, Perichart-Perera O.
Mediciones antropométricas en el neonato. Bol Med Hosp Infant Mex [Internet]. 2005
[citado el 6 de julio de 2023];62(3):214–24. Disponible en:
https://www.scielo.org.mx/scielo.php?script=sci_arttext&pid=S1665-1146200500030
0009
4. Clasificaciones recién nacido [Internet]. Saludinfantil.org. [citado el 6 de julio de
2023]. Disponible en:
http://www.saludinfantil.org/guiasn/Guias_PMontt_2015/Generalidades/Clasificacion
es_Recien_nacido.htm
5. Conei, D. 2023. Base de datos Taller. Ucampus.cl. Universidad de Aysén.
6. Conei, D. 2023. Cápsula 2.1 Bases de Datos y Análisis Descriptivo de los Datos.
Ucampus.cl. Universidad de Aysén.
7. Conei, D. 2023. Cápsula 2.3 Depuración de una Base de Datos. Ucampus.cl.
Universidad de Aysén.
8. Olmedo, V. Depuración de las bases de datos [Internet]. Blogspot.com. [citado el 6 de
julio de 2023]. Disponible en:
http://estadisticaclinica.blogspot.com/2017/04/depuracion-de-las-bases-de-datos.html
9. Conei, D. 2023. Cápsula 5.3 T de Student para muestras independientes - U Mann
Whitney (Tutorial). Ucampus.cl. Universidad de Aysén.
10. Conei, D. 2023. Cápsula 3.1 Análisis de Normalidad de los Datos. Ucampus.cl.
Universidad de Aysén.
11. Conei, D. 2023. Cápsula 7.2 R de Spearman - Pearson (Tutorial). Ucampus.cl.
Universidad de Aysén.

También podría gustarte