Estadística descriptiva, incertidumbre y correlación de variables
Juan Sebastián Rodas Ramirez, Valentina Cárdenas Cuellar.
Laboratorio de Introducción a la experimentación científica, Departamento de Biología, Universidad del Valle,
Cali.
rodas.ramirez.juan@correounivalle.edu.co, valentina.cuellar@correounivalle.edu.co
Resumen.
En la práctica se hicieron mediciones directas e indirectas relacionadas a la velocidad (tiempo y distancia), IMC (altura y
peso) y presión (diastólica y sistólica) de los estudiantes para determinar su estado de salud y hacer un análisis con
estadística descriptiva, distribución, regresión y correlación de variables.
Palabras clave: Regresión, salud, análisis.
1. INTRODUCCIÓN manera inmediata la presión sistólica y diastólica del
Es un hecho que una gran parte de las investigaciones en estudiante. para así establecer estas medidas posteriores a
las Ciencias Experimentales depende, en gran medida, de hacer ejercicio.
métodos estadísticos. La demanda de la Estadıstica viene
motivada por distintas causas, según la especialidad en El anterior procedimiento se repite hasta conseguir tres
cuestión. En la biología cada disciplina tiene su propia datos de presión sistólica y diastólica en reposo y post
serie de variables, que puede incluir medidas ejercicio y tiempo (la distancia solo se midió una vez).
morfológicas convencionales, concentraciones de Por último se midió el peso con una báscula y la altura
sustancias en fluidos corporales, velocidades de ciertos con un metro, teniendo en cuenta que al momento de
procesos biológicos, etc. El problema está en la enorme pesarse el estudiante debe estar derecho y mirando al
variabilidad con que se presentan los fenómenos frente.
estudiados, variabilidad que se incrementa a medida que
se profundiza en la investigación. Esto impide la
formulación de leyes deterministas, propias de otras
disciplinas, en favor de una descripción, lo más amplia y
exhaustiva posible, de los distintos caracteres a estudiar.
Por esta razón, la recolección y el tratamiento de datos, a
través de la estadística, es de gran importancia. [1]
En este laboratorio se midieron algunas variables
fisiológicas relacionadas con el estado de salud de una
persona, como el IMC y la presión arterial. El análisis de
datos se hizo por medio de recursos estadísticos, como
parámetros de centralización y de dispersión, que nos
dieron información sobre la distribución de la muestra.
También se determinó la relación entre las variables por
medio del método de regresión. Se realizó la adecuada
propagación de incertidumbre a los resultados obtenidos.
2. METODOLOGÍA
Primero se midió la presión sistólica y diastólica en
reposo de los estudiantes con un tensiómetro, teniendo en
cuenta que el estudiante no debe hablar y debe estar con el
brazo en un ángulo de 90 grados, posteriormente se midió
una distancia de 50 metros con un metro, para así medir el
tiempo que se demora el estudiante en recorrerlo a
máxima velocidad, utilizando un cronómetro para esta
medición, habiendo recorrido esta distancia se midió de
3. DATOS, CÁLCULOS Y RESULTADOS Nota: La variable tiempo está asociada a una fuente de
incertidumbre adicional dada por el tiempo de reacción
● Caracterización de variables del operador
Tabla 1.
Variable Tipo de ∆i
medición
Altura Directa 0.01 m
Peso Directa 0.01 kg
Presión Directa 1
Tiempo Directa 0.01 s
Distancia Directa 0.01 m
Velocidad Indirecta -
IMC Indirecta -
Tabla 3. Estadística descriptiva para la variable peso
● Estadística descriptiva Peso
Tabla 2. Estadística descriptiva para la variable edad Promedio 58,80
Edad 60,80
Varianza
7,797
Promedio 17,6 Desviación estándar 73,70
Varianza 1,25 47,90
Máximo
25,80
Desviación estándar 1,12 Mínimo 59,95
Máximo 20 No hay
Rango
0,1326
Mínimo 17 Mediana
Rango 3 Moda
Mediana 17 Coeficiente de variación
Moda 17
Coeficiente de variación 0,0635 Tabla 4. Estadística descriptiva para la variable estatura
Estatura
Promedio 1,70
Varianza 0,00667
Desviación estándar 0,0816
Máximo 1,78
Mínimo 1,55
Rango 0,23
Mediana 1,72
Moda 1,77
Coeficiente de variación 0,0481
Tabla 8. Estadística descriptiva para la variable presión
sistólica (reposo)
Presión sistólica en reposo
Promedio 123
Varianza 113
Desviación estándar 11
Tabla 5. Estadística descriptiva para la variable IMC Máximo 147
IMC Mínimo 111
Promedio 20,5 Rango 36
Varianza 6,10 Mediana 121
Desviación estándar 2,47 Moda 121
Máximo 24,3 Coeficiente de variación 0,08624
Mínimo 17,1
Rango 7,25 Tabla 9. Estadística descriptiva para la variable presión
Mediana 19,9 diastólica (reposo)
Moda No hay Presión diastólica en reposo
Coeficiente de variación 0,121 Promedio 77
Varianza 33
Tabla 6. Estadística descriptiva para la variable Tiempo Desviación estándar 6
Tiempo Máximo 89
Promedio 9,6 Mínimo 70
Varianza 2,81 Rango 19
Desviación estándar 1,7 Mediana 76
Máximo 12,7 Moda No hay
Mínimo 7,99 Coeficiente de variación 0,074
Rango 4,70
Mediana 8,69 Tabla 10. Estadística descriptiva para la variable presión
Moda No hay sistólica (post ejercicio)
Coeficiente de variación 0,18 Presión sistólica post ejercicio
Promedio 133
Varianza 155
Tabla 7. Estadística descriptiva para la variable
Velocidad Desviación estándar 12
Velocidad Máximo 152
Promedio 5,4 Mínimo 108
Varianza 0,72 Rango 44
Desviación estándar 0,85 Mediana 132
Máximo 6,26 Moda 137
Mínimo 3,9 Coeficiente de variación 0,0939
Rango 2,32
Mediana 5,76
Moda No hay
Coeficiente de variación 0,16
Figura 2. Distribución de la variable velocidad.
Tabla 11. Estadística descriptiva para la variable presión
diastólica (post ejercicio)
Presión diastólica post ejercicio
Promedio 83
Varianza 46
Desviación estándar 7
Máximo 100
Mínimo 74
Rango 26
Mediana 84 Figura 3. Distribución de la variable presión sistólica en
Moda 84 reposo.
Coeficiente de variación 0,08
Tabla 12. Relación del IMC con la edad
Edad IMC
17 21,3
17 23,5
17 17,1
17 21,2
19 24,3
17 19,9
17 18,9
17 19,4 Figura 4. Distribución de la variable presión diastólica en
20 17,2 reposo
17 18,9
19 23,2
● Distribución de los datos
Figura 1. Distribución de la variable IMC.
Figura 5. Distribución de la variable presión sistólica post La velocidad hipotética de una persona con IMC de 53.33
ejercicio se determinó reemplazando en la ecuación 1.
v=0.0653(53.33)+6.6967
El resultado obtenido fue de 10.2 m/s
4. DISCUSIÓN DE RESULTADOS
De acuerdo a los resultados de estadística descriptiva de la
variable edad, los parámetros indican que la dispersión de
los datos es muy poca, teniendo un rango de sólo 3 años
(17-20) y una desviación estándar 1,12, siendo
prácticamente igual con altura con una baja desviación
estándar y un rango corto donde se encuentran los datos;
siendo un caso opuesto el peso ya que presenta un mayor
Figura 6. Distribución de la variable presión diastólica rango de los datos (47,90-73,30), aunque la desviación
post ejercicio estándar es relativamente baja en relación a los datos.
Si se ve la tabla 5 y se compara con los datos dados en la
tabla 3 del módulo se puede ver que todos los estudiantes
están entre peso bajo y normal, lo cual significa que la
mayoría tiene una buena salud en relación con su peso,
aunque hay una pequeña cantidad de los estudiantes que
deben de alimentarse de mejor manera ya que aunque no
están graves (ya que no bajan del 17.0), si no se cuidan
puede llegar a ser preocupante.
Se puede observar que los datos de la variable IMC, que
se muestran en la figura 1 describe una distribución
normal simétrica. En cambio, los datos de la variable
velocidad presentan una distribución normal asimétrica
con inclinación negativa, ya que hay más datos mayores
● Relación entre las variables que el valor de la media (5.4), consignado en la tabla 7.
La distribución de los datos de las variables presión
Figura 7. Relación entre el IMC y la velocidad sistólica en reposo y presión diastólica post ejercicio
también parecen describir una campana de gauss, que
sugiere una distribución normal simétrica, sin embargo, es
adecuado señalar que no se presentan datos en la primera
parte de la función. El caso opuesto se presenta en los
datos de la presión sistólica post ejercicio, también
parecen tener una distribución normal simétrica, pero no
se presentan datos al final de la función gaussiana.
En la figura 7, que muestra la relación entre el IMC y la
velocidad se puede observar que los datos son muy
dispersos, sugiriendo que no las dos variables no están
correlacionadas. La regresión que mejor se adapta a estos
datos fue la lineal, sin embargo como se muestra en la
gráfica, así como en el coeficiente de correlación muy
Ecuación de regresión: lejos de 1), este modelo no se ajusta a los datos de manera
v=0.0653 x+ 6.6967 Ec . 1 adecuada.
Coeficiente de determinación: R2=0.0363
● Extrapolación
5. CONCLUSIONES
El análisis de diferentes variables estadísticas nos puede
ayudar a determinar que tanta confiabilidad hay en los
datos tomados en el experimento y si estos están
relacionados entre sí, por tanto estas son esenciales para
saber si las mediciones realizadas sirven para hacer un
análisis general de la población o son independientes entre
sí y dependen de otras variables no medidas en el
experimento; por tanto es de gran importancia saber
analizarlas, ya que, un mal análisis puede terminar en una
conclusion erronea sobre el experimento y esto causar
confusión entre los experimentadores.
6. REFERENCIAS
[ 1 ] Sokal, R. R.; Rohlf, F. J.1986 Introducción a La
Bioestadística. Editorial Reverte S.A. 380p.