Está en la página 1de 6

Universidad Nacional de Colombia

Solución del Taller 5


Probabilidad y Estadística Fundamental

Alumnos:
Cristian Andrés Grast Jurado
Juan David Reyes García

Fecha de entrega:

17/07/2019
1. “Todos los cálculos que se mencionan a continuación están respaldados con su
respectivo código en Rstudio en el apartado de los anexos”
A) Se puede observar en la Ilustración 1 que por lo menos hay tres pacientes que actúan
estadísticamente como valores extremos, además de ello se puede observar que llevan una
correlación de Pearson positiva [1].

Ilustración 1 Nube de puntos entre la edad y la presion arterial

La correlación de Pearson calculada por medio de R es de 0.7734175, lo que nos deja


entender que esta serie de datos posee, una correlación lineal fuerte y positiva, y a su vez
como esta es distinta a 0 pero cercana a 1 existe dependencia lineal entre las variables,
cuanto más cercano se encuentre el valor a 1, mayor dependencia presentaran las variables
de la muestra.

B) Ya que un p-valor bajo (>0.05) nos indica que una variable no es estadísticamente
significativa [2], se recurrió a el código de R “summary(reg_lin1)” donde se puede
determinar que la edad es estadísticamente significativo, ya que su p-valor asociado es
2,10 × 10−7
El coeficiente estimado determinado por el código en R “summary(reg_lin1)” para la
variable de la edad es 1.2756, lo cual nos quiere decir que para cada año ganado se puede
esperar que la presión aumente en una media de 1.2756 mmHg.

C) se encontraron tres casos en lo que había crisis de hipertensión, más específicamente


los casos 2, 31 y 32 presentaron más de 180mmHg de presión arterial sistólica.
Se llegó a la conclusión de que los resultados del inciso A como la correlación de Pearson,
la media maestral de los datos y posteriormente su regresión lineal, son afectados
por estos casos particulares.

Ilustración 2 Nube de puntos entre la edad y la presión arterial con datos ajustados

Comparando las Ilustraciones 1 y 2 gráficamente se da a entender que la correlación de


Pearson va a ser mayor en la ilustración 2, esto se profundiza en el anexo, más
específicamente en los numerales B y C, como se puede observar en la Tabla 1 se realiza la
comparación entre las correlaciones de Pearson, lo estadísticamente significativo que son
las variables y su regresión lineal en cada conjunto de datos, dando a entender que es
posible que el modelo de datos ajustado sea más influyente que el modelo de datos inicial.
Tabla 1 Comparación de Modelos

Datos iniciales Datos ajustados


Correlación de Pearson 0.7734157 0.8439069
Estadísticamente 2,10 × 10−7 8,88 × 10−9
significativo edad(p-valor)
Intercepto Pendiente Intercepto Pendiente
Regresión lineal
86.453 1.276 97.0771 0.9493

D) El coeficiente del intercepto de los datos ajustados en inciso C es estadísticamente


significativo ya que su p-valor presente en el código de R “summary(reg_lin2)” es de
2,67 × 10−16 , que como pudimos observa en el inciso B al ser el p-valor menor a 0.05 es
estadísticamente significativo.

E) ¿Cuál es la proporción de la variación total en Presión arterial que puede ser explicada
por la variación en la edad?
Esta es la respuesta que resuelve el coeficiente de determinación 𝑅 2 , al cuadrado de la
correlación de Pearson se le denomina de esta manera [1].
Con los datos iniciales nuestro coeficiente de determinación fue de 0.5981747, de lo que
deducimos que aproximadamente el 40.18% de la presión sanguínea no está relacionada
con la edad de los pacientes.
En el caso de los datos ajustados el coeficiente de determinación fue de 0.7121789, de lo
que deducimos que aproximadamente el 28.78% de la presión sanguínea no está
relacionada con la edad de los pacientes.

F) Las diferencias más significativas entre las ilustraciones 3 y 4 tiene que ver con la
regresión lineal de cada una, por ello misma en las ilustraciones se incluye la ecuación de la
recta (estas expresadas por el comando paste0).
Como se puede observar en la ilustración 3 esta posee una pendiente de 1.28 “valor
aproximado”, lo que nos quiere indicar con respecto a la ilustración 4; con pendiente de
0.95 , que para cada año cumplido se puede esperar que la presión aumente en 0.33 más
con respecto al modelo ajustado de la ilustración 2.

Ilustración 3 Ajuste (abline) para la gráfica del inciso a con datos Iniciales
Ilustración 4 Ajuste (abline) para la gráfica del inciso a con datos Ajustados

G) Las predicciones de la Presión Arterial Sistólica (P.A.S) para los pacientes ingresados
según su edad se ven reflejadas en la tabla 2 por medio de estimación puntual, según el
código en R predict(), este estimado se ve que puede considerarse en algunos casos exacto
si tenemos en cuenta lo dicho en el inciso C, a niveles de (P.A.S) mayores a 180mmHg se
sufre de crisis de hipertensión y requiere atención medica inmediata, teniendo en cuenta
esto se puede sospechar que los Datos iniciales y por ende el Modelo inicial puede llegar a
estar errado.
Tabla 2 Predicciones del P.A.S por modelos de estudio

Predicciones (P.A.S) Modelo Inicial Modelo Ajustado


Paciente 1 (49 años) 148.95 143.59
Paciente 2 (68 años) 173.19 161.63

Los intervalos de confianza al 95 % que cada modelo brinda a los pacientes en cada modelo
están reflejados en la tabla 3, siguiendo lo dicho anteriormente podemos hacer el mismo
análisis, los intervalos de confianza en este caso presentan una sección “por lo menos en
paciente de 68 años” en la que no cumplen con los niveles normales de la (P.A.S) antes de
sufrir problemas de salud, esto se puede explicar por el nivel de significancia y también por
los datos atípicos hallados en la muestra.
Tabla 3 Intervalos de confianza al 95% para cada modelo estudiado

Intervalo de confianza Paciente 1 (49 años) Paciente 2 (68 años)


Modelo Inicial 114.14 - 183.77 137.41 - 208.97
Modelo Ajustado 123.61 - 163.57 140.94 - 182.32

Al tener en cuenta que los intervalos de confianza construidos representan el nivel normal
de la presión arterial de un recién ingresado y que de esta dependa la atención que le brinde
el hospital, se puede concluir que existe un riesgo sustancial en el modelo Inicial, ya que
este puede determinar que una persona con una P.A.S mayor a 180 mmHg, no necesita
atención prioritaria y esto lleve a provocar un accidente trágico en el hospital,
estadísticamente el intervalo de confianza contiene un valor atípico, descartando su utilidad
para contener la normalidad de la población.
Pero al tener en cuenta que el modelo ajustado podría considerarse un riesgo mínimo para
los pacientes, ya que este si organizaría correctamente a los pacientes de 49 años en la sala
de espera, dando prioridad a los que estén en verdadero riesgo, pero tendría problemas a
la hora de ajustarse a los pacientes de 68 años ya que habría casos en los que se necesite
atención prioritaria por complicaciones de salud que se pasarían por alto.
El riesgo presente se debe al límite que una persona puede llegar a tener la Presión Arterial
Sistólica (180mmHg), ya que medicamente una persona que sobrepase este límite puede
perder la vida, y estadísticamente representaría que la muestra puede sobrepasar la zona
límite con normalidad.

H)