Está en la página 1de 14

BIOESTADÍSTICA - SEMINARIO

V Ciclo de Estudios Semestre Académico 2021-II

TEMA DE LA PRÁCTICA:

Tarea 10: "Análisis de correlación y regresión lineal simple"

INTEGRANTES:

Agüero Pérez Angella Daniela 2014440128


Borrero Ulfe Michelle Daniella 71573942
Cubas Saavedra Lucero 72696945
Diaz Meza Marco Antonio 72973194
La Torre Palomino Stefany Carolina 2020154692
Montenegro Cieza Luis Mario 2020108198
Pérez Paulino Edwin Alexis 2019208477
Santisteban Muñoz Kenner Poult 2020131896
Zambrano Chavarry Hebert Alonso 2020108266

DOCENTE:

Dr. Wilber Omero Rodríguez Lopez

GRUPO:

ESO28-15

Pimentel – Perú
2021
OBJETIVOS

 Realizar prueba de hipótesis del coeficiente de correlación de Pearson.

 Construir la ecuación de regresión lineal.

 Interpretar coeficiente de determinación.


INTRODUCCIÓN

La primera vez que usó el término “regresión” fue en 1877 por Sir Francis
Galton, quien llevó a cabo un estudio mostrando que la estatura de los niños
nacidos de padres altos tiende a retroceder o “regresar” hacia la estatura
media de la población. A partir de esto, dicha palabra se refirió como el
nombre del proceso general de predecir una variable a partir de otra. En esta
terminología, la variable que se va a predecir se llama dependiente, mientras
que la o las variables que se usan para predecir el valor de la variable
dependiente se llaman variables independientes.
De igual modo el uso de la correlación es una medida importante de la
relación lineal entre dos variables cuantitativas continuas (como “x”, “y”). En
donde, la manera más sencilla de saber su correlación es determinar si co-
varían (varían conjuntamente). Es importante hacer notar además que esta
covariación no implica necesariamente causalidad, ya que puede resultar
fortuita. A partir de esto, daremos a conocer en el presente informe la
aplicación de la prueba de hipótesis del coeficiente de correlación y los
ejercicios propuestos.
DESARROLLO DEL CUESTIONARIO

1. El diagnóstico de la deficiencia de cobre (Cu) es dificultoso cuando


se toma como único parámetro a la cupremia, pues en las
deficiencias moderadas de cobre esta no siempre disminuye. En el
curso de una investigación cuyo objetivo era determinar la relación
entre los niveles de Cu sanguíneo y hepático (para poder evaluar así
la fiabilidad que aportan los valores de la cupremia), se muestreó
sangre e hígado de un cierto número de animales de laboratorio para
determinar nivel de Cu, ceruloplasmina oxidasa (CPO), hemoglobina y
hematocrito. Los valores de hematocrito y hemoglobina fueron
normales en todos los casos. A continuación, se reproducen los
valores de Cu sérico y CPO correspondientes a una muestra aleatoria
de 6 del total de los casos estudiados:

¿Puede afirmarse que hay relación lineal significativa entre ambos


indicadores?
Teniendo en cuenta las siguientes fórmulas:

# de X Y X2 Y2 XY
observación
1 9 0.4 81 0.16 3.6
2 23 0.45 529 0.2025 10.35
3 32 0.52 1024 0.2704 16.64
4 28 0.7 784 0.49 19.6
5 42 0.87 1764 0.7569 36.54
6 57 0.92 3249 0.8464 52.44
TOTAL 191 3.86 7431 2.7262 139.17

Y tras la elaboración de los datos:


Valores de Cu sérico y CPO
1
0.9
0.8

Cu sérico (ppm)
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0 10 20 30 40 50 60
CPO (ppm)

(191)(3.86)
(139.7) − (3.86) (191)
𝑏= 6 𝑎= − 0.012 𝑥
(191)2 6 6
(7431) −
6

(139.7) − (122.876)
𝑏= 𝑎 = 0.643 − 0.382
(7431) − (6080.166)

16.824
𝑏= = 0.012 𝑎 = 0.261
1350.834

𝑌 = 0.261 + 0.012 (𝑋)

𝟔 (𝟏𝟑𝟗. 𝟏𝟕) − (𝟏𝟗𝟏)(𝟑. 𝟖𝟔)


𝒓=
√[𝟔(𝟕𝟒𝟑𝟏) − (𝟏𝟗𝟏𝟐 )][𝟔(𝟐. 𝟕𝟐𝟔𝟐) − (𝟑. 𝟖𝟔𝟐 )]

𝟖𝟑𝟓. 𝟎𝟐 − 𝟕𝟑𝟕. 𝟐𝟔
𝒓=
√[𝟒𝟒𝟓𝟖𝟔 − 𝟑𝟔𝟒𝟖𝟏][𝟏𝟔. 𝟑𝟓𝟕𝟐 − 𝟏𝟒. 𝟖𝟗𝟗𝟔]

𝟗𝟕. 𝟕𝟔
𝒓=
√𝟏𝟏𝟖𝟏𝟑. 𝟖𝟒𝟖

𝟗𝟕. 𝟕𝟔
𝒓= = 𝟎. 𝟖𝟗𝟗
𝟏𝟎𝟖. 𝟔𝟗𝟐
Podemos llegar a interpretar que el valor del coeficiente de correlación (r)
es de 0.899 , por lo tanto, sí existe una relación lineal entre las variables
con un sentido que se reconoce como una relación directa al ser un valor
positivo y una intensidad que resulta en una correlación positiva intensa al
ser menor que 1 y mayor que 0.5.

2. El Gerente de una Clínica dispone de la siguiente información:

a) Grafique y determine la ecuación de la tendencia.

Observación Año (x) Cirugías (y) 𝒙𝟐 𝒚𝟐


1 2008 120 4032064 14400 240960
2 2009 143 4036081 20449 287287
3 2010 150 4040100 22500 301500
4 2011 170 4044121 28900 341870
5 2012 162 4048144 26244 325944
6 2013 158 4052169 24964 318054
Total 12063 903 2425679 137457 1815615

Una vez que hemos ordenado nuestra información con sus respectivos datos,
vamos a determinar la ecuación de tendencia, para la cual, primero
hallaremos el valor de b:

Ahora reemplazaremos con los datos que tenemos:

133.5
𝑏=
17.5

𝑏 = 7.628
Luego de obtener el valor de b, ahora hallaremos el valor de a:

𝑎 = −15186.742
Por lo tanto, la ecuación de la tendencia seria:

b) Proyecte las cirugías al corazón para el año 2014.


𝑦 = −15186.742 + 7.6286 (x)
𝑦 = −15186.742 + 7.6286 (2014)
𝑦 = 177.2 ≡ 177

Se estima que para el año 2014 se proyectaran 177 cirugías en la clínica.


3. Se efectúa un experimento médico para determinar el efecto de la
droga efedrina en las pulsaciones del corazón. Un paciente recibe
diversas dosis diarias de la droga durante seis días. La tabla que
sigue resume los resultados del experimento.

N° Dosis diaria total N° de pulsaciones por X2 Y2 XY


de efedrina (gr)(X) minuto (Y)

1 3 70 9 4900 210
2 2 60 4 3600 120
3 1 50 1 2500 50
4 3 80 9 6400 240
5 5 100 25 10000 500
6 4 90 16 8100 360
Total 18 450 64 35500 1480

a. Grafique un diagrama de dispersión

PULSACIONES POR MINUTO Y DOSIS


DIARIA TOTAL DE AFREDINA
120

100

80

60
Pulsaciones
40

20

0
0 1 2 3 4 5 6
DOSIS DIARIA TOTAL DE AFREDINA

Interpretación:
Se muestra un diagrama de dispersión con los datos adjuntados del número de
pulsaciones por minuto y su relación con la dosis diaria total de efedrina
representados por punto o pulsaciones en el gráfico.
b. Determine la ecuación de regresión lineal. Interprete los coeficientes
de regresión lineal.

Y = a + bX

El coeficiente “b” será considerado como el coeficiente de regresión lineal, ya


que indica el cambio que tendrá la variable dependiente (Y) por cada vez que
se vea alteraba por “b” la variable independiente (X).

B = 1480 - [18(450)] / 6 = 130 = 13


64 – (18)2/6 10

A = 450 – 13(18) = 75 – 39 = 36
6 6
b.1 Grafique sobre el diagrama de dispersión, la línea de regresión.

PULSACIONES POR MINUTO Y DOSIS


DIARIA TOTAL DE AFREDINA
120
N° DE PULSACIONES POR MINUTO

y = 13x + 36
100 R² = 0.9657

80

60
Pulsaciones
40 Lineal (Pulsaciones)

20

0
0 1 2 3 4 5 6
DOSIS DIARIO TOTAL DE AFREDINA
Interpretación:
Gracias a la línea de regresión, se puede observar que, con el aumento de las
dosis diarias, existe un creciente aumento de las pulsaciones, dándonos un
resultado positivo directamente proporcional entre las 2 variables.
c. Estímese el número de pulsaciones para una dosis diaria de 4 granos
de efedrina.
X= 4
A= 36
B= 13
Ecuación: Y= a+b(x)
Solución:
Y=36+13(4)
Y=36+52
Y= 88
d. Calcule el error estándar de la estimación del modelo
Ecuación:

∑ 𝑌2 − (𝑎 ∗ ∑ 𝑌) − (𝑏 ∗ ∑ 𝑋𝑌)
𝑆𝑒 = √
𝑛−2

Solución:

∑ 𝑌2 − (𝑎 ∗ ∑ 𝑌) − (𝑏 ∗ ∑ 𝑋𝑌)
𝑆𝑒 = √
𝑛−2

35500 − (36 ∗ 450) − (13 ∗ 1480)


𝑆𝑒 = √
6−2

35500 − 16200 − 19240


𝑆𝑒 = √
4

35500 − 35440
𝑆𝑒 = √
4

60
𝑆𝑒 = √
4
𝑆𝑒 = √15

𝑆𝑒 = 3.872

Respuesta: El error estándar de estimación es de 3.872 pulsaciones por minuto

e. Calcule e interprete el coeficiente de correlación

𝑛(∑ 𝑋𝑌)−(∑ 𝑋)(∑ 𝑌)


r=
√[𝑛(∑ 𝑋2)−(∑ 𝑋)2] [𝑛(∑ 𝑌2)−(∑ 𝑌)2

6(1480)−(18)(450)
r=
√[6(64)−(18)2][6(35500)−(450)2]

8880−8100
r=
√[384−324] [213000−202500]

780
r=
√[60] [10,500]

780
r=
√630,000

780
r= √793.725

780
r= 793.725

r= 0.982

El coeficiente de correlación indica una relación lineal directa intensa


CONCLUSIONES

 Podemos afirmar que, el coeficiente de correlación de Pearson, es


una prueba que mide la relación estadística entre dos variables
continuas; por lo tanto, si la asociación entre los elementos no es
lineal, entonces el coeficiente no se encuentra representado
adecuadamente.
 En el presente informe, podemos mencionar que se llegó a
reconocer la regresión de Pearson y su verdadera importancia en el
ámbito clínico, además de la aplicación en los ejercicios del
cuestionario desarrollado.
 La ecuación de regresión lineal es aquella que señala un valor
medio o valor estimado de la función lineal y se utiliza para predecir
el valor de una variable según el valor de otra. La variable que
desea predecir se denomina variable dependiente.
REFERENCIAS BIBLIOGRÁFICAS

1. Agustin G. Regresión Lineal [internet]. Cáceres: Universidad de


Extremadura; 2011 [citado el 19 de Octubre de 2021]. Disponible en:
https://mascvuex.unex.es/ebooks/sites/mascvuex.unex.es.mascvuex.
eboo ks/files/files/file/Bioestadistica_9788469494325.pdf

2. Rodrigo J. Correlación y Regresión lineales simple [Internet].


Cienciadedatos.net. 2016 [citado el 19 de octubre de 2021]. Disponible
en:
https://www.cienciadedatos.net/documentos/24_correlacion_y_regres
ion lineal

3. Regresión y correlación [Internet]. UCA; 2011 [citado el 19 de Octubre


de 2020]. Disponible en:
http://www2.uca.edu.sv/matematica/upload_w/file/REGRESION%20SI
MPLE%20Y%20MULTIPLE.pdf

También podría gustarte